Aller au menu - Aller au contenu

OutWit Hub : un navigateur Web sémantique et extensif

Revenir à la liste des news
Participer à la discussion

Informations

Contributeur(s) : s1404s
Publié : le 14/10/2008 à 03:37:42
Catégorie : Logiciel
Visualisations : 1 060

OutWit Hub : un navigateur Web sémantique et extensif

OutWit Hub, une nouvelle extension pour Firefox, est considérée comme "le premier pas vers un navigateur Web sémantique et extensif" d'après ses développeurs. Mais qu'est-ce que cela signifie réellement ?


OutWit Hub et le défi du Web sémantique



Le Web sémantique en deux mots



Tim Berners Lee

D'après Tim Berners Lee, l'initiateur du World Wide Web et directeur de son consortium, le Web sémantique, appelé aussi le Web 3.0, désigne un Web où les informations en ligne seraient comprises par les ordinateurs pour que tout internaute puisse obtenir l'information qu'il recherche vraiment.

Contrairement au Web actuel, le Web sémantique sera "intelligent" dans le sens où le contenu sémantique des ressources en ligne sera interprétable aussi bien par les hommes que par les logiciels et les machines grâce à un système de métadonnées. Citation : Tim Berners Lee
Ce nouveau Web ira chercher l'information dans diverses bases de données et répondra aux voeux de tous ceux qui voudraient disposer d'un moteur de recherche solide.



OutWit Hub, qu'est-ce que c'est ?



Image utilisateur
OutWit Hub est un nouveau moteur de collecte automatique de données intégré dans une extension Firefox 3. Elle est destinée à faciliter et à améliorer la recherche sur le Web. Elle permet aux utilisateurs de récupérer des images, des documents, des listes ou tableaux de données à partir de n'importe quelles pages voire sites Web et ce, en quelques clics.

Lorsque vous parcourez des pages Web, OutWit les parcourt et extrait les données qui les composent sous forme de tableaux de données que vous pouvez exporter vers des dossiers, des fichiers Excel ou autre pour les utiliser ultérieurement. Voici ce que nous explique le créateur d'OutWib Technologies, J.C. Combaz :

Citation : J.C. Combaz
Si vous cherchez des photos de voiture de sport, les moteurs de recherche vous affichent des listes de vignettes avec des liens vers les pages qui contiennent ces images. OutWit place les photos en haute résolution dans un dossier de votre ordinateur. Si vous voulez des cotations boursières, les moteurs de recherche vous indiquent où vous pouvez trouver les chiffres; OutWit les extrait vers un fichier Excel sur votre bureau.


Comment cette extension Firefox fonctionne-t-elle ?




L'extension OutWit Hub est basée sur trois concepts :
  • Elle dissèque une page Web en différents éléments de données pour permettre aux internautes de les trier et de ne récupérer que les données qui les intéressent : images, liens, adresses e-mails, documents dont les documents PDF, etc.
  • Elle propose un panier à provisions, le Catch, dans lequel les utilisateurs peuvent glisser et déposer n'importe quelles données lorsqu'ils naviguent sur les pages Web.
  • Elle récolte des données sur le Web en un clic (enfin ça dépend ce que vous voulez :D ).

De quoi OutWit Hub est-elle capable ?



OutWit Hub est une extension assez puissante, même pour les développeurs les plus exigeants. Lorsque vous tapez des mots-clés, OutWit reconnaît très souvent ce que vous désirez. Voici quelques impressions d'écran :

Image utilisateur

Image utilisateur
OutWit Hub permet de récupérer des images en haute résolution à partir de vignettes affichées dans des galeries photo comme celle de gauche ou à partir des moteurs de recherche comme Google, Yahoo et compagnie.

De plus, OutWit reconnaît la structure d'une page Web, notamment les liens "suivant". Vous pouvez donc récupérer des tonnes de photos, d'images et de documents de manière automatique et en très peu de clics.

Elle vous permet aussi d'extraire des tableaux de données en HTML s'étalant sur plusieurs pages Web et reliées par le lien "suivant".
Image utilisateur

Vous pouvez récupérer des données qui ne sont pas codées avec la balise <table>. En effet, OutWit Hub essaie de retrouver un motif qui se répète sur toute une page Web. Un motif basique est : nom, prénom, numéro de téléphone, adresse, etc.

Des zéros très bons en programmation peuvent utiliser le noyau d'OutWit Hub afin de développer leurs propres extensions originales pour des usages spécifiques.

Conclusion



OutWit Hub n'est encore qu'un petit pas vers "le navigateur Web sémantique et extensif" puisqu'elle ne reconnaît pas encore toutes les données et qu'elle ne détecte pas systématiquement les liens "suivant". De plus, les fonctions tables et guess ne marchent pas à tous les coups.

Même s'il y a encore des choses à améliorer, elle peut d'ores et déjà constituer un outil intéressant pour les collectionneurs de photos, les développeurs, etc.



Pour bien débuter avec OutWit Hub sans trop vous embrouiller, voici des tutoriels :


Pour plus d'informations


34 Participations

Pour accéder à cette section
Connectez-vous !
connexion_rpx
Page 1  2  Suivante
Pseudo Discussion
1 visiteur sur cette news (0 membre et 1 Anonyme)
Page 1  2  Suivante
En ligne djo0012 # Posté le 14/10/2008 à 04:00:00

Ville : Montréal
Pays : Canada
études : Cégep du Vieux-Montréal

sa semble etre une bonne extension mais par contre je me demande a quel point elle peut etre exploitable... enfin on verra a l'usage si sa apporte réellement a la navigation et a la recherche d'information.

desoler pour le francais j'ai un manque de moliere en moi depuis un bout :( Citation : moi-meme
Si vous n'arrivez pas a résoudre un problème c'est que vous n'avez pas assez travaillé dessus.
 
Hors ligne david96 # Posté le 14/10/2008 à 04:59:02
Avatar

Excellente news !
Merci pour cette découverte, je trouve le concept très interessant.
Par contre, dommage que le plugin soit pour le moment incompatible avec linux 64 bits !
Y'a plus qu'à attendre...
 
Hors ligne MmAxX # Posté le 14/10/2008 à 05:08:10
Le temps est fait de vide.
Avatar

Ville : Baie-comeau
Pays : Canada
études : CEGEP de Baie-Comeau

Hum, sa risque pas de manger mon disque dur ce truc ? o_O
 
Hors ligne Alex # Posté le 14/10/2008 à 05:17:33
Je suis Dieu \/
Avatar

études : Cégep Lévis-Lauzon

À la base, il ne fait qu'analyser la page sur demande. L'exportation est sur demande aussi ;)

Par contre je suis déçu, il semble y avoir quelques incompatibilité avec Linux (sur mon Firefox sur Kubuntu, j'ai pas réussi, j'ai dû venir sur Windows pour tester).

Image utilisateur
 
Hors ligne Dark_Trooper # Posté le 14/10/2008 à 06:48:09
Firefox c'est le bien
Avatar

Pouvoir prendre les résultats d'une recherche Google plus rapidement, c'est franchement pas mal.

Dommage pour la non-compatibilité avec DeviantArt et SocialWallpapering, je viens de tester.

Mais à part ça, c'est vraiment rapide et pratique, j'ai un peu de mal avec l'outil qui permet de faire des tableaux à partir de listes, mais ça a vraiment l'air pratique... Je prends ^^
Hors ligne Nesquik69 # Posté le 14/10/2008 à 07:24:22
Slave of the Rythm
Avatar
Flux RSS

Ville : Tassin-la-demi-lune
Pays : France métropolitaine
études : SUPINFO Rhône-Alpes à Lyon

Bien que j'ai compris le principe de base, tout n'est pas encore très clair dans ma tête. Donc un test de l'extension s'impose pour mieux comprendre ^^ .

Dark-Trooper -> Au passage, pour ceux qui cherchent un moyen de visualiser toutes les images d'une galerie (pour certains sites compatibles seulement), je vous invite à lire ceci ;) .
 
Hors ligne Captain Awesome # Posté le 14/10/2008 à 07:35:58
KNEEL BEFORE ZOD
Avatar

Ville : Bois-colombes
Pays : France métropolitaine

Ça peut être pratique mais le faire manuellement est tout aussi rapide pour moi (glisser/déposer les photos sur le bureau).

Image utilisateur
Image utilisateur >>> TheSerialWatcher <<< Image utilisateur
The (Future) Internet Series Database !

Résumés, fiches, dossiers, news, sous-titres, spoilers, interviews, analyses d'épisodes...
 
Hors ligne Dark_Trooper # Posté le 14/10/2008 à 07:39:43
Firefox c'est le bien
Avatar

Nesquik69, je connaissais pas, c'est vrai que c'est impressionant o_O

Merci pour le lien =)
Hors ligne geenux # Posté le 14/10/2008 à 08:30:12
Vive Qt
Avatar

Ville : Brest
Pays : France métropolitaine

Ça m'a l'air d'être une très bonne extension, j'aurais aimé pouvoir la tester... Mais elle n'aime pas la version 64bits linux de firefox...
Hors ligne l'illusioniste # Posté le 14/10/2008 à 08:54:56
Avatar

Ville : La biolle
Pays : France métropolitaine
études : IUT Annecy

Très bonne news. Une extension à tester.

20 invitations google wave, me MP.

"La violence est le dernier refuge de l'incompétence"
Image utilisateur
 
Hors ligne MathX # Posté le 14/10/2008 à 10:17:00
VIKI
Avatar
Anciens

Ville : Aubel
Pays : Belgique

Belle initiative, ça permettra d'économiser pas mal de temps à certains.

Image utilisateur
 
Hors ligne Prototype # Posté le 14/10/2008 à 11:15:21
Smoke it before it smoke you

Ahhh enfin une news sur l'informatique, c'est pas pour dire mais depuis quelques temps toutes les news concernaient le site du zero, comme si l'actualité d'internet et informatique c'étais subitement arrêtée (pour qui ne lit que le sdz bien sure)

Bon bah sinon, extension à tester et bonne new :)

it's unfair huh?! :diable:
 
Hors ligne MyGB # Posté le 14/10/2008 à 12:04:17
Ying quoi ?
Avatar
Flux RSS

Intéressant, mais sans avoir lu toute la news, c'est peut-être comme Cuil...
Je veux bien qu'il y ait du Web 3.0 mais parmi les millions d'abonnés à l'ADSL, les quelques milliers de fibrés, y'a toujours des 56K... De plus, les technologies supérieures ont tendance à ne pas être utilisés car trop de ressources consommés, 'fin, j'en ai l'impression...

Et si après avoir lu mes posts, vous faisiez un tour sur mon site ?

Article de mon blog contenant le Guide des Solutions de CCDS approuvé par Neamar.
 
Hors ligne gyom # Posté le 14/10/2008 à 12:10:30
Avatar

Citation : MyGB
Intéressant, mais sans avoir lu toute la news, c'est peut-être comme Cuil...
Je veux bien qu'il y ait du Web 3.0 mais parmi les millions d'abonnés à l'ADSL, les quelques milliers de fibrés, y'a toujours des 56K... De plus, les technologies supérieures ont tendance à ne pas être utilisés car trop de ressources consommés, 'fin, j'en ai l'impression...


Effectivement, il aurait fallut lire la news en entier.

Il ne s'agit pas de proposer un nouveau moteur de recherche (du moins à ce que j'ai compris) mais simplement de respecter des normes et des standards pour que les navigateurs "comprennent" mieux les pages web.
Citation : Lee

Ce nouveau Web ira chercher l'information dans diverses bases de données et répondra aux voeux de tous ceux qui voudraient disposer d'un moteur de recherche solide.


Seulement pour ceux qui le voudraient ... les 56k ne sont pas obligés de suivre le moove :p
 
Hors ligne guifson # Posté le 14/10/2008 à 12:24:24
si tu cherches ,tu trouves
Avatar

Je trouve cela franchement très cool.
On essayera pour voir ce que ca donne.
A plus et merci pour le news
 
Hors ligne Lampadaire # Posté le 14/10/2008 à 12:39:04
Rubik's kubuntu
Avatar

Spécial ce truc oO.
J'ai l'impression que ça va être saoulant à comprendre comment ça marche, parce que ça ressemble bien à quelque chose de complexe ! o_O

Image utilisateur
 
Hors ligne KorangaR # Posté le 14/10/2008 à 14:40:51

Citation : MyGB
Intéressant, mais sans avoir lu toute la news, c'est peut-être comme Cuil...
Je veux bien qu'il y ait du Web 3.0 mais parmi les millions d'abonnés à l'ADSL, les quelques milliers de fibrés, y'a toujours des 56K... De plus, les technologies supérieures ont tendance à ne pas être utilisés car trop de ressources consommés, 'fin, j'en ai l'impression...


Bah le web3.0 permet de rechercher plus facilement l'information souhaitée, donc ce n'est pas inaccessible aux 56k bien au contraire, après c'est sur que si ils veulent télécharger des vidéos, c'est pas le web 3 qui va améliorer la compression et la rapidité du dl.
Hors ligne counter ghost # Posté le 14/10/2008 à 15:06:11
Sauver ou Perir
Avatar

humm çà à l'air pas trop mal je vais tester :) merci pour cette news!

.................................RTS-ONLINE.................................

...................................RTS-ONLINE...................................

Site sur les jeux de stratégie en temps réel
 
Hors ligne jordan # Posté le 14/10/2008 à 15:16:31
Développeur indépendant
Avatar
Flux RSS

Ville : Couternon
Pays : France métropolitaine
études : Université de Dijon

Hum, je trouve que le titre est trompeur. Je pense également que cette extension ne respecte pas la définition de l'adjectif "sémantique".

Cette extension comme expliquée dans un des paragraphes de la news se contente de stocker des données qu'elle classe.

On est loin du concept sémantique où un même moteur/logiciel/site devrait pouvoir interroger plusieurs bases de données hétérocliques qui respecteraient toutes un schéma sémantique commun.

Cette extension construit juste une pseudo base de donnée pour son utilisateur. Et sans la partager visiblement.

On me dira que ce n'est qu'un premier pas, mais les développeurs de ce gadjet s'enflamment un peu trop à mon goût.
Hors ligne LinkKokiri # Posté le 14/10/2008 à 16:23:07
M$ is for capitalist at DOS
Avatar

Ville : Argenteuil
Pays : France métropolitaine

Je me trompe peut être mais il me semble que c'est un logiciel libre.

When you're downloading Mozilla Firefox... you're downloading communism
When you pirate MP3s, you're downloading communism
When you program Open Source you're programming communism.
A reminder from your friends at Microsoft
 
Hors ligne zulon # Posté le 14/10/2008 à 16:54:29
Avatar

C'est quoi, un navigateur ou une extension à un navigateur existant, à savoir Firefox ?
Hors ligne robocop # Posté le 14/10/2008 à 17:02:29
Avatar

Ca consiste en quoi le sémentique "web 3.0" ?
Si l'idée est de standardiser le nom des blocs menu, contenu, liens de navigations, etc..., moi, je pense que c'est pas mal du tout.
 
Hors ligne MathX # Posté le 14/10/2008 à 17:34:18
VIKI
Avatar
Anciens

Ville : Aubel
Pays : Belgique

Je dirais plutôt qu'on lui donne le "titre" de navigateur car il inspecte chaque page. Mais sinon ça reste bien une extension pour firefox.

Image utilisateur
 
Hors ligne cgizmo # Posté le 14/10/2008 à 18:07:35
Avatar

Ca a l'air interessant, mais je n'arrive pas a l'installer.
Citation : OutWit
"OutWit Kernel" could not be installed because it is not compatible with your Gran Paradiso build type (Linux_x86_64-gcc3)
Ce n'est visiblement pas compatible avec le 64bit sous linux...
Hors ligne MisterDo # Posté le 14/10/2008 à 18:15:46
"Où est mon programme ?"
Avatar
Flux RSS

Cette extension m'a l'air très puissante.
Le coup du Web 3.0 alors que l'on arrive à peine sur le 2.0... c'est donc très fort !

Encore une bonne extension, persnnelement j'en utilise une très bien pour les développeurs de sites et les curieux ^^ qui est : firebug (très connue...)
 
Hors ligne ff_martial # Posté le 14/10/2008 à 18:26:40
Final-RPG !
Avatar

Ville : Paris
Pays : France métropolitaine
études : EPITA

o_O

Très impressionnant ! Merci beaucoup pour cette extension qui, je pense, va m'être bien utile !

Final fantasy, plus qu'un simple jeu vidéo, un véritable chef d'œuvre...

Vous aimez Final fantasy, et vous voulez créer votre propre RPG ?!
N'hésitez pas, venez nous voir sur -->Final-RPG<--
 
Hors ligne kankan # Posté le 14/10/2008 à 19:42:50
kankan@internet:/com/sdz$
Avatar
Flux RSS

études : EFREI

je trouve que le l'idée de sémantique n'est pas très pertinente pour parler ce ce logiciel. Certes, avec les captures d'écrans, l'on voit qu'il arrive à comprendre ce que l'on cherche, mais après, tout ce qu'il fait, c'est construire une base de données locale.
'fin bon, je vais tester et je reposte.

Edit : tiens, c'est bizarre, un CLUF à accepter... Et pas une licence libre "classique" : il s'agit d'un logiciel propriétaire où quoi ? (pas eu le temps de tout lire, je l'ai juste survolée, c'est tout).
 
Hors ligne lasl92260 # Posté le 14/10/2008 à 22:00:18
tout est relatif
Avatar

Effectivement, non compatible linux 64bits... étrange pour une "simple extension"

De plus l'idée du web 3.0 ne se limite pas à "mon navigateur fait une opération de stockage répétitive à ma place" mais cela permettrai à des applications d'aller naviguer et de ramener des informations bruts pour les afficher en dehors du contexte web, de permettre de monter son propre "moteur de recherche local" agissant comme une extension de ceux préexistant, pouvoir basher des sites webs...
Comme le dit
Citation : les développeurs
le premier pas vers un navigateur Web sémantique et extensif
ce n'est donc pas un navigateur en lui même et ne justifie pas le titre; "OutWit Hub : un navigateur Web sémantique et extensif" l'idée est trés interressante, car à l'aide de regexp cela montre la puissance d'un weeb sémantique au utilisateurs, et va peut-etre donné un coup d'accélérateur à ce dévellopement.


Enfin:
Citation : J.C. Combaz
Si vous cherchez des photos [...] . OutWit place les photos en haute résolution dans un dossier de votre ordinateur. Si vous voulez des cotations boursières, [...]; OutWit les extrait vers un fichier Excel sur votre bureau.

Mais alors comment fait-on si on est sous linux puisqu'il faut avoir Office? </troll>

Et pour conclure le web 3.0 est génial, mais si nous pouvions déjà avoir un bon vrai web 2.0 ce serait déjà bien... (openId par ex.)
 
Hors ligne s1404s # Posté le 14/10/2008 à 23:37:16

Citation : Jordan
Hum, je trouve que le titre est trompeur. Je pense également que cette extension ne respecte pas la définition de l'adjectif "sémantique".Cette extension comme expliquée dans un des paragraphes de la news se contente de stocker des données qu'elle classe.On est loin du concept sémantique où un même moteur/logiciel/site devrait pouvoir interroger plusieurs bases de données hétérocliques qui respecteraient toutes un schéma sémantique commun.


Je trouve que tu vas un peu fort en disant que les développeurs s'enflamment. C’est vrai, la version actuelle est plutôt basée sur une extraction “mécanique” mais le programme inclut déjà un début d’ontologie sémantique qui lui permet de reconnaître des éléments d’information (non seulement les images, liens emails etc. mais aussi les noms de personnes, marques, produits...) et de les classer dans beaucoup de cas sans intervention de l’utilisateur. En plus, si vous regardez bien il classera par exemple les numéros de téléphones ou les noms dans les mêmes colonnes, ce qui évitera beaucoup de boulot dans Excel.
Selon les développeurs le programme devrait devenir de plus en plus intelligent... A suivre....
Hors ligne lasl92260 # Posté le 14/10/2008 à 23:45:04
tout est relatif
Avatar

À mon sens le problème vient du web qui n'a pas encore mué. Nous sommes en tout cas d'accord sur le fait que ce programme est très (trop?) mécanique. Toutefois le classement s'avère gêné par la nécessité du support d'un logiciel de navigation. Idéalement le flux devrait pouvoir être lu par n'importe quelle application sans nécessiter la moindre interprétation (idéalement). Ce que je critiques aussi est essentiellement le titre trompeur donné à la news...

D'autre part en ce qui concerne la citation comprenant excel, cela peut-être considéré comme de la publicité/spam car excel est une marque déposé, alors que le mot tableur aurait été plus approprié car pour les utilisateur d'OpenOffice (et non pas d'Office) l'export en fichier Excel n'est pas très intéressant... (enfin bon je suis peut être un peu pointilleux mais bon)
 
Pour accéder à cette section
Connectez-vous !
connexion_rpx

Revenir à la liste des news