Aller au menu - Aller au contenu

Découvrez Fise, un moteur sémantique Open-Source !

Revenir à la liste des news
Participer à la discussion

Image

Informations

Contributeur(s) : bluestorm et Etienne
Publié : le 05/09/2010 à 19:12:02
Catégorie : Logiciel
Visualisations : 10 011

Licence : Creative Commons BY SA

Découvrez Fise, un moteur sémantique Open-Source !

Le projet Open-Source IKS vient de dévoiler le fruit de ses recherches : Fise, un moteur sémantique.
Le but d'un moteur sémantique est d'analyser un texte pour en dégager les termes fondamentaux et les lier à des thèmes. Par exemple, le mot "Paris" doit pouvoir être identifiable à une ville en France mais également à une ville de l'Illinois (USA). Dans le premier cas, le moteur devra en plus assimiler "Paris" à la capitale de la France.
En bref, le moteur sémantique s'occupe de classifier des documents : dans quelle langue est-il ? De quoi parle-t-il ? Par quels mots-clefs le caractériser ? Quels sont les documents similaires ?

L'extraction et l'assimilation des données est une branche de l'informatique appelée Natural Language Processing (NLP). Plus couramment, on retrouve cette branche dans les correcteurs orthographiques ; le texte à analyser est "découpé" et chaque mot est comparé à une liste de mots correctement orthographiés dans un fichier.

Le projet IKS



Image utilisateur

Les documents contenant de l'information (pages Web, documents PDF, images) foisonnent sur internet. L'information qui s'y trouve est en général destinée à d'autres lecteurs, et souvent partiellement implicite : les humains s'aideront du contexte pour savoir, par exemple, si "FPS" signifie "Frame Per Seconds" ou "First Person Shooter".

Le W3C développe des outils pour rendre ces informations accessibles plus facilement. Par exemple, la balise HTML <acronym> , qui permet de préciser la signification d'un acronyme tel que FPS, ajoute de l'information sémantique au document : en plus d'être utile pour un lecteur humain, elle peut être utilisée par des outils automatisés pour, par exemple, constituer un lexique à partir d'un document, en repérant toutes les utilisations de cette balise.

Plus généralement, le concept du Web sémantique désigne l'ensemble des technologies qui permettent de rendre les informations d'un document plus explicites, sous des formats standardisés, pour pouvoir les utiliser plus facilement ensuite. On veut pouvoir annoter des documents (qui est la personne sur cette photo ?) et y ajouter de la structure. Cela demande le développement de méthodes pour classifier l'information, définir les relations entre différents objets, etc. Les applications sont multiples : recherche et tri des documents améliorés, résumé automatique de textes, mise en relation avec d'autres documents pertinents... On pense que si ces données sémantiques se démocratisaient sur le Web, un grand nombre d'applications nouvelles apparaîtraient, au point de révolutionner notre usage du web : on parle de Web 3.0.

Malheureusement, les bienfaits promis par le Web sémantique tardent encore à arriver dans nos assiettes : il faut que quelqu'un écrive au départ ces annotations, et les auteurs de documents traînent un peu les pieds. Les moteurs de recherche et les moteurs sémantiques permettent de récupérer une partie des informations de textes non-annotés, et sont donc une bonne base de départ, mais il serait intéressant de fournir aux auteurs de contenus des outils efficaces pour construire directement des documents annotés, sans que cela leur demande beaucoup plus d'effort.

Où mettre en place ces outils ? Tous les systèmes automatisés de gestion de contenu sont susceptibles de les intégrer. Par exemple, sur le Site du Zéro, quand on charge (upload) une image pour l'utiliser dans un post, on peut fournir une légende. C'est une façon d'inciter les auteurs à fournir une information qui pourrait ensuite être présente sous forme d'annotation sémantique.

Ainsi, il existe un grand nombre de logiciels destinés à la gestion du contenu (en général pour sa publication sur le Web ou en intranet) : les CMS. Le projet IKS vise à intégrer les technologies sémantiques dans les CMS déjà existant. Sa stratégie est de développer des outils sémantiques open-source (dont Fise fait partie), et de prendre contact avec les développeurs de CMS existant pour les aider à les intégrer dans leur projet.

Fise : un moteur sémantique

Image utilisateur


Le travail de Fise est tout simplement d'assimiler une information à un thème. Le moteur s'occupe donc de "découper" une phrase et de traiter l'information en suivant plusieurs modèles et architectures. Pour le moment, Fise n'accomplit pas tout le travail d'un moteur sémantique. Il est en perpétuelle recherche et développement. De plus, il ne traite pour le moment que les textes en anglais.
Pour assimiler un mot à un thème, il faut faire une recherche dans une base de données. Le choix s'est notamment porté sur DBpedia, qui procède à une structuration des informations de Wikipédia. Le tout regroupe plus de 3 millions d'entrées, dont 312 000 personnages connus :-° .

Des données structurées avec RDF



Il existe un modèle spécialement conçu pour associer une donnée à une idée : RDF. RDF n'est pas un format de données ni un langage de programmation. C'est un modèle que l'on utilise par exemple en XML pour associer des informations à un thème.

Une donnée RDF est présentée sous la forme d'un triplet {ressource, propriété, valeur}. Ce triplet décrit donc un objet comme une phrase.

Code : XML
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
<?xml version="1.0" encoding="iso-8859-1"?>
<rdf:RDF

     xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
     xmlns:dc="http://purl.org/dc/elements/1.1/">

<rdf:Description

     rdf:about="http://www.siteduzero.com"> <!-- La ressource à décrire est le Site du Zéro -->

<dc:creator>M@teo21</dc:creator> 
<!-- La propriété est creator ; la valeur est M@teo21. 
Autrement dit, M@teo21 est le créateur du site du zéro, dont la ressource est http://www.siteduzero.com -->

<dc:title>Le Site du Zéro</dc:title>
<dc:format>Site Web</dc:format>

</rdf:Description>
</rdf:RDF>


On peut ainsi décrire le Site du Zéro et réutiliser ces valeurs ailleurs. Grâce aux triplets, on peut lier les informations entre elles. Désormais, M@teo21 renvoie à l'auteur http://www.siteduzero.com et réciproquement.

L'utilisation de REST


Fise utilise en partie l'architecture REST qui a été conçue par Roy Fielding, un informaticien américain, également co-fondateur de la fondation Apache.
Chaque document (aussi appelé « ressource »), accessible via une URL (http:// ...), possède une représentation (le code). Pour modifier la ressource, il faut modifier la représentation. Voici un schéma de Jean-Paul Figer, placé sous licence Creative Commons BY-NC-ND :

Image utilisateur


La ressource est ici la météo à Paris. Vous pouvez y accéder grâce à une adresse. La météo est représentée sous forme de données informatiques grâce à du code, auparavant structuré pour faciliter le traitement de l'information.
Autrement dit, on doit pour partie à cette architecture la navigation par liens sur le Web. Le lien donne accès à la représentation, qui va pouvoir être interprétée pour afficher une belle page Web. C'est une architecture avantageuse pour le projet IKS. En effet, si les représentations sont auparavant structurées pour faciliter le traitement de l'information, le moteur sémantique peut accéder à ses bases de données avec des liens et renvoyer le résultat de ses comparaisons.

Démonstration


Image utilisateur

(Cliquer pour agrandir)
Nous avons accès à une version d'expérimentation de Fise. C'est assez surprenant. Si nous tapons par exemple « Ringo Starr was born in Liverpool (England) whereas I was born near Paris (France) », nous allons avoir des informations sur Ringo Starr, sur l'Angleterre, sur la France, ainsi que sur Liverpool et Paris. Vous constaterez sur la capture d'écran ci-contre que Starr a été assimilé à une personne, alors que les noms des pays et des villes à des lieux, sans aucune autre information. C'est toute l'idée d'un moteur sémantique.

D'ailleurs, sur le document RDF/XML de sortie (mis en secret), nous remarquons bien le découpage de Fise et la recherche dans les lexiques appropriés.

Secret (cliquez pour afficher)
Code : XML
  1
  2
  3
  4
  5
  6
  7
  8
  9
 10
 11
 12
 13
 14
 15
 16
 17
 18
 19
 20
 21
 22
 23
 24
 25
 26
 27
 28
 29
 30
 31
 32
 33
 34
 35
 36
 37
 38
 39
 40
 41
 42
 43
 44
 45
 46
 47
 48
 49
 50
 51
 52
 53
 54
 55
 56
 57
 58
 59
 60
 61
 62
 63
 64
 65
 66
 67
 68
 69
 70
 71
 72
 73
 74
 75
 76
 77
 78
 79
 80
 81
 82
 83
 84
 85
 86
 87
 88
 89
 90
 91
 92
 93
 94
 95
 96
 97
 98
 99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
<rdf:RDF
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:j.0="http://purl.org/dc/terms/"
    xmlns:j.1="http://fise.iks-project.eu/ontology/" > 
  <rdf:Description rdf:about="urn:enhancement-64b99ac9-801b-9fde-6f68-0880b22adfe4">
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/TextAnnotation"/>
    <j.0:creator rdf:datatype="http://www.w3.org/2001/XMLSchema#string">eu.iksproject.fise.engines.opennlp.impl.NamedEntityExtractionEnhancementEngine</j.0:creator>
    <j.0:created rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2010-08-31T09:31:42.696+02:00</j.0:created>
    <j.1:extracted-from rdf:resource="urn:content-item-sha1-949b77a4cbb5c1dc8a0f8f26437dcbc2eda5cb37"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/Enhancement"/>
    <j.1:selected-text rdf:datatype="http://www.w3.org/2001/XMLSchema#string">France</j.1:selected-text>
    <j.1:selection-context rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Ringo Starr was born in Liverpool (England) whereas I was born near Paris (France).</j.1:selection-context>
    <j.0:type rdf:resource="http://dbpedia.org/ontology/Place"/>
    <j.1:confidence rdf:datatype="http://www.w3.org/2001/XMLSchema#double">0.9264252674592343</j.1:confidence>
    <j.1:start rdf:datatype="http://www.w3.org/2001/XMLSchema#int">75</j.1:start>
    <j.1:end rdf:datatype="http://www.w3.org/2001/XMLSchema#int">81</j.1:end>
  </rdf:Description>
  <rdf:Description rdf:about="urn:enhancement-c461651a-766d-3e99-b0ee-649d2d896006">
    <j.1:end rdf:datatype="http://www.w3.org/2001/XMLSchema#int">11</j.1:end>
    <j.1:start rdf:datatype="http://www.w3.org/2001/XMLSchema#int">6</j.1:start>
    <j.1:confidence rdf:datatype="http://www.w3.org/2001/XMLSchema#double">0.5533030727395185</j.1:confidence>
    <j.0:type rdf:resource="http://dbpedia.org/ontology/Person"/>
    <j.1:selection-context rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Ringo Starr was born in Liverpool (England) whereas I was born near Paris (France).</j.1:selection-context>
    <j.1:selected-text rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Starr</j.1:selected-text>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/TextAnnotation"/>
    <j.0:creator rdf:datatype="http://www.w3.org/2001/XMLSchema#string">eu.iksproject.fise.engines.opennlp.impl.NamedEntityExtractionEnhancementEngine</j.0:creator>
    <j.0:created rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2010-08-31T09:31:42.694+02:00</j.0:created>
    <j.1:extracted-from rdf:resource="urn:content-item-sha1-949b77a4cbb5c1dc8a0f8f26437dcbc2eda5cb37"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/Enhancement"/>
  </rdf:Description>
  <rdf:Description rdf:about="urn:enhancement-2a9e6b03-8f01-ded3-1b2b-b03d6e9e9217">
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Country"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/PopulatedPlace"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Place"/>
    <j.1:entity-type rdf:resource="http://www.w3.org/2002/07/owl#Thing"/>
    <j.1:confidence rdf:datatype="http://www.w3.org/2001/XMLSchema#double">4.107405185699463</j.1:confidence>
    <j.1:entity-label rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Vichy France</j.1:entity-label>
    <j.1:entity-reference rdf:resource="http://dbpedia.org/resource/Vichy_France"/>
    <j.0:relation rdf:resource="urn:enhancement-64b99ac9-801b-9fde-6f68-0880b22adfe4"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/EntityAnnotation"/>
    <j.0:creator rdf:datatype="http://www.w3.org/2001/XMLSchema#string">eu.iksproject.fise.engines.autotagging.impl.EntityMentionEnhancementEngine</j.0:creator>
    <j.0:created rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2010-08-31T09:31:42.736+02:00</j.0:created>
    <j.1:extracted-from rdf:resource="urn:content-item-sha1-949b77a4cbb5c1dc8a0f8f26437dcbc2eda5cb37"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/Enhancement"/>
  </rdf:Description>
  <rdf:Description rdf:about="urn:enhancement-547074e0-f74b-7031-f84a-a02818bef75c">
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Country"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/PopulatedPlace"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Place"/>
    <j.1:entity-type rdf:resource="http://www.w3.org/2002/07/owl#Thing"/>
    <j.1:confidence rdf:datatype="http://www.w3.org/2001/XMLSchema#double">5.315380096435547</j.1:confidence>
    <j.1:entity-label rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Kingdom of England</j.1:entity-label>
    <j.1:entity-reference rdf:resource="http://dbpedia.org/resource/Kingdom_of_England"/>
    <j.0:relation rdf:resource="urn:enhancement-a5d8ed0e-8405-8787-8f06-a8dcef255d52"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/EntityAnnotation"/>
    <j.0:creator rdf:datatype="http://www.w3.org/2001/XMLSchema#string">eu.iksproject.fise.engines.autotagging.impl.EntityMentionEnhancementEngine</j.0:creator>
    <j.0:created rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2010-08-31T09:31:42.710+02:00</j.0:created>
    <j.1:extracted-from rdf:resource="urn:content-item-sha1-949b77a4cbb5c1dc8a0f8f26437dcbc2eda5cb37"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/Enhancement"/>
  </rdf:Description>
  <rdf:Description rdf:about="urn:enhancement-84442bf5-fcf8-d5f7-44c3-1efb842da0fc">
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/MusicalArtist"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Artist"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Person"/>
    <j.1:entity-type rdf:resource="http://www.w3.org/2002/07/owl#Thing"/>
    <j.1:confidence rdf:datatype="http://www.w3.org/2001/XMLSchema#double">4.024414539337158</j.1:confidence>
    <j.1:entity-label rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Ringo Starr</j.1:entity-label>
    <j.1:entity-reference rdf:resource="http://dbpedia.org/resource/Ringo_Starr"/>
    <j.0:relation rdf:resource="urn:enhancement-c461651a-766d-3e99-b0ee-649d2d896006"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/EntityAnnotation"/>
    <j.0:creator rdf:datatype="http://www.w3.org/2001/XMLSchema#string">eu.iksproject.fise.engines.autotagging.impl.EntityMentionEnhancementEngine</j.0:creator>
    <j.0:created rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2010-08-31T09:31:42.714+02:00</j.0:created>
    <j.1:extracted-from rdf:resource="urn:content-item-sha1-949b77a4cbb5c1dc8a0f8f26437dcbc2eda5cb37"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/Enhancement"/>
  </rdf:Description>
  <rdf:Description rdf:about="urn:enhancement-55003c4e-8abb-d7b9-ac76-ab89a0a66089">
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Country"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/PopulatedPlace"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Place"/>
    <j.1:entity-type rdf:resource="http://www.w3.org/2002/07/owl#Thing"/>
    <j.1:confidence rdf:datatype="http://www.w3.org/2001/XMLSchema#double">10.22369384765625</j.1:confidence>
    <j.1:entity-label rdf:datatype="http://www.w3.org/2001/XMLSchema#string">France</j.1:entity-label>
    <j.1:entity-reference rdf:resource="http://dbpedia.org/resource/France"/>
    <j.0:relation rdf:resource="urn:enhancement-64b99ac9-801b-9fde-6f68-0880b22adfe4"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/EntityAnnotation"/>
    <j.0:creator rdf:datatype="http://www.w3.org/2001/XMLSchema#string">eu.iksproject.fise.engines.autotagging.impl.EntityMentionEnhancementEngine</j.0:creator>
    <j.0:created rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2010-08-31T09:31:42.736+02:00</j.0:created>
    <j.1:extracted-from rdf:resource="urn:content-item-sha1-949b77a4cbb5c1dc8a0f8f26437dcbc2eda5cb37"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/Enhancement"/>
  </rdf:Description>
  <rdf:Description rdf:about="urn:enhancement-0e540bb5-9136-afae-aabf-46505f1854b0">
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/Enhancement"/>
    <j.1:extracted-from rdf:resource="urn:content-item-sha1-949b77a4cbb5c1dc8a0f8f26437dcbc2eda5cb37"/>
    <j.0:created rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2010-08-31T09:31:42.699+02:00</j.0:created>
    <j.0:creator rdf:datatype="http://www.w3.org/2001/XMLSchema#string">eu.iksproject.fise.engines.autotagging.impl.EntityMentionEnhancementEngine</j.0:creator>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/EntityAnnotation"/>
    <j.0:relation rdf:resource="urn:enhancement-1b4c81d1-3d9c-12d4-79f6-0cd3aa6c22e2"/>
    <j.1:entity-reference rdf:resource="http://dbpedia.org/resource/Paris"/>
    <j.1:entity-label rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Paris</j.1:entity-label>
    <j.1:confidence rdf:datatype="http://www.w3.org/2001/XMLSchema#double">7.056663990020752</j.1:confidence>
    <j.1:entity-type rdf:resource="http://www.w3.org/2002/07/owl#Thing"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Place"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/WorldHeritageSite"/>
  </rdf:Description>
  <rdf:Description rdf:about="urn:enhancement-a6436412-2f97-20ef-6be4-144082e0ffab">
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/Enhancement"/>
    <j.1:extracted-from rdf:resource="urn:content-item-sha1-949b77a4cbb5c1dc8a0f8f26437dcbc2eda5cb37"/>
    <j.0:created rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2010-08-31T09:31:42.699+02:00</j.0:created>
    <j.0:creator rdf:datatype="http://www.w3.org/2001/XMLSchema#string">eu.iksproject.fise.engines.autotagging.impl.EntityMentionEnhancementEngine</j.0:creator>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/EntityAnnotation"/>
    <j.0:relation rdf:resource="urn:enhancement-1b4c81d1-3d9c-12d4-79f6-0cd3aa6c22e2"/>
    <j.1:entity-reference rdf:resource="http://dbpedia.org/resource/Paris_Saint-Germain_F.C."/>
    <j.1:entity-label rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Paris Saint-Germain F.C.</j.1:entity-label>
    <j.1:confidence rdf:datatype="http://www.w3.org/2001/XMLSchema#double">2.6647486686706543</j.1:confidence>
    <j.1:entity-type rdf:resource="http://www.w3.org/2002/07/owl#Thing"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Stadium"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Building"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/SoccerClub"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Place"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Organisation"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/SportsTeam"/>
  </rdf:Description>
  <rdf:Description rdf:about="urn:enhancement-15ccfad8-4aa2-40ee-ecd0-12f44f4c20a2">
    <j.1:extracted-from rdf:resource="urn:content-item-sha1-949b77a4cbb5c1dc8a0f8f26437dcbc2eda5cb37"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/Enhancement"/>
    <j.0:created rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2010-08-31T09:31:42.696+02:00</j.0:created>
    <j.0:creator rdf:datatype="http://www.w3.org/2001/XMLSchema#string">eu.iksproject.fise.engines.opennlp.impl.NamedEntityExtractionEnhancementEngine</j.0:creator>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/TextAnnotation"/>
    <j.1:selected-text rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Liverpool</j.1:selected-text>
    <j.1:selection-context rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Ringo Starr was born in Liverpool (England) whereas I was born near Paris (France).</j.1:selection-context>
    <j.0:type rdf:resource="http://dbpedia.org/ontology/Place"/>
    <j.1:confidence rdf:datatype="http://www.w3.org/2001/XMLSchema#double">0.8472282501662581</j.1:confidence>
    <j.1:start rdf:datatype="http://www.w3.org/2001/XMLSchema#int">24</j.1:start>
    <j.1:end rdf:datatype="http://www.w3.org/2001/XMLSchema#int">33</j.1:end>
  </rdf:Description>
  <rdf:Description rdf:about="urn:enhancement-a5d8ed0e-8405-8787-8f06-a8dcef255d52">
    <j.1:end rdf:datatype="http://www.w3.org/2001/XMLSchema#int">42</j.1:end>
    <j.1:start rdf:datatype="http://www.w3.org/2001/XMLSchema#int">35</j.1:start>
    <j.1:confidence rdf:datatype="http://www.w3.org/2001/XMLSchema#double">0.7370893254925003</j.1:confidence>
    <j.0:type rdf:resource="http://dbpedia.org/ontology/Place"/>
    <j.1:selection-context rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Ringo Starr was born in Liverpool (England) whereas I was born near Paris (France).</j.1:selection-context>
    <j.1:selected-text rdf:datatype="http://www.w3.org/2001/XMLSchema#string">England</j.1:selected-text>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/TextAnnotation"/>
    <j.0:creator rdf:datatype="http://www.w3.org/2001/XMLSchema#string">eu.iksproject.fise.engines.opennlp.impl.NamedEntityExtractionEnhancementEngine</j.0:creator>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/Enhancement"/>
    <j.1:extracted-from rdf:resource="urn:content-item-sha1-949b77a4cbb5c1dc8a0f8f26437dcbc2eda5cb37"/>
    <j.0:created rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2010-08-31T09:31:42.696+02:00</j.0:created>
  </rdf:Description>
  <rdf:Description rdf:about="urn:enhancement-d7ff888c-b3f5-f618-38c1-9f72b0f362c0">
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Country"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/PopulatedPlace"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Place"/>
    <j.1:entity-type rdf:resource="http://www.w3.org/2002/07/owl#Thing"/>
    <j.1:confidence rdf:datatype="http://www.w3.org/2001/XMLSchema#double">4.091716766357422</j.1:confidence>
    <j.1:entity-label rdf:datatype="http://www.w3.org/2001/XMLSchema#string">New France</j.1:entity-label>
    <j.1:entity-reference rdf:resource="http://dbpedia.org/resource/New_France"/>
    <j.0:relation rdf:resource="urn:enhancement-64b99ac9-801b-9fde-6f68-0880b22adfe4"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/EntityAnnotation"/>
    <j.0:creator rdf:datatype="http://www.w3.org/2001/XMLSchema#string">eu.iksproject.fise.engines.autotagging.impl.EntityMentionEnhancementEngine</j.0:creator>
    <j.0:created rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2010-08-31T09:31:42.736+02:00</j.0:created>
    <j.1:extracted-from rdf:resource="urn:content-item-sha1-949b77a4cbb5c1dc8a0f8f26437dcbc2eda5cb37"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/Enhancement"/>
  </rdf:Description>
  <rdf:Description rdf:about="urn:enhancement-1b4c81d1-3d9c-12d4-79f6-0cd3aa6c22e2">
    <j.1:end rdf:datatype="http://www.w3.org/2001/XMLSchema#int">73</j.1:end>
    <j.1:start rdf:datatype="http://www.w3.org/2001/XMLSchema#int">68</j.1:start>
    <j.1:confidence rdf:datatype="http://www.w3.org/2001/XMLSchema#double">0.9995319155020848</j.1:confidence>
    <j.0:type rdf:resource="http://dbpedia.org/ontology/Place"/>
    <j.1:selection-context rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Ringo Starr was born in Liverpool (England) whereas I was born near Paris (France).</j.1:selection-context>
    <j.1:selected-text rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Paris</j.1:selected-text>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/TextAnnotation"/>
    <j.0:creator rdf:datatype="http://www.w3.org/2001/XMLSchema#string">eu.iksproject.fise.engines.opennlp.impl.NamedEntityExtractionEnhancementEngine</j.0:creator>
    <j.0:created rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2010-08-31T09:31:42.696+02:00</j.0:created>
    <j.1:extracted-from rdf:resource="urn:content-item-sha1-949b77a4cbb5c1dc8a0f8f26437dcbc2eda5cb37"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/Enhancement"/>
  </rdf:Description>
  <rdf:Description rdf:about="urn:enhancement-fe6a41e7-2a6f-9fbe-f527-5a14e45c38ec">
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Area"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/PopulatedPlace"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Place"/>
    <j.1:entity-type rdf:resource="http://www.w3.org/2002/07/owl#Thing"/>
    <j.1:confidence rdf:datatype="http://www.w3.org/2001/XMLSchema#double">10.670327186584473</j.1:confidence>
    <j.1:entity-label rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Liverpool</j.1:entity-label>
    <j.1:entity-reference rdf:resource="http://dbpedia.org/resource/Liverpool"/>
    <j.0:relation rdf:resource="urn:enhancement-15ccfad8-4aa2-40ee-ecd0-12f44f4c20a2"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/EntityAnnotation"/>
    <j.0:creator rdf:datatype="http://www.w3.org/2001/XMLSchema#string">eu.iksproject.fise.engines.autotagging.impl.EntityMentionEnhancementEngine</j.0:creator>
    <j.0:created rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2010-08-31T09:31:42.724+02:00</j.0:created>
    <j.1:extracted-from rdf:resource="urn:content-item-sha1-949b77a4cbb5c1dc8a0f8f26437dcbc2eda5cb37"/>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/Enhancement"/>
  </rdf:Description>
  <rdf:Description rdf:about="urn:enhancement-16db2016-31b6-3fd2-15b9-fffc44e489cc">
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/Enhancement"/>
    <j.1:extracted-from rdf:resource="urn:content-item-sha1-949b77a4cbb5c1dc8a0f8f26437dcbc2eda5cb37"/>
    <j.0:created rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2010-08-31T09:31:42.710+02:00</j.0:created>
    <j.0:creator rdf:datatype="http://www.w3.org/2001/XMLSchema#string">eu.iksproject.fise.engines.autotagging.impl.EntityMentionEnhancementEngine</j.0:creator>
    <rdf:type rdf:resource="http://fise.iks-project.eu/ontology/EntityAnnotation"/>
    <j.0:relation rdf:resource="urn:enhancement-a5d8ed0e-8405-8787-8f06-a8dcef255d52"/>
    <j.1:entity-reference rdf:resource="http://dbpedia.org/resource/England"/>
    <j.1:entity-label rdf:datatype="http://www.w3.org/2001/XMLSchema#string">England</j.1:entity-label>
    <j.1:confidence rdf:datatype="http://www.w3.org/2001/XMLSchema#double">13.279783248901367</j.1:confidence>
    <j.1:entity-type rdf:resource="http://www.w3.org/2002/07/owl#Thing"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Place"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/PopulatedPlace"/>
    <j.1:entity-type rdf:resource="http://dbpedia.org/ontology/Country"/>
  </rdf:Description>
</rdf:RDF>


Par exemple, une des recherches se fait ici dans le document http://dbpedia.org/ontology/Country. Suivant l'architecture REST, cette URL va fournir une représentation, que le moteur va pouvoir utiliser pour effectuer des recherches dans la base de données :) . D'ailleurs, au survol du lien Ringo Starr, nous apercevons une brève description du personnage, identique à celle de Wikipédia.
Tout ceci n'est qu'en version d'essai, mais IKS espère désormais implémenter son moteur dans tous les CMS ralliés au projet afin de pouvoir enfin passer au Web 3.0.

Liens et sources


Image utilisateur
Roy Fielding


IKS & Fise



L'architecture REST :



Autre


26 Participations

Pour accéder à cette section
Connectez-vous !
connexion_rpx
Page 1 
Pseudo Discussion
1 visiteur sur cette news (0 membre et 1 Anonyme)
Page 1 
Hors ligne Edmeral # Posté le 05/09/2010 à 19:17:15
Ulquiorra ♥ Ubuntu !
Avatar

Ville : Meknès
Pays : Maroc

Un nouveau pas vers le Web 3.0 ;)



 
Hors ligne neowillow # Posté le 05/09/2010 à 19:19:17
(/◔ ◡ ◔)/
Avatar
Groupe : Anciens

Bonne news. Par contre juste une faute que j'ai signalée [Corrigée] :

Citation : News
Plus généralement, le concept de Web sémantique

Vive le libre ! :-°

#LGDF: victor vaincra !
« Ce n'est pas parce que l'erreur se propage qu'elle devient vérité. Gandhi »
Statistiques mondiales en temps réel. - FAQ C - The C LRG - FAQ Java - Python - OCaml - quoi.info - La France vue par différentes populations




 
Hors ligne Princeps # Posté le 05/09/2010 à 19:19:29
Avatar

News très intéressante, qui aborde un sujet que je ne connaissais pas.

A mon avis, ce genre de moteur de recherche pourrait à terme concurrencer Google (sauf que google vas probablement s'y mettre aussi).

Je testerai ce moteur de recherche dès que j'aurai un exposé à faire.

Merci beaucoup pour cette bonne longue news j'ai appris pleins de trucs.

EDIT: Ah oui quelques points que j'avais oublié :

Vive le libre!!!

J'avais jamais entendu parlé du web 3.0 encore un truc que j'aurai appris.

EDIT2 : <hs> C'est moi ou la page d'accueil du sdz est inaccessible?</hs>C'est revenu.

« le nucléaire, c'est l'énergie du désespoir » - « L’erreur est humaine, mais un vrai désastre nécessite un ordinateur. »
« Le jour où microsoft fera un truc qui ne plante pas, ce sera un clou! » - « Même Chuck Norris ne peut pas compter tous les bugs de Windows! »
Fourmicosme, jeu par navigateur gratuit dans le monde des fourmis 22 janvier 2012 : La version 1.0 finale de Fourmicosme est sortie !
Fourmicosme un nouveau jeu par navigateur, de stratégie, gratuit, innovant, fait par des lycéens sur le thème des fourmis. Lire l'Histoire, le Guide, les Projets ou le sujet sur le sdz de Fourmicosme.
Passez au moins voir svp, pour aider un petit jeu à démarrer. Donnez aussi votre avis, surtout si vous aimez pas (donnez des raisons).


Image utilisateur
Image utilisateur
Image utilisateur
Princeps alias Le loup des nues (changement de pseudo le 8/05/2010)
 
Hors ligne cypher666 # Posté le 05/09/2010 à 19:39:40
Heu....
Avatar

Ville : Paris
Pays : France métropolitaine
Études : EPITA

Je pense que web 3.0 viens juste d'être inventé par Edmeral ^^

A vaincre sans périls... On évite les ennuis ;)
 
Hors ligne qwerty # Posté le 05/09/2010 à 19:49:44
"2 virgule 21 gigowatts ?!"
Avatar
Groupe : Bannis

Un nouveau moyen de trouver des infos ?
 
Hors ligne guillaumedu95 # Posté le 05/09/2010 à 19:57:57
Honni soit qui mal y pense
Avatar

Ville : Bron
Pays : France métropolitaine

Le principe à l'air interessant, mais faudrait il que tous les contenus soient changés pour faciliter l'automatisation ?

Image utilisateur

Image utilisateur
 
Hors ligne Dark Ghost # Posté le 05/09/2010 à 20:02:32
NanoVoxel
Avatar
Flux RSS

Ville : Arles
Pays : France métropolitaine
Études : IUT de Provence, site d'Arles

Le Web Sémantique... J'en avais déjà entendu parlé, je crois même que c'était sur le site du zéro, un site web basé sur le même principe je crois, j'avais testé en tapant Iron Man 2 et j'avais eu toutes les infos sur le film, du comic aux compositeurs des musiques ! C'est vrai que c'est très puissant, j'espère que ce "Web 3.0" arrivera bientôt ! ^^

En attendant, vive le libre ! :)
 
Hors ligne SkyZ13 # Posté le 05/09/2010 à 20:15:25
Le pourquoi du comment ?
Avatar

Je découvre ça, cela a l'air très intéressant

Signature ici
 
Hors ligne romio # Posté le 05/09/2010 à 20:37:17

Citation : Dark Ghost
Le Web Sémantique... J'en avais déjà entendu parlé, je crois même que c'était sur le site du zéro, un site web basé sur le même principe je crois, j'avais testé en tapant Iron Man 2 et j'avais eu toutes les infos sur le film, du comic aux compositeurs des musiques ! C'est vrai que c'est très puissant, j'espère que ce "Web 3.0" arrivera bientôt ! ^^

En attendant, vive le libre ! :)



serait-ce WolframAlpha ??

http://www.wolframalpha.com/
Hors ligne Scronchh # Posté le 05/09/2010 à 21:05:28
Avatar

Très bonne news, dommage qu'elle soit masquée par celle des clés USB sdz :(
Hors ligne Aurenae # Posté le 05/09/2010 à 21:14:38
God is wearing black
Avatar
Groupe : Bannis

Interressant...

Le pouvoir de l'argent fera le désespoir des hommes.... :(
Je ne désespère pas qu'ils trouvent ce à quoi mon cœur a toujours aspiré.
Mais cette paix est un trop grand trésor pour eux, ils devront passer par la haine et son fléau de guerre.
Et sans aucun doute par la douleur.
Aurenae
 
Hors ligne Dark Ghost # Posté le 05/09/2010 à 22:33:15
NanoVoxel
Avatar
Flux RSS

Ville : Arles
Pays : France métropolitaine
Études : IUT de Provence, site d'Arles

Citation : romio
serait-ce WolframAlpha ??

http://www.wolframalpha.com/

Oui un truc du genre, mais pas celui-là ! Ça y ressemblait beaucoup en tout cas !
 
Hors ligne Maxibolt # Posté le 06/09/2010 à 00:12:26
E Ultreïa
Avatar
Groupe : Bannis

Ne confondez pas fise et google hein, ce n'est pas vraiment un moteur de recherche.

« J'entends par "valeur publique" ce qui fut le sens de l'honneur, puis le sens du sacré, puis la "bonne morale" de la IIIeme, et qui est actuellement "5 fruits et légumes par jour", et "penser à mettre une capote" »

Statistiques de l'activité sur les forums du sdz.
 
Hors ligne bluestorm # Posté le 06/09/2010 à 00:21:17
dont ask to ask
Avatar
Groupe : Anciens
Flux RSS

Deux remarque.

D'une part, je pense qu'il ne faut pas forcément, comme je l'ai vu dans plusieurs commentaires, comparer les moteurs sémantique (comme Fise) et les moteurs de recherche (comme Google). Ce sont deux outils qui ont des buts très différents : Fise sert à déterminer, dans un document donné, les choses désignées par le texte, alors que Google cherche à déterminer dans un grand nombre de documents, la pertinence de chacun par rapport à une question donnée.

Bref, le moteur sémantique est là pour enrichir des documents avec des informations sémantiques. C'est un procédé local. Un moteur de recherche comme Google peut s'aider de ces informations pour affiner ses recherches (d'ailleurs ils le font sûrement un peu déjà), mais ce n'est qu'un exemple parmi l'ensemble des applications qui seront plus faciles ou plus efficaces quand des informations sémantiques seront facilement disponible pour chaque document.


D'autre part, je ne me considère pas vraiment comme un auteur de la news : j'ai donné mon avis à Etienne-02, et proposé une rédaction pour une partie. Ce n'est pas grand chose par rapport au travail de recherche, de documentation, etc. et les différentes réécritures qu'il a dû effectuer pour cette news.
 
Hors ligne La source # Posté le 06/09/2010 à 07:45:21
où, quoi, comment ?
Avatar

Ville : Gembloux
Pays : Belgique

Citation : Scronchh
Très bonne news, dommage qu'elle soit masquée par celle des clés USB sdz :(


+1 ...

Cherchez pas, l'erreur vient de vous ! (99.9% des erreurs sont entre la chaise et le clavier)
Utilisez votre tête et pas vos pieds pour réfléchir >_<
 
Hors ligne softdounia # Posté le 06/09/2010 à 14:47:15
A
Avatar

Ville : Alger
Pays : Algérie
Études : ETS Montréal

:magicien:

Les 40e rugissants et les 50e hurlants. o_O --> Brainstorming --> CamelCase
Image utilisateur

-------------
"je crois qu'on ne peut mieux vivre qu'en chercant à devenir meilleur, ni plus agréablement qu'en ayant pleine conscience de son amélioration"
Socrate >_<
-------------
les meilleurs peintres se sont fait dire qu’ils n’étaient pas bon, aujourd’hui ce sont des Dieux!
-------------
RTFM :-° l'expression anglaise d'argot Internet Read the fucking manual (« Lis le foutu manuel ») ;
-------------
Mon CV en ligne ici
 
Hors ligne Kev2a # Posté le 06/09/2010 à 15:10:28
Demacia !
Avatar

Ville : Ajaccio
Pays : France métropolitaine
Études : EPITA

La correction d'orthographe syntaxique et sémantique c'est le futur. ;)

Epita Promo 2014
ING1
Projet de Sup : Team Deity Crew - aMAZEing Escape
Image utilisateur
 
Hors ligne Marg51 # Posté le 06/09/2010 à 16:18:22

Avatar

Ville : Saint pierre de boeuf
Pays : France métropolitaine

C'est très interessant =)

user powered by Image utilisateur
 
Hors ligne Etienne # Posté le 06/09/2010 à 18:25:16
Have you mooed today ?
Avatar
Groupe : Anciens

Citation : bluestorm

D'autre part, je ne me considère pas vraiment comme un auteur de la news : j'ai donné mon avis à Etienne-02, et proposé une rédaction pour une partie. Ce n'est pas grand chose par rapport au travail de recherche, de documentation, etc. et les différentes réécritures qu'il a dû effectuer pour cette news.


Il a corrigé des énormités, refondu la news, en a rédigé une bonne moitié... modeste bluestorm ^^
Hors ligne Princeps # Posté le 06/09/2010 à 18:32:21
Avatar

Citation : bluestorm
Deux remarque.

D'une part, je pense qu'il ne faut pas forcément, comme je l'ai vu dans plusieurs commentaires, comparer les moteurs sémantique (comme Fise) et les moteurs de recherche (comme Google). Ce sont deux outils qui ont des buts très différents : Fise sert à déterminer, dans un document donné, les choses désignées par le texte, alors que Google cherche à déterminer dans un grand nombre de documents, la pertinence de chacun par rapport à une question donnée.

Bref, le moteur sémantique est là pour enrichir des documents avec des informations sémantiques. C'est un procédé local. Un moteur de recherche comme Google peut s'aider de ces informations pour affiner ses recherches (d'ailleurs ils le font sûrement un peu déjà), mais ce n'est qu'un exemple parmi l'ensemble des applications qui seront plus faciles ou plus efficaces quand des informations sémantiques seront facilement disponible pour chaque document.


Merci des précisions, j'avais un peu tout mélangé.

« le nucléaire, c'est l'énergie du désespoir » - « L’erreur est humaine, mais un vrai désastre nécessite un ordinateur. »
« Le jour où microsoft fera un truc qui ne plante pas, ce sera un clou! » - « Même Chuck Norris ne peut pas compter tous les bugs de Windows! »
Fourmicosme, jeu par navigateur gratuit dans le monde des fourmis 22 janvier 2012 : La version 1.0 finale de Fourmicosme est sortie !
Fourmicosme un nouveau jeu par navigateur, de stratégie, gratuit, innovant, fait par des lycéens sur le thème des fourmis. Lire l'Histoire, le Guide, les Projets ou le sujet sur le sdz de Fourmicosme.
Passez au moins voir svp, pour aider un petit jeu à démarrer. Donnez aussi votre avis, surtout si vous aimez pas (donnez des raisons).


Image utilisateur
Image utilisateur
Image utilisateur
Princeps alias Le loup des nues (changement de pseudo le 8/05/2010)
 
Hors ligne Dexyne # Posté le 06/09/2010 à 19:01:24
Prog' & Graphisme PoWa =D
Avatar

Ville : Coulommiers
Pays : France métropolitaine
Études : BTS IG Melun

Sympa tout ça c'est intéressant à savoir.

Je vais voir pour en savoir encore d'avantage. :D
Hors ligne planete.game57 # Posté le 06/09/2010 à 20:53:26
Avatar

Études : IRIS

News très riche et instructive.

Merci beaucoup à bluestorm et Etienne-02. ;)

xHTML/CSS |||||||||| 100% | PHP/MySQL |||||||||| 100% | Langage C |||||||||| 8.5%
Python |||||||||| 100% | JavaScript |||||||||| 5.5% | Photoshop |||||||||| 0.0%
Smarty |||||||||| 100%

Image utilisateurImage utilisateur
 
Hors ligne Triviak # Posté le 06/09/2010 à 22:35:21
vous aime !
Avatar

News très intéressante. Elle m'a permis de découvrir plusieurs notions dont le web 3.0 ou encore les moteurs sémantiques.

Bravo !

Image utilisateur Image utilisateur Image utilisateur Image utilisateur Image utilisateur
Image utilisateur
 
Hors ligne basco # Posté le 07/09/2010 à 14:54:54
Avatar

C'est un peu comme "Roue magique" avec google ! Non ?

- Je n'ai pas la solution, mais j'admire le problème...
 
Hors ligne pierreyoda # Posté le 07/09/2010 à 16:51:35
Avatar

Très intéressant!

En gros, on pourrait s'en servir pour "résumer" (du moins les thèmes) un texte automatiquement?
Hors ligne Etienne # Posté le 07/09/2010 à 18:43:19
Have you mooed today ?
Avatar
Groupe : Anciens

C'est tout à fait ça pierreyoda.
Pour accéder à cette section
Connectez-vous !
connexion_rpx

Revenir à la liste des news