Une de mes contacts m’a indiquée souhaiter distinguer dans Wikidata « Robinson Crusoé » en tant que titre d’un livre, de « Robinson Crusoé » en tant que personnage de fiction.
Au 4/8/2024, une recherche sur wikidata.org donne de nombreux résultats. Le saisie dans le champ de recherche donne comme premier élément dans la liste déroulante d’aide à la saisie l’entité Q483034, avec la description ‘roman de Daniel Defoe, publié en 1719’. Cette entité a été créée en 2012.
Les résultats de la recherche contiennent divers éléments comme un opéra, une série télé, des films, des bandes dessinées … pas ordonnés suivant une pertinence très convaincante!
On trouve aussi dans la liste Q12292447, décrit comme étant un personnage de fiction. Cette entité a été créée en 2013.
Le rapprochement des deux entités mentionnées ci-dessus donne un bon exemple de façon de distinguer deux entités qui utilisent un même label « Robinson Crusoé » mais désignent des éléments conceptuellement différents: un personnage de fiction et un livre qui traite de ce personnage.
En particulier, le personnage Q12292447 est relié à l’œuvre Q483034 par la propriété P1441 « présent dans l’œuvre« . L’œuvre Q483034 est reliée au personnage Q12292447 par la propriété P674 « personnages« .
Via l’interface d’interrogation plus technique, WDQS, qui permet d’interroger Wikidata avec le langage d’interrogation SPARQL, la requête:
select * where { ?s rdfs:label "Robinson Crusoé"@fr }
donne 8 résultats. Elle pourrait s’énoncer en langage courant ‘donne moi les entités de Wikidata qui ont pour label en français "Robinson Crusoé"
. En complétant avec le type des éléments
select ?s ?type where { ?s rdfs:label « Robinson Crusoé »@fr; wdt:P31 ?type }
on peut distinguer des autres les deux entités auxquelles on s’est intéressé précédemment. Par exemple, Q12292447 a pour type Q15632617 (être humain de fiction); Q483034 a pour type Q7725634 (œuvre littéraire). Pour les autres entités trouvées avec le label "Robinson Crusoé"
, on trouve des types comme ‘film’, ‘film d’animation’, ‘œuvre dramatico-musicale’, …
Ainsi, on peut distinguer des entités ayant un même label. Pour un traitement de type ‘reconnaissance d’entité nommées’ dans un texte, la distinction devra tenir compte du contexte pour déterminer si le texte évoque plutôt le personnage, l’œuvre littéraire, un film, une bande dessinée …
Laisser un commentaire