publicité
Accueil Archimag > magazines > Archimag n°224 > "les moteurs n'exploitent pas à fond la sémantique"


DR - jean-Luc Minel est professeur des universités, directeur du laboratoire Modyco, unité mixte de recherche qui dépend de l'université Paris Ouest-Nanterre-La Défense et du CNRS, comprenant plus de soixante permanents spécialistes des sciences du langage et d'une centaine de doctorants.

« les moteurs n’exploitent pas à fond la sémantique »

propos recueillis par patrick brébion
archimag - mai 2009

Si les possibilités de l’analyse sémantique textuelle sont encore loin d’être opérationnelles, quelques projets « verticaux » se mettent en place. Rencontre avec le professeur Jean Luc Minel.

Les technologies utilisées dans le traitement automatique des langues progressent. Notamment l’approche sémantique. Que recouvre ce terme ?

le terme mérite avant tout clarification quant à son emploi. L’acte de naissance de la sémantique est généralement attribué à M. Bréal, linguiste de la fin du XIXe siècle, avec son ouvrage Essai de sémantique, comme la discipline s’occupant des « lois qui président à la transformation du sens ». Cette définition très générale a donné lieu à différentes approches comme la sémantique formelle, la sémantique lexicale, etc. Par ailleurs, il est de tradition de distinguer plusieurs paliers dans l’analyse sémantique, allant du palier du lexème – un mot du lexique – à celui du syntagme – un groupe de mots –, puis du texte – un ensemble de phrases reliées par des liens sémantiques, voire rhétoriques.

Comment se traduisent les avancées sur le terrain ?

Pour l’instant, l’intérêt des entreprises qui développent de moteurs de recherche ne porte que sur une part réduite des possibilités de l’analyse sémantique. Cette dernière permet de formaliser de nombreux type de relations. Les logiciels se cantonnent à ce jour à des relations de synonymies ou d’hyperonymie dans quelques ontologies, dans le but de répondre aux questions des internautes.

Est-ce la première brique de ce que l’on appelle communément le web sémantique ?

 Le web sémantique a focalisé les recherches sur les notions de concepts organisés dans des ontologies à l’aide de relations sémantiques. À ce propos, il convient de remarquer que Tim Berners- Lee, qui anime le consortium du W3C en charge de l’évolution du web, déclare : « Le terme sémantique prête un peu à confusion car la sémantique s’intéresse au sens du langage pour en déduire des constructions logiques ». Du coup, certains ont pensé qu’il s’agissait d’un web qui permettrait d’effectuer des recherches en langage naturel. Or ce n’est pas son but. En fait nous aurions dû l’appeler dès le départ « web de données » (La Recherche, n° 413, p. 35). Dans le même entretien, Tim Berners-Lee insiste sur l’importance de la catégorisation des données : « Nous avons inventé un outil pour formaliser la description de ces données, RDF [resource data frameworks]. […] RDF permet de relier une donnée à une catégorie. Et ces catégories sont elles-mêmes définies avec le langage OWL [web ontology language] dans des dictionnaires spécialisés par domaine, des ontologies qui sont en cours d’élaboration ». En résumé, dans le web sémantique, l’accent est mis sur l’existence d’un langage formel de représentation des connaissances favorisant le partage par des applications informatiques des concepts décrivant un domaine. La définition de ces concepts, qui privilégie l’aspect lexical, associée à l’expression des relations sémantiques qui les lient, constitue ainsi le modèle conceptuel.

pour lire la suite...

Acheter ce numéro en version électronique Acheter ce numéro en version papier
    Envoyer &agrave un ami
 

Flux RSS IT : Ajouter à Netvibes - Ajouter à Google

<

Flux RSS Métier : Ajouter à Netvibes - Ajouter à Google

<

Flux RSS livres blancs : Ajouter à Netvibes - Ajouter à Google

<

Flux RSS derniere minute : Ajouter à Netvibes - Ajouter à Google

<