Article réservé aux abonnés Archimag.com

Comparatif - Text mining : le non structuré va parler

Le text mining selon Temis. Temis

 

L'abondance d'informations numériques devient un problème du fait de leur manque de structure et de classement. Les solutions de texte mining, ou fouille de textes, sont là pour analyser les documents textuels et y reconnaître les informations utiles, dans un but d’accès au contenu pertinent et de valorisation.

« De plus en plus de gens soulignent le problème de la non structure des données. Les volumes doublent tous les deux ans. Que puis-je conserver, jeter ? Comment retrouver la bonne information ? Nos clients se posent une multitude de questions qui restent pour eux un mystère », explique Daniel Mayer, vice-président marketing chez Temis, éditeur français de la solution de fouille de textes Luxid.

Structurer les données pour mieux gérer et valoriser les contenus est l’objet des solutions de text mining. Une solution de text mining utilise un vocabulaire de référence qui lui permet de repérer les mots voulus dans les textes qui lui sont soumis – ce qui n’exclut pas...

Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
Les podcasts d'Archimag
La mise à disposition des décisions de justice en Open Data a vu le jour grâce à la loi pour une République numérique votée en 2016. Les articles 20 et 21 prévoient la mise en open data des quatre millions de décisions de justice produites chaque année par les tribunaux français. Camille Girard-Chanudet est chercheuse en sociologie au sein du Centre d’étude des mouvements sociaux. En 2023, elle a soutenu une thèse devant l’École des hautes études en sciences sociales (EHESS) : "La justice algorithmique en chantier, sociologie du travail et des infrastructures de l’intelligence artificielle". Dans ce cadre elle a rencontré les équipes de la Cour de cassation qui procèdent à l’anonymisation des décisions de justice.