Twitter s’archive à la bibliothèque du Congrès américain

Le Thomas Jefferson Building, le plus ancien des trois bâtiments qui composent la bibliothèque du Congrès américain. cliff1066™

 

La bibliothèque du Congrès américain dresse un premier bilan du projet d’archivage des messages diffusés sur Twitter depuis la création du réseau social en 2006. Bien que constituées de 140 caractères au maximum, ces archives atypiques constituent un fonds… de poids !

Le 7 décembre dernier, l’accord permettant l’archivage des messages diffusés sur Twitter, depuis sa création en 2006, par la bibliothèque du Congrès américain était enfin scellé. La plus ancienne institution culturelle fédérale des Etats-Unis avait annoncé le lancement de l’opération en avril 2010. Un état des lieux de ce projet d’archivage original vient d’être publié par l’institution de Washington.

170 milliards de messages

A raison de 400 millions de tweets publiés chaque jour sur le célèbre réseau social (contre 140 millions en février 2011), ce sont, au total, plus de 170 milliards de messages de 140 caractères qui sont archivés électroniquement par la bibliothèque du Congrès. C’est par l’intermédiaire d’une socitété du Colorado, Gnip, que Twitter a fait "don" de ses tweets, et c’est désormais en flux continu que les "petites" archives viennent remplir, chaque jour, ce fonds d’un genre nouveau... lequel pèse près de 133 000 gigaoctets !

Inaccessibles pour le moment

L’exploitation des données récoltées pose malgré tout quelques problèmes : difficiles à trier, elles supposent une indexation permanente, le concours de nombreux ingénieurs ou encore l’utilisation de plusieurs centaines de serveurs. Des contraintes onéreuses qui poussent la bibliothèque du Congrès à envisager de faire appel au soutien du secteur privé. En effet, l’institution américaine n’a, pour le moment, pas été en mesure de répondre aux demandes de chercheurs qui l’ont sollicitée depuis le début du processus d’archivage, en 2010.

Protection de la vie privée

Si les messages effacés ou protégés sont écartés du projet, il faut savoir également que les tweets archivés ne seront réellement accessibles qu’après 6 mois de publication. Si seuls vos propres messages vous intéressent, l’option lancée par Twitter en décembre dernier permettant d’archiver, cette fois-ci, uniquement ses propres tweets, pourra peut-être vous suffire !

Les podcasts d'Archimag
Rencontre avec Stéphane Roder, le fondateur du cabinet AI Builders, spécialisé dans le conseil en intelligence artificielle. Également professeur à l’Essec, il est aussi l’auteur de l’ouvrage "Guide pratique de l’intelligence artificielle dans l’entreprise" (Éditions Eyrolles). Pour lui, "l’intelligence artificielle apparaît comme une révolution pour l’industrie au même titre que l’a été l’électricité après la vapeur".