1153, c’est le nombre de logiciels désormais référencés dans le premier catalogue national des logiciels libres issus de la recherche académique, toutes disciplines confondues. À la fois outil, produit et objet de recherche, le logiciel occupe une place centrale dans l’écosystème scientifique. Le Comité pour la science ouverte et son collège « Codes sources et logiciels », ont inscrit cette initiative dans le cadre du Plan national pour la science ouverte. Ce catalogue (disponible en version bêta), accessible depuis avril 2025, marque une avancée stratégique dans la reconnaissance, la valorisation et la pérennisation des productions logicielles de la recherche française.
Lire aussi : PeriScops : le nouveau portail de la recherche scientifique belge francophone
Référencer pour mieux valoriser
À l’origine du catalogue, un rapport publié en janvier 2025 dressait un état des lieux des pratiques de référencement des logiciels de recherche. Il mettait en lumière la nécessité de créer un catalogue national pour mieux référencer, citer, archiver et valoriser les logiciels issus de la recherche en s’appuyant sur une analyse globale des pratiques scientifiques, des infrastructures existantes et des outils de catalogage.
Lire aussi : 67 % des 160 000 publications scientifiques françaises sont désormais en accès ouvert
Une plateforme de science ouverte conçue pour et par la recherche
Les fonctionnalités du catalogue permettent de rechercher un logiciel par nom ou mots clés, par domaine ou sous-domaine scientifique et d’appliquer des filtres, comme l’environnement d’utilisation (MacOS ou Windows, par exemple) ou le langage de programmation (Javascript ou Python, par exemple).
Les fiches logicielles regroupent des métadonnées essentielles — date, mots-clés, etc. — ainsi que des liens vers Software Heritage (plateforme d’archivage du code source), vers la fiche HAL du logiciel, et, lorsqu’ils existent, vers des articles scientifiques associés pour croiser les publications et les données entre elles.
Le catalogue repose sur une architecture hybride et interopérable. Il s’appuie principalement sur HAL, qui centralise les notices logicielles contenant un identifiant SWHID (Software Heritage ID), moissonnées automatiquement toutes les 24 heures et sur le dépôt du logiciel lorsqu'il est hébergé sur GitHub.
Vers un catalogue enrichi et collaboratif
Le projet est amené à évoluer à travers plusieurs axes :
- le moissonnage de nouvelles sources, comme Zenodo, une plateforme d’open data ;
- le développement de fonctionnalités communautaires (commentaires, retours utilisateurs) ;
- l’intégration automatique des données de publication, pour relier plus finement logiciels, articles et jeux de données ;
- l’internationalisation de la plateforme, avec une traduction automatique pour un usage bilingue.
L’objectif est aussi de faire du catalogue un outil vivant, porté par les retours de la communauté scientifique. Chercheurs, ingénieurs, doctorants, bibliothécaires ou encore services de valorisation sont invités à contribuer à l’amélioration du service via un questionnaire en ligne.