CORE franchit le cap des 5 millions de documents en texte intégral indexés et en libre accès

  • open_cahier.jpg

    open
    En plus d'un accès gratuit à son moteur de recherche, CORE offre également toutes les données gratuitement via une API et un dataset. (opensourceway via Visualhunt.com / CC BY-SA)
  • Entre 2015 et 2016, la base de CORE est passée d'environ 3 millions de documents en texte intégral indexés à plus de 5 millions.

    Le cap des 5 millions de documents en texte intégral indexés dans la base de CORE (COnnecting REpositories) est désormais atteint, ce qui fait de lui le plus grand agrégateur de documents de recherche en texte intégral et en libre accès du monde. 

    Plus d'une centaine de pays producteurs

    Accessible depuis son moteur de recherche, sa collection compte également 66 millions d'enregistrements de métadonnées. Et ce sont plus de 2 000 documents institutionnel et thématiques qui y sont archivées. L'ensemble de ces documents est issus de 102 pays, dans 52 langues différentes.

    core_data

    Depuis son lancement en 2011, CORE vise à recenser et faciliter l'accès du public aux résultats de recherche et aux articles scientifiques, issus de dépôts institutionnels et disciplinaires, ainsi que de documents de recherche, de littérature grise, de mémoires et de thèses d'étudiants. Son objectif : "faciliter l'accès illimité gratuit à la recherche pour tous". 

    Récolte accélérée

    "L'année dernière, nous avons réussi à accélérer notre processus de récolte, explique le fondateur de CORE, Petr Knoth, sur le blog du portail ; cela nous a permis d'augmenter significativement la quantité de contenus en libre accès que nous pouvons offrir à nos utilisateurs. De plus en plus de contenus en libre accès étant mis à disposition par les fournisseurs de données, grâce à de récentes politiques d'accès ouvert, CORE peut désormais capturer et donner accès à un pourcentage plus élevé de la littérature scientifique mondiale".

    À lire sur Archimag
    Les podcasts d'Archimag
    La mise à disposition des décisions de justice en Open Data a vu le jour grâce à la loi pour une République numérique votée en 2016. Les articles 20 et 21 prévoient la mise en open data des quatre millions de décisions de justice produites chaque année par les tribunaux français. Camille Girard-Chanudet est chercheuse en sociologie au sein du Centre d’étude des mouvements sociaux. En 2023, elle a soutenu une thèse devant l’École des hautes études en sciences sociales (EHESS) : "La justice algorithmique en chantier, sociologie du travail et des infrastructures de l’intelligence artificielle". Dans ce cadre elle a rencontré les équipes de la Cour de cassation qui procèdent à l’anonymisation des décisions de justice.

    sponsoring_display_archimag_episode_6.gif