Bilan du programme national ISTEX, une initiative d’excellence en IST

Licencesnationales.fr / Istex / IDEX

ISTEX est une initiative d’excellence (-EX) dans le domaine de l'information scientifique et technique (IST-). Autrement dit, dans le domaine de la documentation des chercheurs (publications, corpus, données) et des usages que l'on peut en tirer (rédiger, citer, publier, veiller...).

Pour rappel, ce dispositif entrait dans les « Initiatives d’avenir » lancées par le ministère ESR, à hauteur de 60 millions d'euros répartis initialement sur 3 ans. Il avait deux vocations : l’acquisition nationale de ressources documentaires accessibles en ligne et la création d’une plateforme numérique de valorisation. Avec pour ambition :

Construire le socle de la bibliothèque scientifique numérique nationale.

A présent que le programme est arrivé à son terme, quel bilan peut-on en tirer ? Quelques mots sur l'aboutissement des deux volets.

L’acquisition de grands corpus documentaires scientifiques numériques a concerné principalement des collections rétrospectives de revues et de livres électroniques des grands acteurs de l’édition académique. Il s'agit au final de plus de 18,5 millions de documents issus d'une vingtaine d'éditeurs. Nous retrouvons ainsi : Brill, Brepols, BMJ, Cambridge, Garnier, De Gruyter, Duke, EDP Sciences, Elsevier, Emerald, Gale, GSL, IOP, Lavoisier, Nature, New Pauly, Numérique Premium, Oxford, Proquest, La Haye, RSC, Royal Society of London, Sage, Springer, Wiley, Taylor & Francis. Les publications concernées remontent souvent à la création de la revue jusqu’aux parutions des années 2000 (parfois 2010 ou 2012). On parle ainsi d’ « archives » par opposition aux abonnements courants des établissements qui donnent accès aux dernières parutions des revues ou livres numériques. Ces collections nationales ISTEX complètent donc l’offre locale de chaque institution. Les accès sont pérennes et fonctionnent depuis les établissements comme en dehors (logins institutionnels).

Chantiers d'usages ISTEX
Exemples d'utilisations du méta-corpusBig oil, de jumpinjimmyjava, licence CC-BY-2.0
Accès aux ressources
Liste complète des ressources ISTEX 
La plateforme ISTEX, elle, propose l’intégralité des ressources ISTEX, qui ont été retravaillées pour une forme numérique enrichie [1] : indexation et sémantisation du texte intégral et du contexte de publication (extraction des citations et des liens entre publications, repérage des entités nommées comme les personnes, les lieux, les nomenclatures, les projets financés ou les dates cités dans les textes, etc.), tout cela afin de permettre des usages avancés. En effet, plus qu’une plateforme d’archivage et d’accès qui viendrait s’ajouter aux plateformes des éditeurs, la plateforme ISTEX est conçue pour proposer des services d’usages avancés qui exploitent tout ou partie du méta-corpus ISTEX. On peut penser par exemple à la fouille automatique de texte ou à l’extraction de connaissance à partir de texte (text and data mining ou TDM, traitement automatique du langage ou TAL).

Concrètement, vous pouvez tester le corpus ISTEX sous plusieurs formes :

Gros plan sur des utilisations possibles d'ISTEX. Encore en phase expérimentale, voici quelques exemples d’exploitation du méta-corpus ISTEX par des établissements testeurs. Les diaporamas sont disponibles pour chaque fiche projet : cliquez sur son nom pour y accéder.

ReITEX : « Ce projet a pour objectif d’utiliser l’important volume des données ISTEX pour valider des méthodes d’extraction d’informations et de connaissances à partir du plein texte dans le cadre de travaux de traitement automatique des langues »

NEOTEX : L’objectif du projet est d’accompagner un chercheur « néophyte » dans  une recherche documentaire exploratoire : le néophyte ne connait pas encore les termes scientifiques clés du domaine, les auteurs spécialistes ou les articles de référence. Le projet propose de déterminer les « bons documents » les plus pertinents pour débuter, puis ceux pour approfondir ses connaissances dans une direction spécifique.

Chantier  thématique sur les Terres Rares : étudier la possibilité d’enrichir la bibliographie des chercheurs autour du thème des Terres rares par l’identification des publications sur ce domaine et leur cartographie informationnelle.

3ST : construire un outil de lecture assistée par ordinateur via le surlignage sémantique des textes scientifiques.

Alpage : rendre exploitable l’information contenue dans la littérature scientifique et technique (fouille de textes scientifiques et annotation sémantique)

Projet Biosystémique : recherche automatisée de résultats expérimentaux dans les publications scientifiques concernant la biologie systémique afin de détecter les voies de signalisation des récepteurs couplés aux protéines G et d’en établir le réseau (relations attendues, nouvelles relations…).

TERRE-ISTEX : projet interdisciplinaire qui « a pour objectif d’identifier l’évolution des fronts de recherche en relation avec les territoires d’études, les croisements disciplinaires ainsi que les modalités concrètes de recherche ». 3 volets : 1) identifier les périodes et les lieux qui ont fait l’objet d’études empiriques et dont rendent compte les publications issues des corpus analysés, 2) identifier les approches (méthodes et concepts) mobilisées pour la réalisation de ces études 3) développer un démonstrateur Web de recherche d’information géographique (RIG).

FULLLAB : comparer la quantité d’informations livrée par l’abstract avec celle du texte intégral de l’article qu’il résume et mesurer le « taux de générosité » de l’abstract suivant le contexte de publication. L’enjeu est notamment une meilleure connaissance de la littérature scientifique (clés pour la rédaction efficace d’un abstract voire génération automatique, meilleure stratégie économique dans le choix des abonnements…).

Listes des ressources ISTEX avec accès UnivRéunion :
pour en profiter en toute mobilité, utilisez vos logins UnivRéunion

 

Brepols Publishers – revues 45 titres des origines, le fascicule le plus ancien datant de 1882, à 2012, publiés par Brepols Publishers, maison d’édition belge créée en 1796 et spécialisée en histoire ancienne et médiévale, littérature, linguistique, pensée et théologie médiévales. Accès UnivRéunion
Brepols Publishers – ebooks 849 titres, dont les Miscellanea, publiés par Brepols Publishers, maison d’édition belge créée en 1796 et spécialisée en histoire ancienne et médiévale, littérature, linguistique, pensée et théologie médiévales. Accès UnivRéunion
Brill – revues 220 titres de revues scientifiques publiées par Brill depuis les origines jusqu’à 2012, consacrées principalement aux humanités, aux sciences sociales, au droit international et aux droits de l’homme et à la biologie. Accès UnivRéunion
British Medical Journal – revues 64 titres de revues médicales publiées par le BMJ, branche édition de l’association des médecins britanniques (BMA) depuis les origines jusqu’à 2013. Accès UnivRéunion
Cambridge University Press – revues 312 titres de revues publiées par le CUP, traitant de toutes les disciplines scientifiques, bien qu’à forte dominante SHS, depuis les origines jusqu’à 2010 (voire 2014 pour certains titres). Accès UnivRéunion
Classiques Garnier Numérique Grand Corpus des dictionnaires (24 dictionnaires qui couvrent l’évolution de la langue française sur douze siècles)Grand Corpus des grammaires françaises, des remarques et des traités sur la langue (comprend les grammaires françaises de la Renaissance, les grammaires françaises du 17e siècle et les remarques sur la langue française). Accès UnivRéunion
De Gruyter – revues 474 titres de revues scientifiques publiées par De Gruyter depuis les origines jusqu’à 2012. Accès UnivRéunion
De Gruyter – ebooks 223 titres de livres numériques en langue française, publiés entre 1965 et 2017 dans sept disciplines des sciences humaines : art et architecture, études classiques, histoire, linguistique, littérature, philosophie, théologie et religion. Accès UnivRéunion
Duke University Press – Duke Mathematical Journal 161 volumes des origines (1935) jusqu’à 2012. Accès UnivRéunion
EDP Sciences - revues 90 titres de revue, souvent depuis leur premier numéro et jusqu’en 2012, dans les domaines allant des mathématiques aux sciences du vivant en passant par la physique et la biologie. Inclus : les prestigieux titres Journal de Physique et Le Radium. Accès UnivRéunion
Elsevier – revues Plus de 2200 titres de revues scientifiques publiées par Elsevier depuis les origines jusqu’à 2001. Accès UnivRéunion
Emerald – revues 362 revues publiées par Emerald, principalement en commerce, gestion et économie, de 1898 à 2010 inclus. Accès UnivRéunion
Gale Cengage Learning – ECCO Plus de 180 000 titres (200 000 volumes) imprimés entre 1701 et 1800 en Grande-Bretagne et dans les colonies britanniques. Accès UnivRéunion
Geological Society Publishing 305 volumes publiés entre 1964 et 2008, issus des Special Publications de la Lyell Collection. Accès UnivRéunion
Institute of Physics Publishing – revues 107 titres de revues scientifiques publiées par l’Institute of Physics depuis les origines jusqu’à 2012. Accès UnivRéunion
Lavoisier - revues 32 titres de revues, parfois depuis le premier numéro et jusqu’en 2013 inclus. dont des revues majeures en médecine, notamment Douleur et Analgésie ; Côlon & rectum ; Obésité ou encore Oncologie. Accès UnivRéunion : à venir via plateforme ISTEX
Nature – revues Nature, la revue scientifique généraliste de référence, des origines (1869) jusqu’en 2012 « Nature branded journals » des origines jusqu’en 2012. Accès UnivRéunion
New Pauly Online Encyclopédie de référence en sciences de l’Antiquité, dans sa version anglaise et allemande. Accès UnivRéunion
Numérique Premium 2 bouquets, « Littérature française et francophone » et « Révolution française et Premier Empire », composés de 268 ouvrages publiés entre 1962 et 2015. Accès UnivRéunion
Oxford University Press – revues 264 titres de revues scientifiques publiées par les presses universitaires de la prestigieuse Oxford University depuis les origines jusqu’à 2010. Accès UnivRéunion
ProQuest – Early English Books Online Version numérisée de l’intégralité des ouvrages imprimés entre 1473 et 1700 en Angleterre, en Irlande, en Ecosse, au Pays de Galles et dans les colonies britanniques d’Amérique du Nord, ainsi que les ouvrages en langue anglaise imprimés ailleurs. Accès UnivRéunion
Recueils des cours de l’Académie de La Haye 338 volumes de cours dispensés à l’Académie de droit international de La Haye, des origines (1923) jusqu’en 2012, formant une collection encyclopédique sur le droit international15 titres de colloques (1969-2008)8 titres du Centre for Studies and Research in International Law and International Relations (2000-2008)7 titres de The Law Books of the Academy (1988-2010). Accès UnivRéunion
Royal Society of Chemistry – revues 118 titres de revues scientifiques publiées par la Royal Society of Chemistry depuis les origines jusqu’à 2010. Accès UnivRéunion
Royal Society of Chemistry – ebooks 1200 livres publiés par la Royal Society of Chemistry entre 1968 et 2014. Accès UnivRéunion
Royal Society of London - revues 9 titres publiés par la Royal Society, depuis les origines jusqu’à 2014 inclus : Proceedings A et B, Philosophical Transactions A et B, Notes and Records, Biographical Memoirs, Interface et Interface focus, ainsi que Biology Letters. Accès UnivRéunion
Sage – revues 748 titres de revues scientifiques publiées par Sage depuis les origines jusqu’à 2009. Accès UnivRéunion
Springer – ebooks Plus de 7500 titres de livres électroniques publiés jusqu’en 2004 et issus de 16 séries d’ebooks. Accès UnivRéunion
Springer – revues Plus de 1000 titres de revues scientifiques publiées par Springer depuis les origines jusqu’à 1996. Accès UnivRéunion
Springer Nature – ebooks 33 000 titres, des origines à 2013 inclus, comprenant l’ensemble de la production de chaque année éditoriale, issus de 4 collections en mathématiques et statistiques, physique et astronomie, chimie et science des matériaux, sciences de l’ingénieur.
600 titres publiés en 2013 et issus des LNCS – Lecture Notes in Computer Science. Accès UnivRéunion
Wiley – revues Près de 2200 titres de revues scientifiques publiées par Wiley depuis les origines jusqu’à 2011. Accès UnivRéunion
Taylor & Francis – ebooks 1494 livres en sciences politiques et relations internationales publiés par Taylor & Francis entre 1977 et 2012. Accès UnivRéunion

Images : Big oil, de jumpinjimmyjava (licence CC-BY) et OpenSourceWay (licence CC-BY-SA)

Notes

Les ressources numériques en Sciences de l'éducation grâce à vos BU

Les ressources numériques par discipline sont accessibles via le site Web des BU
(page Bases en ligne).

En Sciences de l'éducation, voici les abonnements et les ressources gratuites proposés par les BU de l'Université de La Réunion.
=> Accès : site web des BU : page Bases en ligne onglet Sciences de l'éducation

  • Les sites indispensables

  • Des livres en ligne

  • Des articles et des revues

  • la revue de l'ESPE de La Réunion : Expressions

  • Et si nous allions à la découverte d'autres ressources :
    • L'actualité pédagogique   
    • Films pour enfants           
    • L'histoire de l'éducation   
    • la bibliothèque spécialisée en France sur l'éducation 

 

  • Plus d'infos sur ces ressources (cliquer pour agrandir)

Bonne découverte numérique !

ENCCRE : toute l'encyclopédie de Diderot et d'Alembert en ligne

L'Encyclopédie. Prospectus, Bibliothèque Mazarine (Creative Commons BY-NC-ND). Source : http://mazarinum.bibliotheque-mazarine.fr/idurl/1/2112

C'est un projet unique qui a permis de mettre à la disposition du public l'intégralité des 28 volumes de l'encyclopédie de Diderot et d'Alembert (17 volumes de texte puis les 11 de planches) : ENCCRE (acronyme d'Edition numérique collaborative et critique de l'encyclopédie de Diderot et d'Alembert).

Celui-ci a été mis en œuvre par l'Académie des Sciences en partenariat avec la Bibliothèque Mazarine, dépositaire de l'exemplaire 1, qui contient, outre le texte, de précieuses gravures et des références d'édition utiles à l'analyse. Mais bien plus qu'une numérisation en mode image, le projet, coordonné par Alexandre Guilbaud (Maître de conférences à l’université Pierre-et-Marie-Curie et membre du projet « Histoire des sciences mathématiques » de l’Institut de mathématiques de Jussieu - Paris Rive Gauche (CNRS/ Université Pierre-et-Marie-Curie/Université Paris-Diderot)), s'est attelé à la fois à rendre la recherche plein texte possible et à enrichir l'édition d'un appareil critique : c'est toute la pertinence de l'édition électronique dynamique au format XML-TEI.

Le projet comprend notamment l’établissement scientifique du texte, le balisage du contenu et de la structure de l’ensemble de l’ouvrage, l’annotation et la présentation des articles, la publication de dossiers critiques transversaux, l’articulation de l’ensemble des connaissances sur l’Encyclopédie, ses sources et ses réemplois. Soutenu par l'Académie des Sciences grâce à son Comité D'Alembert et à sa Fondation Servant, et par la Fondation Simone et Cino del Duca, le projet est l'objet d'une étroite collaboration entre la Bibliothèque Mazarine et l'Institut de mathématiques de Jussieu - Paris Rive Gauche (IMJ-PRG), le Centre des Sciences des Littératures en langue Française (CSLF) de l'Université Paris-Ouest Nanterre et plusieurs autres laboratoires de recherche français, ainsi que la Société Diderot.

(Source : Bibliothèque Mazarine : http://www.bibliotheque-mazarine.fr/fr/evenements/projets/enccre)

L'Encyclopédie est un outil de recherche historique important, qui témoigne d'un état des arts et des sciences unique au XVIIIe siècle : c'est aussi et tout simplement la première encyclopédie imprimée en France. Inspirée de la Cyclopædia: or, An Universal Dictionary of Arts and Sciences du britannique Ephraim Chambers, L’Encyclopédie, ou Dictionnaire raisonné des sciences, des arts et des métiers (1751-1772), codirigée par Diderot, D’Alembert et Jaucourt, est aussi la première entreprise éditoriale d'une telle ampleur, rassemblant un important collège de contributeurs.

L'interface numérique va permettre différentes recherches en utilisant des filtres :

  • Par index des contributeurs
  • Par volume
  • Par domaine de la connaissance
  • Par nomenclature : en limitant à planche/article
  • Un accès "documentation" pour connaître l'histoire et la génétique du projet encyclopédique, mais aussi l'étude de sa réception

Enfin, le projet ENCCRE offre un accès à la description matérielle de l'exemplaire numérisé.

L'ensemble des reproductions numériques est disponible en téléchargement au format PDF intégral sur Mazarinum, la bibliothèque numérique de la Bibliothèque Mazarine.

© ENCCRE /2017 ACADEMIE DES SCIENCES

Pour en savoir plus sur le projet : une interview d'Alexandre Guilbaud sur CNRS Le Journal.