Le point sur la fraude scientifique

Science Fish, de Steve Rainwater, licence CC BY-SA

Mardi dernier nous vous parlions ici-même des papiers frauduleux, ces fausses publications générées par ordinateur ("fake papers"). Quelques jours auparavant, une polémique éclaboussait la biologie française. Le plagiat fait quant à lui l'objet de vraies campagnes de sensibilisation des communautés universitaires.

La fraude scientifique est définie comme "une action destinée à tromper dans le champ de la recherche scientifique", sous trois formes principales : "la falsification de données, la fabrication de données et le plagiat. (source : wikipédia). De plus en plus relayée dans les médias, elle témoigne à la fois des difficultés de la recherche et de l'importance du pacte de confiance entre science et société.

Pour comprendre l'écho de ces mauvaises pratiques, il faut revenir au contexte de la publication scientifique.

Côté chercheurs, d'abord. La fameuse injonction de publier, "publish or perish" incite les chercheurs à multiplier les publications pour être visibles, reconnus et donc subventionnés. Le système de l'évaluation de la recherche est pourtant fortement critiqué depuis des années mais il peine à trouver d'autres critères que la publication pour évaluer les institutions et leurs équipes. Objet de toutes les attentions, des financeurs aux chercheurs, elle est monnayable et favorise les dérives : technique du salami, renvoi d'ascenseur en matière de citations, choix des projets de recherche en fonction de leur "publiabilité", invisibilité des résultats négatifs... et soumission de faux articles générés par des machines. C'est ici le système de production scientifique qui est pointé du doigt, avec pour risque, en toile de fonds, une stagnation de la recherche.

Photo de Chris Drum, un livre de published & perished  Gilbar, Steven & Dean Stewart (ed) PUBLISHED & PERISHED: Memoria, Eulogies & Remembarances of American Writers, Godine '02, 1st edn, (47 well considered and often startlingly honest appraisals of great names in American literature, memorialized, eulogized, and sometimes criticized by their closest friends and peers

Il existe un autre versant : celui des éditeurs scientifiques. C'est parce qu'ils sont réputés garants de la bonne évaluation scientifique de l'article que les revues scientifiques ont un coût : on paie pour publier et on paie pour accéder à l'article (note 1). Là encore, le contexte joue contre les éditeurs : la montée des tarifs est à l'origine d'un malaise grandissant des chercheurs et des institutions acculés par des budgets en baisse. D'autant que de nouveaux modèles de publication se développent comme l'open access (note 2), la pré-évaluation avant soumission (Rubriq), ou encore l'évaluation post-publication. La tension monte lorsqu'un groupe comme Nature (NPG) lance son service d'accélérateur : payer plus pour être évalué plus vite (et donc publié plus vite). Une science à deux vitesses ?

De la difficulté d'être évalué. Un second risque est l'installation d'un climat de suspicion généralisée entre chercheurs. Pubpeer, spécialiste de l'évaluation collaborative post-publication, est ainsi montré du doigt pour l'agressivité de son principe d'anonymat des commentaires : il suffit de chercher une publication (par son DOI, son auteur, etc.) et l'on peut ajouter un commentaire qui sera public. Ouverture du débat scientifique ou porte ouverte aux dénigrements ou laudations intéressés ? (3)

Dans ce contexte, on comprend que les faux pas des éditeurs qui publient des articles contestables ou contestés (parfois même après des années), ne passent pas. On comprend aussi l'importance pour les institutions de recherche de sensibiliser tous les acteurs aux bonnes pratiques de la recherche et à la reconnaissance des fraudes et manquements. En témoigne ce Guide pour promouvoir une recherche intègre et responsable proposé fin 2014 par le comité d'éthique du CNRS.

Vraiment?

Vraiment?

Notes et références

Aller plus loin :

(1) Pour publier un article, il faut souvent s'acquitter du coût de publication auprès de l'éditeur, jusqu'à 3000$ parfois : ce sont les APC, pour Article processing charge, dont le montant varie selon la notoriété de la revue et son mode d'accès. Publier dans une revue en libre accès coûte ainsi généralement plus cher que dans les revues commercialisées (qui coûtent, elles, une seconde fois au contribuable via les abonnements des chercheurs aux revues, voire une troisième fois si on compte le premier coût de la recherche effectuée en amont de l'article).

(2) Open access : la pression est moindre car le mouvement, dans un contexte de forte légitimité scientifique des éditeurs, a été largement récupéré par les éditeurs avec le modèle "gold open access". Cela dit, la sensibilisation à la diffusion libre et ouverte à tous des résultats de la recherche a fait son chemin.

(3) Le principe d'anonymat de Pubpeer : la question rappelle la vieille interrogation sur la fiabilité de Wikipédia, qui a su mettre, depuis, des gardes-fous. Mais les enjeux diffèrent.

Images : "Science Fish", de Steve Rainwater, licence CC BY-SA. "Published and perished", photo de Chris Drum, un livre de Steven Gilbar Steven et Dean Stewart.

Vers la fin des publications frauduleuses en recherche ?

Techaleidoscope, d'Opensourceway, licence CC-BY-SA

Avez-vous déjà entendu parler des "fake papers", ces publications frauduleuses  "rédigées" automatiquement par ordinateur avec un logiciel comme SCIgen ou Mathgen et soumises à publication ? Elles défraient régulièrement la chronique parce qu'elles mettent en lumière les failles du système de publication des résultats de la recherche, y compris chez les grands éditeurs scientifiques. Elles interpellent également l'éthique du chercheur, vertu cardinale de l'intégrité des activités scientifiques. Une telle fraude expose à la fois le chercheur incriminé, son institution et l'éditeur fautif de la mauvaise (ou fausse ?) évaluation.

C'est d'ailleurs dans ce but qu'avait été créé SCIgen à l'origine, en 2005, par des étudiants : ils voulaient démontrer la supercherie de ces pseudo-conférences qui ne pratiquent aucune évaluation scientifique des papiers soumis. Librement accessible en ligne, le logiciel a servi de canulars, de sensibilisation aux problèmes d'évaluation des revues... et petit à petit de vrai générateur d'articles pour des vrais fraudeurs.

scidetectC'est pourquoi certains ont travaillé à la conception d'un outil détecteur de fraude scientifique. Après les logiciels anti-plagiat, voici donc SciDetect, qui traque les fausses publications scientifiques, un logiciel conçu par l'Université Joseph Fourier de Grenoble et l'éditeur Springer.

La nouvelle fait grand bruit dans les milieux de la recherche et de l'édition. Est-ce que cela signe pour autant la fin des fraudes orchestrées par ordinateur ? Si l'on en croit l'expérience de l'anti-plagiat, c'est une étape qui marque une meilleure sensibilisation mais il est probable que les logiciels s'adaptent pour ne pas être détectés, puis pour mieux détecter, comme pour les antivirus. Toujours est-il que Springer vient tout juste de procéder à un retrait d'une publication : on n'en connait certes pas encore la raison...

Prochain billet : Le point sur la fraude scientifique

Le coût de la connaissance

Dollars on a plate, de TaxCredits, licence CC-BY-2.1

Il y a deux ans, nous évoquions sur ce blog les difficultés d'accès aux résultats de la recherche, notamment sous leur forme la plus connue : les revues scientifiques. Le billet s'intitulait : Le savoir scientifique deviendra-t-il un produit de luxe ? Les publications coûtent cher, la situation n'a pas changé. Le contexte s'est même durci : les budgets des universités régressent et nombreuses sont les universités qui se voient obligées de résilier une partie de leurs abonnements numériques. La presse nationale s'en est largement fait l'écho (Le Monde du 12/02/2014, p.12). Notre université n'échappe pas à la règle, en procédant cette année à des suppressions d'abonnements, après une précédente vague en 2013, et après diverses baisses successives du budget alloué à la documentation physique traditionnelle (ouvrages, manuels et revues imprimés).

Les critères de choix des désabonnements. Il faut savoir que 65% du budget "Documentation électronique" de l'Université de La Réunion est sous engagement : il s'agit d'abonnements pluriannuels, aux tarifs négociés mais à la résiliation impossible pour 2014. Cela empêche toute politique documentaire. Parmi les 35% restants, les critères de sélection ont été : la priorité au texte intégral ; la priorité à la pédagogie et à la recherche ; l'exclusivité des revues ou bases en ligne ; éviter les réengagements pluriannuels qui présentent trop de risques en période de restrictions budgétaires annuelles.

Le mouvement des "licences nationales" en France (#istex). Parallèlement, de nouveaux abonnements ont été annoncés pour 2014 : il s'agit en réalité non d'abonnements mais d'achats nationaux d'archives de quelques grandes revues (ou packages de revues de grands éditeurs). Le coût se fait donc en une seule fois, au niveau national, avec garantie de la pérennité d'accès aux numéros des revues achetées. Les enjeux et modalités sont très clairement détaillés sur le site web dédié des "licences nationales". Les choses se compliquent lorsqu'une licence nationale se met en place sous la forme d'un abonnement pluriannuel de cinq ans... avec l'éditeur Elsevier, venant ainsi compléter la licence nationale de l'achat d'archives Elsevier ISTEX.

Le cas Elsevier, le marché Elsevier 2014-2018. Beaucoup de choses ont été dites sur Elsevier et ce n'est pas fini. A l'étranger, il y a d'abord eu cette pétition The cost of knowledge, qui invitait les chercheurs à un certain boycott de l'éditeur pour leurs prochaines publications. Plus largement, les universités manifestent leur résistance à continuer de consacrer une part toujours croissante de leur budget aux grands éditeurs, dont Elsevier devient presque le symbole négatif, même s'il n'est pas le seul. Il faut dire que l'allocution de l'un de ses dirigeants, rappelant l'impérieuse nécessité de la confidentialité des négociations et tarifs pour maintenir son business modèle (... sinon les prix risqueraient de baisser), dépenses publiques ou non, n'est pas passée inaperçue. Contraintes financièrement, les universités font donc des choix. Mais les suppressions d'abonnement, entre autres mesures d'économie, accentuent les inégalités entre établissements : l'idée de proposer un abonnement national aux revues Elsevier semble donc une bonne idée... tant que son financement vient en plus. La difficulté du marché Elsevier est là, d'autant que le contrat engage pour 5 années.

Quel modèle adopter entre égalité d'accès et maîtrise locale de son budget ? entre licence nationale et autonomie des universités ? Un abonnement national pluriannuel à Elsevier ne risque-t-il pas d'exposer davantage les autres ressources numériques souscrites en local par les universités ?

Crédit photo : "Dollars on a plate", de TaxCredits, licence CC-BY-2.0 

Pourquoi publier ma thèse sur internet ?

writing thesis, de sam hames

Lorsque vous soutenez votre thèse, vous devez indiquer si vous êtes d'accord pour la diffusion internet de votre thèse. Le plus souvent, vous êtes intéressé(e) par la visibilité offerte par le web mais vous songez également au risque des copier-coller intempestifs (plagiat) et l'opportunité d'une édition commerciale (publier). Voici quelques recommandations du service Thèses des BU de l'Université de La Réunion.

Diffusion web = Une vraie visibilité

Avec la publication sur internet, votre thèse sera visible dans les grands moteurs de recherche spécialisés dans les publications scientifiques et les travaux universitaires :

  • France : Theses.fr, le portail national des thèses françaises
  • Europe : Dart-Europe, le portail européen des thèses
  • Monde : les annuaires spécialisés dans les thèses, mais aussi les grands moteurs de recherche spécialisés dans les publications scientifiques de tout ordre : Google Scholar, Web of Science, Scopus, Francis, Pascal, Pubmed, etc.

Exemple de recherche : pasolini fassbinder theatre. Google Scholar donne 218 résultats : le 1e résultat est une thèse électronique de l'Université de Montpellier : belle visibilité ! (2e résultat sur 288 000 dans Google.fr)

Visibilité = Une garantie contre le plagiat

Les universités se dotent depuis plusieurs années de mécanismes anti-plagiat chargés de repérer, automatiquement ou à la demande, les suspicions de plagiat concernant les travaux universitaires rendus. Publiée sur le web, votre thèse sera visible dans les grands moteurs de recherche, dont les moteurs spécialisés dans les publications scientifiques et universitaires comme Google Scholar (cf. liste plus haut). Cela signifie que les logiciels anti-plagiat repéreront facilement les tentatives de plagiat de votre travail, puisqu'ils s'appuient sur ces sites (notamment) pour repérer les copier-coller et autres mésusages. De plus, la mise en ligne de votre thèse numérique via votre BU apporte un horodatage qui permet de prouver votre antériorité en cas de litige. Ainsi, accessible à tous sur le web, votre thèse présente moins de risques d'être plagiée.

Et l'édition commerciale de ma thèse ? 

L'autorisation de diffusion sur internet que vous nous accordez n'est pas exclusive : vous conservez tous vos droits, en particulier celui de diffuser votre thèse par d'autres moyens (publics ou privés) que ceux que nous mettons à votre disposition. Si vous envisagez la publication de votre thèse avec un éditeur commercial, sachez donc que cela reste légalement compatible avec la diffusion internet en amont de votre thèse numérique telle que vous le propose l'Université. Avec l'Université, il s'agit de la version de votre thèse telle qu'elle a été soutenue à l'Université, et donc validée (après corrections si votre jury de thèse vous les a demandées). Votre thèse sera ainsi diffusée en "open access". Avec un éditeur commercial, votre thèse sera vraisemblablement remaniée. Autrement dit, publier numériquement sa thèse en open access n'est plus un obstacle à sa publication imprimée commerciale : pour preuve ces deux exemples à Limoges et à Lyon 3.

Dans tous les cas, vous restez libre de revenir à tout moment sur la diffusion internet de votre thèse. Il vous suffit d'avertir l'Université qui effectuera les démarches nécessaires pour suspendre cette publication dans les meilleurs délais.

En cas de projet sérieux de publication, le mieux est de prendre contact avec les éditeurs en amont, pour connaître leur politique en matière d'open access. Sur la question des droits d'auteur, ce document du CNRS est assez complet. Vous pouvez aussi prendre conseil avant de négocier vos droits avec un éditeur, contactez info-bu.

Cas particulier des démarchages par les maisons d'édition. Certaines maisons démarchent systématiquement les personnes ayant soutenu un mémoire (d'école, d'université), une thèse, un HDR, etc. pour leur proposer l'édition commerciale. Quelques points de vigilance. 1) Législation : par exemple les "Editions Universitaires Européennes" étant une maison d'édition privée, c'est la législation allemande qui s'applique en cas de litige. 2) Cession des droits : il est fortement déconseillé de signer un contrat indiquant une cession complète des droits exclusifs.  3) Responsabilité de l'auteur. Bien veiller à ne pas se retrouver dans la situation où l'auteur reste seul responsable en cas de litige : une édition commerciale impose un travail de négociation des droits annexes, élément par élément : les tableaux, graphiques, illustrations de votre thèse sont légaux tant qu'il s'agit d'un travail non commercial à des fins de recherche (on parle de droit de citation). Ils contreviennent au droit d'auteur et à la propriété intellectuelle dès qu'il s'agit d'une publication commerciale. 4) Services proposés par l'éditeur : travail de mise en page, relecture et corrections, assistance pour la négociation des droits annexes. 5) Toujours se renseigner sur l'éditeur qui vous démarche (via Google ou autre).

D'une façon générale, il est toujours recommandé de se méfier des propositions de publication commerciale "en l'état" (c'est à dire sans aucune retouche de votre thèse).

Contact : info-bu

Crédits photo : Writing Thesis, de Sam Hames, licence CC-BY-SA 2.0

 

Journée "Recherches et Bibliothèque" du 13 février 2013

La BU Droit-Lettres accueille les doctorants en Droit - Economie - Lettres - Sciences humaines pour une journée de formation où il sera question de Recherches et de Bibliothèque.
Le mercredi 13 février 2013, venez approfondir vos connaissances en matière de recherche de documents (thèses, articles, archives ouvertes,...) et en matière de publication de vos travaux sur le web (zotero, feuille de style,...)

Cette journée sera l'occasion de (re)découvrir les services en ligne  proposés par la bibliothèque : prêt entre bibliothèques, compte-lecteur, accès distant, renseignement via info-bu.

Journée de formation EDLSH 2013 (programme en PDF)
Pour plus d'informations, contactez le responsable des formations : M. Griot

Plagiat dans la recherche : ne fermons pas les yeux

Jean-Noël Darde, Maître de conférences en Sciences de l’information et de la communication à l’Université Paris 8 Saint-Denis, se lance dans une grande bataille contre le plagiat dans la recherche universitaire.

Auteur et éditeur du blog Archéologie du copier-coller, il poursuit ses investigations et lance une pétition déjà signée par plus de 70 universitaires.

Libre-accès à l'information scientifique et technique : débat

Le libre-accès à l'IST fait débat en ce moment : bref résumé d'une veille récente.

Évolution de l’archive ouverte HAL-SHS  (Laurent Capelli). Le CCSD est en train de repenser son archive ouverte HAL. Il propose d'en dévoiler les futurs contours : le chercheur au centre du dispositif, moteur de recherche, dépôt de vidéo, épirevues, etc.

Libre accès à la recherche britannique : un projet controversé  (par Annie Vercasson sur Actualitté). Les articles de recherche qui exposent des travaux financés par le contribuable britannique seront consultables gratuitement par les universités, les entreprises et les particuliers, et ce, pour n'importe quel motif et où qu'ils se trouvent. Ce projet est controversé en raison du choix de la voie "premium" ou "gold" (l'auteur paye pour son libre-accès) au détriment de la "verte" (dépôt gratuit dans une archive ouverte)

Chercheurs, le CNRS continue de vendre cher nos articles gratuits  (site de Rue89) Ce texte a été initialement publié sur le blog d’Olivier Ertzscheid, sous forme d’adresse au responsable du service Refdoc (lettre à l'Inist sur le site d'Affordance) à l’Institut de l’information scientifique et technique du CNRS (Inist), et au directeur de l’Inist. Le Refdoc, service de commande de documents de l’INIST/CNRS, dispose d’un catalogue enrichi de 52 millions de notices.

et comme toujours URFIST Info

Le savoir scientifique deviendra-t-il un produit de luxe ?

Serait-ce une énième contestation vouée à faire long feu ou un mouvement de fond qui fera reculer le premier éditeur scientifique mondial, Elsevier ?
Par l’intermédiaire de son blog, Tim Gowers, mathématicien à l’Université de Cambridge et récipiendaire de la Médaille Fields (plus haute distinction académique en mathématiques) en 1998 a radicalisé sa position vis à vis de l’éditeur. Depuis longtemps, défenseur de la libre diffusion des résultats de la recherche scientifique, il enjoint désormais ses collègues chercheurs, à travers une pétition et un site web (The Cost of Knowledge), à refuser l’augmentation incontrôlée des prix des revues scientifiques et les pratiques commerciales d’Elsevier : vendre à prix très élevé un “pack” de centaines de revues plus ou moins intéressantes, enfermer ses clients, universités et bibliothèques en tête, dans un système où ils ne contrôlent ni le contenu, ni la tarification.
En signant la pétition, les chercheurs peuvent s’engager à ne plus publier, participer à la relecture des articles ou faire partie des comités éditoriaux des revues Elsevier.
Depuis son lancement, la pétition a recueilli plus de 6100 signatures à travers le monde, un succès inespéré qui pourrait traduire une prise de conscience des principaux acteurs, les chercheurs, face à un modèle éditorial à bout de souffle, un modèle économique insoutenable et un modèle de diffusion scientifique en décalage par rapport aux enjeux du 21ème siècle.
Et vous, avez-vous signé la pétition ?

crédit photo : Diamonds, Kim-bodia, Licence CC By