![]() |
![]() |
||
|
Compte rendu de la journée |
|||
|
Les approches de l'IST par l'INRA et l'Inserm Repenser la communication électronique PubMed Central des National Institutes of Health (NIH) - BioMed Central E-Biosci, projet européen de diffusion des résultats de la recherche EDP-Sciences : cinq ans d'édition en ligne, bilan et perspectives Limites rencontrées dans l'exploitation des publications relatives à un génome particulier : le cas d'Arabidopsis thaliana Micado : ressources bibliographiques et intégration des connaissances en génomique Les universités face au développement de l'édition électronique Publication électronique des résultats de la recherche : quel impact sur l'évaluation ?
Cette journée est destinée aux scientifiques et aux chargés de documentation, d'édition et de communication de nos institutions. Le but est de réfléchir aux évolutions actuelles liées au développement croissant des outils de communication électronique . Le coût des périodiques scientifiques, qui s'est accru de 169 % en dix ans, ne peut plus aujourd'hui être compensé par le budget des bibliothèques universitaires qui, aux Etats-Unis, sont ainsi contraintes de réduire leurs acquisitions d'ouvrages. Le cycle de l'information traditionnelle, qui partait du scientifique et des laboratoires pour aller vers les bibliothèques et les centres de ressources, en passant par les éditeurs publics, privés, et les sociétés savantes, eux-mêmes en lien avec des agences d'abonnement et des diffuseurs de bases de données, est en pleine évolution avec la numérisation et l'apparition des réseaux. La valeur ajoutée que chacun apportait se déplace au profit des plates-formes électroniques d'information dans lesquelles chacun amène des éléments : revues électroniques, banques de données factuelles, banques bibliographiques, etc. La bibliothèque de demain sera sans doute constituée autour de ces plates-formes. Apparaissent ainsi non seulement de nouveaux moyens, mais également de nouveaux métiers comme les agrégateurs d'informations. Les pratiques des scientifiques changent également avec les techniques de communication : les listes de diffusion, les news group, les forums, les messageries, les bases de préprint, les bases de données factuelles, la diffusion par les serveurs web de pages personnelles ou d'articles vont faire profondément évoluer les pratiques de gestion de l'information scientifique et technique et le statut des publications scientifiques. Certaines revues électroniques sont d'ailleurs déjà apparues. Apparaît ainsi la notion de collaboration préalable à l'édition traditionnelle appelée collaboratoire ou collèges invisibles. Suzy MOUCHET Cette journée est motivée par les nombreux projets qui se sont développés autour de la gestion de l'information et de l'accès à celle-ci, conséquence du développement des outils de communication électroniques. En 1991, Paul Ginsparg lançait le serveur de préprint des physiciens des hautes énergies. En 1992, avec Philippe Kourilsky et Pierre Oudet, conseillers auprès du département de l’information et de la communication de l’Inserm pour la communication électronique, nous avons effectué une proposition à l'Académie des Sciences pour l'ouverture d'un serveur de ce type. Ce projet pilote est resté sans écho, ce qui est normal compte tenu de l'avance qu'il constituait pour le champ biologique et médical. 1999 a été marquée par l'annonce et le développement du projet de lancement d'un serveur public de publications électroniques, E-Biomed, par les National Institutes of Health (Harold Varmus) et le National Center for Biotechnology Information (David Lipman). De nombreuses discussions ont eu lieu, notamment lors de notre réunion annuelle à Obernai, réunion à laquelle participait l’INRA et lors de laquelle le projet E-Biomed a été présenté par le NCBI. S'en est suivi le développement en Europe d'une concertation pilotée par l'EMBO. Franck Gannon vous parlera ainsi de ce projet E-Biosci, qui associe, comme aux Etats-Unis, les sociétés savantes, les éditeurs et les institutions publiques. Fin 1999-début 2000, la convention de Santa Fe s'est tenue autour des serveurs de préprint sur Open Archives Initiative. Le serveur de préprint est un échange de versions brutes d'articles, avec une adresse unique, contrôlée, stable et un accès gratuit et identifié. Open Archives Initiative consiste à fédérer les serveurs de préprint existant et à uniformiser les formats et les protocoles afin de rendre transparent pour l'utilisateur le cheminement vers l'information. Notre proposition aux Comptes Rendus de l'Académie des Sciences portait sur la série III des sciences de la vie, alors en pleine rénovation. Le projet consistait à proposer à l'Académie la création d'un serveur pilote avec trois niveaux d'intégration des Notes soumises pour publication aux Comptes Rendus. Toute note proposée à l'Académie rentrait dans le niveau C. Une fois qualifiée de pertinente et une fois validée quant à son format, elle entrait dans le niveau B, sous la responsabilité de l'auteur. A la demande de ce dernier, elle était examinée par des " referees " des Comptes Rendus de l'Académie des Sciences en vue de passer en niveau A et d'une publication en version papier. Des niveaux d'entrée existaient donc déjà, avec une large accessibilité de l'information et des liens avec d'autres informations, comme dans le projet E-Biomed, dont Pierre Oudet vous parlera. Franck Gannon, Directeur exécutif de l'EMBO, vous dira où en est le projet E-Biosci, la France étant associé à celui-ci. Une réunion sur ce projet a récemment eu lieu à Heidelberg. Marie-Françoise Chevallier-Le Guyader et moi-même y étions. Participent également au projet des représentants du Ministère de la recherche et du CNRS.
Les approches de l'IST par l’INRA et l’Inserm
Le schéma traditionnel s'appuie sur trois pôles : publier, s’informer, échanger. En plus de nos activités classiques d’édition, nous sommes passés à l'édition de périodiques en ligne. Outre nos publications dans un grand nombre de revues (875 titres) essentiellement européennes (68 % des articles paraissent dans une revue européenne), nous éditons quelques revues en ligne, que nous éditons soit sur notre site, soit en partenariat avec un éditeur. Pour échanger, nous développons les info-services. L'INRA en comprend aujourd'hui 80. Nous avons également un certain nombre de bases de données en ligne. Le nombre de consultations a doublé en un an, atteignant un million en février sur le site institutionnel. Les scientifiques sont en outre inscrits à de nombreux news group et dans des listes de diffusion internes animées en permanence. Concernant l’accès à l'information scientifique et technique, une étude a été conduite récemment par Gérard Grozel, responsable de l'unité centrale de documentation de Versailles, Marie-Hélène Magri, directeur adjoint de l'unité de documentation de Jouy-en-Josas, leurs collaborateurs et l'ensemble des documentalistes des centres de l'INRA. Le but était de mieux appréhender la transition vers une documentation virtuelle. Une étude budgétaire très fine a permis de noter que sur un budget de près de 19 millions de francs, 12 millions étaient consacrés à l'acquisition de périodiques scientifiques. Mon propos ne concernera ici que ces derniers. Nous avons aujourd'hui environ 5 100 abonnements à l'INRA, ce qui correspond à 1 986 titres. Grâce à l'action des laboratoires et du service de documentation, une rationalisation des abonnements a été opérée ces dernières années. Nous avons également étudié la répartition de ceux-ci entre les éditeurs et en avons recensé 770, beaucoup d'entre eux (entre 500 et 600) n'ayant qu'un seul titre au sein de l'INRA. Il s'agit sans doute là d'une caractéristique de l'information agronomique. Nous avons également observé que 450 éditeurs avaient un chiffre d'affaires inférieur à 2 500 francs. En croisant toutes ces données, nous avons identifié un groupe d'éditeurs dont le chiffre d'affaires était de l'ordre de 6,5 millions et avons entamé une démarche pour regrouper dans des plates-formes électroniques ces éditeurs qui représentent 400 titres souvent en faible nombre compte tenu de leurs coûts. Vous en connaissez sans doute une, Science Direct, puisque nous avons récemment évalué l'intérêt de cette plate-forme. Cette démarche permet une accessibilité plus grande aux publications. Elle ne supprime pas pour autant la réflexion sur le statut des périodiques scientifiques et sur d'autres modes de gestion économique de l'information scientifique et technique. Outre l'accès aux périodiques scientifiques
en ligne, nous avons également développé un accès
aux banques de données secondaires et aux revues d'abstracts, qui
nous semblent essentielles dans une institution comme la nôtre car
ce sont des outils de synthèse dont l’exploitation facilite l’étude
des programmes de génomique. Nous fournissons ainsi un accès
en ligne à toutes les unités de recherche à la base
CAB, qui a été mise en ligne par la Direction de
l'information. Il faut encourager l'accès à ces référentiels
d'information. A partir du test Science Direct, nous avons effectué
une enquête de satisfaction sur l'intérêt d'une approche
virtuelle de l'accès à l'information. Documentalistes et
scientifiques ont émis des avis favorables, ce qui nous encourage
à aller dans ce sens.
Depuis 1992, suite à l'expérience pilote que nous avions proposée à l’Académie des Sciences, nous nous sommes donné pour objectif de répondre de manière constante aux besoins de la communauté scientifique en matière d'accès à l'information scientifique, de gestion et de partage de cette information et ce grâce à une maîtrise des outils de communication électronique et au développement d’un mode de fonctionnement de type " collaboratoire ". Nous travaillons ainsi sur des plates-formes électroniques scientifiques, afin de favoriser le partage d'informations scientifiques autour d'une thématique. Il s'agit d'accéder à l'information brute, de l'échanger, et d'apporter de la valeur ajoutée afin d'aboutir à des connaissances. Chaque plate-forme correspond à un besoin exprimé par la communauté scientifique et réunit trois types de compétences : l'ingénieur en information-documentation, dont la fonction est de repérer, collecter, trier, structurer, indexer et filtrer l'information ; la communauté scientifique composée des chercheurs qui analysent, valident, commentent et personnalisent l'information ; et l'informaticien, qui adapte, développe et répond aux besoins exprimés. Nous n'oublions en outre jamais le citoyen et ouvrons l'accès à l'information grâce à Internet. Différents modules sont intégrés dans ces plates-formes : thesaurus, modules bibliographiques, bases factuelles, sites web, modules d'interrogation, outils d'analyse textuelle, grilles de lecture, glossaire, forums, et statistiques. Nos réalisations portent sur différents thèmes parmi lesquels, notamment, l'éthique, les bonnes pratiques de laboratoire, et les disparités sociales dans l'économie de la santé. Nous avons développé également des colloques électroniques pilotes, en partenariat avec la Fondation Mérieux. D’autres sont à venir. Les colloques électroniques se basent toujours sur le partage des connaissances et sur une large diffusion de celles-ci. Pour en revenir à l’information publiée, nous comptons 4 000 abonnements annuels à 1 500 titres de revues scientifiques pour un coût de 12 millions de francs, ce qui correspond à 3 % du coût de fonctionnement des laboratoires de l’Inserm. Pour faciliter l’accès de nos chercheurs à l’information électronique, nous venons de passer avec Science Direct (Elsevier) une convention de trois ans pour permettre à plus de 5 000 chercheurs de l’Inserm et travaillant à l’Inserm d’accéder aux cent revues électroniques d’Elsevier faisant actuellement l'objet d'un abonnement papier. Différentes questions se posent aujourd'hui. Par exemple, les institutions qui financent les recherches doivent-elles continuer de payer pour publier et pour voir les résultats ou doivent-elles se doter de serveur de préprint et de publications ? Quelles doivent être les modalités d'évaluation ? Quelle doit être l'évaluation des scientifiques et de leur carrière ? Quel est l'impact de ces nouveaux moyens de communication sur le droit moral, patrimonial et le copyright ? Nous devons aujourd'hui tous nous concerter pour faire évoluer les pratiques. Pour maîtriser celles-ci, une anticipation est nécessaire.
Les débats que nous allons avoir s'inscrivent dans un processus ancien : celui du développement des dispositifs socio-techniques pour l'information et la communication scientifique et technique. Cette problématique est à la croisée de plusieurs axes : le développement des nouvelles technologies, qui nous permettent désormais d'être à la fois producteurs et consommateurs d'informations ; le développement des champs scientifiques et l'augmentation croissante des besoins de communication et d'édition scientifique au niveau international ; et les politiques publiques de soutien au développement des services de communication et d'information électronique. Tout a commencé dans les années 60-70 aux Etats-Unis avec les bibliographies spécialisées et sous l'impulsion des agences fédérales américaines. Il s'agissait de rendre plus accessibles les bibliographies spécialisées et l'informatisation des informations gérées par ces agences, alors même que se développait une informatique documentaire lourde. Les années suivantes connurent le développement des réseaux : Transpac, TCPIP, serveurs, etc. Les banques de données se multiplièrent et apparut en France une vraie politique de l'IST. Durant les années 80-90, les ressources documentaires et les informations factuelles sur Cd-Rom se développèrent. Des réseaux locaux de Cd-Rom furent mis en place et les banques de données connurent une forte croissance. Quant à la dernière décennie, elle a connu l'avènement des autoroutes de l'information avec le développement du web qui a débuté aux Etats-Unis. Le web a permis l'apparition de modèles alternatifs de communication et d'information scientifique : revues électroniques, mise en place de bases de préprint, montée en puissance des bibliothèques numériques dans les politiques publiques, ce surtout aux Etats-Unis et en Grande-Bretagne. Il faut à mon sens rendre hommage aux chercheurs pionniers, qui ont eu une vraie réflexion politique sur l'évolution de leur système de communication, et notamment à Paul Ginsparg, chercheur en physique théorique, qui installa dès 1991 son serveur de préprint dans le laboratoire de l'Ocean Mouth, à Nadrew Obisco, mathématicien aux laboratoires de l'ATT, qui publia dès 1995 de célèbres articles sur l'évolution des revues scientifiques, et à Etienne Harnad, qui est professeur à l'Université de Southampton, chercheur en sciences cognitives. Ce dernier, qui est aujourd'hui parmi nous, réfléchit depuis un certain nombre d'années sur l'édition scientifique et sur son devenir. On lui doit des concepts forts qui ont animé de nombreux débats et fait réfléchir la communauté des professionnels de l'information et de la documentation, ainsi que les chercheurs :
Parmi les projets qu'il a développés, je rappellerai celui de Quant Prints, un projet de bases de prépublication, d'archives de préprint et d'articles publiés. Il s'agit en fait d'une mise en pratique du concept d'autopublication financée dans le cadre de la politique de soutien du Royaume-Uni au développement des bibliothèques numériques (projet Deli). Etienne est également à l'origine du projet Psycholoqy, qui est une revue purement électronique. Il anime en outre depuis plus de vingt ans la revue Behavorial and Brain Science, qui existe maintenant sur support électronique et qui a permis le développement de la notion d'Open peer commentary.
Repenser la communication scientifique
Un nécessaire changement En tant que chercheur, vous faites des découvertes, soit théoriques soit empiriques, et avez le désir de diffuser vos résultats pour que les autres chercheurs sachent ce que vous avez trouvé. La publication vous permet de participer à la connaissance humaine, d'autres chercheurs pouvant s'appuyer sur vos résultats pour avancer. Il y a certes d'autres raisons, que ce soit des raisons alimentaires, ou une volonté de carrière et de renommée. Mais celles-ci me paraissent secondaires. La question à se poser est à mon sens la suivante : qu'est-ce qui distingue un chercheur d'un auteur de livres ou d'articles journalistiques ? Or la réponse est simple : le chercheur n'est pas rémunéré pour ses articles. Dans ce système ésotérique, la plupart du temps, l’auteur a peu de lecteurs. Il ne s'agit pas pour autant de réduire vos publications car il y a toujours un petit nombre de personnes intéressées : les chercheurs actuels et à venir. La publication papier a longtemps été le
seul moyen d'être lu. Le papier étant coûteux, il était
nécessaire de demander aux lecteurs une participation financière
et les institutions devaient donc dépenser beaucoup d'argent pour
accéder aux périodiques. Désormais, ce système
n'est plus incontournable. Il ne s'agit certes pas de lire des articles
sur écran. Lorsque ceux-ci vous intéressent, libre à
vous de les imprimer. Mais tout ce qui procède de la recherche
peut se faire sur ordinateur. On imprime donc désormais uniquement
ce qui est nécessaire à son travail. Nos ennemis ne sont
pas les éditeurs mais les abonnements, les licences de sites et
les pay per view. Ces derniers doivent donc être remplacés
par un système mieux adapté à nos objectifs. Les
sociétés savantes disent souvent qu'elles ont besoin de
ces ressources pour assurer leur fonctionnement. Or la vraie question
est celle-ci : souhaitez-vous empêcher certains chercheurs
d'accéder à vos travaux pour financer des congrès ?
Il existe un certain nombre d’institutions riches pour lesquelles il est
possible d’avoir accès à toutes les revues souhaitées.
Mais ce n'est pas le cas pour toutes les institutions et pour tous les
pays ; le nombre de lieux où les chercheurs ne peuvent accéder
à nos résultats est beaucoup plus important que le nombre
de ces lieux fortunés. Le paradoxe de l'édition scientifique Etant donné que les bibliothèques n'ont pas suffisamment d'argent pour payer toutes les revues, le fond du problème est intrinsèque. Alors que les chercheurs offrent leurs résultats, tout le monde doit payer pour y accéder. Si l'auteur ne souhaite pas être rémunéré pour ce qu'il publie, l'accès à ses travaux doit être libre. En outre, les revues expertisées ou les monographies spécialisées, parce qu'elles ne sont pas rentables, ne trouvent pas d'éditeurs, tout comme les actes de congrès. Tout ceci doit donc être une littérature offerte. Je vous rappelle que " copyright " signifie " droit d'auteur ", ce qui signifie bien que ceux-ci appartiennent à l'auteur et non à l'éditeur. Lorsque j'offre mes résultats, j'offre mes propos mais je garde mon statut d'auteur, qui doit être protégé. Ce droit me protège contre le plagiat – le vol de mon statut d’auteur. Mais si je ne désire pas de protection contre le " vol " de mon texte, il m’est inutile d’invoquer mon droit d’auteur contre moi-même ! Le pacte faustien que nous avons conclu avec les éditeurs n'est aujourd'hui plus nécessaire. Il ne s'agit pas d'abandonner les revues scientifiques. Personne ne vous demande de ne plus soumettre vos articles aux revues de votre choix. Il ne s'agit pas d'auto-publication mais d'auto-archivage. La publication demeure. Il ne faut pas oublier que ce ne sont pas les revues qui expertisent nos rapports mais des pairs, c’est à dire nous même. Des spécialistes font des recommandations que le rédacteur transmet à l'auteur. Mais ce dernier n'est pas obligé de les suivre et peut par exemple soumettre son article à une autre revue. Ce système d'expertise ne changera pas. Mais les textes n’y seront plus tenus en otages : le service sera payé séparément et le texte lui-même sera libéré. Logiciel à venir Je ne cherche pas à réduire le prix des revues mais à le supprimer totalement ! Les administrateurs de bibliothèques ont mieux à faire que de dépenser leur budget dans des abonnements. En juillet, un logiciel permettant d'établir des archives vous sera offert " http://eprint.org ". Il vous suffira de libérer de la place sur vos serveurs. Il s'agit d'un logiciel inter-opé-rable " http://www.openarchives.org " : un article stocké par l'INRA ou par l’Inserm sera accessible et pourra être lu par tous ceux que cela intéresse, n’importe où, sur le réseau, gratuitement. Au lieu de payer pour lire un article dans Psychological review, qui est la revue ayant le plus d'impact dans mon domaine, il vous suffira de le chercher dans les " archives ouvertes ", qui seront toutes des clones reliés par leur inter-opérabilité. Il suffit aux institutions d’acquérir des serveurs, d’installer le logiciel eprint. Ensuite, les chercheurs n’auront plus qu’à stocker leurs articles dedans. Les chercheurs vont rapidement préférer accéder gratuitement aux articles et la demande pour les revues payantes inévitablement chuter. Une fois la littérature libérée, les abonnements ne seront plus nécessaires. L'expertise pourra être financée par une partie du gain financier (10 % environ) qui en découlera. Les revues deviendront uniquement des étiquettes certifiant le niveau de qualité de l’article. Débat Un chercheur à l'INRA Comment se fait l'auto-archivage ? Se fait-il à partir du texte envoyé à la revue ? Etienne HARNAD Le texte est digitalisé dans l'ordinateur. Il suffit de se connecter au logiciel d'auto-archivage, de préciser quelques paramètres – par exemple s'il s'agit d'un pré-tirage ou d'un article expertisé (nom de la revue – d'indiquer l'URL où est stocké l'article, et le système fait le reste. Votre article est alors en accès libre. La première fois, cela prend dix minutes. Et une fois cloné, le stockage prend deux minutes. L'accord de Santa Fe permet à tous les fichiers d'être inter-opérables " http://www.openarchives.org/sfc/sfc_entry.htm ". Une intervenante Comment la digitalisation des images se fera-t-elle ? Etienne HARNAD Par les DGIF, par exemple. La même intervenante Cela ne prend-il pas trop d'espace ? Etienne HARNAD Non. Le coût de l’espace est devenu dérisoire. Un intervenant Vous partez sans doute du fait que la gestion électronique de toutes ces informations est forcément moins chère que la gestion actuelle. Cela me fait penser à ce que l'on disait à propos de l'énergie solaire dans les années 1960. Etienne HARNAD Je ne fais aucune hypothèse. Tout ce dont je parle existe déjà. L'archive de Los Alamos a par exemple déjà capté une grande partie de la littérature en physique " http://xxx.lanl.gov ". Un intervenant Il faut tout de même payer. Etienne HARNAD Le coût est dérisoire. En outre, le réseau développé par le Los Alamos, aux Etats-Unis, est un réseau central. Je parle pour ma part d'un réseau distribué. Le coût est très faible rapporté au nombre d'articles disponibles (près de 120 000) et partagés par un nombre important d’institutions. Annick FONTBONNE Je ne vois pas pourquoi les revues dépenseraient de l'argent pour chercher des experts afin d'évaluer les articles. De plus, comment sera gérée toute l'information scientifique, qui est déjà très importante ? Sans sommaire de revue, comment pourra-t-on rechercher les articles qui nous intéressent ? Etienne HARNAD J'ai déjà parlé de l'expertise. 10 % de ce que vous aurez économisé en ne payant pas les abonnements permettront de payer l'expertise. Je vous rappelle que les experts, comme les auteurs, offrent leurs services. En outre, les revues scientifiques continuent à exister, mais comme des cyber-étiquettes de qualité uniquement. Un intervenant Qui gérera cette expertise ? Etienne HARNAD Les revues actuelles. Le système actuel rapporte énormément aux éditeurs et ne répond pas aux besoins des chercheurs. Si les éditeurs établis n'acceptent pas ce fonctionnement (contrôle et certification de qualité), de nouveaux éditeurs en ligne prendront leur place. La gestion de la quantité d'information est une autre question. Mieux vaut stocker les informations sur des ordinateurs que sur des étagères ! Je parle de libération de la littérature. Si la quantité vous fait peur, il faut tuer les chercheurs ! Quant aux moyens de sélection, ils sont aujourd'hui divers : mots clés, moteurs de recherche, citation etc. Suzy MOUCHET L'idée est de centraliser et de maintenir tous les systèmes d'expertise. La masse d'informations existe déjà, même si elle n'est pas visible, compte tenu du filtre que constituent les comités de lecture. Ce qui sera lu sera de toute façon ce qui aura été filtré. Un chercheur à l'Inserm, rédacteur d'une revue européenne Pourriez-vous expliquer votre proposition d'évaluation ? Comment voyez-vous celle-ci à l'échelle d'un pays, de l'Europe et du monde ? Pourrait-il y avoir un système d'évaluation mondial ? Etienne HARNAD Rien ne changera. Je vous ai déjà dit que les revues resteraient en place, de même que les moyens d'évaluation. Il y aura certes des exceptions. Certains éditeurs préféreront sans doute changer de métier. Le même intervenant Les revues, en perdant 90 % de leurs profits, feront rapidement faillite. Etienne HARNAD Mais les spécialistes et les rédacteurs existeront toujours. Les éditeurs ne sont pas les seuls capables de mettre en place une expertise. Certains rédacteurs ont par exemple démissionné d’Elsevier en masse et ont reconstitué un comité. Si les comités restent les mêmes, peu importe le nom de la revue. François LE TACON, chercheur à l'INRA L'idée d'auto-archivage est extrêmement séduisante. En tant que chercheur, je ne peux qu'y souscrire. Mais je pense qu'elle est actuellement impossible. En effet, lorsqu'un article est accepté par une revue, le droit d'auteur et le copyright ne font qu'un. Jamais les éditeurs n'abandonneront ce droit. Etienne HARNAD Je suis rédacteur depuis vingt ans dans une revue [" http://www.cogsci.soton.ac.uk/bbs " ] ayant un fort impact, et je rédige également depuis dix ans dans une revue gratuite du même type " http://www.cogsci.soton.ac.uk/psycholoquy ". Si cette dernière n'a pas tué la première, c'est tout simplement parce que les chercheurs sont lents à se rendre compte de l’optimal et de l’inéluctable ! Mais cela arrivera un jour. Quant au droit d'auteur, les chercheurs ne sont tout de même pas assez stupides pour signer des contrats offrant l'exclusivité de leurs articles aux revues, alors que celles-ci ne les payent pas ! Il faut garder le droit de disposer de ses articles. Il vous suffit, pour ce faire, d'auto-archiver vos informations avant même de les soumettre aux éditeurs. Ainsi, le pré-tirage est déjà sur le réseau et les arbitres n'ont plus qu'à faire leur travail d’expertise. Les informations sont ensuite acceptées avec des changements éventuels et le droit d'auteur cédé à l'éditeur. Mais le texte du pré-tirage reste sur le réseau. Il suffira ensuite d'ajouter une liste de corrections. Tout cela est parfaitement légal (et nous précipitera vers l’optimal et l’inéluctable). Suzy MOUCHET Il y a une réflexion à approfondir avec les éditeurs (et je pense qu’ils n’ont pas le choix), de manière à voir comment on peut autoriser le libre accès aux articles avec des systèmes d'auto-archivage, sans pour autant détruire l'équilibre économique des revues. C'est ainsi que l'on commence à procéder actuellement. Etienne HARNAD Je ne demande pas de sacrifice. Il est certes moins commode de commencer par regarder le pré- tirage puis de regarder ensuite les corrections. Mais tout est une question de temps. Charles DUMONTET, rédacteur en chef d’une revue électronique en cancérologie Il faut bien distinguer, dans les revues, le rôle des sociétés savantes des procédures de contrôle de qualité. La plupart des grandes revues sont issues de sociétés savantes spécialisées qui, elles, ne disparaîtront pas. Comme vous le disiez, l'expertise est réalisée par des spécialistes, membres de ces sociétés. Il est donc tout à fait concevable que le contrôle de qualité perdure et qu'un sous-groupe soit affecté à cette tâche. Docteur ROBERT, Laboratoire d'ophtalmologie de l'Hôpital Hôtel-Dieu Il m'arrive de participer à l'évaluation de chercheurs qui vivent sous le stress du " publish or perish ". Les comités ont pour instruction de ne tenir compte que des publications en langue anglaise et dans des revues internationales. Comment pensez-vous convaincre ces comités pour qu'ils tiennent compte des publications électroniques ? Etienne HARNAD Ces comités ont raison et rien ne changera. Les chercheurs évalués soumettront leurs articles aux même revues. Il n'est pas nécessaire de changer ce système. L’étiquette d’expertise continuera à certifier le niveau de qualité. Docteur ROBERT Mais une impression sur papier sera-t-elle nécessaire ? Etienne HARNAD Toutes les revues de qualité sont d'ores et déjà en ligne. Si Science abandonne la revue papier, croyez-vous pour autant que les publications de cette revue ne seront plus admises par les comités ? Je pense que ceux-ci ne sont pas si idiots ! C’est l’étiquette qui compte et non le parchemin. Un intervenant Préconisez-vous un abandon total du format papier ? Et que conseillez-vous aux chercheurs qui veulent appliquer ce que vous proposez ? Etienne HARNAD Le papier disparaîtra au fur et à mesure de la disponibilité des moyens, en ligne et gratuits. Les chercheurs n’ont qu’à insister pour que leurs institutions établissent des archives inter-opérables ; ensuite, ils n’auront plus qu’à tout stocker dedans. Qu’il signe un contrat faustien ou pas ne change rien. Il a la possibilité, dans tous les cas, de libérer ses recherches en ligne. C’est cela qui compte. Le même intervenant Avez-vous déjà essayé de ne pas signer ? Etienne HARNAD Un geste héroïque de cet ordre n'est pas nécessaire. Ce n'est pas ce que je propose. Quant au format papier, il disparaîtra lorsqu'il n'y aura plus de demande. Ne vous en occupez pas et auto-archivez ! Le même intervenant Il me semble tout de même nécessaire de garder ce format. Etienne HARNAD Je ne crois pas. Et si tel est le cas, ce format demeurera, en parallèle avec l’auto-archivage libre. Une intervenante Je voudrais revenir sur les revues à fort impact et sur le " publish or perish ". Il existe en effet un impérialisme de certaines revues dans lesquelles il faut publier ; et l'évaluation des scientifiques finit par prendre ce seul critère en compte. Les systèmes de communication électronique permettant un accès à des informations plus riches que celles figurant dans les revues papier, ils entraîneront sans doute une meilleure évaluation des scientifiques. Etienne HARNAD Nous avons tous plusieurs casquettes. Nous sommes auteurs, rédacteurs, experts, lecteurs, etc. Je souhaite améliorer le système d'expertise et j'ai mes idées sur le " publish or perish " mais je ne souhaite pas en parler car ce n'est pas le propos. Je ne parle ici que de libération de la littérature. PubMed Central des National Institutes of Health (NIH) – BioMed Central Pierre OUDET Introduction - Ghislaine CHARTRON Le Professeur Pierre Oudet est conseiller scientifique auprès du département de l’information scientifique et de la communication (Disc) de l’Inserm et pour son réseau d’ingénieurs en information (réseau Disc-Doc). Le projet PubMed Central s'inscrit dans l'histoire des banques de données génomiques. Le phénomène a débuté en 1965. En 1984, a été créé BioNet, le premier réseau permettant d'accéder aux premières banques génétiques. Et en 1988, Le National Center for Biotechnology Information (NCBI) a été créé pour gérer ces banques. La libéralisation des banques de données bibliographiques a permis une plus grande accessibilité. Medline est l’interface d'accès à la littérature publiée dans le domaine biomédical. PubMed Central est une avancée supplémentaire consistant à avoir un accès au texte intégral. Avancées outre-Atlantique Je suis depuis de nombreuses années ce qui se passe aux Etats-Unis, et notamment à Washington. Ce que je vais vous présenter aujourd’hui émane de ces visites. Il y a une quinzaine de jours encore, j’étais au NCBI pour vérifier mes informations. J'ai pu voir quels étaient les idées, les réalisations et les projets. Il m'est ainsi apparu que l'Europe avait énormément de progrès à faire si elle voulait s'accrocher au train à grande vitesse qui a démarré Outre-Atlantique. Je précise que je ne suis ici mandaté ni par le NCBI, ni par les NIH ou par la NLM. Lorsque j'ai été pour la première fois en contact avec PubMed Central, début 1999, il s'agissait d'un projet dont nous avions discuté à plusieurs reprises. Nous caressions ce type d'objectif compte tenu des nouvelles technologies qui engendrent un mode de communication scientifique totalement différent et dont les implications sont spécifiques. Par exemple, la production de grandes bases de données, aujourd'hui disponibles dans les domaines clinique et biologique, rend difficile le rassemblement de ces différentes données comme leur accès interactif. Diversité des supports d'information Les données produites par la recherche sont contenues, entre autres, dans les publications, qui ne sont, aujourd'hui, que des indicateurs de localisation d'une connaissance. En effet, en biologie et en médecine, les publications ne contiennent pas les éléments permettant la reproduction des connaissances décrites. Ne figurent que les adresses, éventuellement électroniques, des auteurs. Les informations peuvent également être présentées sous forme d'images, de films ou de bases de données. Elles peuvent également figurer dans des banques de produits biologiques, notamment dans les biothèques, qui relèvent de la responsabilité des instituts finançant la recherche, mais également des laboratoires qui doivent maintenir ces produits, faute de quoi on ne pourra jamais répéter les expériences. Evolution du concept de publication Les connaissances que l'on communique engendrent aujourd'hui des collaboratoires, c'est-à-dire des interactions entre groupes de recherches permettant un échange privilégié de données. Cela assure aux laboratoires concernés une reproductibilité et un accès aux connaissances. Ceux qui ne font pas partie des collaboratoires s'excluent en quelque sorte de l'accès à certaines connaissances. Conséquences Le manuscrit dépasse largement la forme papier dont nous disposons aujourd'hui car il doit contenir toute l'information permettant de reproduire les expériences. J'ai déjà parlé des contraintes, notamment en termes de matériel biologique. Dans certains domaines de la biologie clinique, par exemple, on ne peut rien faire si l'on n'a pas accès au matériel. Les références, les techniques et les réseaux, qui sont générateurs de connaissances, doivent être associés au manuscrit. Ce dernier doit, en outre, avoir un format unique. Dans le cas contraire, il serait difficile d'avoir des outils de stockage, de recherche et d'accès à l'information efficaces et performants. Nous devons donc faire évoluer les modes de diffusion de nos connaissances vers un format unique, ce qui n'est pas une petite tâche. Les plus grands serveurs buttent sur ce problème. Toutefois, un format unique va progressivement s'imposer grâce à des serveurs contenant un certain nombre d'informations interfacées et liées entre elles. Le format unique repose sur le développement de bases de données spécifiques. Dans le domaine des modulations et des expressions génétiques dans les cancers, il existe par exemple aujourd'hui la plus grande base d'information : CGAP. Cette base, gérée par le NCBI et financée par le National Cancer Institute (NCI), contient toute l'information disponible actuellement sur les bases de données de modulation de l'expression génétique des différents cancers. Sans accès à cette base de données, les articles sont difficilement exploitables. C'est ainsi que, dans le cadre du projet E-Biomed, le NCI a examiné, sur un certain nombre de clones cellulaires, la sensibilité à différentes drogues corrélée à l'expression génétique. Pour aboutir à des informations pertinentes, comme la relation entre drogue, type de cancer et efficacité, on a besoin de toute l’information. En plus des données brutes archivées et des produis biologiques associés à une recherche, existe la valeur ajoutée, à savoir les commentaires, revues et opinions attachés à cette recherche. Ceci s'est développé avec le travail sur les séquences, à un moment où la notion d'évolution des connaissances associées à un gène a fait son apparition. Les chercheurs doivent donc avoir accès à l'ensemble des connaissances, si possible de manière conviviale. Les structures finançant la recherche doivent intégrer le coût de cette évaluation et de cette diffusion dans le financement de la recherche. Cela se fait d'ailleurs déjà. Dans les projets américains sur les génomes, 9 à 12 % des financements étaient automatiquement dévolus à la diffusion et au stockage des connaissances sous forme électronique. Les structures finançant la recherche gardent ainsi le contrôle non seulement de la production mais également de la diffusion de la recherche. Evolution du projet du National Center for Biotechnology Information (NCBI) Le projet initial, qui avait pour nom E-Biomed, date de début 1999. Depuis, il a évolué, se décomposant en deux sous-projets : PubMed Central et PubMed Central Express. Fin 1998-début 1999, David Lipman et Harold Warmus ont abouti aux mêmes conclusions quant à la diffusion des connaissances scientifiques et à son coût. Cela ne constituait d'ailleurs pas un phénomène isolé puisque le Vice-président américain, Al Gore, avait déjà demandé que toutes les informations relatives à la santé soient en accès libre pour les chercheurs, les médecins mais aussi pour les patients ; l'ensemble des informations de la NLM fut ainsi entièrement financé par le budget fédéral, et le coût d'accès à ces informations disparut. L'idée de patrimoine commun existait donc déjà dans le domaine biologique et médical. Et PubMed Central n'est, en fait, que l'extension de cette idée. En mai 1999, Harold Warmus a commencé à développer l'idée du serveur E-BioMed sur Internet, avec pour objectif de court-circuiter les journaux et de rendre accessibles les articles full text dans le domaine biologique et médical. Le coût était pris en charge par les NIH et les autres organismes finançant la recherche. Au début, le système devait être à deux vitesses avec, d'une part, du matériel évalué (Peer-reviewed) et, d'autre part, du matériel non évalué. On pouvait ainsi proposer au chercheur de diffuser l'information sur sa recherche directement, sans aucune évaluation. Le but du projet était bien évidemment de diminuer le coût de diffusion des informations de la recherche. Il s'agissait en outre de lutter contre des groupes de pression privilégiant certaines informations et de faire en sorte que toutes les informations scientifiques soient disponibles et disposent de la même lisibilité. Le système devait ainsi devenir plus homogène et plus transversal. Le serveur électronique devait également permettre des échanges et des collaborations entre les groupes de recherche. Il devait établir des liens avec d'autres bases de données, les expériences du NCBI au niveau des bases de séquences et des banques de structures pouvant être directement utilisées. Le serveur permettait d'organiser et de préserver l'évaluation scientifique des résultats de la recherche. Il résolvait ainsi le problème de l'évaluation et de la comparaison des informations qu'entraînait la sélection opérée par les coéditeurs. David Lipman, pour sa part, avait évalué que le coût des abonnements pouvait être réduit de cent millions de dollars par an. Le coût d'une publication était ainsi ramené à une centaine de dollars. C'est ainsi qu'avec Harold Warmus, il a pensé à une structure regroupant quatre américains, quatre européens, deux asiatiques, etc., mais également des représentants des sociétés savantes et du secteur privé. Le projet a immédiatement provoqué des objections et des critiques, qui se sont progressivement calmées. Il était tout d'abord demandé comment la qualité scientifique des documents diffusés serait assurée et comment serait empêchée l'utilisation malencontreuse des données cliniques, d'essais cliniques ou de perspective de recherches biologiques en clinique. Il était reproché aux auteurs du projet d'accuser les sociétés savantes de faillite dans l'évaluation et la valorisation de l'information. Il était en outre demandé si l'identité des différents journaux, et donc la hiérarchie des informations, seraient maintenues. Enfin, il était demandé si une nouvelle structure serait créée ou si les structures existantes allaient évoluer vers une structure unique. Suite à des discussions, la NLM et les NIH ont décidé de lancer le projet PubMed Central en 1999. Il s'agit d'un serveur donnant un accès libre à toutes les informations scientifiques publiées dans le domaine des sciences de la vie. Dans le projet actuel, les publications et les informations scientifiques ne seraient pas envoyées directement à PubMed Central, mais transiteraient par une structure différente appelée BioMed Central. Le projet ne contiendrait ainsi que des données ayant été évaluées et qualifiées. Le contrôle de qualité serait donc assuré. Un deuxième site distinct, BioMed Express, contiendraient les informations non évaluées. Ce dernier projet, peu soutenu par la communauté scientifique, est pour l'instant en attente. Le serveur BioMed Central est accessible sur le Net mais presque vide. Les auteurs du projet ont commencé par travailler sur deux journaux, Mocular Biology of the Cell et les PNAS, et ce faisant, ils ont commencé à se poser la question de la structure de l'information stockée. En effet, pour stocker et accéder à l'information, il faut que celle-ci ait une même structure quels que soient sa provenance et son traitement préalable. Le travail à partir des deux journaux permet d'établir un cahier des charges afin que le système soit performant. Le serveur existe actuellement sous forme de prototype en accès local, mais un certain nombre de problèmes reste à résoudre. Je précise que ces problèmes de format unique n'ont pas été résolu dans le projet HighWire Press, qui fait coexister plusieurs formats différents, des adaptations étant nécessaires pour accéder aux différents journaux. David Lipman pense que PubMed Central sera opérationnel à partir de mai prochain. Le budget 2000 de PubMed Central est de 2,5 millions de dollars. Et le budget 2001 devrait être équivalent. La moitié de ce budget est consacrée aux salaires et l'autre moitié aux équipements. Le projet BioMed Central Ce serveur est actuellement visible. Il ne s'agit pas d'une structure publique mais d'une structure commerciale, une association d'éditeurs rassemblés pour créer une nouvelle revue totalement électronique. Cette revue bénéficiera d'une structure d'évaluation assurant la qualité et des services associés. Il existe ainsi des développements informatiques pour la structuration des données et pour la création de liens avec les publications disponibles. Tout article évalué et structuré par BioMed Central est immédiatement transféré à PubMed Central, qui l’archive et le diffuse. BioMed Central n'a donc pas pour objectif d'être un serveur. Parmi les services supplémentaires offerts par BioMed Central, on trouve la possibilité d'indexer les articles et des aides à la publication. Si vous avez des problèmes d'anglais ou de structuration de données, vous pouvez envoyer votre manuscrit à BioMed Central qui, moyennant finance, le réécrit. Relations entre BioMed Central et PubMed Central BioMed Central peut être vu comme la structure amont engendrant les données transférées à PubMed Central. Ce consortium est piloté par le Current Science Group (CSG) qui tire ses bénéfices de la valeur ajoutée qu'il donne aux documents. Il fonctionne comme une société à but non lucratif pour les chercheurs, puisqu'il évalue gratuitement les documents, mais pour l'utilisateur, l'information est payante. Il porte sur cinquante domaines couvrant la biologie et la médecine. Trois co-éditeurs ayant chacun accès à un ensemble d'experts évaluent les documents. CSG est une structure totalement privée. Un sous-ensemble de CSG, qui appartenait à Elsevier, a quitté la structure. BioMed Central ne limitera pas son activité à l'édition d'articles soumis. Il se propose, en effet, d'être un pivot pour l'élaboration de collaboratoires, c'est-à-dire pour favoriser les liens entre des groupes de recherche qui bénéficieraient ainsi d'un site et d'outils permettant d'échanger, de stocker des informations et de constituer des banques de données. Ce service suppléerait aux réseaux européens et internationaux péniblement mis en place pour la diffusion des connaissances, notamment dans le domaine de séquences. Parallèle avec HighWire Press HighWire Press n'a aucun lien avec les deux projets précédents. C’est une structure financée sur contrat, qui assure la diffusion de références bibliographiques mais surtout de textes complets consultables sur site. C'est un exemple de serveur qui permet de voir quelles pourraient être, dans l'avenir, les voies d'accès à l'information, les contraintes, les difficultés et les solutions retenues. Ce site comporte des journaux n'ayant pas tous la même valeur ; des grands journaux n'y sont d'ailleurs pas. Pour certains journaux, à titre expérimental, vous avez accès au full text au moment de la parution papier. Pour d'autres, les versions immédiatement accessibles ne sont pas mises en ligne. Le Journal américain de psychiatrie, par exemple, n'est accessible que jusqu'en juin 2000. Il ne faut donc pas voir HighWire Press comme une structure pérenne permettant d'accéder au full text de tous les journaux. HighWire Press accepte de gérer les archives des journaux mettant en ligne le full text de leurs publications. Après six mois ou un an, les journaux considèrent en effet que la diffusion de copies d'articles n'est plus rentable et ils acceptent ainsi que ces informations soient stockées et rendues accessibles sur un serveur. Vous avez ainsi accès sur HighWire aux articles parus dans Blood entre janvier 1997 et aujourd'hui. Ce type de serveurs remplacera sans doute toutes les collections se trouvant actuellement sur les rayonnages. Conclusion La situation a beaucoup évolué depuis 1999 et courant 2000 et les concepts présentés évolueront encore. Les Américains ont aujourd'hui une expérience importante au niveau des bases de données. Ils ont développé l'interactivité entre texte, image, film et graphique et peuvent désormais développer des serveurs. La structure créée, qui était à l'origine prévue comme purement publique, a évolué : les informations seront évaluées par une structure en lien avec les structures existantes, même si d'autres structures se développent ; une partie de l'alimentation du serveur BioMed Central est gérée par le secteur privé. Reste à savoir si, en Europe, nous sommes capables de monter des opérations aussi efficaces dans des délais relativement restreints. BioMed Central et PubMed Central seront totalement efficaces à l'automne 2000. Débat Etienne HARNAD La probabilité de succès de BioMed Central et de PubMed Central dépend de la probabilité pour que les éditeurs acceptent d'offrir le contenu de leurs revues. PubMed Central est aujourd'hui presque vide parce qu'il dépend du don d'articles par les éditeurs. Et BioMed Central est une structure concurrente qui souhaite enlever le marché aux éditeurs actuels. Le problème est le même pour HighWire Press. Pierre OUDET Il y a un décalage important entre votre discours et mon analyse. Lorsque je parle de PubMed Central, je ne parle pas d'un serveur de publication électronique classique mais d'un serveur qui met à disposition des textes et des liens avec des bases de données dont il favorise l'entretien et la diffusion. Ce travail est beaucoup plus complexe que celui d'un éditeur. Il s'agit d'intégrer dans la connaissance scientifique diffusée les matériels, les formations, les techniques ayant permis de générer les résultats de la recherche. Il s'agit d'un pivot. Les publications ne sont qu'un élément, qui devient mineur par rapport au contenu de la recherche. Ce sont les liens entre les différentes bases de données, les résumés et les commentaires actuellement mis en place qui sont intéressants dans le projet PubMed Central. La démarche intègre la nécessité d'un accès à la totalité de l'information pour les chercheurs comme pour les organismes finançant la recherche. Je pourrais citer un certain nombre de publications ne présentant aucun intérêt si ce n'est leurs conclusions. Or ce qui est intéressant pour le chercheur, c'est ce qui est autour : techniques, résultats bruts, connaissances attachées et interaction avec les groupes. Une intervenante Les publications passant par BioMed Central seront injectées dans PubMed Central mais comment seront-elles identifiées ? Pierre OUDET Cette question est effectivement importante car les publications passant par BioMed Central auront une forte valeur ajoutée. Cette structure assure l'indexation, la visibilité et l'importance des publications. Le contrôle de qualité réalisé et le commentaire de l'éditeur seront utilisés pour pointer les publications. Les auteurs des deux projets, parce qu'ils sont à l'origine de ceux-ci, sont à même de le faire. Jean-Luc GATTI Nous ne sommes pas sûrs de la pérennité de l'accès libre puisque le système sera mixte. Le financement dépend du bon vouloir du gouvernement et du Congrès américain. Et ceux qui ajoutent de la valeur aux articles risquent de ne donner accès qu'à l'article brut, sans la valeur ajoutée, s'ils ne sont pas rémunérés.
E-Biosci, projet européen de diffusion des résultats de la recherche Franck GANNON Les Etats-Unis occupent une place très importante dans le monde de la recherche mais un tiers des publications sont européennes et un tiers vient du reste du monde. La montée en puissance des systèmes de stockage de l'information risque de poser un jour un problème de monopole. Si les structures changent les règles d'accès, comme cela s'est produit dans certains domaines pour des raisons de lutte contre l'espionnage ou d'opposition à certaines idées, des blocages risquent apparaître. Pour lutter contre le risque de monopole, il faut que différents pays créent leurs systèmes. Pour les banques de données de séquençages, les Etats-Unis et l'Europe avaient deux systèmes différents. Même si EMBL affirme qu'elle était pionnière, les deux systèmes ont été créés simultanément. C'est parce qu'il existait en Europe un système bien organisé que des discussions ont été possibles, même si elles ont été difficiles compte tenu de leur objet : l'organisation d'un format unique. Les faibles sont contraints d'accepter le système mis en place par les plus puissants. Il est donc important d'avoir du poids. L'exemple de PubMed Central et BioMed Central Pierre Oudet a souligné l'aspect commercial de PubMed Central, ce qui est rare dans un lieu public. Ce sont en fait des Anglais qui sont à l'origine du projet mais qui sont allés aux Etats-Unis pour le réaliser. Leur idée est de donner les articles de base gratuitement et de gagner de l'argent en présentant les articles de manière différente pour les lecteurs n'ayant pas le temps de lire toutes les publications. La montée en puissance de Minireviews et Reviews témoigne, ces quinze dernières années, de ce qui va se passer dans l'avenir. Je ne pense pas que BioMed Central restera seul sur le marché. Il sera ainsi intéressant de voir comment PubMed Central réagira lorsqu'une autre société se créera. Nous verrons comment la diversité sera acceptée. Rien n'empêche l'Inserm et l'INRA de créer un tel système. Ils disposent des experts nécessaires pour créer un comité de lecture. Ils peuvent donc créer une norme et diffuser les informations sur PubMed Central. BioMed Central n'est que le premier d'une série de comités de lecture, avec un logo et une marque, qui n'est pas dans le domaine du print. Nous sommes poussés à créer une structure en lien avec d'autres systèmes de recherche pour faciliter l'accès à l'information. C'est dans cette optique que se place E-Biosci. Si nous ne créons rien au niveau européen, nous serons obligés de suivre le modèle décidé aux Etats-Unis. Un tel système ne se crée pas du jour au lendemain. Il est donc urgent utile d'avancer rapidement. L’émergence du projet E-Biosci Il y a douze mois, je me suis demandé qui avait le droit de prendre la parole pour l'Europe, où les voix sont trop nombreuses. La communauté européenne avait rédigé des articles à ce sujet mais rien ne se passait. L'initiative prise par les NIH nous a tous obligés à réagir. Au départ, je ne pensais pas que EMBO serait le seul à entrer dans le débat. EMBO est une organisation concernée par toutes les sciences de la vie et pas seulement par le génie génétique. Elle a été créée dans les années 60, à une époque où le clonage n'existait pas. Elle est parvenue à rassembler les pensées des chercheurs. Après de nombreux contacts avec ces derniers, je me suis rendu compte que tous souhaitaient que l'Europe agisse. En janvier, lors de notre réunion à Heidelberg avec une trentaine de personnes de sociétés différentes, chacun s'est accordé sur ce point. C'est ainsi que nous avons décidé de créer un site. Deux voies étaient possibles : soit suivre le modèle des NIH avec un seul serveur centralisé, soit créer plusieurs sites permettant de rendre compte de la richesse européenne. Des systèmes électroniques sophistiqués ayant été créés pour les chercheurs dans tous les pays, la seconde solution est apparue préférable. Après qu'il fut proposé que EBI, le centre de banque de données d’ADN, joue le rôle d'un site central, ce qui constituait un premier élément de réponse, une autre voie a donc été suivie, à savoir la constitution d'un réseau de distribution en lien avec les différents sites européens. Son nom, E-Biosci, changera peut-être. Peu importe. Le système ne ressemblera donc pas à PubMed Central. Présentation du projet Nous avons décidé que dans un premier temps, tout devait être Peer-reviewed, les chercheurs, aujourd'hui, souhaitant unanimement garder ce système. Tout finira certes par changer : la façon dont le Peer-review est effectuée, sa vitesse de réalisation, la manière dont nous choisissons nos peers, etc. Mais il est nécessaire de commencer avec ce système. Les Etats-Unis eux-mêmes l'ont conservé dans PubMed Central. Le système E-Biosci ne se limiterait pas aux journaux périodiques que nous connaissons aujourd'hui. BioMed Central, par exemple, devra avoir la possibilité de placer des articles sur E-Biosci. Il est souhaitable que ce système soit une plate-forme pour tous les systèmes actuels et à venir. Nous avons essayé d'ouvrir le débat grâce à un site sur lequel nous présentons toutes les avancées. Nous avons également invité les personnes concernées de tous les pays. Nous ne devons pas oublier que s'il s'agit d'un outil pour les chercheurs, toutes les personnes intéressées doivent pouvoir accéder aux données. Nous resterons donc à l'écoute des besoins. E-Biosci n'est donc pas un PubMed Central européen. Comme vous l'avez vu, PubMed Central est aujourd'hui vide. Il faut admettre que le contenu n'est pas gratuitement disponible, même s'il est nôtre. Or pour démarrer un projet utile à tous les chercheurs, il faut un contenu. Nous devons nous doter d'un système européen avec un contenu important. Nous devons, pour ce faire, travailler avec les éditeurs, que nous le voulions ou non. Ce n'est qu'avec ces derniers que nous pourrons progresser. De plus, ceux-ci sont d'accord pour travailler avec nous si nous leur assurons que cette mutation ne les mettra pas en péril. Des possibilités existent, comme le montre l'expérience de HighWire Press, qui donne accès aux articles après un certain délai. D'après les PNAS, qui ne sont pas dans le champ des éditeurs commerciaux, le coût d'un système de diffusion complètement électronique équivaut à 70 % du coût actuel de diffusion, car les coûts d'organisation sont importants. Une partie du coût provient également du fait qu'il n'y a pas de format unique. Nous avons aujourd'hui une idée assez fine de ce que sera E-Biosci. Nous avons eu une réunion la semaine passée dans laquelle nous avons décidé qu'il fallait un governing party, c'est-à-dire un groupe permettant la continuité : représentants des pays, des bibliothèques, des éditeurs, d'EMBO, et de sociétés savantes, notamment pour les domaines scientifiques non couverts par EMBO. Nous avons également créé un comité technologique avec des experts pouvant délivrer le système, les distributed networks demandant une expertise particulière. Nous allons en outre chercher une personne pour coordonner tout le projet au quotidien. Nous sommes donc engagés dans une voie qui n'est peut-être pas révolutionnaire mais qui permettra une évolution.
Débat Etienne HARNAD A quoi sert ce système s'il n'est pas gratuit ? Franck GANNON Ce système permet d'avoir une seule adresse de connexion. On peut ainsi se connecter chaque jour sur celle-ci pour être au courant de ce qui paraît. Vous avez dit vous-même que le texte n'avait pas d'intérêt pour certaines choses. Le problème du paiement évoluera avec le temps. Les journaux électroniques gratuits prendront une part plus importante dans l'avenir. Etienne HARNAD Je n'ai pas dit que le texte était inutile mais qu'il n'était pas toujours nécessaire de le lire en entier. Avez-vous une idée sur le mouvement Open Achives Initiative et sur l'interopérabilité ? Vous avez parlé du fait que PubMed Central serait centralisé alors que E-Biosci serait distribué. Les logiciels étant plus ou moins équivalents, on peut tous les nommer E-Biosci, qui n'est qu'un nom. Franck GANNON Le projet n'est pas le mien. Tout se décidera en commun. Franck GANNON C'est un principe de réalité. A mon avis, les éditeurs sont incontournables. Mais ils ne contrôleront pas le système. Pierre OUDET BioMed Central offre la possibilité à toute société savante et à tout groupe de chercheurs de démarrer une publication électronique à l'aide d'un format unique et d'outils de structuration de données. Franck GANNON Il intègre donc toutes les sociétés. Pierre OUDET Tout à fait. Le but est-il d'avoir des archives ou de nouvelles publications sous forme électronique avec un système décentralisé intégrant des spécificités européennes ? Dans ce dernier cas, s'agit-il d'acheter le système BioMed Central ou de développer nous-mêmes nos propres systèmes ? Franck GANNON Personne ne se servira d'un système inutile. En outre, je serais étonné s'il n'existait qu'une seule voie à suivre. Il y a en Europe des personnes tout aussi compétentes qu'aux Etats-Unis. Il est préférable de créer notre propre valeur ajoutée. Prenons l'exemple de DNA Database. Il s'agit d'un système universel mais qui émane de plusieurs endroits du monde. Je pense que nous verrons apparaître divers systèmes. Un intervenant Le problème européen est complexe. En Europe, les centres de décisions sont répartis dans de nombreux pays et dans de nombreuses sociétés savantes, et les maisons de publication, notamment privées, sont importantes. Vous dites que l'on finira par les contourner mais qu'il ne faut leur dire immédiatement. Or ces maisons ont compris les enjeux depuis longtemps. Elles sont prêtes à la confrontation. Il ne sera pas si facile de les contourner. Aux Etats-Unis, le système est plus homogène et un effort collectif est plus facile à mettre en œuvre, même si le succès n'est pas garanti. C'est pourquoi nous sommes pénalisés, contraints à un discours relativement conservateur. Un discours plus volontariste se heurterait en Europe à de nombreux intérêts. Franck GANNON Ce problème existe dans tous les domaines en Europe. Nous n'avons même pas les mêmes plaques minéralogiques, ce qui montre nos difficultés à résoudre les problèmes, même lorsque ceux-ci sont sans enjeux. Comme vous le dites, les éditeurs ne sont pas dupes. Mais ils ne cherchent pas à bloquer les évolutions. Ils recherchent plutôt d'autres moyens de faire des bénéfices. Ces mêmes éditeurs sont en contact avec les Etats-Unis, qui ont ainsi les mêmes problèmes que nous avec PubMed Central. PubMed Central ne fonctionnera pas si les éditeurs refusent de mettre leurs contenus sur le site. Nous sommes à un tournant. L'environnement changeant constamment, il est préférable d'avoir plusieurs systèmes car si un modèle ne fonctionne pas, il faut en avoir d'autres en rechange. Il sera temps de choisir le meilleur modèle lorsque chacun aura fait ses preuves. Nous avons raté le démarrage de PubMed Central. Il nous faut donc créer autre chose. Suzy MOUCHET En Europe, nous avions Embase comme point d'entrée bibliographique. Ce système a été développé par Elsevier. Franck GANNON Il nous faut un système solide. Si E-Biosci se crée avec une forte participation de fonds publics, il sera impossible de le vendre. Un intervenant Si le pouvoir dépend de l'information, on voit ici que l'argent est toutefois le nerf de la guerre. En dehors des financements du gouvernement américain ou de l'Inserm, les trois modes de financement dans le secteur privé proviennent actuellement de l'auteur, du lecteur ou de la publicité. Dans le cadre du projet BioMed, une décision a-t-elle été prise au niveau de la publicité ? Rien n'interdit à un site d'accès public de s'ouvrir à la publicité. Franck GANNON C'est une possibilité de financement. Il peut y avoir des avantages pour les chercheurs. La possibilité de cliquer sur d'autres sites peut être intéressante. Il n'y a pas de honte. Les éditeurs devraient peut-être également payer puisque nous allons leur permettre d'obtenir une audience supérieure à celle qu'ils ont aujourd'hui. Et les financements publics sont aussi nécessaires de manière à assurer une certaine indépendance. J'espère que la communauté européenne assurera un financement car certaines recherches seront bloquées si le système de fonctionne pas correctement. Le financement sera donc diversifié. Le governing party s'opposera peut-être toutefois à un financement par la publicité. Monsieur CHEMINEAU L'INRA n'est qu'un organisme public parmi d'autres en Europe. Ne peut-on envisager que tous les grands organismes publics ayant des revues concédées à des éditeurs privés décident de mettre fin à cette concession en mettant celles-ci sur un équivalent de PubMed Central. Franck GANNON Tout à fait. Lorsque E-Biosci et PubMed Central existeront, les petites sociétés savantes se demanderont sûrement s'il n'est pas préférable pour elles de transférer leurs publications sur ces sites. Mais il faut que nous créions un système permettant cette évolution. Il ne serait par exemple pas étonnant que The Macedonian Society of Endocrinology décide de publier sur E-Biosci car le site lui offrira une plus grande visibilité. Alors qu'aujourd'hui, elle ne peut créer seule un site car celui-ci ne serait pas suffisamment visible et consulté. Un intervenant Il existe également une diversité de langues en Europe. Franck GANNON Les économies obtenues grâce à la mise en ligne pourront servir aux traductions. Le problème des langues n'a rien à voir avec les technologies. Il s'agit d'une question de lisibilité. Pour donner un plus large accès aux publications, il faut tout d'abord un accès facilité. Daniel COMMANGE, Inserm, coéditeur de la revue Biometrics Je suis d'accord avec la nécessité d'évolution vers une diffusion libre. Mais il faudra une période de transition. Une revue comme Biometrics doit-elle par exemple se diriger vers PubMed Central ou vers BioMed ? Ne faudrait-il pas évoluer rapidement vers un système international, sans pour autant aboutir à un monopole des Etats-Unis ? En tant que biostatisticien, je travaille à la fois dans le domaine des sciences de la vie et des mathématiques. Je m'interroge donc sur la nécessité de cloisonner les domaines. Ne devrait-on pas évoluer vers un système universel ? Franck GANNON Je suis d'accord avec vous mais pour le moment, il faut être réaliste. Toutefois, les systèmes devront un jour devenir compatibles entre eux. Votre question portant sur l'opportunité de vous diriger vers PubMed Central est intéressante. Nous nous sommes posé la même question pour l’EMBO Journal et pour EMBO Reports, qui paraîtra à partir de juillet. Toutefois, comme nous avons des contrats avec Oxford University Press, nous ne pouvons soudain décider de diffuser gratuitement ces revues. Nous nous donnons donc un délai de douze mois pour évoluer dans ce sens sans remettre en question nos revenus. Cette question est importante car nous avons plusieurs projets. Nous devons par exemple avoir les moyens de lancer Young Investigation World Scheme. Chaque revue devra faire ses choix selon la durée de vie de ses articles. Mais dans tous les cas, il arrivera un jour où ne pas être dans ces systèmes de diffusion sera pénalisant. C'est pourquoi les éditeurs ne pourront refuser de mettre leurs articles sur ces sites. Dès que les personnes auront l'habitude de consulter quotidiennement E-Biosci, les éditeurs seront contraints d'offrir gratuitement leurs articles. Marie-Françoise CHEVALLIER-Le GUYADER Les mathématiques ont été évoquées. Il est vrai que pour l'INRA, il existe des champs de recherche corrélés aux sciences de la vie. D'autres pays partagent-ils ce besoin d'accès à une information non spécifiquement bio moléculaire ? Franck GANNON Bien sûr. J'ai eu un mail hier soir d'une personne qui était en colère parce qu'EMBO se focalisait trop sur le genetic engineering. Je ne vois pas pourquoi l'on restreindrait l'accès aux données, quelles qu'elles soient. Il n'y a aucune raison valable de ne pas donner un accès sur le site aux données éloignées de la recherche en biologie moléculaire. Une fois le système mis en place, il faut s'en servir pour donner le maximum de possibilités d'informations. Suzy MOUCHET Vous conviendrez qu’il est aujourd'hui difficile de faire de la recherche en biologie sans faire de la chimie, de la physique et des sciences humaines et sociales ! Franck GANNON Ce sera au governing body de décider des limites. Etienne HARNAD Tu souhaites en fait subventionner tes jeunes chercheurs avec la lecture de mes articles ! Le mouvement d'archivage est interdisciplinaire. Le logiciel que je propose porte sur toutes les disciplines. A quoi servent les territoires et les noms de E-Biosci, BioMed, etc ? Un intervenant Plusieurs conférenciers ont évoqué le format unique. Quelle est votre position à ce sujet ? Souvent, lorsque des normes internationales ont tenté de s'implanter, elles ont été vaincues par les normes de fait. Il n'est donc pas aisé d'imposer un format unique, même si on le souhaite pour mettre en place de grands systèmes et faire baisser les coûts. Franck GANNON Il est vrai que ce problème est difficile à résoudre. Peut-être Etienne a-t-il une réponse à cette question ! Un intervenant Puisque l'on parle d'un projet européen, peut-être pourrait-on parler de financement européen. La communauté européenne s'intéresse-t-elle à ce type de projet ? Franck GANNON Le système ne sera pas européen. Il sera ouvert à tous. Quant à la communauté européenne, elle s'intéresse bien évidemment à ce type de projet. Des représentants européens ont assisté à certaines de nos réunions et nous ont conseillé d'aller dans certaines voies. Ils apprécient que quelqu'un s'occupe de ce sujet car eux ne l'ont pas fait ; or il y a un enjeu stratégique. Nous devons suivre les règles du jeu et trouver des solutions. Les représentants européens nous ont par exemple demandé si tous les partenaires européens étaient impliqués dans le projet. La communauté s'occupe beaucoup des industries en Europe et finance le Program homework. Et je pense que nous pourrons obtenir des financements. EDP-Sciences : cinq ans d'édition en ligne, bilan et perspectives
Introduction - Marie-Christine BENE Nous aborderons cet après-midi trois sujets importants. Nous verrons tout d'abord des expériences d'utilisation des systèmes on line. Nous parlerons de l'évolution des bibliothèques universitaires. Et nous aborderons le problème du devenir de l'évaluation. Je passe tout de suite la parole à Jean-Marc Quilbé, Directeur des éditions EDP-Sciences, héritières des éditions de physique, qui ont une expérience on line de cinq années avec trente revues, dont neuf nouveaux titres datent de cette année. Présentation d'EDP-Sciences Nous nous sommes engagés, il y a cinq ans, dans l'édition on line avec peu de moyens et sommes devenus un petit éditeur rivalisant avec les plus grands. EDP-Sciences est en effet le successeur des Editions de physique, le nom de la société ayant changé en 1998 lorsque que nous avons commencé à nous tourner vers d'autres domaines que la physique. La société a 80 ans et appartient à une société savante, la Société française de physique. Parmi les premiers actionnaires se trouvent plusieurs prix Nobel comme Jean Perrin ou Marie Curie, ainsi que Louis Lumière. Nous sommes un éditeur scientifique. Nous publions essentiellement des journaux primaires mais avons également un programme de livres. Nous nous positionnons comme le partenaire des sociétés savantes puisque notre actionnariat est composé essentiellement des apports de la Société française de physique et de la SMAI (Société de mathématiques appliquées et industrielles). Des discussions ont actuellement lieu pour que la Société française de chimie entre dans le capital. Nous avons également des contrats avec des institutions publiques européennes comme l'ESO (European Sourcing Observatory) pour la publication de leur revue Astronomy and Astrophysics, ou avec des institutions françaises, comme l'INRA pour la publication de ses huit revues. Nous avons également des accords de partenariat créant des liens entre des revues de physique américaines comme l'AIP ou l'American Physical Society. Nous co-éditons également certains journaux avec la Société italienne de physique. En France, nos partenariats sont nombreux. Nous sommes une PME très spécialisée sur notre créneau. Notre chiffre d'affaires, en 1999, a été de 28,5 MF, dont un quart en France, 37 % avec le reste de l'Europe, 20 % avec les Etats-Unis, et 18 % avec le reste du monde. Nous avons des abonnés dans 70 pays, du Japon à l'Argentine en passant par le Maroc et l'Inde. Nous gérons entre 20 % et 25 % d'abonnés aux Etats-Unis, où nous sommes fortement présents sur le secteur de la physique et de l'astronomie. Nous disposons d'un bureau à Cambridge, dans la banlieue de Boston. Nous avons 28 titres au catalogue 2000, répartis entre différents secteurs scientifiques : astronomie, chimie, mathématiques, physique, sciences de la vie. Nous avons également un titre en sciences sociales et en radioprotection. Les étapes de l'édition on line Notre réflexion a débuté en 1994. Nous avons été poussés vers l'édition électronique par les communautés scientifiques, et notamment par les physiciens et astronomes qui avaient déjà entamé une réflexion dans ce sens. Nous avons été fortement aidés par un transfert de compétences, qui nous a permis de mettre rapidement en place une chaîne de production utilisant le logiciel Latec. Ce logiciel est spécialisé dans la composition de textes mathématiques, ceux-ci posant de nombreux problèmes notamment à cause de leurs coûts de production. Cette chaîne de production nous a permis d'améliorer notre productivité et de passer le cap du on line plus facilement. Nous avions, en 1995, neuf titres au catalogue : quatre journaux de physique, un journal d'astronomie et quelques autres de moindre importance. Quatre titres ont rapidement été mis en ligne. La première année, seuls les résumés ont été mis en en ligne. Nous étions à l'époque le premier éditeur à mettre en place un service de ce type. Tout était présenté en pages HTML. Le service comportait alors deux personnes. En 1996, nous sommes passés au full text. Nous utilisions alors le HTML, le Postscript et le PDF. En 1997, nous sommes devenus de vrais professionnels en mettant en place des liens vers des bases de données dans la revue Astronomy and Astrophysics. Les utilisateurs pouvaient ainsi se connecter directement vers les références sur les données stellaires de l'observation. Les liens se faisaient en direction de deux centres : l'ADS Nasa (Astronomical Data Service) à Cambridge et l'ECDS de Strasbourg. Je vous rappelle que l'ADS Nasa est un centre financé par la Nasa qui numérise depuis une dizaine d'années tout ce qui est publié dans le domaine de l'astronomie. Et l'ECDS Strasbourg est un centre ayant le même profil mais au niveau européen. La chaîne de production en Latex est un élément important. Il s'agit d'une condition de succès. L'édition on line est une vraie profession. Si l'on peut certes créer un petit serveur soi-même, lorsque l'on souhaite publier des milliers de pages chaque année et respecter les délais, on devient une vraie industrie. Il faut donc des moyens. Et l'édition on line coûte très cher en temps et en matériel. 1998 a été une année d'expansion : toutes nos revues ont été mises en ligne, sauf les colloques, qui restent produits en prêt à cliché. Nous avons rapatrié en interne toute la chaîne de production car nous avons estimé plus efficace de préparer la mise on line des articles en faisant un tapage du texte de l'article dès la réception des données venant de l'auteur. Dès qu'un article est accepté, nous mettons en effet des balises permettant de le passer dans des moulinettes automatiques. Sans ce système, nous serions contraints d'intervenir manuellement dans les fichiers, opération difficilement rentable lorsque ceux-ci sont importants. En 1998, nous avons également repris la publication d'une revue électronique lancée par la SMAI et pilotée par le Ministère. Les articles sont publiés en ligne dès leur acceptation. Et en fin d'année, nous publions une version papier pour archive. L'intérêt de ce système est qu'il permet une publication rapide durant l'année et en fin d'année, le document publié peut être traité par les bibliothécaires et servir pour l'archivage à long terme. Nous avons poursuivi notre montée en charge en 1999 avec 18 revues en ligne. Nous avons négocié avec l'American physical society un accord permettant de relier les articles de Physical review, le leader mondial, avec The european physical journal, un journal que nous avons créé avec des partenaires allemands et italiens. Nous pensons en effet qu'il existe trop de revues nationales et qu'à terme, leur nombre ira diminuant. Il convient donc dans ce cadre d'avoir une initiative pilotée par les sociétés savantes et permettant la création d'un journal d'envergure internationale à partir de cinq ou six journaux nationaux. Pour ce faire, nous avons dû développer des logiciels spécifiques comme par exemple le Link manager. En effet, la stabilité à long terme des adresses de fichier fait partie des problématiques importantes. Entre 30 % et 50 % des URL ont été modifiées au cours des dernières années. Il faut donc un système permettant un adressage stable sur le long terme. Nous avons également conclu des accords pour la publication gratuite des résumés sur Top Science, un projet à l'initiative duquel se trouve le Department of Energy américain, et sur les sites d'agences d'abonnement, EBSCO, Swets, etc. Le but est de diffuser au maximum les abstracts. Notre politique consiste, en effet, à ce que tous les abstracts soient gratuits. Seul le full text est payant. Nous avons ainsi une vision très ouverte de l'accès à la connaissance, même si, n'étant pas financés par l'Etat, nous devons être rémunérés. Nous avons également ouvert en 1999 deux sites miroirs : l'un aux Etats-Unis sur le site du Smithonian Institute, avec pour adresse edpscience-usa.org, et un autre au Japon sur le site du National Astronomical Observatory. Cette démarche s'inscrit dans notre volonté d'apporter des services aux auteurs et aux lecteurs car lorsque vous vous connectez du Japon sur un site européen, il faut à certaines heures cinq à dix minutes pour télécharger un fichier de 100 kilo-octets. Dans le domaine de l'astronomie, compte tenu des nombreuses figures, le téléchargement devient ainsi impossible. Nous avons donc investi pour acheter des machines et louer des heures d'ingénieur sur place. Bilan et perspectives Nous avons aujourd'hui 26 revues on line, et 28 au catalogue. Nous introduirons en 2000 le DOI (Digital Object Identifyer) afin d'améliorer l'accès aux articles à partir de bases de données. Nous publions des compléments multimédias à l'article : vidéo, simulation, etc. Nous avons ainsi publié l'an dernier un test en astronomie. L'article comportait une petite vidéo d'un astéroïde rebondissant au moment de son entrée dans l'atmosphère, un document très rare filmé par hasard par un amateur. Le suivi constitue une grosse charge de travail car les techniques évoluent sans cesse. Il n'existe aucun format de fichier stable depuis dix ans et nous ne parvenons pas encore à gérer l'écriture mathématique, même si des progrès ont été faits. Nous réaliserons cette année une nouvelle version de notre serveur qui sera ainsi plus dynamique. Je vous engage donc à vous connecter régulièrement sur notre site pour voir ce qui s'y passe. Nous n'avions, en 1995, sur le site EDP-Science, que quelques milliers de hits par mois, c'est-à-dire de clics permettant le chargement d'une page. Le décollage a été progressif, avec une explosion en 1998-1999. Nous sommes aujourd'hui presque à un million de hits par mois, un chiffre honorable même par rapport aux sites grand public. Nous comptons aujourd'hui plus de 80 000 utilisateurs émanant de plus de 20 000 institutions à travers le monde. Alors qu'en 1995, 95 % des connections étaient effectuées par des Français, les Etats-Unis ont peu à peu pris une importance non négligeable et représentent aujourd'hui 30 % des connections. La France représente ainsi aujourd'hui 10 %, une part stable depuis trois ans. La mise en ligne des journaux rend ceux-ci plus visibles. L'accès aux articles est facilité grâce aux bases de données et aux moteurs de recherche. Les bases documentaires intégrant les résumés font aujourd'hui apparaître les articles de revues européennes au même niveau que ceux des revues américaines. En effet, bien que les revues d'astronomie américaines dominent par rapport à celles des autres pays, lorsqu'on utilise les services de l'ADS Nasa, tous les articles apparaissent au même niveau. Le chercheur dispose ainsi de toute la littérature sur le sujet. La démarche de l'ADS Nasa est exhaustive. Tout ce qui a été publié dans le monde depuis quarante ou cinquante ans a été numérisé. Nous leur avons ainsi fourni les numéros d'Astronomy and Astrophysics parus depuis plus de vingt ans. Nous avions le même but en nous connectant avec Physical Review aux Etats-Unis mais le lien est assez déséquilibré car si nos articles citent beaucoup Physical Review, il n'en va pas de même dans le sens inverse. Je n'ai pas l'impression que les serveurs de préprint gagnent beaucoup de terrain sur le marché des revues scientifiques. Beaucoup d'articles que nous publions dans le domaine de la physique viennent de ces serveurs. L'auteur nous donne un numéro d'accès au serveur et nous allons nous-mêmes chercher l'article pour le réutiliser en production une fois accepté par le comité éditorial. A court terme, je ne vois donc pas de concurrence importante entre les deux secteurs. Notre expérience avec les journaux mathématiques purement on line a montré que les auteurs ne souhaitaient pas avoir ce type de journaux. La version papier reste nécessaire. C'est pourquoi nous avons ajouté une version papier en fin d'année pour l'archivage. L'expérience anglaise du New Journal of Physics, un journal purement on line, n'a d'ailleurs pas fonctionné. Et l'expérience que nous avons menée avec Springer, en Allemagne, qui consistait dans la création d'une version parallèle à The european physical journal proposant aux auteurs qui le souhaitaient une publication on line seulement s'est soldée par un échec. Le métier d'éditeur se transforme profondément sous le poids des nouvelles techniques. Il y a dix ans, un éditeur travaillait avec un imprimeur chargé de toute la composition. Aujourd'hui, toute cette partie doit être reprise en charge pour que les coûts restent raisonnables. Alors qu'en 1995, sur vingt personnes, il y avait deux personnes dans le service on line, cette année, sur 36 personnes, il y en a douze. Et sur les 45 personnes qui composeront notre effectif l'an prochain, la moitié seront dans ce service. Notre masse salariale était de neuf millions de francs l'an passé, dont la moitié pour le service on line et la mise en page. Et nous avons investi un million de francs en matériel. Aujourd'hui, le serveur web représente 20 gigaoctets de données qui s'accumulent chaque mois ; nous devrions atteindre 35 gigaoctets à la fin de l'année. Nous avons également des frais de ligne Internet. Et cette année, les travaux de renouvellement du serveur coûteront entre 500 000 et un million de francs. A notre échelle, ces coûts sont très importants. Nous avons réduit les délais de publication et essayons de poursuivre dans ce sens en passant à la soumission purement électronique des articles. Cela revient à se connecter sur le serveur du bureau éditorial, et à soumettre l'article en le collant sur le serveur pour qu'il passe dans le système beaucoup plus vite. Le logiciel permettant cela se nomme le MMS : Manuscript Management System. Il est en place depuis moins d'un an et sera généralisé à l'ensemble des revues courant 2000. Nous sommes dans une structure privée même si nous appartenons à une association loi 1901. Nous avons des salariés qu'il faut payer. J'ai entendu dire que la publication scientifique devait être faite par des scientifiques. Or il ne faut pas oublier le travail qu'il y a derrière. Les scientifiques ne pourront tout assumer seuls. Mieux vaut à mon sens qu'ils se consacrent à la science et que des personnes soient payées pour assurer l'édition. Si un organisme public finance l'édition, l'argent devra donc être prélevé sur les impôts. Je ne peux pas dire aujourd'hui que l'édition on line nous ait apporté un abonné mais peut-être peut-on se féliciter ne pas en avoir perdu ! Nous sommes toutefois parvenus à attirer d'autres propriétaires de revues grâce à la compétence que nous avons acquise en interne en matière de services orientés vers les auteurs et la communauté scientifique. Problématiques Les problématiques majeures me semblent être la pérennité des adresses URL et les processus de production. Le service on line peut en outre être utilisé comme un outil de marketing. Nous sommes actuellement en discussion avec l'INRA au sujet du contrôle des abonnements électroniques. L'édition en ligne est un outil de promotion des revues. Nous donnons systématiquement en libre consultation sur le serveur le numéro un de chaque revue. Nous pratiquons également un abonnement d'essai à prix réduit. Les mailing lists sont pour leur part peu appréciés des scientifiques. Le contrôle par le numéro IP est de moins en moins possible, certains instituts se protégeant du piratage par plusieurs numéros. Nous sommes ainsi obligés d'ouvrir largement l'accès à notre serveur, d'autant que le contrôle par mot de passe reste impopulaire. Je pense que le Peer reviewing restera à la base de la publication. Ce n'est pas parce qu'il y a des serveurs de préprint qu'il ne faut pas effectuer des sélections d'articles assurant une qualité. Je pense qu'il y aura à terme une convergence entre les bases de préprint et les journaux. Les articles sélectionnés par les comités de rédaction seront peut-être dans les bases de préprint, mais avec un label de qualité du type "sélectionné par". Parallèlement, la version papier reste demandée par certains bibliothécaires, notamment en astronomie. Les astronomes travaillent en effet à l'échelle de plusieurs siècles. Or personne ne sait ce que seront les crédits pour les systèmes du type ADS Nasa ou ECDS de Strasbourg. Le seul moyen de conserver des informations scientifiques sur le très long terme reste donc le papier. Or le coût fixe de l'édition demeure quel que soit le nombre d'exemplaires tirés. Nous allons pour notre part vers une prépublication rapide des articles et nous continuerons à ajouter de la valeur sous la forme de liens et en suivant les progrès technologiques. Débat Etienne HARNAD Les astronomes n'ont-ils pas d'imprimeurs ? Vous pourriez faire beaucoup d'économies car seul l'étiquetage demeurera dans l'avenir. Jean-Marc QUILBE Le problème est celui de la stabilité à long terme. Nous enregistrons aujourd'hui les fichiers sous certains formats ne permettant pas de relire ce qui a été fait il y a dix ou quinze ans. Etienne HARNAD Votre responsabilité s'arrête au moment où vous acceptez mes articles. Il ne sert à rien de dépenser de l'argent pour le tirage papier. Jean-Marc QUILBE N'oubliez pas que les imprimeurs ont également une chaîne de production qui évolue. Un imprimeur ne peut par exemple rien faire si vous lui donnez un fichier Wordstar datant des années 80. Etienne HARNAD Il vous suffit de stocker. Et si l'astronome veut imprimer, qu'il le fasse ! Jean-Marc QUILBE Si vous ne produisez pas sur papier, vous n'avez qu'un fichier électronique qui obéit à certaines règles de constitution. Or ces règles ne sont pas stables. Un imprimeur ne peut aujourd'hui travailler avec un fichier datant de dix ans. Etienne HARNAD Oui, mais l'astronome peut, s'il le désire, imprimer aujourd'hui ce que vous stockez. Un intervenant Dans ce cas, quel est votre bénéfice après impôt ? Et si un auteur ne veut pas signer le copyright, que faites-vous ? Jean-Marc QUILBE Le copyright ne nous gène pas. Nous le faisons par tradition mais un article scientifique a un statut particulier. On ne réutilise jamais un article. Nous diffusons gratuitement les abstracts. Il suffit que nous nous assurions d'avoir la prépublication pour nous rémunérer du service global que nous rendons. Je signe régulièrement des autorisations de droit de reproduction. Comme je ne réutilise pas commercialement les articles, avoir ou pas le copyright ne change rien. Ce n'est pas comme pour un livre dont on fait une édition anglaise, française, etc. Une fois produit, un article scientifique est consultable par les abonnés. Quant à mon bénéfice après impôt, il est de 6 %, ce qui est correct par rapport à la moyenne de 3 % ou 4 % des entreprises françaises.
Limites rencontrées dans l'exploitation des publications relatives à un génome particulier : le cas d'Arabidopsis thaliana Alexandra LOUIS Cette exploitation des données textuelles a été faite grâce à une collaboration entre le laboratoire génome et informatique et de l'UVSQ et l'unité centrale de documentation de l'INRA de Versailles. Elle entre dans le cadre d'un projet plus vaste : la constitution d'une base de connaissances spécifiques dédiées à l'analyse du génome de cette espèce. Je vous parlerai ici spécifiquement des relations de voisinage. Nous souhaitons en effet ne plus considérer un gène comme une entité isolée. Notre but est de décrire le gène ou l'entité biologique en fonction des relations qu'il entretient avec d'autres entités. Le projet de séquençage systématique génère une grande quantité de données, que celles-ci soient des données de séquence protéique ou nucléique, ou des données bibliographiques. En 1999, nous avions un certain nombre d'entrées dans les bases de données de notices d'articles, que ce soit Medline, Biosis ou Pascal. En nous intéressant à la co-citation des gènes dans le corpus des documents textuels disponibles, nous avons dû identifier les sources pertinentes : notices bibliographiques disponibles en format électronique, monographies en format papier, et articles de revues et de synthèses en format électronique ou papier selon les cas. Une fois les sources identifiées, nous avons tenté d'établir les relations de voisinage pour l'intégration dans la base de connaissance à constituer. Nous avons pour ce faire pris en compte la co-citation de deux gènes, de deux protéines ou de deux mutants dans le titre ou le résumé des notices, ainsi que la co-citation dans un chapitre, un sous-chapitre ou un paragraphe dans un article de revue. Nous estimons en effet que si deux gènes sont cités ensemble, c'est qu'il existe entre eux une relation biologique forte. Problèmes rencontrés Trouver un nom de gène, de protéine, de mutant ou de locus dans un texte n'est pas très difficile pour certaines espèces mais il en va tout autrement pour l'Arabidopsis. S'il existe une commission de nomenclature pour les plantes, on trouve pourtant différentes formes, différentes casses, ainsi que diverses abréviations. S'ajoute en outre des problèmes de concaténation lorsqu'on parle d'une famille de gène. Par exemple, le phytochrome AAE représente cinq occurrences différentes que l'on ne peut retrouver directement en utilisant "phyAE". Il existe également le problème des fautes de frappe. On se heurte ainsi au problème des silences dans les recherches à partir d'un dictionnaire de noms de gènes et au problème des faux positifs, certains noms de gènes n'étant pas uniquement des noms de gène. Et encore, nous n'avions heureusement pas pour Arabidopsis le problème des noms vides du type or ou the ! Pour constituer notre base de connaissances, nous avons dû indexer manuellement toutes les informations qui nous semblaient pertinentes. Nous avons ainsi recréé en quelque sorte des notices de documents. Pour l'intégration sur un gène donné, nous avons par exemple indexé la liste des chapitres et des sous-chapitres dans lequel celui-ci était cité avec la liste des gènes en relation avec ce gène dans les sous-parties du document. Dans les bases de données où nous pouvions trouver des notices référençant des articles sur le génome Arabidopsis, il y avait Medline et Biosis. Pour avoir le corpus de données textuelles le plus complet possible, nous avons donc acheté les notices Biosis et les avons ré indexées en fonction des noms de gène, de protéine et de mutant. Ces notices ont été achetées par l'INRA et ne sont accessibles qu'au personnel ayant un accès à l'Intranet de l'INRA. Pour PubMed, il existe donc un lien sur le NCBI permettant de visualiser ces notices. Données indexées Il existe une base bibliographique disponible à l'INRA, l'HGR-DB (Arabidopsis Genes Retrieval Database), qui permet de faire des recherches sur les notices PubMed et Biosis à l'aide des mots clés dans le titre, des noms d'auteur, des noms de gène et du locus cité. Bientôt, sera également disponible l'interrogation par nom de protéine et par nom de mutant. Seul le personnel de l'INRA a accès à la référence Biosis dans lequel le gène Apthala1 est co-cité avec le gène iphy. Dans le cadre d'une base de connaissances plus complexe, nous essayons, en créant des familles, de regrouper les gènes en fonction des relations qu'ils ont entre eux. Nous avons ainsi clusterisé les gènes en fonction de leurs co-citations dans les références, chapitres et sous-chapitres. Nous développons un système d'interrogation permettant de visualiser sous forme de graphes les familles de gènes ayant des relations bibliographiques. Dans ces graphes, chaque nœud représente un gène et chaque lien une référence ou une liste de références bibliographiques correspondant au lien entre les gènes. Une étude a été faite sur les références issue de PubMed et le lien se fait pour le moment directement sur NCBI mais à termes, le lien sera sur la base HGR-DB disponible à l'INRA. Conclusion Il y a une vraie prise de conscience aujourd'hui au niveau de la communauté scientifique, qui se rend compte que la bibliographie est une mine d'informations pour comprendre l'organisation d'un génome. Des études sont donc faites pour généraliser le travail que nous avons effectué aux autres génomes. Mais s'il était possible de faire le travail manuellement pour Arabidopsis parce que le projet de séquençage est en route depuis peu et que l'on s'intéresse depuis seulement une dizaine d'années à ce gène, il n'en va pas de même si l'on s'intéresse à l'homme. Dans PubMed, il y a en effet sept millions de références. Il y a donc un réel besoin de mise à disposition de documents relatifs aux résultats de la recherche et un réel besoin de structuration et de balisage des documents afin de permettre une reconnaissance facile des entités et afin de trouver les relations entre celles-ci. Pour notre part, nous nous sommes limités aux co-citations et nous devons maintenant nous intéresser aux relations entre les entités citées. Avec tous les projets transcriptome et protéome qui se mettent place, on devrait pouvoir retrouver dans la littérature une bonne partie des schémas de régulation. Il faudrait également établir des relations entre des entités d'espèces différentes. Micado : ressources bibliographiques et intégration des connaissances en génomique Philippe BESSIERES, INRA Je suis depuis le 1er janvier 2000 dans une nouvelle unité " Mathématique, informatique et génome ", qui regroupe trois équipes : mathématiciens, génomistes et structuralistes. Les microbes représentent 30 % de l'activité de l'INRA. Nous avons été très impliqués dans le séquençage du Bacilus subtilis parce qu'il s'agit d'une bactérie modèle. Le programme du Bacillus a débuté en 1990 et a duré sept ou huit ans. Nous avons signé le papier de la séquence complète du chromosome de cette bactérie à plus de 150. En 1997, une équipe de quatre personnes a séquencé la bactérie lactique Lactococcus après deux ans de travail mais le séquençage n'est pas encore publié à cause du temps pris pour déposer le brevet. A un forum de microbiologistes, en 1999, nous nous sommes rendus compte qu'il existait une forte demande pour le séquençage de 26 espèces. Nous avons donc lancé le séquençage de sept bactéries sur une période de deux ans. Une vingtaine de personnes seront sans doute impliquées dans le projet. Contexte L'efficacité des outils d'expérience en biologie moléculaire s'est considérablement accrue. Les projets de séquençage ont montré que l'on découvrait des gènes alors que la majorité des gènes présents sur les chromosomes des microbes n'ont pas de fonction connue. Ceci a relancé la mise au point d'expériences à grande échelle, avec une volonté de relier l'information de séquence avec les informations de biochimie et de physiologie. Nous entrons ainsi dans une vraie démarche d'encyclopédiste. Relier plusieurs niveaux de connaissances et avoir des approches comparatives est assez simple avec les microbes car leurs génomes sont assez petits : de 600 000 à 10 millions de paires de bases, soit mille fois plus petit qu'un génome humain qui compte trois milliards de paires de bases. Bacillus étant un modèle, il est extrêmement bien couvert par la documentation et notamment par Medline. On peut considérer qu'en biologie moléculaire, l'information est bien structurée, que ce soit au niveau de la littérature ou des collections de données. Il y a d'ailleurs des accords entre les éditeurs de revues et les administrateurs des banques qui imposent le dépôt de certaines données, notamment les séquences, avant leur publication. Les informations dans ces banques de données factuelles sont très riches en texte et tous les objets y figurent systématiquement avec des références bibliographiques. En outre, bien avant l'émergence du web, les collections se référençaient les unes les autres. Il y a ainsi une collection de séquences d'ADN avec des liens vers les séquences de protéines codées par les gènes qu'elles portent, ce qui forme un réseau de connaissances. Les prédictions mathématiques et informatiques ont leurs limites et ne remplacent pas les expériences. C'est pourquoi l'on observe aujourd'hui un recours massif à ces dernières. Les techniques évoluant, la production s'accroît sans que le travail d'annotation puisse suivre. Ainsi, paradoxalement, l'émergence des approches à grande échelle sur les génomes nous font opérer un retour sur la littérature scientifique, les connaissances disponibles étant nécessaires pour interpréter les résultats. De plus, il faut avoir un raisonnement intégratif permettant de placer les faits et les données dans le contexte génétique, chimique et physiologique. Les bases de données sont donc dans ce cadre très utiles. Se posent ainsi le problème de l'accès à ces bases, et des interfaces de visualisation et de réseau. Nous sommes aujourd'hui dans un processus d'intégration des connaissances génomiques grâce à trois types de sources : les analyses automatiques, dont les prédictions sont au cœur de la bio-informatique classique ; les approches expérimentales du type transcriptome et puces d'ADN, qui conduisent à aller exploiter la littérature scientifique ; et le regroupement des gènes coexprimés, qui consiste non seulement à vouloir trouver les réseaux de régulation dans la littérature mais aussi à voir si l'on ne trouve pas sur les séquences d'ADN des motifs régulateurs communs. Les séquences d'ADN sont au cœur de la biologie moléculaire. Nous associons une référence bibliographique à chaque séquence, avec un lien vers Medline qui permet de visualiser les abstracts. Nous avons également d'autres liens, comme ceux entre une partie codante de gène et une banque de séquence de la protéine. L'outil doit être convivial pour les biologistes. Un des accès est donc interactif : on part du chromosome pour descendre vers les séquences ordonnées le long du chromosome et déposées dans GenBank ; en cliquant sur la séquence, on arrive sur une visualisation des gènes, etc. Cette arborescence aboutit soit aux références bibliographiques, soit au texte de la séquence, soit au détail des différentes propriétés des séquences. Présentation du système Le cœur de notre système d'information est donc une base de données servant à différents types d'usage. Le premier usage est collaboratoire. Tel fut le cas pour le programme d'analyse fonctionnelle du Bacillus subtilis, qui se poursuit de manière à affiner les expériences. A côté de ce type de saisie interactive, un projet sur quatre ans avec 17 laboratoires a permis de constituer une base. Outre les données rentrées par les laboratoires, des imports automatiques de données ont eu lieu à partir des collections en ligne GenBank et des collections de cartographies génétiques. La base peut être utilisée pour effectuer de l'exploration de données, automatiser des processus et proposer des interfaces de requête conviviales pour les utilisateurs. Sont regroupées dans cette base de données les références bibliographiques associées aux différents objets informés dans la base, ce qui permet de consulter les informations d'analyse fonctionnelle à partir de critères liés aux séquences d'ADN du gène étudié dans le programme et inversement. Une extension de cette base a actuellement lieu en collaboration avec le laboratoire de biométrie de Lyon, c'est-à-dire avec des phylogénéticiens travaillant sur des familles de gènes et des arbres phylogénétiques. Nous travaillons avec eux pour faire de la prédiction de fonction de manière à aller plus loin que les simples relations d'homologie. Les annotations des génomes complets sont très pauvres comparées aux petites séquences déposées dans les banques, ce qui peut se comprendre dans la mesure où GenBank est constitué d'une équipe travaillant depuis dix ans sur un gène alors que pour un génome complet, il n'y a qu'un ou deux curateurs qui collectent les séquences. Nous nous sommes lancés dans l'analyse automatique de la bibliographie pour collecter les promoteurs mis en évidence expérimentalement chez le Bacillus subtilis, ceux-ci étant en effet difficile à prédire par des analyses mathématiques et informatiques. Ce socle nous permettra de mettre à l'épreuve les méthodes de prédiction actuellement disponibles. Pour le Bacillus, il existe une nomenclature respectée, ce qui est pour nous une chance. Les gènes ont une forme lexicale extrêmement simple qui nous a permis de capter rapidement les co-citations des noms de gènes sur les abstracts Medline. On possède ainsi aujourd'hui 350 couples de gènes promoteurs et l'on essaie, avec les classifications de métabolisme dans la base de données, de déterminer le degré de corrélation entre un certain type de métabolisme et la présence de ces activateurs de transcription. Cela nous permet, pour les gènes inconnus, d'avoir une idée de la classe à laquelle ils appartiennent. Nous avons voulu aller plus loin et il y a deux ans, j'ai lancé un appel pour trouver des chercheurs en linguistique et en sémantique afin d'accéder le plus rapidement possible au sens et de généraliser notre approche. Nous collaborons ainsi aujourd'hui avec des laboratoires de l'INRIA et des laboratoires de la Faculté d'Orsay. Le projet se nomme CADRIGE : catégorisation automatique de documents pour l'extraction de réseaux d'interaction génique. Le but est de parvenir à l'utilisation automatique des ressources linguistiques à partir des corpus de textes composés par la littérature. Nous avons commencé par les abstracts Medline mais nous pensons également aborder les textes intégraux dans le futur. Les spécialistes pensent en outre pouvoir extraire le cadre conceptuel, c'est-à-dire la définition des objets composant le domaine, ce qui nous conduit à nous soucier de la normalisation, un sujet mieux traité du côté américain que de du côté européen. Débat Pierre OUDET Ne faites-vous pas de différence entre la protéine et le gène. Philippe BESSIERES Si, nous extrayons d'abord les noms de gènes, puis nous ajoutons une majuscule et moulinons à nouveau pour repérer les textes parlant de la protéine. Pierre OUDET Avez-vous déjà poussé l'analyse jusqu'à identifier ce qui résulte d'une modélisation et ce qui résulte d'une expérience ? Philippe BESSIERES Nous en discutons actuellement. Quand on parle de modélisation, on s'intéresse à la fois à ce qu'est la transcription, à savoir un motif promoteur, et à une sous-unité sigma liée à un ARN polymérase qui amène cette dernière sur le promoteur, déclenchant ainsi la transcription et la production d'un ARN messager. Il faut ensuite une représentation sur les différentes approches. Une approche peut consister par exemple à voir si le gène s'exprime lorsqu'on supprime 200 paires de base en amont. Dans le cas contraire, cela signifie que le promoteur est dans cette région. Une autre approche peut consister à faire muter sigma et à voir si le gène s'exprime encore. Dans le cas contraire, cela signifie que sigma est le facteur de transcription qui active l'expression du gène en question. Une intervenante Pourriez-vous nous dire quels sont les linguistes qui travaillent avec vous et ce qu'ils prennent comme substrat théorique ? Philippe BESSIERES Je ne les ai pas encore tous identifiés. Mais il y a Claire Nédellec qui est sémanticienne au LRI. Claire NEDELLEC Il y a différents types de scientifiques qui ont travaillé sur le projet. Certains, comme Christian Jacquemin, s'intéressent au traitement automatique de la langue. D'autres travaillent dans l'apprentissage automatique, comme par exemple Gilles Buisson et moi-même. Notre spécialité est le comptage automatique à partir de textes : nous essayons d'acquérir automatiquement des anthologies à partir d'un ensemble de résumés. Nous avons donc besoin d'une collaboration étroite avec les linguistes et les personnes pour lesquelles nous réalisons les applications.
Les universités face au développement de l'édition électronique
Si ce sujet peut paraître banal, il n'est pourtant pas si facile à traiter dans la mesure où se cachent sous le terme d'université des réalités très différentes selon la nature, la taille et la spécificité de celles-ci. De même, le terme de ressource électronique est très vague. Comme tous les organismes travaillant avec le savoir et l'information, les universités ont été confrontées au développement rapide de l'édition et de l'information électroniques. Les bibliographies électroniques, le texte intégral électronique, le Cd-Rom, la mise en ligne, les accès aux ressources gratuites ou payantes sont autant de révolutions pour l'université. Les modes d'accès et d'acquisition sont très divers ; il y a parfois un couplage entre la fourniture papier et la fourniture électronique, dans d'autres cas un accès unique à l'électronique. Toutes ces évolutions ont de plus eu lieu dans un contexte de croissance des coûts des publications et des revues scientifiques. Les coûts augmentent en effet depuis 1995, sans doute à cause du fait que le modèle économique de l'édition électronique n'est pas encore stabilisé. Les établissements sont à la fois des producteurs et des acquéreurs d'information, ce qui pose des problèmes de différentes natures. Il faut tout d'abord maîtriser les accès sous forme de réseau. Dans le cadre de la politique contractuelle que nous menons avec les universités, leur capacité à avoir des débits suffisamment élevé est importante, tout comme leur équipement. Et la question centrale est celle des contenus et de leur validation, que ce soit en termes de sélection de ce que l'on importe ou en termes de validation de ce que l'on exporte. Toutes ces évolutions ont eu des conséquences au niveau organisationnel et politique. Traditionnellement, les établissements travaillaient avec différents services (informatique, édition, documentation, etc.). L'arrivée des ressources électroniques a fait éclater les frontières et obligé les différents métiers à travailler ensemble. L'organigramme des universités a ainsi évolué : au niveau de la présidence, une même personne s'occupe du centre de ressources informatique, de l'édition et de la documentation. Et il a fallu mettre en œuvre une véritable politique d'établissement, renforçant ainsi le rôle de la présidence d'établissement. Il ne faut pas oublier que les universités venant d'une vieille tradition, les facultés, elles possèdent des forces centrifuges importantes. Le rôle de diffuseur d'informations des universités Le rôle de diffuseur d'information des universités ne doit pas être sous-estimé même si leur rôle le plus important est de former les étudiants et de conduire des recherches. Et là aussi, les bouleversements ont été importants. L'édition est un métier qui s'organise autour de trois fonctions : la validation du savoir, qui s'effectue soit en propre, soit par un comité de rédaction, soit par un directeur de collection ; la fabrication, c'est-à-dire la transformation d'un manuscrit ou d'un fichier électronique en document ; et la diffusion. Or l'édition électronique a fait éclater toutes ces fonctions. La diffusion, dès lors qu'elle est assurée par un serveur à distance, et la fabrication, dès lors qu'il suffit de formater un document dans un format d'archivage, sont des métiers qui se sont profondément transformés. On a ainsi entendu dire, dans certaines universités, que les éditeurs ne servaient plus à rien, la compétence scientifique de validation étant dans les établissements et les problèmes de fabrication et de diffusion n'existant plus. Ce discours me paraît toutefois simpliste car la transformation d'un document natif en document pouvant être diffusé largement est un vrai métier. L'édition scientifique électronique est un vrai métier. Pour autant, le monde de la production et de la diffusion de l'information scientifique a profondément évolué. Coexistent aujourd'hui différents partenaires : les grands groupes éditoriaux du type Elsevier ; les sociétés savantes, qui valident et diffusent ; et les établissements, qui sont producteurs d'informations. Dans la valorisation des thèses, par exemple, les universités ont un rôle éminent à jouer, les thèses faisant partie de leur patrimoine scientifique. Comme vous le savez, une thèse est à la fois un travail de recherche, un exercice académique et un document. De tous temps, la puissance public s'est souciée de la conservation de ces documents. Mais le dispositif mis en place en 1985 est aujourd'hui obsolète et ne correspond pas aux attentes de la communauté scientifique. C'est la raison pour laquelle à court terme, des décisions devraient être prises. Les thèses étant aujourd'hui directement écrites sous forme électronique, il existe sans doute des prescriptions à imposer de manière à homogénéiser la production de ces documents natifs. Des chaînes de traitement sont également à mettre en œuvre pour transformer ces documents dans un format d'archivage et de diffusion. Et un dispositif respectant l'autonomie des universités et permettant une cohérence doit voir le jour. Les universités doivent garder leur capacité de valorisation de ce capital scientifique et les thèses doivent être facilement accessibles sous forme électronique, sous réserve d'une autorisation de l'auteur. La Direction de la recherche, la Direction de la technologie et la Direction de l'enseignement supérieur ont beaucoup travaillé sur ce sujet ces derniers mois et les décisions devraient être rapides. Le rôle d'acquéreur d'informations des universités Même si elles n'acquièrent pas toujours les ressources au sens financier du terme, les universités doivent pouvoir les consulter. Tout comme l'édition, la documentation est en plein évolution. Un service de documentation est une interface entre des ressources documentaires et une évaluation des besoins des usagers. Si les fonctions de base de ce service n'ont pas changé, puisqu'il s'agit toujours de sélectionner de l'information, de la signaler et d'y donner accès, les conditions d'exercice ont en revanche été bouleversées. L'émergence des ressources électroniques joue un rôle déterminant dans les changements que connaissent depuis plusieurs années les services de documentation, qui d'ailleurs se nomment maintenant services communs de documentation. Ces services se positionnent tout d'abord différemment dans les universités. Traditionnellement, la documentation papier encourageait un modèle organisationnel éclaté, avec autant de services documentaires que de composantes. Avec le virtuel, une politique d'établissement devient inévitable. Les arbitrages documentaires ont ainsi été rapprochés du pouvoir exécutif de l'université. La sélection, l'évaluation et la validation de l'information Suite à ces bouleversements, le travail de sélection, d'évaluation et de validation de l'information prend une place prépondérante, et ce que l'information soit gratuite ou payante. Ainsi, si l'édition électronique ne tue pas l'éditeur, elle ne tue pas non plus les services documentaires mais renforce au contraire leur travail dans la mesure où l'information est de plus en plus diversifiée et difficile à analyser. La mutualisation des ressources Une autre conséquence de cette évolution est le renouvellement de la problématique de mutualisation des ressources documentaires. En effet, tout service de documentation effectue un travail de veille scientifique, ne serait-ce qu'en pointant les bibliographies. L'édition électronique a rendu ce travail plus complexe, celui-ci faisant désormais appel à des compétences plus variées que par le passé. Ceci a conduit les universités à mutualiser le travail. Dans les petites universités, où les bibliothèques ont des effectifs réduits, comme dans les universités multidisciplinaires, le travail de veille peut difficilement être efficace s'il est effectué par des équipes réduites. On a ainsi dû regrouper les forces et constituer des groupes de veille thématique dans les grands secteurs scientifiques : santé, sciences exactes, sciences juridiques et économiques, etc. Apparaissent également des groupements d'achat pour l'acquisition de ressources électroniques. Le regroupement des achats Face à une offre difficile à analyser et à des coûts en hausse, les établissements ont dû regrouper leurs achats. Il existe ainsi, pour les périodiques numériques, un consortium universitaire qui a traité avec plusieurs grands éditeurs non pour réaliser des économies mais pour négocier des limitations de hausse des coûts et obtenir des services améliorés. Il s'agit également d'améliorer sensiblement l'offre grâce à des systèmes d'accès croisés. Moyennant des surcoûts maîtrisés, on peut ainsi avoir accès non seulement aux abonnements pris en propre mais également aux abonnements des autres membres du groupement d'achat. Ceci s'est traduit dans certaines universités par une multiplication par neuf des abonnements. Les universités les plus riches, qui avaient déjà de nombreux abonnements, ont vu ceux-ci multipliés par deux. Ce système permet un travail en commun et un progrès au niveau de l'archivage, tous les membres du groupement d'achat n'étant pas obligés de conserver une version papier. Il contribue également à réduire les écarts entre universités riches et universités pauvres. Passage à une logique de réseau Le passage d'une logique de bâtiment à une logique de réseau est une autre conséquence de l'apparition des ressources électroniques. Se mettent en place des systèmes d'information dont le cœur est le système intégré de gestion de bibliothèque, qui gère les principales fonctions de la bibliothèque (gestion du catalogue, des inscriptions, des prêts et des communications). Mais parallèlement, l'accès à d'autres ressources est rendu possible : catalogues collectifs, outils de signalement, ressources Intranet de l'université, documents numérisés (rapports de recherche, documents pédagogiques, thèses, etc.) et ressources Internet sélectionnées, que celles-ci soient gratuites ou payantes. Si la bibliothèque reste toutefois localisée à un endroit de l'université, ne serait-ce que parce qu'un lieu commun aux étudiants et aux enseignants est nécessaire, la conception des bâtiments doit être revue. L'ouvrage intitulé Construire une bibliothèque universitaire, publié en 1993 par la Direction de l'enseignement supérieure, est aujourd'hui en partie obsolète. Les pratiques des usagers sont plus riches, la flexibilité des bâtiments doit être plus importante, les usagers doivent être formés, le câble et l'équipement doivent être plus riches, etc. La formation La dernière conséquence de l'apparition des ressources électroniques concerne les usagers. Si les bibliothèques ont toujours consacré du temps à la formation des usagers, la diversification de la documentation a imposé des changements. Des services fonctionnant 24h/24 sont désormais nécessaires. Conclusion Les questions de l'archivage et de la conservation restent aujourd'hui en suspens. Dans ce domaine, toutes les disciplines ne sont pas confrontées aux mêmes problèmes. Il existe en effet des sciences "accumulatives" pour lesquelles un accès facile à des données anciennes est indispensable : c'est le cas pour les sciences humaines, pour les mathématiques, ou pour l'astronomie. S'il n'en va pas de même pour les sciences dures, on nous dit toutefois souvent que mettre cinq années d'une revue scientifique en ligne ne suffit pas. Les discours traditionnels consistant à dire qu'en science dure, on avait besoin de cinq ans d'archives, en science juridique de dix ans, et en sciences humaines d'archives exhaustives est donc un peu schématique. Il ne faut pas oublier que l'établissement garde accès aux informations à distance tant qu'il poursuit son abonnement, contrairement à ce qui se passait avec les abonnements traditionnels. En outre, chacun connaît le problème de la conservation des données électroniques. Nous connaissons tous les solutions mais savons qu'elles n'offrent pas une garantie absolue ; la pérennité de beaucoup de documents électroniques est problématique. Les universités, comme les organismes de recherche, ne peuvent passer outre ce problème de la conservation. Débat Une intervenante En faisant une étude à l'INRA, je me suis récemment penchée avec mes collègues sur la part revenant aux chercheurs dans l'information car un article du Monde nous avait alertés en indiquant qu'aux Etats-Unis, cette part était de 65 000 francs par chercheur et par an. Nous sommes donc allés sur les serveurs des bibliothèques américaines et avons retrouvé un calcul quelque peu hermétique donnant un coût de cet ordre pour toutes les universités de la côte Ouest. Avez-vous des éléments sur ce point ? Qu'en est-il pour les universités françaises ? Claude JOLLY Il est difficile de répondre sur le coût en documentation d'un chercheur, d'autant que si les chercheurs sont le seul public ciblé dans les organismes de recherche, dans les universités, il faut faire la part entre ceux-ci et les étudiants, et définir où commence la recherche. Cette question est donc délicate. Je vous rappelle qu'en France, la recherche est souvent mixte, c'est-à-dire à la fois dans les organismes de recherche et dans les universités. Quand un laboratoire dépense 100 francs pour la documentation, ce coût est parfois imputé sur le budget de l'université et d'autres fois sur le budget du laboratoire. Il faudrait donc avoir un budget consolidé prenant en compte ces éléments pour avoir des données de ce type. Nous connaissons en revanche le budget consacré par les universités aux abonnements à des revues étrangères, qui sont essentiellement à destination des chercheurs. Mais rapporter ce coût à un nombre de chercheurs est difficile compte tenu des financements croisés. En outre, même si les évolutions vont dans le bon sens, il y encore 35 % des dépenses documentaires des universités qui se font en dehors du service commun de documentation. Un intervenant Faut-il mettre les thèses sur le web ? Un problème de propriété se pose, notamment dans les UMR. On ne peut dire que la thèse est la propriété du thésard ou de l'université. En outre, ne risque-t-on pas de tuer la liberté des discussions générales de thèses en les mettant à la disposition de la communauté scientifique ? Nous savons tous qu'une thèse n'est pas un document public. Je pense qu'il faut une réflexion plus approfondie sur ce sujet car la responsabilité ne revient pas seulement à l'université. Claude JOLLY J'ai dû être trop rapide sur ce point. Nous avons beaucoup travaillé sur ce sujet et les questions que vous posez ont été abordées clairement. La thèse est un document ayant un double statut juridique. Elle relève à la fois du droit d'accès au document administratif et du droit d'auteur. Sauf si le jury demande la confidentialité de la thèse, on ne peut refuser l'accès à une thèse conservée sous forme papier dans l'université de soutenance. Les tribunaux administratifs ont tranché sur ce point. Toutefois, on ne peut mettre en ligne une thèse sans l'accord de son auteur. De ce point de vue, l'auteur est donc protégé. Nous avons fait une expérience sur la mise en ligne de thèses de lettres et sciences humaines et avons demandé l'accord explicite des auteurs. Il y a une vraie demande de mise en ligne des thèses, même si certains auteurs ne voudront pas le faire parce qu'ils ont par exemple un projet d'édition. Tous les experts scientifiques que nous avons consultés considèrent que, sous réserve de l'accord de l'auteur et en l'absence de demande de confidentialité du jury, il est souhaitable que les thèses soient mises en ligne. Les universités sont en outre de plus en plus nombreuses à vouloir prendre en charge le diffusion électronique des thèses soutenues en leur sein. Nous sommes actuellement dans un dispositif très centralisé avec des ateliers nationaux de reproduction de thèse qui réalisent des microfiches. Or cette technologie n'est plus adaptée. On aurait pu imaginer la création d'un serveur national pour les thèses, surtout dans un pays aussi jacobin que le nôtre ! Mais ce n'est pas ce qui ressort de la conférence des présidents d'université et des présidents d'université eux-mêmes. Il s'agit donc d'articuler la volonté des universités de mettre en ligne ce qu'elles considèrent comme un témoignage de leur pratique scientifique. Un intervenant Vous avez dit qu'avec les nouveaux contrats d'abonnement, les organismes et les universités perdaient toutes les informations acquises lorsqu'elles stoppaient l'abonnement. Cela me semble inacceptable. Les contrats devraient être négociés de manière à ce qu'il y ait un droit à la conservation des informations payées. Quelqu'un a demandé combien coûtaient les abonnements. Chez nous, l'achat des revues et des ouvrages revient à 25 000 francs par an. Et nous avons sans doute la plus belle bibliothèque dans notre domaine. Il faut ajouter à ce coût le coût d'un poste de travail pour la création et la visualisation des informations, ainsi que la construction et l'entretien du bâtiment. Je pense que le coût global doit ainsi atteindre entre 30 000 et 35 000 francs. Claude JOLLY Les coûts varient selon les disciplines. On peut
difficilement comparer les coûts en sciences humaines et en sciences
exactes. Quant au droit que doivent donner les licences, il s'agit en
effet d'un problème. Les bibliothèques doivent porter une
attention particulière aux contrats qu'elles négocient. Publication électronique des résultats de la recherche : quel impact sur l'évaluation ?
Je suis. En dehors du fait que je lis et publie, j'ai été rédacteur et rédacteur en chef dans plusieurs revues appartenant à la société savante française et britannique. Je suis également co-éditeur depuis 17 ans d'un journal appartenant à Elzévir et à une société allemande. Je suis administrateur d'EDP-Science. J'ai été collaborateur scientifique de Paul Ginsparg lorsqu'il a créé sa banque de données. Et j'ai été pendant six ans directeur de laboratoire et donc d'une bibliothèque de grande qualité. J'ai ainsi souffert année après année de l'augmentation des prix et de la stagnation de mon budget. Autant de raisons qui font que je m'intéresse à la publication électronique.
Présentation de l'outil La création du site de Paul Ginsparg a eu lieu en 1991 à l'initiative de ce dernier, appuyé par ses collègues. Il a accumulé plus de 127 000 articles. Le nombre de soumissions par mois augmente de manière linéaire depuis novembre et atteint aujourd'hui 3 000. On compte plus de 100 000 connexions par semaine et il y a aujourd'hui 14 sites miroirs. Il s'agit d'un outil efficace. L'information est diffusée de manière instantanée. L'accessibilité est gratuite et facile pour les auteurs et les lecteurs. Elle est en outre facilitée par les sites miroirs. Les articles complets sont en format postscript ou PDF. Les sources sont disponibles en Tec ou en Latec. L'information est réunie sous une adresse unique, ce qui facilite la recherche bibliographique. Pour les articles relevant de la physique des particules, une collaboration avec le laboratoire Slac de Stanford crée des liens par citation et référence, et engendre toutes les statistiques de citation, ce qui est utile lorsqu'on doit faire des rapports sur un collègue. La pérennité de l'information à court et moyen terme me semble assurée grâce aux sites miroirs. Limites Les outils de recherche sont assez primitifs et leur amélioration n'est pas très rapide compte tenu des problèmes d'intelligence artificielle, d'informatique et compte tenu de la quantité de travail nécessaire et donc de coût. Il s'agit d'un système délivrant de l'information brute, sans validation. Il existe toutefois une validation implicite dans le temps. A partir du moment où les articles sont présents depuis un certain temps, il existe des références croisées et des citations qui constituent une validation plus utile que celle des journaux. A court terme, il y a cependant des articles sur lequel on ne sait rien. L'absence de validation rapide est ainsi inadéquate pour l'évaluation des chercheurs, et en particulier des plus jeunes. Il en va de même pour les chercheurs ayant des financements à demander, ceux-ci dépendant souvent de la publication de leurs précédents travaux. Si le système a des avantages, il a donc des limites. Or en neuf ans, peu de progrès ont été réalisés à ce niveau. Le succès du système tient au fait qu'il est gratuit. Mais certaines tâches, comme l'évaluation scientifique, ne peuvent toutefois être automatisées. Quand les archives ont été créées, on a considéré qu'elles remettaient en cause le rôle des journaux scientifiques, notamment dans leur fonctionnement traditionnel. Pourtant, avec le système de l'abonnement, ceux-ci mettent une barrière à l'accès aux articles et ont tendance à parcelliser l'information. De ce point de vue, la base est plus efficace que les journaux. Toutefois, ces derniers restent pour le moment le seul moyen de valider le travail des chercheurs. Le système est ainsi devenu paradoxal et antiéconomique. En effet, les journaux scientifiques n'ont à l'origine pas été créés pour jouer un rôle de validation. La validation est apparue au cours du temps pour éviter la pollution dans les journaux, mais leur rôle de départ est la diffusion de l'information scientifique. Aujourd'hui, on insiste ainsi sur ce qui n'était que secondaire. En outre, le système n'est pas optimisé. On ne l'aurait pas conçu ainsi si l'électronique avait existé lors de sa création. Etienne s'est consacré sur un seul problème mais les problèmes sont en fait nombreux. Il nous a dit qu'il ne fallait pas dire aux journaux qu'ils étaient menacés mais simplement les tuer sans leur dire ! Il ne faut toutefois pas oublier que nous ne savons pas encore très bien comment utiliser les moyens électroniques à cause des changements permanents et des résistances au changement. Les maisons de publication ont en outre des employés qui ont été formés à d'autres tâches que celles que nous leur demandons aujourd'hui. Malgré les efforts méritoires d'EDP-Science, par exemple, il est difficile pour cette maison de suivre les évolutions. Il a fallu dire à ces maisons qu'elles allaient mourir d'ici cinq ans si elles n'évoluaient pas. Ces problèmes sont également vrais pour les sociétés savantes, où les chercheurs ont une certaine influence, même si ils le sont encore plus pour les sociétés commerciales. Tout changement de fonctionnement ne peut venir que d'une décision collective au niveau international. Un chercheur ne peut seul décider d'un changement d'évaluation. La décision doit être globale, ce qui est loin d'être évident. On pourrait en effet aboutir dans le cas contraire à un système absurde dans lequel les chercheurs publieraient dans des revues dont ils déconseilleraient l'achat à leur laboratoire ! Enjeux De nombreuses stratégies sont envisageables. J'ai d'ailleurs écrit de nombreux articles à ce sujet. Mais aucune stratégie n'a pour le moment été essayée. Les jeunes chercheurs sont très réticents car ils ne veulent pas expérimenter à leurs frais un changement de système. J'ajoute que les chercheurs sont rarement conscients des enjeux économiques. Le fait que le système coûte moins cher les intéresse peu. Ils ne réfléchissent au problème que lorsqu'on leur dit que faute de budget, il va falloir supprimer certains abonnements ! Les revues scientifiques européennes sont les premières menacées par ces évolutions. En effet, les revues américaines, qui ont un marché plus grand et vendent donc plus d'exemplaires, peuvent amortir leurs coûts fixes plus facilement. En Europe, le système est très parcellisé ; la plupart des maisons de publication sont de petite taille. C'est pourquoi nos collègues américains disent qu'il faut que nous abandonnions nos revues. Si nous sommes d'accord avec cette idée, nous sommes toutefois réticents parce que ce seront les Américains qui en profiteront les premiers. Le système se réorganisera inévitablement mais nous souhaiterions que l'évolution ne se fasse pas de manière chaotique. Le changement ne se fera que lorsque les chercheurs le décideront. Le système doit d'abord permettre une validation immédiate. Dans la base de Los Alamos, par exemple, un article n'ayant pas d'adresse de laboratoire sera rejeté. Le but est d'éviter la pollution. La reconnaissance de l'originalité du travail du chercheur est également un point essentiel, notamment pour l'auteur. Pour la hiérarchisation de l'information, l'électronique offre de nombreuses possibilités encore inexploitées. La hiérarchisation se faisait jusqu'à aujourd'hui par l'acceptation primaire d'un article par une revue ayant plus ou moins d'impact. Ce faisant, cette hiérarchisation ne rendait pas justice au travail des rapporteurs. L'électronique, quant à elle, donne la possibilité d'ajouter des remarques aux articles. L'évaluation directe par des comités de lecture a des concurrents directs. On peut par exemple imaginer des validations spontanées, des commentaires explicites attachés, etc. Il devient en outre possible de créer des modèles d'évaluation dynamiques. Cela se fait déjà plus ou moins. Comme je le disais précédemment, l'essentiel, pour un article, devient plus le fait qu'il ait été cité par plusieurs experts que le fait qu'il ait été publié dans telle ou telle revue. Cette évaluation est toutefois à long terme. Et un article peut être cité plusieurs fois pour être contesté ! L'analyse statistique ne suffit donc pas. L'électronique permet toutefois une réévaluation dans le temps qu'il convient d'utiliser. Toutes les possibilités qu'elle offre doivent être organisées et l'on ne pourra jamais se passer de l'équivalent d'un comité de lecture, d'un secrétariat, etc. On aura toujours besoin de ce type de système, qui pourra cependant être organisé de manière plus rationnelle, plus efficace et moins coûteuse. Claude KORDON, Inserm Je suis rédacteur en chef d'un journal international, ancien directeur de laboratoire, membre de commissions d'évaluation dans différents pays comme l'Allemagne, le Canada, la France et même l'Inde, où les problèmes de l'évaluation et de la production scientifique sont encore plus complexes. Je suis membre d'Euroscience, une société de réflexion sur l'impact de la science sur la société et la communication. Je suis tout à fait d'accord avec ce qu'ont dit Franck Gannon et Jean Zinn-Justin. Il n'y a de salut que dans un cadre européen. Une concertation massive de toutes les communautés scientifiques européennes est indispensable. Toutefois, je nuancerais quelque peu les constats qui ont été faits. Les sciences de la vie ne sont pas toutes dans la situation décrite par Franck Gannon. La biologie végétale, les disciplines physiologiques, l'immunologie, les neurosciences et les disciplines pathologiques, qui ne sont pas structurées, connaissent des difficultés encore plus aiguës. Rappels sur les disciplines non structurées Le manque d'impact Sur 4 000 publications indexées, 80 % se trouvent en science de la vie et de la santé, ce qui est démesuré. Les trois quarts de ces publications ont un facteur d'impact inférieur à un, ce qui signifie que les articles sont en moyenne cités moins d'une fois. Il y a donc une inflation inutile de documents. Même dans les revues ayant un fort facteur d'impact, entre 5 % et 10 % des articles ne sont jamais cités. Le fait d'avoir un article dans ces revues ne signifie donc pas que l'article est important. Et dans les revues de moindre impact, on a souvent plus de la moitié des articles qui ne sont jamais cités. Il existe ainsi une contradiction entre l'objectif de diffusion du savoir et la justification de sa propre action. La manière dont les chercheurs cherchent des certificats dans le but d'obtenir des financements se fait au détriment d'une vraie stratégie de communication. On ne choisit pas un journal en fonction du lectorat mais en fonction du facteur d'impact, ce qui amène à publier dans des journaux très généralistes, où les informations sont noyées. Et lorsque les chercheurs ne peuvent faire autrement, ils publient là où leur article est accepté, sans réfléchir à la pertinence de leur choix. La vulnérabilité des revues européennes Les sociétés savantes européennes sont vulnérables car elles manquent de moyens, contrairement aux grandes sociétés américaines. Progressivement, la majorité des bonnes revues seront ainsi américaines. Ce que vous disiez tout à l'heure à propos du maintien de notre savoir-faire me rappelle un vieux débat entre les Etats-Unis et la France. Au moment où nous avons monté un système de recherche spatiale, les Américains nous disaient qu'il ne servait à rien de dépenser des milliards pour une recherche que nous pouvions mener avec eux. Or dans un tel cas, nous aurions probablement eu accès à beaucoup de ressources du système spatial américain, mais nous aurions également perdu notre liberté et notre autonomie scientifiques. La pression de publication La pression de publication, dans les universités, est parfois telle qu'elle conduit à des pratiques paradoxales. J'ai par exemple discuté avec le doyen d'une grande faculté de médecine allemande à qui on avait demandé de parler avec les étudiants. Au cours de sa première année, il ne s'est pas passé une semaine sans qu'un étudiant ne vienne se plaindre parce que son directeur de recherche le conduisait à la fraude. En effet, certains chercheurs n'ont pas le temps de s'occuper des étudiants et poussés à la publication, ils demandent à ceux-ci de laisser de côté certains résultats pour prendre d'autres directions. Or il en va de même dans les facultés françaises. Une réflexion institutionnelle est donc à mener. Et la publication électronique me paraît être un moyen d'assainir la situation. Conditions de succès d'un renouveau de l'édition scientifique La publication électronique ne fonctionnera que si elle est gratifiante pour les chercheurs. Pour ce faire, deux conditions doivent être remplies. Il faut tout d'abord mettre les chercheurs à l'abri du pillage de leurs idées. Dans beaucoup de disciplines, notamment en physique lourde, le problème du pillage ne se pose pas vraiment car il est impossible de reproduire les résultats dans un délai suffisant. Dans un grand institut comme l'EMBO, le problème se pose également peu car l'organisation est telle qu'elle permet une rapidité de travail. Mais dans les disciplines peu structurées, dans nos organismes de recherche et dans nos universités, la situation est différente. Les exemples de pillage d'idées sont multiples et beaucoup de chercheurs craignent que la diffusion de préprint n'ait pas l'effet bénéfique qu'elle a en physique. La publication électronique doit en outre pouvoir servir à l'évaluation et participer à la reconnaissance de l'activité du chercheur. Or pour l'institut Max Planck, la DFG, le MRC, l'Inserm, le CNRS, et sans doute pour l'INRA, l'impact actuel de la publication électronique sur l'évaluation est nulle. Je me souviens avoir lancé l'idée d'un journal totalement électronique lors d'une réunion du comité de lecture de mon journal aux Etats-Unis. Or ce ne fut pas les chercheurs européens qui furent les plus réticents mais les chercheurs américains, qui m'accusaient de vouloir mettre dans le journal électronique ce que je ne voulais pas publier dans le journal papier. Ils me mirent ainsi en garde sur la possible baisse d'impact du journal papier si je conservais le même nom pour les deux publications. Suggestions pratiques Agir ensemble Il me paraît indispensable d'associer, au niveau européen, des sociétés savantes, des rédacteurs, des comités de lecture, des organismes de recherche et des universités, c'est-à-dire des représentants des évaluateurs, ainsi que des éditeurs, notamment des éditeurs indépendants et académiques qui sont plus proches des universitaires et qui peuvent comprendre une logique autre qu'une logique strictement commerciale. Cette association pourrait se faire dans le cadre de la fondation européenne pour la science, qui est le club des organismes de recherche européen. Les conditions de validation des données des journaux électroniques devraient être le premier objet de négociation. Je ne pense pas qu'un organisme de recherche puisse seul changer les règles. Mais à une époque où beaucoup d'organismes réfléchissent à ce que pourrait être une vraie évaluation européenne, chose que l'Union européenne n'a pas su mettre en place, nous pourrions en profiter pour redéfinir les règles. J'étais il y a peu à Munich dans le comité scientifique d'un grand institut Max Plank, avec son directeur, Monsieur Markup. Or cet institut, si prestigieux qu'il soit, n'a pas de politique de communication. Monsieur Markup m'a avoué son impuissance dans ce domaine, en ajoutant que si une vraie réflexion stratégique avait lieu au niveau européen, les choses avanceraient. Imposer un code déontologique Nous avions travaillé au conseil scientifique de l'Inserm pour proposer notamment une déontologie des rapporteurs, dont la logique de comptabilisation des publications par facteur d'impact doit être cassée. Il y a en effet des papiers qui ne sont pas cités pendant sept ou huit ans et qui deviennent soudain la racine d'une découverte majeure. Sans révolutionner l'évaluation, il y a des moyens de la faire évoluer. Nous devons avoir une démarche plus volontariste et faire respecter une déontologie. Créer des sites par discipline Il serait également souhaitable de négocier pour appuyer la macro prospective sur des expériences pilotes, et plus exactement sur des spécificités disciplinaires. Franck Gannon a dit que nous pourrions réaliser un site France ou Inserm à l'intérieur du grand site, or je ne suis pas sûr qu'il faille ouvrir des sites nationaux. En revanche, les sites de sous-communautés disciplinaires me paraissent utiles. En effet, les habitudes de publication varient sensiblement selon les domaines. En outre, on ne donnera confiance aux chercheurs qu'en inventant des règles adaptées à leurs modes de fonctionnement et reconnues par leurs pairs. Nous devrions commencer par définir des produits originaux. Lorsqu'on observe la plupart des journaux diffusés sur Internet, on s'aperçoit qu'ils ne sont pas différents des journaux papier. Un ami me disait un jour que lorsqu'on a inventé les chemins de fer, on a commencé par mettre des diligences sur des rails. Or un chemin de fer est tout autre chose ; cette nouvelle technologie a agi sur les habitudes de transport des voyageurs, sur les habitudes de traction, sur la construction du matériel roulant, etc. Je ne veux pas dire que le journal électronique détruira le journal papier, comme le chemin de fer a détruit la diligence. Je veux simplement dire que s'il ne trouve pas sa spécificité, il ne parviendra pas à trouver sa place. Nous avions ainsi suggéré il y a un certain temps à l'Inserm de définir des produits originaux et pour ce faire, de faire une recherche sur les moteurs de recherche. Le but était de trouver des moteurs de recherche reproduisant la démarche du chercheur. Il s'agirait d'utiliser des systèmes experts qui, dans chaque sous-discipline, aide le chercheur dans sa recherche. On arriverait ainsi dans chaque discipline à une validation interne, c'est-à-dire à des moyens de recoupement plus efficaces que le simple constat de la fréquence d'accord ou de désaccord entre tel type de conclusion et la littérature. Pour être moins abstraits, prenons un exemple sur lequel nous avions travaillé avec l'Inserm et avec des informaticiens de Paris VI dans le cadre de la neuro-endocrinologie. En neurosciences, il y a un certain nombre de réalités incontournables que nous connaissons tous mais que les ordinateurs et les banques de données ne connaissent pas forcément : la neuro-anatomie. En dehors de celle-ci, les corrélations biochimiques ou génétiques que l'on peut faire n'ont pas de sens, celui-ci étant donné par le rapport structure-fonction. Nous avions donc imaginé un système de graphe en neuro-anatomie, auquel nous superposions des plans différents selon la physiologie, la biochimie, l'expression des gènes, la pathologie, en suivant toujours la logique neuro-anatomique. Il y avait là une forte connotation disciplinaire ; en immunologie, par exemple, la logique sous-jacente est différente. Les tentatives que nous avions faites dans ce domaine devraient être reprises, car elles ont tout leur sens aujourd’hui. Trouver notre propre voie Nous devons nous baser sur nos spécificités, sans quoi nous ne parviendrons pas à rester dans la compétition. Les Etats-Unis ont des années d'avance dans la composition de bases de données et il sert à rien de vouloir reproduire leurs logiciels. Nous aurions à mon sens plus de chances d'avoir des financements européens et de redevenir des interlocuteurs de poids si nous recherchions une stratégie différente mais complémentaire, en utilisant notamment les communautés disciplinaires et le savoir-faire de l'Europe en matière de système expert. Synthèse et débat final
Je crois que nous avons abordé toutes les interactions entre les nouvelles technologies et l'évolution du système de communication électronique. L'enjeu de la matinée était l'usager final, avec comme question la construction d'un accès unique, sans barrière, pour la diffusion des écrits scientifiques. Nous avons eu trois sortes de propositions :
L'après-midi a amplifié le débat, qui a touché non plus aux systèmes d'information mais aux systèmes de connaissances. Nous ne pouvons plus raisonner en termes de gestion des publications. Il faut raisonner aujourd'hui en termes de gestion de connaissances et interconnecter les résultats de la recherche avec les données de la recherche. A également été abordée l'évolution du processus d'évaluation, thème où j'ai moins perçu de nouveautés. Reste à définir ce qu'il faut organiser, et par quoi il faut commencer. Marie-Christine BENE Il y a tout de même une nouveauté : l'utilisation des notices et la mise à disposition, pour les lecteurs, des remarques de reviewers. Ceci valoriserait le travail de ces derniers et permettrait d'en finir avec les reviewers qui, sans même avoir lu l'article, le refusent quand d'autres, au contraire, font un vrai travail éditorial. Ghislaine CHARTRON Je crois qu'Etienne a expérimenté ce système sur sa revue. Etienne HARNAD Je rédige depuis vingt ans une revue spécialisée dans les commentaires des pairs. Chaque article est lu par un comité de pairs qui, lorsqu'il accepte celui-ci, rédige ses commentaires. Je reçois donc les articles bruts et il me semble préférable d'épargner aux lecteurs cette phase. En outre, si je suis pour l'auto-archivage, je ne suis pas pour l'auto-nomination des pairs. Personne n'a encore une idée de l'alternative à trouver au système. Les commentaires de pairs ne sont pour le moment qu'un supplément. Ils ne se substituent à rien. Marie-Christine BENE Il s'agit simplement d'améliorer la qualité du reviewing. Un intervenant Pendant six ans, j'ai été éditeur du Journal of physics. En tant que rédacteur en chef également, j'avais proposé de rajouter dans la version électronique non pas directement les rapports mais les commentaires et les conclusions lorsque ceux-ci étaient intéressants. Il aurait fallu, bien entendu, avoir l'autorisation de celui qui avait effectué le rapport. Mon bureau s'y est opposé six années consécutives. Etienne HARNAD Deux revues font déjà cela. Si l'arbitre donne sa permission, elles publient le rapport. Il s'agit là encore d'un supplément intéressant mais non d'une alternative. L'important, dans tous les cas, est d'éprouver les hypothèses avant de les généraliser. Pour le moment, la littérature est contrôlée. Vous avez parlé du peu de citations qu'ont certains articles, ce qui est tout à fait vrai. Le système est ainsi fait. Il s'agit d'une liberté indispensable. Le passage par le contrôle des pairs vaut publication. La seconde étape est l'archivage. La publication est indépendante du média. Une revue électronique n'est en fait rien de particulier. 90 % des revues sont déjà des revues électroniques. Vos propos sur l'évaluation ne sont donc pas valables puisque toutes les revues classiques comptant pour l'évaluation sont désormais en ligne. Mais vous pensiez peut-être aux revues uniquement en ligne, qui sont des nouvelles revues ayant une valeur inférieure aux revues établies. Je pense pour ma part qu'il faut séparer les paramètres. Un intervenant On a eu au départ l'illusion que les revues électroniques allaient coûter environ 30 % moins cher et que tout le monde allait se précipiter sur elles. Or les chercheurs ne font pas ce calcul économique. De ce point de vue, peu importe donc que la revue soit électronique ou papier. Si vous dites à un chercheur que le taux d'impact d'une revue est de dix, il publiera dedans même si celle-ci est impossible à consulter compte tenu de son coût. Une revue électronique ne peut s'imposer que grâce à la qualité de son contenu et son prestige. Etienne HARNAD J'ai proposé de garder ces avantages, de conserver les revues préférées, de garder le système classique de contrôle par les pairs, mais en y ajoutant autre chose. Diminuer les taux n'entraîne aucune libération ; il y aura toujours ceux qui peuvent avoir accès aux revues et les autres. On a recommandé ce matin de garder les œuvres en otage pour subventionner les jeunes chercheurs. Il n'y a pas de raison de l'accepter. Il s'agit du même problème que pour les astronomes qui souhaitent conserver des pages pour l'éternité. Pourquoi les papiers devraient-ils être gardés en otage pour répondre à ces superstitions alors qu'il existe des imprimeurs ? Gardons la version expertisée de l'article, la seule ayant de la valeur. Ceux qui veulent une copie papier n'ont qu'à imprimer chez eux. Un intervenant Je me suis peut-être exprimé d'une manière trop elliptique. Je suis d'accord avec votre critique. Qu'un journal soit publié sous forme électronique ou non n'a pas d'impact sur l'évaluation. Mais l'impact des revues électroniques est biaisé, y compris dans les organismes de recherche. Et lorsque je parlais de l'impact possible d'une édition électronique, c'était avec l'espoir que ce qui constitue les trois quarts des revues dans le domaine des sciences de la vie ne disparaissent pas. Celles-ci pourraient disparaître parce qu'elles polluent la littérature. Elles n'ont plus de contenu scientifique parce que les articles sont faits simplement pour qu'un étudiant signe en premier. On publie uniquement pour contenter les étudiants étrangers, pour ne pas les laisser rentrer chez eux sans avoir pu publier leurs travaux dans un laboratoire français. J'en ai discuté avec le président du Max Planck, qui lui-même n'arrive pas à faire sortir les laboratoires de cette logique. Ce type d'article ne devrait plus être sur papier. Etienne HARNAD On ne sait pas ce qui arriverait si ces articles étaient supprimés. Pour avoir la crème, il faut le lait ! Le même intervenant Les informations ne sont intéressantes que si elles ne sont pas trop diluées. Il s'agit certes d'une hypothèse. C'est pourquoi je souhaiterais des expériences pilotes avant que l'on ne détermine une grande stratégie de publication électronique. La seule manière de valider ou d'invalider cette hypothèse est de mener des expériences dans un domaine suffisamment restreint pour qu'il n'y ait pas d'impact massif sur le système. Etienne HARNAD Laissons les expériences. Ne faisons pas de lien entre le destin de la littérature actuelle et celui de la littérature en ligne. La littérature actuelle doit être libérée, quels que soient les résultats de ce type d'expérience. Le même intervenant Je n'ai rien dit qui soit en désaccord avec ce que vous dites. Mais ces expériences pilotes doivent tout de même être effectuées en concertation avec les évaluateurs. L'expérience ne fonctionnera que si l'on convainc un certain nombre de chercheurs de jouer le jeu. Or les chercheurs ne seront convaincus que s'il existe un minimum de caution institutionnelle. Un intervenant J'ai l'impression qu'il y a deux niveaux de discussion. L'un concerne les qualités et les défauts de l'édition en ligne. Or tout le monde est d'accord pour développer ce type d'édition. Le problème de la publication d'articles secondaires ou tertiaires ne tient pas à l'édition électronique. L'autre niveau concerne la libération des publications qui, en revanche, est un vrai problème. Je suis un jeune chercheur et j'aimerais bien savoir ce qu'il faut faire pour ne plus avoir à payer des articles qui nous appartiennent. Vous avez tous dit que personne n'osait faire le premier pas. Que faut-il donc faire ? Un intervenant nous propose un putsch et un autre propose un équivalent de l'initiative des NIH qui ne révolutionnera rien. Pourquoi ne pas faire ce qu'ont fait les physiciens ? Etienne HARNAD Stockez vos articles et la littérature sera libérée ! Jean ZINN-JUSTIN Nous avons effectivement franchi le cap en physique. J'espérais que, dans la mesure où les chercheurs pouvaient maintenant mettre librement leurs articles sur une base de données, la pression de publication allait diminuer. En tant que rapporteur et éditeur, j'ai été confronté aux gémissements des auteurs qui sont d'accord avec le fait que certains de leurs articles ne sont pas intéressants mais qui demandent à ce qu'ils soient tout de même publiés pour obtenir des financements. Il est ainsi difficile d'arrêter un papier car même si on le refuse, il paraît le lendemain dans une autre revue. Malgré mes espoirs, je dois toutefois avouer que pour le moment la pression demeure. Un intervenant Dans deux ou trois mois, je vais envoyer une publication dans une revue prestigieuse. Et je me demande si je dois refuser de signer le copyright ou si je dois le signer en archivant le manuscrit envoyé, tout en sachant que dans ce cas, certains pourront me voler les résultats. Ce problème ne se pose pas en physique. Il est vrai que la publication est utile pour obtenir des financements, mais il y a aussi les abstracts et les congrès. Une intervenante Peut-être que l'archivage électronique daté et correctement référencé pourrait résoudre ce type de problème. Une intervenante Nous ne vous demandons pas de vous transformer en Don Quichotte ! Claude Kordon et Philippe Bessières ont évoqué des démarches collectives. Si l'on peut penser à la fin de cette journée que des rapprochements et des réflexions partagées vont avoir lieu, il y aura déjà un progrès. Un intervenant Par choix intellectuel, je serais plutôt du côté des putschistes. Cependant, lorsqu'on fait un putsch, il faut être assuré de sa réussite. Or pour réussir, il faut que ceux qui l'initient soient reconnus. Si je suis pour une plus grande liberté de publication, je n'oublie pas que toute liberté entraîne une responsabilité. Une manière d'exercer celle-ci est de trouver un substitut aux mécanismes de validation, notamment pour ceux qui ne sont pas satisfaisants. C'est pourquoi il serait utile que se créent des journaux électroniques radicalement différents, publiant par exemple sous un format standardisé certains types de résultats comme des résultats négatifs. J'ai pour ma part du mal à publier des résultats entièrement négatifs dans ma revue car je me demande qui cela peut intéresser. Or cela intéresse beaucoup de monde car cela évite de répéter certaines manipulations. Un intervenant Certaines revues le font. L'intervenant précédent Les bonnes revues ne le font pas et les mauvaises ne sont de toute façon pas citées ! Pourquoi ne pas spécialiser quelques revues électroniques sur ce créneau ? On entend dire aux Etats-Unis que 2 % des articles publiés sont faux, que 5 % apportent quelque chose à la littérature et que 93 % ne sont même pas faux ! Certains résultats faux peuvent apporter des éléments intéressants. Notre responsabilité est de censurer ce qui est faux lorsqu'on le peut mais surtout de réguler ce qui n'est même pas faux de manière à ce que le contenu devienne utilisable, ce qui n'est pas le cas pour le moment. Une intervenante Nous sommes fascinés par les possibilités d'Internet, qui permet par exemple d'effectuer du raisonnement automatique à partir de la masse de données produites. Et en même temps, nous avons peur parce que personne n'est capable de mettre en place des moyens pour contrôler la diffusion d'information. A combien cela revient-il de remplacer un abonnement papier par un accès aux publications électronique ? Pour ce faire, il faut en effet acheter des ordinateurs à Microsoft, qui n'est rien moins qu'une autre mafia, mais également acheter des navigateurs, des mises à jour de logiciel, etc. Y a-t-il réellement un gain économique ? Un intervenant Il ne faut pas se bercer d'illusions. Quand un scientifique publie un texte, on lui offre un service en diffusant son article. Or ce service a un coût. Vous parlez d'auto-archivage, de diffusion gratuite, etc. Il ne faut pas oublier qu'il faudra que quelqu'un assume les coûts. Microsoft, par exemple, prendra sa dîme quelque part. Au final, ce sera l'Etat qui paiera. Il y aura simplement un déplacement de flux. Etienne HARNAD C'est tout à fait faux ! Nous avons déjà les ordinateurs pour d'autres utilisations. Vous tenez des propos d'éditeur. Un intervenant Nous avons parlé des consortiums avec Monsieur Jolly, mais celui-ci n'a pas expliqué comment ils fonctionnaient. Il a simplement indiqué qu'un certain nombre d'universités françaises s'étaient regroupées pour offrir un service différent. Cette initiative, qui se nomme Couperin, regroupe actuellement cinq universités (bientôt huit) ayant négocié des contrats avec les éditeurs. Pour moi qui suis hospitalo-universitaire, qui gère donc un laboratoire et des chercheurs tout en enseignant, ce système est très utile. Avant, lorsque je voulais une information, je devais faire ma recherche sur PubMed et envoyer un coursier à la bibliothèque. Désormais, lorsque je cherche quelque chose, il me suffit de cliquer pour obtenir le texte sur Acrobat. Si l'information obtenue n'est pas ce que je cherchais, il me suffit de fermer mon ordinateur ; et si l'information est intéressante, je peux la recopier ou l'imprimer. Ceci est permis grâce au regroupement des bibliothécaires des services communs de documentation. En se rassemblant pour éliminer les doublons, les universités ont ainsi pu acheter des revues qui n'existaient dans aucune d'elles et avec les 10 % de fonds supplémentaire, elles ont ouvert un accès à toutes les revues pour tous les personnels à partir de leur ordinateur. Cela ne me gêne pas de dépenser 10 000 francs dans un nouvel ordinateur pouvant lire les données par exemple sur Netscape 5. Les étudiants, qui traînaient à la bibliothèque et faisaient des centaines de photocopies qu'ils ne lisaient parfois jamais, utilisent maintenant le net et n'impriment que les articles qui les intéressent réellement. Il s'agit d'un outil extraordinaire. Un intervenant J'ai l'impression que nous discutons de choses différentes. Il y a une démarche altruiste qui consiste à offrir notre travail sur le web parce qu'il a été financé par la communauté, et ce peu importe le format sous lequel il sera rendu disponible. Mais à côté, nous avons la possibilité d'avoir des éditeurs qui proposent de mettre nos publications on line avec des compléments. Les deux systèmes sont totalement différents. Ils ne s'excluent pas l'un l'autre. Refuser le copyright sous prétexte de vouloir rendre disponible son travail à toute la communauté scientifique pose des problèmes. Qui fera l'archivage et quelle sera sa pérennité ? En même temps, en tant que scientifique, nous payons pour faire publier nos articles et nous payons pour les lire, ce qui est un vrai problème. Le fait que les éditeurs nous donnent un plus permettant d'analyser des bases de données de génomes en fonctionnement est une quatre question. Une intervenante Je crois qu'il faut multiplier les initiatives. Le travail sur le transfert du copyright me paraît important. Réaliser un web institutionnel qui stockerait les publications des chercheurs me semble la moindre des choses compte tenu des possibilités offertes par les nouvelles technologies. Nous devons travailler pour assouplir les procédures de transfert de copyright. Les physiciens ont gagné. Les éditeurs permettent l'auto-archivage sur les sites et apparemment les revues ne se trouvent pas pour autant concurrencées par ce système. Les deux systèmes peuvent donc cohabiter. Nous devons nous donner des moyens pour expérimenter le modèle défendu par Etienne Harnad, ne serait-ce que pour offrir un droit d'accès pour tous aux fruits de la recherche financée par les crédits publics. Un intervenant Etienne a tort d'insister sur l'aspect financier du problème, même si celui-ci est important. En droit français, l'auteur garde toujours un droit moral sur son œuvre. Le copyright n'achète que l'objet physique, ce qui n'est pas le cas en droit anglo-saxon. L'aspect financier est secondaire car les chercheurs ne se laisseront jamais convaincre par des considérations financières. En revanche, ils sont sensibles à l'argument de l'accès libre à l'information scientifique. S'il est légitime que les éditeurs se fassent rémunérer pour l'amélioration et la structuration de l'information, ils ne peuvent nous enlever le droit à notre propre travail. Ce message est important. Dans le domaine de la physique, les maisons d'édition ont également protesté mais elles ont dû se résigner. Un compromis a fini par s'installer et chacun y trouve un avantage à court terme. Un intervenant Je suis très sensible à la possibilité de jouir de son œuvre et de la diffuser comme on l'entend. Mais pour y parvenir, nous devons tous nous battre afin d'obtenir une modification profonde des habitudes d'évaluation de la recherche par les universités et les organismes de recherche. Les jeunes chercheurs, notamment, doivent monter au créneau avec les organismes de recherche, dont certains sont sans doute suffisamment matures pour le faire. Si les services ont un coût, dans un certain nombre d'éditions et de publications primaires, le coût demeure alors que le service diminue. Je connais des revues qui se créent alors qu'il en existe déjà plusieurs qui couvrent parfaitement le domaine. En continuant ce jeu, on fait croître le coût sans pour autant accroître le service.
Suzy MOUCHET Je retiens de cette journée les fantastiques possibilités offertes par la communication électronique. L'important est de donner un accès aussi large que possible aux informations scientifiques de toute nature nécessaires à la recherche. Pierre Oudet en a parlé ce matin et a bien fait la différence entre la publication et tous les " objets de connaissance ". Ce sont également les liens entre les différents types d'informations qui sont nécessaires. Les institutions payent pour la recherche, pour la publication et pour la lecture. Il est clair que le système doit évoluer. Et je pense qu'il est prêt à évoluer. Lorsque les physiciens ont ouvert leur service de pre-print, ils n'ont pas négocié le copyright. Cela a été admis par les éditeurs. Aujourd'hui, il existe un trio entre les institutions, les auteurs, qui sont payés par celles-ci pour produire des connaissances et publier, et les éditeurs. Sans oublier le rôle fondamental joué par les sociétés savantes. Peut-être les institutions pourraient-elles considérer, comme les NIH, qu'elles sont propriétaires des résultats des recherches de leurs chercheurs et ainsi négocier directement avec les éditeurs. On peut en outre se demander si les organismes de recherche ne devraient pas développer des serveurs de préprint par champ disciplinaire. Nous lançons à l'Inserm deux ou trois expériences pilotes au niveau des instituts fédératifs de recherche, c’est à dire au niveau de sites de recherche. Aujourd’hui, nous avons juste effleuré ce qui ne pourra qu'évoluer, soit à cause d'expériences pilotes, soit du fait des éditeurs, soit parce les chercheurs évolueront. Les besoins évoluent et nous serons bien obligés d'évoluer pour mieux répondre à ceux-ci. Marie-Françoise CHEVALLIER-Le GUYADER Les concertations se développent au niveau européen
comme au niveau national. Chaque collectivité scientifique a du
travail. Contactez-nous si vous souhaitez que nous initiions d'autres
projets pour vous aider à réfléchir. Compte rendu réalisé par la société Hors Ligne – 01 55 64 04 44 |
|||
Retour accueil rencontre-débat
Mise en ligne : 3 octobre 2000