Introduction
La visibilité des revues scientifiques dépend aujourd’hui de la qualité et de la cohérence de leurs métadonnées. Dans le cadre de la science ouverte, les référentiels tels que le DOAJ (Directory of Open Access Journals), HAL (Hyper Articles en Ligne), ou Mir@bel exigent une structuration normalisée, interopérable et transparente des métadonnées et du contenu. Or, les revues, notamment en SHS sont souvent gérées par de petites équipes, peinant alors parfois à répondre à ces critères. En effet, la fragmentation des formats, l’absence d’harmonisation sémantique et le manque de ressources humaines expliquent en grande partie ces difficultés structurelles1. C’est dans ce contexte que s’inscrit ce travail mené au sein de la plateforme NumeRev, projet portée par la MSH-Sud, qui hébergent plusieurs revues, dont certaines en SHS. Mon stage avait pour objectif de diagnostiquer les points de non-conformité documentaire et éditoriale affectant la visibilité des revues, puis de proposer des actions correctives permettant leur référencement et leur harmonisation auprès du DOAJ, de Mir@bel et de HAL.
L’article propose un retour d’expérience sur ce processus d’audit et de mise en conformité, en montrant comment la normalisation documentaire peut s’adapter aux spécifiques éditoriales des SHS, tout en respectant les valeurs de la science ouverte.
Diagnostiquer les faiblesses : un état des lieux initial
La première étape a consisté à répertorier l’ensemble des revues de NumeRev dans Xmind afin d’en établir une vue d’ensemble. Pour chaque revue, j’ai consulté sa fiche Mir@bel et noté les métadonnées disponibles (titre, ISSN, éditeur…) et les revues non inscrites, puis repérer les informations manquantes ou incohérentes à partir des sites des revues. Ce travail a permis de dresser un état des lieux précis de la complétude et de la fiabilité des métadonnées sur les plateformes (à la fois sur Mir@bel, et sur les pages dédiées aux revues sur NumeRev).
J’ai ensuite confronté les caractéristiques de chaque revue aux critères de référencement du DOAJ afin d’évaluer leur éligibilité potentielle. Cette analyse préalable a révélé que la majorité des revues ne satisfaisaient pas aux exigences minimales. Ces constats mettent en évidence les obstacles organisationnels et les ressources limitées entravant la production de métadonnées fiables dans les revues indépendantes et/ou avec de faible ressource humaine2.
Enfin, l’audit technique des sites a mis en évidence un problème d’interopérabilité avec le portail HAL. Le code HTML3 des pages articles comportait des balises Dublin Core4 et des métadonnées incomplètes, empêchant le moissonnage automatique et donc un référencement optimal dans HAL. Ce dysfonctionnement, souvent observé dans les plateformes non standardisées, rejoint les analyses sur les effets de la qualité des métadonnées dans les systèmes multiculturels et multi-institutionnels5. L’ensemble de ces constats a mis en évidence la nécessité d’une mise en conformité globale, à la fois éditoriale et technique. Ces résultats ont constitué la base du travail présenté dans la partie suivante.
Intervenir sur plusieurs niveaux : méthodologie et actions
À la suite du diagnostic, une série d’actions coordonnées a été menée pour répondre aux faiblesses identifiées. Ces interventions se sont articulées autour de trois axes complémentaires, la normalisation documentaire, l’amélioration du référencement externe, et la mise à niveau technique, afin d’accroître la visibilité, la cohérence et la conformité des revues aux standards de la science ouverte.
1. Normalisation documentaire
Sur la base des constats établis à partir des critères du DOAJ, chaque revue a fait l’objet d’un travail de mise en conformité progressive. J’ai rédigé ou reconstruit pour chacune d’elles les politiques éditoriales, normes de rédaction et lignes éditoriales, en veillant à intégrer les éléments essentiels : procédures d’évaluation par les pairs, politique de diffusion, mentions de licences, critères éthiques, etc. Ces ajustements ont permis d’aligner les revues sur des standards homogènes tout en respectant leurs spécificités disciplinaires.
2. Référencement et enrichissement des métadonnées
Une mise en à jour complète des fiches Mir@bel a été entreprise pour corriger les incohérences relevées lors du diagnostic. J’ai modifié les notices présentant des ISSN manquantes, des liens obsolètes ou des métadonnées incomplètes, et j’ai créé les fiches des revues non encore référencées. Ce travail, mené en cohérence avec le guide de saisie de Mir@bel a contribué à fiabiliser la représentation des revues de NumeRev au niveau national.
En parallèle, les revues ont été évaluées puis préparées à la candidature au DOAJ selon leur degré de conformité. Les plus avancées ont pu faire l’objet d’un dépôt, notamment la revue COSSI (Communication, Organisation, Société du Savoir et Information), acceptée après harmonisation de ses politiques éditoriales. Cette étape a renforcé la crédibilité et la visibilité des revues, tout en ancrant la plateforme dans une démarche continue de qualité documentaire.
3. Correction technique et interopérabilité
Sur le plan technique, j’ai procédé à un repérage exhaustif des DOI6 sur l’ensemble des articles publiés. Ce travail a consisté à recenser manuellement plusieurs centaines de notices afin d’identifier les cas de DOI manquants, non résultats ou mal formatés, comme les doublons du type : https://doi.org. Ce relevé a permis d’établir une cartographie complète de la qualité des identifiants à l’échelle de la plateforme et de signaler précisément les articles nécessitant une intervention.
Parallèlement, l’analyse du code source des pages articles a mis en évidence un dysfonctionnement structurel empêchant un bon référencement sur HAL. À partir de ce constat, j’ai proposé un nouveau modèle de code HTML intégrant les balises Dublin Core et les métadonnées essentielles au moissonnage automatique, conformément aux recommandations d’Amadi et al, pour qui la lisibilité machine est la première étape vers un contrôle qualité automatisé7. Cette proposition vise à renforcer la compatibilité de NumeRev avec les infrastructures de la science ouverte.
4. Vers une gouvernance documentaire partagée et des perspectives d’automatisation
Ces avancées techniques s’accompagnent d’une évolution organisationnelle, les échanges entre la développeuse, les responsables éditoriaux, et les gestionnaires de l’information ont posé les bases d’une gouvernance documentaire partagée. Cette approche collaborative pour la mise en place de profils de métadonnées cohérents favorise la continuité sémantique et l’interopérabilité entre systèmes8. Elle peut ainsi aider à maintenir dans le temps la qualité des données grâce à une veille normative et à un meilleur suivi des dépôts et des référencements. Enfin, la réflexion s’oriente vers la mise en place d’outils d’intelligence artificielle pour automatiser certaines étapes du contrôle qualité, comme la détection des métadonnées manquantes, la vérification des DOI, ou l’harmonisation des politiques éditoriales. Ces technologies peuvent agir comme des assistants d’audit documentaire, à condition qu’elles restent encadrées par une supervision humaine conforme à l’AI Act9.
Conclusion et perspectives
L’expérience menée sur la plateforme NumeRev montre qu’améliorer la qualité éditoriale ne se limite pas à corriger des métadonnées. C’est un processus collectif et stratégique qui engage les acteurs techniques, documentaires et éditoriaux autour d’un même objectif de transparence et de fiabilité. L’audit réalisé a permis de structurer une gouvernance documentaire partagée, d’identifier les leviers d’interopérabilité et de poser les bases d’un contrôle qualité pérenne. Ce travail a ainsi constitué pour moi une expérience professionnalisante en gestion de projet et en pilotage de la qualité de l’information, montrant que la normalisation peut être un véritable outil de valorisation des revues, et non une contrainte. Également, il peut ouvrir la voie à des prolongements concrets, tels que l’automatisation partielle de l’audit, l’intégration d’outils d’IA pour l’analyse documentaire, ou encore la mutualisation des bonnes pratiques entre revues.
Bibliographie
Amadi, David, et al. "Making Metadata Machine-Readable as the First Step to Providing Findable, Accessible, Interoperable, and Reusable Population Health Data: Framework Development and Implementation Study". Online Journal of Public Health Informatics, vol. 16, n° 1, août 2024, p. e56237, https://doi.org/10.2196/56237
Auclair, Deni, et al., Challenges and Roadblocks to Robust Metadata in the Scholarly Communications Industry Insights. Janvier 2024, https://doi.org/10.1629/uksg.642
Gregg, Will James, et al., "A Literature Review of Scholarly Communications Metadata". Research Ideas and Outcomes, vol. 5, août 2019, p. e38698, https://doi.org/10.3897/rio.5.e38698
Loi sur l’intelligence artificielle de l’UE - Développements et analyses actualisés de la loi sur l’intelligence artificielle de l’UE. https://artificialintelligenceact.eu/fr/
Shi, Julie, et al. "Identifying Metadata Quality Issues Across Cultures". College & Research Libraries, vol. 86, n° 1, janvier 2025, p. 101, https://doi.org/10.5860/crl.86.1.101
Thalhath, Nishad, et al. "Metadata application profile as a mechanism for semantic interoperability in FAIR and open data publishing". Data and Information Management, vol. 9, n° 1, mars 2025, p. 100068. ScienceDirect, https://doi.org/10.1016/j.dim.2024.100068
Notes de bas de page
1 Gregg, W. (2019). A literature review of scholarly communications metadata. Research Ideas and Outcomes (RIO) Journal, 5, e38698. https://doi.org/10.3897/rio.5.e38698
2 Auclair, D., Carmichael J., Thibodeau J., (2024). Challenges and roadblocks to robust metadata in the scholarly communications ecosystem. Insights : The UKSG Journal, 37(1), 642. https://doi.org/10.1629/uksg.642
3 HyperText Markup Language (HTML) est un langage de balisage conçu pour écrire une page web.
4 Dublin Core est un schéma de métadonnées générique du web sémantique utilisé pour décrire une ressource documentaire.
5 Shi, J., Nason, M., Tullney, M., et Alperin, J. (2025). Identification des problèmes de qualité des métadonnées selon les cultures. Bibliothèques universitaires et de recherche, 86(1), 101. doi : https://doi.org/10.5860/crl.86.1.101
6 Un DOI est un identifiant pérenne et unique pour référencer, citer et fournir un lien stable d’un fichier en ligne.
7 « Making Metadata Machine-Readable as the First Step to Providing Findable, Accessible, Interoperable, and Reusable Population Health Data: Framework Development and Implementation Study ».Online Journal of Public Health Informatics, vol. 16, no1, août 2024, p. e56237 .ojphi.jmir.org, https://doi.org/10.2196/56237
8 Data and Information Management, vol. 9, no1, mars 2025, p. 100068.ScienceDirect, https://doi.org/10.1016/j.dim.2024.100068
9 Loi sur l’intelligence artificielle de l’UE - Développements et analyses actualisés de la loi sur l’intelligence artificielle de l’UE. https://artificialintelligenceact.eu/fr/