Cas d'étude FRBR Vaulx-en-Velin

Dans le cadre de la journée Transition Bibliographique à la BNF, le catalogue des médiathèques de Vaulx-en-Velin, FRBRisé intégralement par Progilone, a été présenté pour illustrer l'application des nouvelles normes dans un contexte pragmatique. https://bm.mairie-vaulxenvelin.fr/

Progilone à ISWC 2017

La cellule R&D Progilone s'est envolée pour l'Autriche afin de présenter ses dernières innovations avec Syrtis, et notre Plateforme Santé de documentation, lors de la prestigieuse conférence ISWC sur le Web Sémantique.

Canopé a choisi PROGILONE

Le réseau Canopé a choisi Progilone, dans le cadre de la refonte de son SID, pour lui confier une prestation d’expertise et de conseil sur la FRBRisation des catalogues de son réseau.

ISSN a choisi Progilone

Progilone a réalisé un nouveau portail ainsi que l'ISSN Customer Extranet pour l'ISSN afin de permettre aux institutions de gérer directement leurs abonnements et aux éditeurs de suivre leurs demandes d’ISSN. Le projet a démarré il y a un an sous la responsabilité de Anne Dupiat, Chef de Projet chez Progilone.

Évolution des systèmes documentaires… et les établissements de santé ?

Les établissements publics de santé (CHU, CHR...) sont en charge de fonds documentaires qu’ils mettent à disposition des étudiants, chercheurs et professionnels du monde médical. Les métadonnées bibliographiques de ces documents sont gérées de manière numérique via des systèmes d’information documentaires dédiés. Cependant, force est de constater que les portails d’accès à ces informations sont encore loin de remplir les exigences des utilisateurs, déjà habitués des technologies performantes qu’offre le web aujourd’hui. En effet, les problématiques de classification, de stockage et de représentation, souvent associées aux bibliothèques de lecture publique, pour les métadonnées bibliographiques se posent aussi pour ces institutions spécialisées.

C’est pourquoi un enjeu majeur des centres documentaires de CHU est d’adopter les récentes innovations issues de l’univers des bibliothèques numériques concernant l’enrichissement, la recherche et la visualisation de données culturelles. Les Hospices Civils de Lyon (HCL), 2ème CHU de France, a franchi le pas avec la société Progilone afin d’adopter les dernières technologies et modèles de gestion bibliographique pour leur catalogue documentaire.

Grâce à la solution Syrtis, développée par Progilone, des centaines de milliers de notices bibliographiques ont pu être normalisées et transformées en une base de connaissances décloisonnée, accessible et pertinente selon les principes du web sémantique, les modèles inspirés des FRBR et le vocabulaire RDA. Cette nouvelle version du catalogue permet désormais aux HCL d’en exploiter au mieux la richesse à travers un catalogage simplifié et une représentation plus fidèle de la richesse des liens entre les ressources bibliographiques. De plus, l’usage de ces technologies de pointe apporte la flexibilité nécessaire pour s’adapter aux contraintes documentaires strictes d’un CHU tout en proposant des fonctionnalités performantes et intuitives. Au final, cette transition réussie offre de nouvelles perspectives à tous les centres de documentation qui peuvent, dès à présent, profiter de ces évolutions majeures pour faciliter les alignements entre catalogues et améliorer la réutilisation des métadonnées bibliographiques dans le but d’offrir des services toujours plus performants à leurs utilisateurs.

Syrtis : au cœur du renouveau des humanités numériques

La transmission des connaissances de l’humanité, qui représente un enjeu majeur pour la préservation de notre liberté intellectuelle, implique de plus en plus d’efforts pour organiser et classifier les ressources culturelles. Des techniques de rangement des moines de l’époque médiévale jusqu’aux récentes règles de catalogage RDA , les bibliothécaires n’ont cessé d’œuvrer à l’organisation de notre patrimoine culturel pour faciliter l’accès des utilisateurs aux ressources bibliographiques. Toutefois, les utopies d’une connaissance universelle entièrement classifiée et accessible, comme rêvé par Paul Otlet , sont redevenus envisageables avec l’arrivée du numérique. L’idée de multiplier les liens entre les documents pour organiser une connaissance est une technique bien connue des acteurs du Web qui marchent dans les traces de son inventeur Tim Berners-Lee . Mais le chemin est long pour créer l’harmonie entre bibliothécaires et informaticiens qui ont tous deux connus de nombreux conflits depuis l’apparition des premiers systèmes d’information documentaire.

Le projet Syrtis, porté par la société Progilone, s’inscrit dans cette démarche cruciale de remettre le numérique au service des professionnelles du monde documentaire (et plus l’inverse). Par exemple, un objectif majeur concerne la réduction les efforts de catalogage qui pèsent sur l’énergie initialement prévue à la valorisation de l’information. Les principes FRBR proposés par la communauté documentaire, dont certaines modélisations concrètes EDM ou FRBRoo ont été fondées en accord avec les technologies du web sémantique, offrent de réelles solutions pour représenter efficacement des familles bibliographiques riches. Les projets innovants de migration de notices existantes vers ces nouveaux modèles comme data pour la BNF, Doremus avec Radio France ou encore Scherzo montrent la voie vers de nouvelles générations de catalogues documentaires. Le système d’information Syrtis, intégrant nativement ces paradigmes de catalogage, bouscule le paysage des solutions existantes de gestion documentaire en offrant la possibilité aux professionnels, à la fois de migrer leurs catalogues vers ces technologies sémantiques, plus adaptées au contexte actuel, ainsi que de remettre l’utilisateur au centre de la réflexion.

Les regards seront de plus en plus tournés vers les nouvelles solutions de gestion documentaire proposées par la communauté des humanités numériques et par tous les acteurs de cette grande évolution. Progilone affine donc ses solutions pour répondre à cette demande en s’inspirant des innovations récentes comme de nouveaux moteurs de recherche s’appuyant sur une sémantique riche des données, la migration et l’enrichissement sémantique automatisés des données issues des formats MARC ou encore des visualisations intuitives de données « FRBRisées » . Le projet Syrtis , propose aujourd’hui une solution complète de gestion documentaire qui offre aux professionnels la possibilité de gérer, d’enrichir et de diffuser plus efficacement leurs données en bénéficiant directement des nouvelles modélisations sémantiques comme FRBR. Ces solutions rendent possible l’évolution des institutions culturelles, et pas seulement au niveau national, vers des fonctionnalités innovantes et plus en phase avec les nouvelles attentes des utilisateurs.

Des travaux de R&D autour de la FRBRisation

L’émergence des technologies du Web Sémantique change le comportement des utilisateurs de portails documentaires. Ces derniers attendent des moteurs de recherche performants, facilitant leur accès à l’information. C’est pourquoi de plus en plus d’institutions culturelles tentent d’améliorer leurs systèmes d’information et de réinventer leurs pratiques de catalogage. La communauté des bibliothèques a déjà commencé son évolution avec la proposition de nouveaux modèles et règles pour le catalogage (ex : FRBR, RDA). Toutefois l’adoption de nouveaux modèles sémantiques comme FRBR implique de relever des challenges techniques pour migrer des données existantes. Les bibliothécaires doivent être accompagnés dans cette démarche avec les outils et les méthodes appropriés pour accomplir avec succès cette migration.

Migration des Métadonnées vers FRBR : FRBRisation. Le processus de FRBRisation est connu de la communauté des bibliothécaires. Il consiste à extraire des entités et relations FRBR à partir de notices en MARC. Ce processus peut être très complexe à appliquer sur de grand volumes de données car il implique de rédiger des règles de migration pour interpréter automatiquement les notices MARC. De la richesse de ces règles va dépendre la qualité du résultat FRBR en sortie du processus. Toutefois les catalogues MARC sont très hétérogènes en fonction du type de ressource représenté, des pratiques de catalogage ou d’erreurs potentielles. Il est donc important pour une bibliothèque souhaitant adopter FRBR de pouvoir évaluer les techniques de FRBRisation utilisées sur son catalogue. Dans le cadre du projet Syrtis, Progilone a participé à la réalisation de travaux de recherche sur les techniques de FRBRisation des deux dernières décennies. Ces travaux ont abouti à la publication d'un article de recherche, dans le cadre de la conférence internationale TPDL 2015, qui propose une classification intuitive et pertinante des outils de FRBRisation (A Survey of FRBRization Techniques). Les conclusions de cette étude montrent que la plupart des outils proposés par la communauté n’ont pas ou peu été évalués en termes de qualité de la migration. C’est pourquoi Progilone a orienté ses recherches vers l’évaluation des outils de FRBRisation.

Interprétation des notices bibliographiques. La migration des catalogues bibliographiques vers de nouveaux modèles sémantiques implique de garantir la complétude et la cohérence des données en sortie du processus. Pour la transformation des notices MARC vers FRBR, la FRBRisation, la qualité du processus est cruciale pour la bibliothèque qui transforme ses données. Dans un processus de migration automatisé sur des notices MARC, la qualité de la transformation dépend des règles utilisées pour générer les entités et relations FRBR. L’expressivité de ces règles peut varier en fonction de l’interprétation qui est faites des notices en entrée. Les recherches sur le domaine ont montré que différents niveaux de lecture doivent être considérés, les champs contenant les valeurs en chaînes de caractères, les zones correspondant à des agrégats d’informations de plus hauts niveaux (ex : Responsabilités, Sujets) et enfin des patterns bibliographiques implicites (ex : Traduction d’une œuvre, adaptations, relations spéciales entre œuvres).

A ces niveaux de lecture doit s’ajouter une compréhension des pratiques de catalogages spécifiques et spécificités du modèle MARC utilisées pour compléter l’interprétation des notices et écrire les règles de FRBRisation. En se basant sur ces critères, les recherches de Progilone ont mené à l’élaboration de mesures d’évaluation pour les techniques de FRBRisation et à la réalisation d’un benchmark des solutions récentes dédiées à ce processus. Ce benchmark est constitué de différents jeux de données étudiés pour tester les cas essentiels (Patterns bibliographiques, pratiques de catalogage) qu’un outil de FRBRisation doit considérer. Il inclut également différent types d’erreurs ou de manquements pouvant concerner un catalogue du monde réel à interpréter. Les éléments qui constituent le benchmark ont été présentés lors de la conférence Internationale JCDL 2016 (Open Datasets for Evaluating the Interpretation of Bibliographic Records). Les détails du benchmark et les expérimentations faites sur les outils existants de FRBRisation ont également donné lieu à la publication d’un article long, présenté lors de la conférence Internationale TPDL 2016 (BIB-R: a Benchmark for the Interpretation of Bibliographic Records).

Des informaticiens au service de la liberté intellectuelle

Progilone a participé, en 2016, à la conférence BOBCATSSS qui rassemble des professionnels du monde documentaire et des chercheurs en science de l'information. Cette manifestation a placé l'accent sur les mutations des bibliothèques dans un univers toujours plus connecté ainsi qu'à la transformation du métier de bibliothécaire dans notre société changeante. Le cœur des discussions a tourné autour d'une thématique majeure pour notre société : la liberté intellectuelle.

Cette dernière, brillamment défendue par le professeur émérite Paul Struges de l'université de Loughborough, représente un droit mais aussi un devoir. D'un côté, elle incarne cette liberté fondamentale d'accéder à notre patrimoine culturel et à l'épanouissement intellectuel. D'un autre côté, elle nous rappelle toute l'importance de cultiver notre curiosité afin d'enrichir notre vision du monde et de garder notre esprit ouvert. Il est donc crucial pour nos institutions culturelles de faciliter nos démarches d'accès à notre patrimoine culturel. Pour y parvenir, les nouvelles technologies doivent se mettre au rythme des professionnels des bibliothèques, musées et autres centres documentaires pour, ensemble, travailler efficacement au service de notre liberté intellectuelle. Ce n'est qu'en travaillant dans la même direction que tous les acteurs de notre cher patrimoine culturel pourront cultiver des solutions à la hauteur des attentes des usagers de nos institutions culturelles.