Archives de Catégorie: Web de données

Mais qu’est-ce qu’il se passe ? (2) Bibliothèque du Congrès

  • 31 octobre 2012

Là-bas ils sont engagés dans la définition de leur futur format de données. Ce processus, ils l’ont appelé Bibliographic Framework Transition Initiative, BFI parfois, Bibframe pour les intimes.

Il en avait été question ici même en son temps, c’est à dire au moment du lancement du processus il y a un an.

Les choses ont avancé depuis.

La LC a recruté un consultant spécialisé (Zepheira) pour accélérer la définition du futur format de données, avec deux maîtres mots : le web de données comme contexte et RDF (Resource Description Framework) comme modèle de base.

Ce consultant est chargé de « produire un (ou des) modèle(s) qui serviront de base de discussion, et de fournir une analyse d’initiatives analogues. La Bibliothèque prévoit un processus itératif se nourrissant des retours de l’ensemble des professionnels, permettant d’affiner les spécifications. L’objectif est de parvenir à un format bibliographique souple, un code de référence robuste, une infrastructure fiable de déploiement, et un plan opérationnel de migration de MARC vers le nouveau format » (« a flexible bibliographic framework, a robust reference code, a supporting infrastructure for deployment, and an effective migration plan from MARC to a new framework. »). Voilà ce qu’on lit sur la page du site de la LC donnant accès à la transmission vidéo de la conférence d’Eric Miller, de Zepheira (16 juillet 2012) : Library of Congress New Bibliographic Framework Initiative: Update Forum with Eric Miller (en anglais).

Voici le diaporama correspondant (accessible sur Slideshare) :

Voir notamment la diapo 21, qui présente le schéma du « modèle de haut niveau » destiné à servir d’appui à l’ensemble du processus. Ça ressemble un peu aux FRBR… mais ça surprend.

On consultera par ailleurs la présentation [.pptx] de Sally McCallum (LC) au congrès annuel de l’IGeLU (Groupe international des utilisateurs d’Ex Libris) : Bibliographic Framework Initiative Approach for MARC Data as Linked Data (Zürich, 13 septembre 2012), qui précise les étapes du processus en cours (en particulier : une première expérimentation du modèle « de haut niveau » fourni par Zepheira doit être conduite par un « très petit groupe de testeurs pionniers » en octobre et novembre, c’est à dire en ce moment même).

S’informer :

Testing Large Turbines, Westinghouse Co. Works. États-Unis : American Mutoscope and Biograph Company, 1904.
Filmé le 5 mai 1904, probablement à la Westinghouse Machine Company, East Pittsburgh, Pennsylvanie. Mis en ligne par la Bibliothèque du Congrès (États-Unis).

Publicités

This is London calling

Tiens, c’est pour toi.

British Library Data Model
British Library data model. 2011. (Cliquer pour agrandir [pdf – 122 Ko].)

C’est assez vilain c’est vrai, mais d’une laideur intéressante. C’est le fait de notre voisine la perfidious Albion, dont la bibliothèque nationale « est en train de développer une version de la British National Bibliography, qu’elle met à disposition dans le web de données […]. » (Voir British Library Free Data Services.)

Ça te fait une belle jambe ? Tant mieux pour toi, alors lis la suite, ça t’en fera deux.

Le schéma représente le modèle de données utilisé. Données qui décrivent pour l’instant des ouvrages imprimés publiés depuis 1950, et sont donc obtenues à partir de notices MARC — forcément antéFRBRiennes.

Et d’ailleurs nulle tentative de FRBRisation dans cette entreprise. On peut donc comme tu vois mettre des données bibliographiques structurées dans le web de données sans les FRBRiser. C’est moins bien (pas de regroupement par titres d’œuvre) mais ça se fait.

Deuxièmement, les données sont exprimées dans une syntaxe RDF (Resource Description Framework), qui comme on sait est fondée sur l’usage de triplets sujet-prédicat-objet, du type :

<PPN 103587586> [sujet]
<a pour réalisateur> [prédicat]
<Ruiz, Raúl (1941-2011)> [objet]

où les deux premiers éléments au moins doivent être exprimés chacun par une URI (Uniform Resource Identifier).

La propriété <a pour réalisateur>, il faudrait donc la déclarer et la définir quelque part sur le web, en lui assignant une URI. Ou voir si elle n’est pas déjà dans ce cas, par exemple au sein d’un registre de métadonnées spécialisées appliquées au cinéma, ou d’un système généraliste dans le genre du Dublin Core ou de RDA, voire dans tout ça à la fois.

Oui, car la grande souplesse de ce mécanisme, chaque triplet étant autonome, entraîne qu’on peut si nécessaire faire appel à plusieurs référentiels de métadonnées, plusieurs ontologies, cela pour décrire une même ressource.

Ça te choque ces mélanges ? Pour préparer tes coquilles saint-jacques, il te faut bien pourtant, outre les coquilles : de la coriandre fraîche, de l’ail, du vinaigre balsamique, de l’huile d’olive, du poivre et du sel non ? Il serait étonnant que ton poissonnier soit à même de te fournir tout ça. Et encore c’est une entrée des plus simples. Imagine pour le kig ha farz.

Quoi qu’il en soit ce recours au mélange est à l’œuvre dans le modèle de la British Library. Par exemple les notes bibliographiques et la mention d’édition  font appel à l’ISBD, d’autres éléments au Dublin Core ou autre.

Et d’ailleurs pour le Sudoc c’est pareil ! Mais je ne crois pas qu’il y ait un dessin.

Et lorsque ce sera FRBRisé, alors là… ! Ah mais qu’est-ce que t’as ! Mince alors je ne pensais pas te faire pleurer avec ça… arrête, c’est pas si grave allons, c’est que des métadonnées ! Ah c’est les oignons. T’aurais dû prendre ceux de Roscoff non ? Ou les doux des Cévennes (mais au fait, t’en as pas besoin pour les coquilles…)

Stop your sobbing / Pretenders, groupe vocal et instrumental ; Ray Davies, paroles et musique. Grande-Bretagne : Thames Television, 1980. (The Kenny Everett Video Show).