Archives du blog

Un atelier pour propulser l’Unimarc dans le Web sémantique

En direction de l’Atlantique, espérons-le.

  • 24 mars 2016

Unleashing UNIMARC to the Semantic Web: UNIMARC in RDF

L’atelier, organisé par la Biblioteca Nacional de Portugal en liaison avec le PUC (Permanent Unimarc Committee), aura lieu à Lisbonne le 6 avril prochain (14h30 – 16h30 | Auditório [auditorium] BNP | Entrée libre).

Il est cornaqué par Gordon Dunsire (tiens) et Mirna Willer, professeur à l’Université de Zadar (Croatie), Département des sciences de l’information.

Voici une traduction rapide de la présentation de l’atelier sur le site qui lui est consacré :

« L’atelier s’ouvrira sur une introduction au concept de données liées (« linked data ») et au standard RDF (Resource Description Framework) du W3C qui constitue la technologie sous-jacente du Web sémantique ou du Web de Données. Suivra une illustration d’une méthodologie de représentation des standards en RDF prenant comme exemple le format UNIMARC bibliographique, à partir d’un travail co-financé par le PUC proprement dit et par l’IFLA entre 2013 et 2015. La première partie de l’atelier se conclura sur une présentation du CMS (Content management system, c’est à dire Système de gestion de contenu) utilisé pour publier les vocabulaires Unimarc de données liées dans l’OMR (Open Metadata Registry, Registre de métadonnées ouvert). »

« Dans la deuxième partie de l’atelier on verra des exemples de données liées utilisant les vocabulaires Unimarc, illustrant les problèmes spécifiques posés par les données codées de longueur fixe et les questions posées par la publication de données liées issues de systèmes bibliographiques en Unimarc. »

« La troisième partie de l’atelier sera consacrée aux travaux de recherche en cours et aux projets : 1 – la réduction des écarts entre étiquettes et sous-zones ; les problèmes spécifiques posés par les sous-zones répétables, l’ordre des éléments, les éléments de données parallèles ; le profil d’application. 2 – la représentation en RDF des autorités Unimarc. 3 – l’alignement sémantique de l’Unimarc avec l’ISBD. 4 – BIBFRAME (MARC21 en RDF) et Unimarc : différences d’approche dans la représentation du stockage de données et des formats d’échange. »

Un prétexte acceptable pour voir, ou revoir, Lisbonne.

………

Senhora do Tejo. OqueStrada, groupe vocal et instrumental ; José Luís Gordo, paroles ; José Fontes Rocha, musique.
Vidéo : Marta Miranda, réalisation. Sony Music, 2011.

This is London calling

Tiens, c’est pour toi.

British Library Data Model
British Library data model. 2011. (Cliquer pour agrandir [pdf – 122 Ko].)

C’est assez vilain c’est vrai, mais d’une laideur intéressante. C’est le fait de notre voisine la perfidious Albion, dont la bibliothèque nationale « est en train de développer une version de la British National Bibliography, qu’elle met à disposition dans le web de données […]. » (Voir British Library Free Data Services.)

Ça te fait une belle jambe ? Tant mieux pour toi, alors lis la suite, ça t’en fera deux.

Le schéma représente le modèle de données utilisé. Données qui décrivent pour l’instant des ouvrages imprimés publiés depuis 1950, et sont donc obtenues à partir de notices MARC — forcément antéFRBRiennes.

Et d’ailleurs nulle tentative de FRBRisation dans cette entreprise. On peut donc comme tu vois mettre des données bibliographiques structurées dans le web de données sans les FRBRiser. C’est moins bien (pas de regroupement par titres d’œuvre) mais ça se fait.

Deuxièmement, les données sont exprimées dans une syntaxe RDF (Resource Description Framework), qui comme on sait est fondée sur l’usage de triplets sujet-prédicat-objet, du type :

<PPN 103587586> [sujet]
<a pour réalisateur> [prédicat]
<Ruiz, Raúl (1941-2011)> [objet]

où les deux premiers éléments au moins doivent être exprimés chacun par une URI (Uniform Resource Identifier).

La propriété <a pour réalisateur>, il faudrait donc la déclarer et la définir quelque part sur le web, en lui assignant une URI. Ou voir si elle n’est pas déjà dans ce cas, par exemple au sein d’un registre de métadonnées spécialisées appliquées au cinéma, ou d’un système généraliste dans le genre du Dublin Core ou de RDA, voire dans tout ça à la fois.

Oui, car la grande souplesse de ce mécanisme, chaque triplet étant autonome, entraîne qu’on peut si nécessaire faire appel à plusieurs référentiels de métadonnées, plusieurs ontologies, cela pour décrire une même ressource.

Ça te choque ces mélanges ? Pour préparer tes coquilles saint-jacques, il te faut bien pourtant, outre les coquilles : de la coriandre fraîche, de l’ail, du vinaigre balsamique, de l’huile d’olive, du poivre et du sel non ? Il serait étonnant que ton poissonnier soit à même de te fournir tout ça. Et encore c’est une entrée des plus simples. Imagine pour le kig ha farz.

Quoi qu’il en soit ce recours au mélange est à l’œuvre dans le modèle de la British Library. Par exemple les notes bibliographiques et la mention d’édition  font appel à l’ISBD, d’autres éléments au Dublin Core ou autre.

Et d’ailleurs pour le Sudoc c’est pareil ! Mais je ne crois pas qu’il y ait un dessin.

Et lorsque ce sera FRBRisé, alors là… ! Ah mais qu’est-ce que t’as ! Mince alors je ne pensais pas te faire pleurer avec ça… arrête, c’est pas si grave allons, c’est que des métadonnées ! Ah c’est les oignons. T’aurais dû prendre ceux de Roscoff non ? Ou les doux des Cévennes (mais au fait, t’en as pas besoin pour les coquilles…)

Stop your sobbing / Pretenders, groupe vocal et instrumental ; Ray Davies, paroles et musique. Grande-Bretagne : Thames Television, 1980. (The Kenny Everett Video Show).

Journée d’étude AFNOR/BnF 2011. Il fallait y être.

C’est déjà du réchauffé : les présentations de la récente et très intéressante Journée d’étude AFNOR/BnF Référentiels et données d’autorité à l’heure du Web sémantique (vendredi 27 mai 2011) sont en ligne.

En voici un extrait des plus significatifs :

Je n'ai pas encore parlé du Web sémantique ni de RDF