Archives de Catégorie: Formats

Souvenir de Lisbonne

  • 1er avril 2017

En plus il a fait moche.

En plus de quoi ? Patience.

Lisbonne, le Tage, 23 mars 2017.
Le Tage à Lisbonne, mars 2017. Photo Ph. Le Pape.

Depuis le temps qu’il se dit que les formats Marc ont déjà un pied dans la tombe et que si une bonne âme se dévouait pour crocheter l’autre ce serait un service à rendre à l’humanité, sans qu’apparaisse jamais dans les pages nécrologiques d’aucune gazette au monde aucun faire-part, sur aucun membre de la famille, l’annonce en 2011 par la Bibliothèque du Congrès du lancement d’une étude (qui allait se concrétiser dans le projet Bibframe) et, par la même occasion, celle de l’abandon du format Marc21 dans un délai de 10 ans, avait arraché au peuple un soupir d’aise collectif (et provoqué un excès temporaire de gaz carbonique dans la stratosphère).

Cette annonce ayant été faite en juin 2011, il resterait environ 4 ans à attendre.

Il ne s’agit que de la Bibliothèque du Congrès et du format Marc21, mais enfin ce n’était pas une bonne nouvelle pour la famille Marc.

Nous voici au printemps 2017 : non seulement les formats Marc ne donnent aucun signe de faiblesse, mais ils continuent à se développer. Paradoxalement la publication et le succès grandissant de RDA leur procurent une vitalité nouvelle.

RDA et Marc21

RDA, attendu comme un standard en rupture avec ceux d’avant (d’avant le modèle FRBR, s’entend), en est en réalité très proche. Il n’est aucune notion du RDA actuel qui ne puisse être prise en change par un format Marc. Les choses changeront peut-être lorsque la révision majeure qui a lieu cette année sera achevée. Il s’agit en effet d’intégrer dans RDA les principes du modèle LRM, successeur de FRBR, FRAD et FRSAD, en lieu et place des principes issus de ces derniers.

Quoi qu’il en soit les bibliothèques utilisent encore massivement les formats Marc, qu’il faut donc mettre à jour pour les adapter à RDA. Marc21 a connu depuis 2010 — et connaît encore — de nombreuses évolutions : création de nouvelles zones, de listes contrôlées de termes et/ou de codes etc.

Unimarc et FRBR

Les utilisateurs de l’Unimarc, généralement tournés vers les standards publiés par l’IFLA (ISBD et règles associées) plutôt que vers ceux issus du monde anglo-saxon, ne se sont guère souciés de ces agitations. Sauf le CfU (Comité français de l’Unimarc, désormais rattaché au programme national Transition bibliographique).

Dès 2010 le CfU a élaboré un nombre considérable de propositions de création de nouvelles zones destinées à « traduire » le modèle FRBR en Unimarc, en donnant au format des notices bibliographiques et surtout à celui des autorités les moyens de rendre compte des entités Œuvre et Expression et de toutes les relations associées, y compris celles avec les autres entités du modèle. Ces propositions, acceptées par le PUC (Permanent Unimarc Committee, l’instance internationale qui administre l’Unimarc), font désormais partie du format.

Le CfU a eu plus de difficulté à faire accepter la création de nouvelles zones (181 et 182) pour les notions de Type de contenu et Type de médiation, pourtant présentes dans l’ISBD consolidé autant que dans RDA, et davantage encore pour le Type de support (183), complément des deux premiers mais présent seulement dans RDA.

RDA et Unimarc

Cette année il s’agissait de faire valider la création de deux nouvelles zones, à l’occasion de la publication des règles de RDA-FR portant d’une part sur les éléments qui, ensemble, se substituent à la zone de l’adresse de l’ISBD (Mention de production, Mention de publication, Mention de distribution, Mention de fabrication et Date de copyright), et d’autre part sur les Caractéristiques du fichier numérique.

Ces éléments ne trouvent pas leur place dans les zones existantes (210 pour la zone de l’adresse, 230 pour la zone 3 spécifique aux ressources électroniques, d’ailleurs rendue obsolète dans l’ISBD consolidé). Le CfU a donc proposé une zone 214 pour les éléments de l’ex-zone de l’adresse, 231 pour ce qui concerne les fichiers numériques. L’une et l’autre étaient largement calquées sur les zones correspondantes créées en Marc21 pour les mêmes besoins (la 214 sur la 264 Marc21, la 231 sur la 347 Marc21)

La réunion annuelle du PUC qui devait décider de leur sort s’est tenue la semaine dernière à Lisbonne, à la jolie Biblioteca nacional de Portugal, rose et modeste, malheureusement survolée en rase-mottes par les avions qui vont atterrir sur les pistes toutes proches de l’aéroport. Bonne cantine (bien meilleure que celle de la BNF).

La zone 231 a été validée, moyennant quelques retouches.

Le projet de zone 214 en revanche, qui pourtant avait été transmis aux membres du PUC en juin 2016 accompagné d’un appel à commentaires (qui ne sont jamais venus), a fait d’emblée l’objet d’un tir de barrage de la part des représentants italien et portugais, soutenus par la Slovénie. Tous préconisaient l’aménagement de la zone 210. Représentant le CfU, j’ai eu beau leur remontrer que c’était impossible, que j’avais commencé par envisager moi-même cette possibilité avant de reconnaître qu’elle ne fonctionnait pas et que force était, comme cela avait été fait en Marc21, de recourir à une nouvelle zone, rien n’y a fait. Le débat s’est conclu sur un vote. Nous n’étions que 6 pays ou organismes représentés (manquaient la Chine, la Lituanie et le CIEPS). Résultat : 3 pour (France, OCLC, Russie), 3 contre (Italie, Portugal, Slovénie). La décision a été prise de rédiger un projet d’aménagement de la 210 et de statuer sur cette 210 remaniée à la prochaine réunion. Dans un an.

Or nous avons déjà défini la zone 214 dans le Sudoc (sous l’étiquette provisoire de 219). Elle entre en application le 18 avril.

Comment faire à l’avenir ?

Je ne sais pas.

Soit on attend, avant de pratiquer dans le Sudoc toute évolution de format nécessitée par l’application de RDA-FR — mais l’attente peut être longue et la décision finale est imprévisible. Le PUC examinait encore cette année des propositions datées de 2008 et de 2010 : l’une a été définitivement validée, l’autre définitivement rejetée.

Soit on fait ce qu’il y a à faire dans le format de catalogage, quitte à ce que celui-ci s’éloigne du format de diffusion.

Autre option : les évolutions indispensables, lorsqu’elles sont refusées par le PUC ou que la décision prend trop de temps, sont validées au niveau national pour l’échange entre institutions françaises.

À voir.

………

Salvador Sobral. Nem eu / Dorival Caymmi, paroles et musique.
Salvador Sobral, chant ; Júlio Resende, piano.
Vidéo : prod. Edições Valentim de Carvalho S.A., 2016.

Mise à jour de RDA-FR

  • 12 août 2016

Footvolley at Leme beach, Copabana beach, Rio de Janeiro, Brasil, par alobos Life sur Flickr Footvolley at Leme beach, Copabana beach, Rio de Janeiro, Brasil, par alobos Life sur Flickr (CC BY-NC-ND 2.0).

Tandis que tous les yeux du monde contemplent la gloire des athlètes rassemblés à Rio de Janeiro, voici que s’accomplit, loin de ce spectacle mirobolant, une prouesse discrète : la première mise à jour de RDA-FR, un an après son apparition.

Ce que comprend la mise à jour

Cette nouvelle publication, prélude à d’autres plus considérables qui devraient se produire avant l’hiver, n’affecte encore que la description des manifestations.

La totalité de la zone de l’adresse de l’ISBD est désormais remplacée par de nouvelles règles : à la Mention de publication, qui faisait partie de la première livraison de RDA-FR, s’ajoutent les mentions de production, de diffusion ou de distribution et de fabrication ainsi que la date de copyright.

À l’ancienne Indication générale du type de document de l’ISBD (« Texte imprimé », « Enregistrement sonore », « Ressource électronique » etc.) s’étaient déjà substitués deux éléments nouveaux (Type de contenu et Type de médiation), plus rigoureux et plus propices à la mise en place de facettes dans une interface de recherche. Les voici complétés par le Type de support matériel qui n’a pas de correspondance dans l’ISBD et qui permet d’aller au bout de la logique de sélection des ressources documentaires par leurs modalités d’utilisation. À noter que la liste des types de supports de RDA-FR est plus riche que celle de RDA international et qu’elle propose des termes génériques en plus des désignations particulières.

Enfin deux éléments spécifiques aux ressources électroniques : Caractéristique du fichier numérique et Équipement ou système requis se substituent respectivement à l’ancienne zone 3 de l’ISBD : Zone du type et de la taille de la ressource électronique et à sa Note sur la configuration requise.

Application dans le Sudoc

L’application de ces innovations dans le Sudoc n’est pas prévue avant janvier 2017, notamment parce que certaines d’entre elles nécessitent la création de nouvelles zones dans le format de catalogage.

Nouvelles zones Unimarc

Le Type de support matériel s’exprimera dans une zone 183, en cours de validation au niveau international, au moyen de valeurs codées à choisir dans une liste.

La zone 210 est insuffisante pour recevoir les différentes mentions instituées dans RDA en lieu et place de la zone de l’adresse de l’ISBD. La France a adressé en juin 2016 au PUC (Permanent Unimarc Committee) une demande de création d’une zone 214, proche dans sa conception de la 264 du Marc21 (développée pour RDA). La décision du PUC n’est pas attendue avant avril 2017, de sorte que c’est sous une étiquette provisoire (219) que cette zone fera son apparition dans le format de catalogage du Sudoc. Tant que le PUC n’aura pas livré son verdict sur la proposition française, la 219 sera exportée en 210 vers les systèmes locaux, ou en 264 pour les établissements qui utilisent le Marc21.

Consulter la norme mise à jour [.pdf] :

………

Onde o Rio é mais baiano [L’endroit le plus bahianais de Rio]. Caetano Veloso, paroles et musique.
Caetano Veloso, chant et guitare. Captation : Rio de Janeiro (Brésil), quartier de la Mangueira, 1994.
Vidéo : probablement extraite de la captation du spectacle Doces Bárbaros Ao vivo Na Mangueira (Brésil, 1994). Mise en ligne : 2016.

Un atelier pour propulser l’Unimarc dans le Web sémantique

En direction de l’Atlantique, espérons-le.

  • 24 mars 2016

Unleashing UNIMARC to the Semantic Web: UNIMARC in RDF

L’atelier, organisé par la Biblioteca Nacional de Portugal en liaison avec le PUC (Permanent Unimarc Committee), aura lieu à Lisbonne le 6 avril prochain (14h30 – 16h30 | Auditório [auditorium] BNP | Entrée libre).

Il est cornaqué par Gordon Dunsire (tiens) et Mirna Willer, professeur à l’Université de Zadar (Croatie), Département des sciences de l’information.

Voici une traduction rapide de la présentation de l’atelier sur le site qui lui est consacré :

« L’atelier s’ouvrira sur une introduction au concept de données liées (« linked data ») et au standard RDF (Resource Description Framework) du W3C qui constitue la technologie sous-jacente du Web sémantique ou du Web de Données. Suivra une illustration d’une méthodologie de représentation des standards en RDF prenant comme exemple le format UNIMARC bibliographique, à partir d’un travail co-financé par le PUC proprement dit et par l’IFLA entre 2013 et 2015. La première partie de l’atelier se conclura sur une présentation du CMS (Content management system, c’est à dire Système de gestion de contenu) utilisé pour publier les vocabulaires Unimarc de données liées dans l’OMR (Open Metadata Registry, Registre de métadonnées ouvert). »

« Dans la deuxième partie de l’atelier on verra des exemples de données liées utilisant les vocabulaires Unimarc, illustrant les problèmes spécifiques posés par les données codées de longueur fixe et les questions posées par la publication de données liées issues de systèmes bibliographiques en Unimarc. »

« La troisième partie de l’atelier sera consacrée aux travaux de recherche en cours et aux projets : 1 – la réduction des écarts entre étiquettes et sous-zones ; les problèmes spécifiques posés par les sous-zones répétables, l’ordre des éléments, les éléments de données parallèles ; le profil d’application. 2 – la représentation en RDF des autorités Unimarc. 3 – l’alignement sémantique de l’Unimarc avec l’ISBD. 4 – BIBFRAME (MARC21 en RDF) et Unimarc : différences d’approche dans la représentation du stockage de données et des formats d’échange. »

Un prétexte acceptable pour voir, ou revoir, Lisbonne.

………

Senhora do Tejo. OqueStrada, groupe vocal et instrumental ; José Luís Gordo, paroles ; José Fontes Rocha, musique.
Vidéo : Marta Miranda, réalisation. Sony Music, 2011.

RDA, le code de catalogage qui fait grossir

  • 16 juin 2014

Lucques Photo Philippe Le Pape

Il importe absolument de faire la différence entre des métadonnées RDA produites en format Marc et d’autres, qui pourraient être produites elles aussi en appliquant RDA, mais selon des modalités plus modernes, directement destinées à une exploitation dans le L.O.D. par exemple, et sans aucune référence au dispositif longuement éprouvé des catalogues informatisés des dernières décennies du XXe siècle. De telles métadonnées existeront peut-être un jour.

Les métadonnées RDA produites en Marc sont des notices Marc. Elles peuvent, ou non, tirer avantage des facilités de mise en relation des notices Marc entre elles proposées par des formats comme Marc 21, ou plus encore Unimarc.

Les formats Marc et le modèle FRBR

Le format Marc 21, qui reste celui dans lequel produisent les grands établissements bibliographes dans lesquels le code RDA est pratiqué depuis 2013, a connu quelques mises à jour qui reflètent non une remodélisation en faveur des FRBR, mais le passage d’AACR2 à RDA. Des zones, sous-zones, codes etc. supplémentaires ont été définis dans les formats des notices bibliographiques et d’autorité pour des éléments de RDA sans correspondance dans les AACR (voir RDA in MARC).

Quid des entités FRBR du groupe 1 les plus novatrices (œuvre & expression), et des relations qui en partent ou y aboutissent ? D’après les exemples de notices Marc 21 auxquelles on peut accéder depuis le RDA Toolkit [.pdf] on comprend que ces deux entités peuvent être l’une et l’autre exprimées en tant qu’autorités titre, ou nom-titre. Cependant, il n’y a aucun moyen de déclarer une autorité comme décrivant soit une œuvre soit une expression. Rien. Pas le moindre code quelque part, dans le label ou ailleurs. Les étiquettes et les intitulés des zones n’ont même pas été modifiées pour refléter la terminologie FRBR en vigueur dans RDA : c’est toujours « 130 – Main Entry – Uniform Title » pour les œuvres sans créateur associé ou leurs expressions ; « 100 – Heading-Personal Name », « 110 – Heading-Corporate Name » pour celles avec créateur associé, et ça sert indifféremment pour les œuvres et pour les expressions.

La structure des points d’accès, notamment celle des points d’accès autorisés, n’a pas bougé. C’est-à-dire que les points d’accès autorisés de ces notices — qui en application de RDA doivent suffire à identifier une œuvre ou une expression selon le cas — sont identiques aux titres uniformes d’avant le modèle FRBR.

Aucune instruction pour l’enregistrement des relations suivantes : œuvre ↔ expression (a pour expression / est une expression de) ; créateur ↔ œuvre (en particulier en cas de créateurs multiples) ; contributeur ↔ expression ; sujet ↔ œuvre.

Dans le format Marc21 bibliographique, les zones qui permettent d’établir un point d’accès autorisé identifiant l’ « œuvre manifestée » et l’ « expression manifestée », en faisant éventuellement un lien vers les autorités correspondantes, n’ont pas été modifiées elles non plus : ce sont celles des titres uniformes d’autrefois. Comme dans le format des autorités, il n’y a pas de différence d’étiquette selon que le point d’accès identifie une œuvre ou une expression. Ni d’indicateur qui pourrait tenir ce rôle. Et pourtant selon RDA l’ « œuvre manifestée » et l’ « expression manifestée » sont deux relations distinctes. À l’évidence, on considère que « qui fait le plus fait le moins », c’est-à-dire qu’un titre uniforme « d’expression » identifie aussi l’œuvre. Seulement si la zone ad hoc tient aussi lieu de lien vers une notice d’autorité, quel identifiant y met-on : celui de l’expression, ou celui de l’œuvre ?

Les choses sont plus claires en Unimarc. Les entités œuvre et expression, traitées comme en Marc 21 dans le format des autorités, sont clairement distinguées l’une de l’autre. Un code dans une zone spécifique (154) permet de déclarer une autorité comme décrivant soit une œuvre soit une expression. Par ailleurs des zones nouvelles ont été définies pour ce qu’on pourrait appeler des titres uniformes FRBRisés, et les étiquettes sont différentes pour les œuvres et pour les expressions. Ces distinctions se retrouvent dans le format bibliographique : un « titre uniforme d’expression » n’a pas la même étiquette qu’un « titre uniforme d’œuvre ».

Toutes les relations entre entités ont été ajustées selon le modèle FRBR, et dûment identifiées. Dans le format des autorités : œuvre ↔ expression (a pour expression / est une expression de) ; créateur ↔ œuvre (en particulier en cas de créateurs multiples) ; contributeur ↔ expression ; sujet ↔ œuvre. Dans le format bibliographique : lien vers l’œuvre et lien vers l’expression, comme indiqué plus haut.

RDA en Marc dans la pratique

C’est à dire qu’on serait vraiment beaucoup mieux armé pour appliquer un RDA « FRBRisé » en Unimarc qu’en Marc 21 (or c’est sur la base du Marc 21 qu’est conçu Bibframe, rappelons-le au passage).

Seulement la LC, la British Library, la NLA (National Library of Australia), la BAC (Bibliothèque et Archives Canada) etc. utilisent le Marc 21.

Qu plus est, dans la pratique actuelle de la LC et des autres il n’y a pas d’identification systématique de l’ « œuvre manifestée » dans les notices bibliographiques. Apparemment lorsque le titre propre de la publication décrite suffit à identifier l’œuvre, ou les œuvres contenue(s), on s’en tient là. Encore moins d’identification de l’expression dans ce cas, bien entendu. C’est le chapitre 17 de RDA qui traite des « relations fondamentales » du modèle FRBR (c’est à dire les relations entre les entités du groupe 1, œuvre, expression, manifestation, item). Ceci est le profil d’application de la LC pour ce chapitre (copie d’écran du RDA Toolkit) :

RDA-LCPCC-ch17

« Do not apply chapter 17 in the current implementation scenario. » « N’appliquez pas le chapitre 17 dans le scénario d’implémentation actuel. » C’est réaffirmé sur la même page pour les parties « œuvre manifestée » et « expression manifestée ». Voilà. Comme ça, si on avait encore un doute sur la FRBRisation du catalogue de la LC (et des bibliothèques participant au PCC, c’est à dire le Program for Cooperative Cataloging), on n’en a plus. Voir la page du profil d’application de RDA (« Policy statements ») LC-PCC sur le site de la LC.

Voyons la NLA :

RDA-NLA-ch17

« There are no policy statements for this chapter. »  Ça alors, qu’est-ce qu’on fait si on travaille dans cette bibliothèque-là ?

La British Library n’a pas de profil d’application dans le RDA Toolkit, mais elle y a publié des « flux de travail ». On lit ce qui suit dans celui élaboré pour les « monographies » :

General Guidelines for Choosing the Preferred Title (6.2.2.3)
The preferred title for a work is a core element of the description. It is the title chosen as the basis for the authorised access point representing the work. This may simply consist of the title proper recorded in the 245 subfield $a if the title is unique and there is no person, family or corporate body responsible for creating the work. If that title is not unique, additional identifying elements must be included in a new preferred title recorded in field 130, or in the 240 in combination with a 100 or 110 field.

The preferred title is also used to refer to a related work or expression, for example, as the stem of an authorised access point given in the $t of fields 700-711 or $a of field 730.
British Library. Monograph Workflow (Last updated 05.06.14, Aligned with RDA Update April 2014)

Il y est clairement indiqué :

  • que dans certains cas le titre propre (245$a en Marc 21) suffit à identifier une œuvre dans la notice bibliographique, mais les critères sont assez restrictifs, et les directives précises quant à la rédaction d’une entrée au titre privilégié de l’œuvre.
  • que « le titre privilégié est également utilisé pour faire référence à une œuvre ou une expression en relation [avec la ressource décrite], par exemple en formant la racine d’un point d’accès privilégié donné dans les $t des zones [Marc 21] 700-711 [c’est à dire : la sous-zone permettant d’encoder un titre dans des entrées supplémentaires nom-titre] ou $a d’une 730 [idem, pour une entrée titre]. »

Il en résulte que cette notice RDA que j’ai montrée aux Journées Abes 2014 (je l’avais faite moi-même) :

Notice Alice 1

n’est pas juste. Si elle avait été obtenue par conversion du Marc 21, les « titres d’œuvre » auraient été étiquetés 500 (Titre uniforme) en Unimarc, et non 577 (Identification d’une expression), et ces 500 n’auraient pas été liées à l’autorité correspondante, il aurait fallu le faire à la main :

Notice Alice 2

Si elle avait été produite directement en Unimarc, et en respectant les conventions de ce format pour des données complètement FRBRisées il aurait fallu des zones 577 identifiant chacune des deux expressions contenues, et éventuellement des 576 identifiant les œuvres correspondantes.

Qu’appelle-t-on relation dans RDA ?

Les quatre premières sections de RDA sont consacrées aux entités FRBR, les six dernières aux relations entre ces entités. Mais qu’appelle-t-on au juste relation dans RDA ?

RDA sert clairement à décrire des publications (FRBR : manifestations). Si on travaille en Marc, on peut le reformuler ainsi : RDA sert à faire des notices bibliographiques.

Cependant RDA exige que toute notice bibliographique fasse état de certaines des relations qui existent entre la ressource décrite et d’autres entités du modèle FRBR. Par exemple entre la publication et son éditeur. Entre la publication et l’œuvre, ou les œuvres, qu’elle contient — à moins que celles-ci soient en trop grand nombre — de même qu’avec leurs créateurs s’ils sont connus.

Il n’est pas obligatoire pour cela de mettre la notice bibliographique formellement en relation avec d’autres notices (par exemple : celle(s) décrivant l’œuvre, ou les œuvres, contenue(s), ou leurs expressions respectives ; les notices d’autorité établies pour les créateurs de l’œuvre, ou des œuvres, contenue(s) ; celle établie pour la maison d’édition). RDA ne fait pas d’obligation de ce genre, tout simplement parce que techniquement ce n’est pas possible dans bien des systèmes informatiques.

Ce qui est désigné par le terme de relation dans RDA, c’est simplement la mention que l’entité décrite est en relation avec d’autres. Cette mention peut prendre différentes formes, au choix :

  1. le type de la relation + un identifiant de l’entité liée (équivalent Unimarc : les zones de lien des blocs 5XX, 6XX, 7XX avec $3, celles des 4XX avec $0)
  2. le type de la relation, + un point d’accès autorisé identifiant l’entité liée (équivalent Unimarc : les zones de lien des blocs 5XX, 6XX, 7XX sans $3, celles des 4XX sans $0)
  3. une mention textuelle, par exemple une note, identifiant à la fois l’entité liée et le type de relation

Une zone Unimarc 210 telle que :

210 ## $a Paris $c Grund $d [etc.]

suffit à exprimer la relation à l’éditeur (210$c signifie « est l’éditeur de la ressource »).

De même, une note textuelle (Unimarc 3XX) telle que :

304 ## $a Traduit de : Alices’s adventures in Wonderland

suffit à rendre compte à la fois de la relation à l’œuvre contenue et de celle à l’expression originale ; RDA n’en exige pas davantage (mais ne l’interdit pas non plus, bien entendu). En toute orthodoxie vis-à-vis des FRBR, il s’agit là d’une relation entre deux expressions (la traduction française réalisée par André Bay de Alices’s adventures in Wonderland et le texte original anglais de Lewis Carroll). Mais vu qu’Alice’s adventures in Wonderland est aussi le titre par lequel l’œuvre est identifiée, on peut à la rigueur convenir que cette même note fait aussi référence à l’« œuvre manifestée » (ce qui est en principe obligatoire).

Dalí. Todas las sugestiones poéticas y todas las posibilidades plásticas, par Museo Reina Sofía sur Flickr (CC BY-NC-ND 2.0) Dalí. Todas las sugestiones poéticas y todas las posibilidades plásticas, par Museo Reina Sofía sur Flickr (CC BY-NC-ND 2.0)

La différence avec le catalogage « à l’ancienne » ? Eh bien… Hum… Mettons qu’il réside dans le fait que « le catalogueur » est dorénavant conscient que par cette 210 et par cette note 304 il fait œuvre FRBRisatrice. Que sa 210 n’est pas une simple zone de l’adresse bibliographique, mais l’enregistrement de la relation manifestation → éditeur. Qu’il n’a pas simplement transcrit en note le titre original trouvé sur l’ouvrage comme le lui demande sa norme, mais qu’il a mis en évidence une relation entre le livre qu’il décrit et une des « œuvres » qu’elle contient.

Voilà.

Un pâté de FRBR

Les bibliothèques appliquant actuellement RDA (en format Marc donc) se contentent généralement d’enregistrer les relations selon les formes 2 et 3 de la liste ci-dessus (c’est à dire sans faire de lien entre notices). La structure de la notice traditionnelle n’a pas été bouleversée, en dépit de quelques modifications, la plus spectaculaire étant le remplacement de l’indication générale du type de document par un ensemble de trois éléments distincts :

  • RDA 6.9 Type de contenu (Marc 21 336, Unimarc 181)
  • RDA 3.2 Type de média (Marc 21 337, Unimarc 182)
  • RDA 3.3 Type de support matériel (Marc 21 338, Unimarc 183)

(voir La zone 0).

Une notice bibliographique Marc se suffit à elle-même, en RDA comme en AACR2. Tel est le principe qui semble prévaloir dans le monde anglo-saxon, et singulièrement à la Bibliothèque du Congrès. La notice bibliographique Marc contient tout :

  • l’identification de la manifestation (elle est faite pour cela)
  • l’identification de l’œuvre, ou des œuvres, contenue(s)
  • l’identification de leurs expressions s’il y a lieu
  • la mention, sous forme textuelle ou sous forme de points d’accès normalisés, des relations de la manifestation et/ou de l’expression et/ou de l’œuvre aux entités de type personne, collectivité ou famille.

Tout cela se trouve réuni au sein d’une même notice bibliographique RDA en Marc. Il arrive même qu’une zone Marc réunisse des attributs de plusieurs entités FRBR. Ainsi par exemple de la zone de la description physique (Unimarc 215, Marc 21 300) :

215 ## $a 479 pages $c illustrations, en couleurs $d 31 cm (Unimarc)
300 ## $a 479 pages :$b illustrations, en couleurs ;$c 31 cm (Marc 21)

où $a (Unimarc et Marc 21) correspond à l’élément Importance matérielle (attribut de la manifestation), $c (Unimarc) / $b (Marc 21) à des attributs de l’expression (en l’occurrence RDA 7.15 Contenu illustratif et RDA 7.17 Contenu de couleur), et $d (Unimarc) / $c (Marc 21) à l’élément Dimensions, autre attribut de la manifestation.

Les couleurs utilisées dans les notices présentées aux Journées Abes 2014 (voir la diapo ci-dessus) indiquent à quelle entité FRBR, telle qu’elle est traitée dans le code RDA, renvoie chacun des éléments constitutifs de la notice. Noir : manifestation. Bleu : expression. Rouge : œuvre.

On le voit d’une manière flagrante, RDA en format Marc c’est un pâté de FRBR : œuvres, expressions, manifestations etc. hachées, mélangées, mises en terrine.

Une fois qu’on l’a devant soi ce pâté, comment y résister ? La tentation est trop forte. Du pain, un joli vin rouge pour accompagner, quelques radis qu’on a toujours sur soi, des olives. Un pélardon, un Paris-Brest, un café.

Notice suivante. Plus de Paris-Brest c’est vrai ? Y a des mille-feuilles je crois. De toute façon y a le far aux pruneaux en cas de lacune. Côté fromage c’est bon ? Le vin si, j’ai vérifié en arrivant ce matin. Y a du blanc aussi, du muscadet. Oui je sais mais bon. Houlà c’est quoi ce truc encore.

Img0133, par Luca Cerabona (« ckOrange ») sur Flickr (CC BY-NC-ND 2.0) Img0133, par Luca Cerabona (« ckOrange ») sur Flickr (CC BY-NC-ND 2.0)

La zone zéro

  • 26 mai 2014

Zero, par MTSOfan sur Flickr
Zero, par MTSOfan sur Flickr (CC BY-NC-SA 2.0)

Comme annoncé aux Journées Abes 2014, nous travaillons à l’implémentation dans le Sudoc de la zone 0. De ce nom stupéfiant on désigne une partie de la notice ISBD permettant d’informer sur la forme du contenu de la publication décrite et sur le type de médiation par laquelle on y accède. La conception de cette zone la destine essentiellement à des fonctions de tri (au moyen de facettes par exemple).

La zone 0 annule et remplace l’indication générale du type de document (« texte imprimé », « enregistrement sonore » etc.) jusqu’à présent encastrée dans la zone du titre et de la mention de responsabilité (en Unimarc : 200$b).

1. L’indication générale du type de document

Cette indication générale du type de document présente plusieurs inconvénients.

D’abord un « document » relève d’un type et d’un seul. Il ne peut pas être à la fois « texte imprimé » et « image fixe » par exemple. C’est ainsi qu’une bande dessinée est conventionnellement décrite comme « texte imprimé ». Idem d’un album pour enfants, bien que l’image y soit largement prépondérante. Idem d’un catalogue d’exposition, d’une monographie sur l’œuvre d’un peintre ou d’un photographe, etc.

Ensuite on voit bien que certaines des formules normalisées utilisables pour cet élément informent à la fois sur un type de contenu (« texte ») et sur un mode de mise à disposition (« imprimé »). Pour autant « texte électronique » n’a jamais été une désignation reconnue. On dit « ressource électronique » — qui n’est qu’un mode de mise à disposition, ce qui nécessite de préciser le type de contenu d’une telle ressource ailleurs dans la notice (en l’occurrence dans la zone 3, Unimarc 230). Certaines autres « indications générales du type de document » ne désignent au contraire qu’un type de contenu (« image fixe », « document cartographique » par exemple). Pour une publication d’« image fixe » ou un « document cartographique » publiés électroniquement, l’indication générale du type de document devient obligatoirement « ressource électronique ». (Sans compter qu’un « document cartographique » est aussi une image.)

Conclusion : l’indication générale du type de document manque à ce point de rigueur et de cohérence qu’elle n’est pour ainsi dire d’aucune utilité en tant que critère de tri dans un catalogue.

2. La zone 0 de l’ISBD

La zone 0 (« zone de la forme du contenu et du type de médiation »), définie dans l’ISBD, édition intégrée (2011, traduction française 2013, pages 29-34), tente de pallier ces inconvénients.

Contrairement à l’indication générale du type de document, elle est répétable et chacun de ses éléments l’est aussi, ce qui d’ailleurs est potentiellement source de micmacs considérables. D’autant que l’ISBD manque d’explications et d’exemples sur ce sujet — qui ne sera pas développé dans ce billet. Une autre fois peut-être.

Elle est structurée en deux parties bien distinctes : la forme du contenu (de la ressource décrite), et le type de médiation, c’est à dire son mode de mise à disposition. Par exemple : texte (forme du contenu), électronique (type de médiation). Ou son (forme du contenu), audio (type de médiation). Avec la ponctuation prescrite qui fait le charme de l’ISBD :

Son : audio

Le signe « : » matérialise la frontière entre les deux parties de la zone 0. Il marque bien qu’il s’agit de deux éléments distincts. Remarquons au passage que le type de médiation « audio » et la forme du contenu « son » ne sont pas redondants (du son peut être mis à disposition sous forme de fichier électronique).

2.1. L’élément Forme du contenu

Les différentes formes du contenu possibles sont les suivantes :

Données — Image — Mouvement — Multimédia — Musique — Objet — Parole énoncée — Programme — Son — Texte — Forme du contenu non définie

(pour les définitions, voir l’ISBD), p. 30 et 31. On déplore la présence dans cette liste de multimédia,  qui a le sens de « formes multiples ».

2.2. Le sous-élément Qualificatif du contenu

Une forme du contenu telle que « texte » doit être précisée par un qualificatif du contenu, car du texte peut être destiné à être lu soit à l’œil soit au toucher :

Texte (visuel) : électronique

Le qualificatif du contenu est un sous-élément de la forme du contenu. Il est « obligatoire si applicable », c’est à dire que certaines formes du contenu exigent un ou plusieurs qualificatifs du contenu (jusqu’à quatre), qui sont, dans l’ordre : la spécification du type, la spécification du mouvement (en cas d’image uniquement), la spécification de la dimensionnalité (en cas d’image uniquement), et la spécification du sens humain grâce auquel le contenu est perçu (qui comporte entre autres le terme olfactif pour les ressources qui puent de manière intentionnelle).

C’est ainsi qu’un texte est soit visuel, soit tactile (c’est à dire en braille ou autre système analogue), qu’une image peut être cartographique (« spécification du type »), qu’elle est animée ou fixe (« spécification du mouvement »), bidimensionnelle ou tridimensionnelle (« spécification de la dimensionnalité »), et peut enfin être perçue soit par la vue soit par le toucher (« spécification du sens sollicité »). Exemple :

Image (cartographique ; fixe ; bidimensionnelle ; tactile)

Sublime.

Voici la liste des qualificatifs du contenu :

Spécification du type : cartographique — noté/notée — interprété/interprétée

Spécification du mouvement : animée — fixe

Spécification de la dimensionnalité : bidimensionnelle — tridimensionnelle

Spécification du sens sollicité : auditif/auditive — gustatif/gustative — olfactif/olfactive — tactile — visuel/visuelle

(pour les définitions, voir l’ISBD), p. 32.

2.3. L’élément Type de médiation

Cet élément est constitué d’un terme assez général indiquant le moyen par lequel on accède à la ressource décrite. Enfin… c’est un peu moins simple que ça. Cet élément fait d’abord la différence entre les ressources qui ne nécessitent aucune médiation (c’est à dire auxquelles on accède directement grâce au sens mentionné en qualificatif du contenu) et les autres. Dans le premier cas, on dit : « immédiat ». Exemple :

Texte (visuel) : immédiat

« Immédiat » est le terme consacré dans l’ISBD, mais bien entendu on peut en retenir un autre dans une interface de recherche et/ou d’affichage.

Dans les autres cas, ça dépend du type d’appareil nécessaire pour accéder à la ressource. Les différents types de médiation possibles dans ces cas-là sont les suivants :

audio — électronique — microforme — microscopique — projeté/projetée — stéréoscopique — vidéo

Exemples :

Texte (visuel) : microforme
Image (animée ; bidimensionnelle) : vidéo
Musique (interprétée ; auditive) : audio
Parole énoncée (auditive) : électronique

Et il en reste deux : le malencontreux multisupport (malencontreux dans sa formulation), et l’indispensable type de médiation non défini.

Le type de médiation ne s’accompagne d’aucun qualificatif.

3. À quoi sert la zone 0 ?

Zero, par LEOL30 sur FlickrOn peut bien entendu l’afficher telle quelle (mais elle achèvera de précipiter les statistiques de consultation du catalogue dans les abysses : mieux vaut trouver des équivalents intelligibles).

Elle est plutôt conçue, ainsi décomposée en éléments et sous-éléments, pour les tris. Par exemple, avoir isolé l’aspect « tactile » permet de filtrer les ressources destinées aux mal- ou non-voyants. La zone 0 permet de définir des facettes ou des filtres de recherche de manière assez souple, avec plus ou moins de granularité, en opérant éventuellement des regroupements, et cela « à la carte ».

3.1. Quelques imperfections

Seulement pour que ce soit possible dans tous les cas, il faut éliminer l’implicite dans la terminologie employée. Cette règle est assez bien respectée. Par exemple on qualifie bien de visuel un texte ou autre qui n’est pas tactile, au lieu de considérer qu’il l’est par défaut.

En revanche un objet par exemple est par défaut tridimensionnel. On ne le dit pas explicitement (la spécification de dimensionnalité ne s’applique qu’à l’image).

Ou bien, si la musique est soit notée soit interprétée (« spécification du type »), ce n’est pas le cas du texte. Pour un texte noté on ne donne pas de « spécification du type ». Pour un texte interprété on ne dit plus texte, mais parole énoncée, qui est une « forme du contenu » à part entière, distincte donc de texte. C’est gênant.

Encore autre chose, pour un enregistrement sonore textuel on a ceci :

Parole énoncée : audio

Supposons qu’il s’agisse d’une captation de spectacle. Si cette même captation est disponible aussi en enregistrement vidéo on a cette fois :

Image (animée ; bidimensionnelle) : vidéo

Encore qu’en principe rien n’interdirait dans ce cas de doubler la forme du contenu pour éviter de perdre l’aspect « parole énoncée » :

Image (animée ; bidimensionnelle). Parole énoncée : vidéo

3.2. Et le type de support ?

Ce qui manque à cette zone 0, c’est une information complémentaire sur le type de support pour indiquer que (par exemple) le « texte (visuel) : immédiat » et l’ « image (fixe ; bidimensionnelle ; visuelle) : immédiate » sont publiés sous la forme d’un livre. On le dit sous forme textuelle dans la zone de la description physique (Unimarc 215, $a), mais il vaudrait mieux un vocabulaire contrôlé qui viendrait préciser la forme du contenu et le type de médiation. Cet élément existe dans RDA.

 

4. RDA : type de contenu, type de média, type de support matériel

Le RDA, s’il fait bien du type de contenu (RDA § 6.9) et du type de média (RDA § 3.2) deux éléments distincts, ne va pas au-delà dans la granularité. C’est à dire qu’il a prévu un ensemble de combinaisons standard des différents aspects  du type de contenu prévus par l’ISBD (forme de contenu – spécification du type – spécification du mouvement – spécification de la dimensionnalité – spécification du sens sollicité), chacune de ces combinaisons formant une entrée dans le vocabulaire contrôlé correspondant.

Exemple :

Forme / type de contenu (ISBD & RDA)

De même, la combinaison de l’ISBD :

Image (cartographique ; fixe ; bidimensionnelle ; visuelle)

a pour équivalent dans RDA le type de contenu :

Image cartographique

qui veut dire tout ça à la fois. Les autres types de contenu relatifs à l’image dans RDA sont au nombre de six (image animée bidimensionnelle ; image animée tridimensionnelle ; image cartographique animée ; image cartographique tactile ; image fixe ; image tactile). C’est plus simple que l’ISBD lorsqu’on catalogue, puisqu’on a déjà anticipé sur les combinaisons les plus probables et qu’il suffit de choisir celle qui convient dans une liste.

Inconvénients : il est possible que des combinaisons n’aient pas été prévues (mais c’est prévu quand même : « Si aucun des termes dans la liste ci-dessus ne s’applique au contenu de la ressource décrite, enregistrer autre. » RDA § 6.9), et surtout ça laisse moins de liberté pour paramétrer ses facettes de recherche (on ne peut définir une facette sur la seule forme image qu’en regroupant les 7 types cités plus haut en une seule, idem si on en veut une sur l’aspect tactile, 7 types différents aussi, etc.), d’autant que beaucoup de place a été laissée à l’implicite dans le vocabulaire : ce qui n’est pas tridimensionnel est réputé bidimensionnel, sauf l’image animée — mais seulement lorsqu’elle n’est pas cartographique (on dit : image animée bidimensionnelle mais image animée cartographique tout court, qui s’oppose à image cartographique tridimensionnelle).

Bref : c’est plus simple lorsqu’on catalogue, mais ça laisse moins de latitude lorsqu’on paramètre les interfaces de recherche.

Le type de contenu et le type de média sont complétés dans RDA par un 3e élément : le type de support matériel (RDA § 3.3), pour lequel a été défini un vocabulaire contrôlé. Les trois éléments sont conçus comme un ensemble.

5. Dans le Sudoc, ce sera comment ?

5.1 Le format Unimarc

Les deux standards (ISBD et RDA) sont pris en compte dans les zones 181 et 182 du format Unimarc bibliographique. 181 pour la partie forme du contenu de la zone 0 ISBD ou l’élément type de contenu du RDA, 182 pour la partie type de médiation de la zone 0 ISBD ou l’élément type de média du RDA. Une zone 183 a également été définie pour l’élément Type de support matériel de RDA. Ce sont des zones de données codées. Comme le Marc21, l’Unimarc offre la possibilité d’encoder aussi ces divers éléments sous forme textuelle (zone 203 pour la zone 0 de l’ISBD ou les éléments Type de contenu et Type de média de RDA, zone 283 pour l’élément Type de support matériel de RDA), mais ces zones ne seront pas implémentées dans le Sudoc.

La zone 181 (Forme du contenu) comporte deux sous-zones de longueur fixe ($a, 2 positions, $b, 6 positions) pour refléter la conception analytique de la zone 0 de l’ISBD. Exemple :

$ai#$bxxxe##

pour : Texte (visuel). Voilà qui semble bien complexe pour exprimer si peu de chose, mais c’est tout simplement parce que la forme de contenu ($a) étant en l’occurrence du « texte » (valeur : i), les 3 premières positions de la sous-zone $b (qualificatifs de contenu) sont « non applicables », d’où ces trois valeurs « x » précédant la valeur « e » (pour « visuel »).

Le principe de cette zone est en effet celui de toute zone codée de longueur fixe dans laquelle s’enchaînent des éléments d’information signifiants en raison de leur position.

Si on veut utiliser la 181 pour RDA, on dispose juste d’une $c contenant un code à 3 caractères alphabétiques (défini pour le format MARC21) correspondant à chacun des types de contenu spécifiés dans la norme. Exemple :

$ctxt$2rdacontent

pour : Texte (qui est l’équivalent RDA de Texte (visuel) de l’ISBD). Cette $c n’est pas spécifique à RDA, mais à tout code de catalogage autre que l’ISBD. D’où la sous-zone $2 précisant de quel vocabulaire est issu le code figurant en $c.

La zone 182 (Type de médiation) n’a qu’une sous-zone ($a pour l’ISBD, $c pour RDA). En cas de $c, il faut une $2rdamedia. Exemple :

$an

ou :

$cn$2rdamedia

pour : immédiat (ISBD) ou sans médiation (RDA).

La zone 183 (RDA Type de support matériel), qui vient tout juste d’être créée dans le format Unimarc/B, n’a pas encore fait l’objet de spécifications pour une implémentation dans le Sudoc.

5.2 Catalogage

En catalogage ce sont les catégories du RDA qui seront proposées, pour des raisons de simplicité (c’est donc la sous-zone $c qui sera renseignée). La liste à utiliser comporte une grosse vingtaine de termes. Les catalogueurs auront à leur disposition une boîte de saisie avec une liste déroulante de libellés que nous espérons aussi parlants que possible.

5.3 Exports

Une table de correspondance a été établie entre la nomenclature RDA et les libellés ISBD, sur la base du vocabulaire RDA (toute combinaison théoriquement possible en ISBD, mais non prévue dans RDA, ne pourra être codée que comme « forme du contenu non définie »). Cette table permettra de générer automatiquement des zones 181 structurées selon l’ISBD ($a et $b). Les deux versions des zones 181 et 182 seront exportées en Unimarc. L’export en Marc21 est également prévu (zones 336 et 337).

5.4 Affichages

La conformité à l’ISBD sera respectée dans le seul affichage « i » (notice ISBD dans WinIBW). L’affichage « u » (avec libellés) de même que l’affichage public appliqueront une formulation plus simple.

5.5 Calendrier

Ces deux nouvelles zones (181 et 182) devraient être mises en production dans le courant de l’automne.

6. La zone 0 et le modèle FRBR

Dans le modèle FRBR, l’un des attributs de l’expression est sa forme :

On entend par « forme de l’expression » le moyen par lequel l’œuvre est réalisée (par exemple, sous forme de notation alphanumérique, de notation musicale, sous forme déclamée, sous forme de sons musicaux, d’image cartographique, d’image photographique, de sculpture, de danse, de mime, etc.).
FRBR, 2e éd. française, § 4.3.2 Forme de l’expression

On le voit, cette notion de forme de l’expression (FRBR) est très proche de celle de forme du contenu (ISBD).

Cependant une publication (manifestation) réunit fréquemment plusieurs œuvres différentes à travers leurs expressions respectives. Il suffit (par exemple) qu’un texte soit accompagné d’illustrations dans telle publication. Ou qu’une publication soit un recueil de choses plus ou moins homogènes quant au contenu (actes de congrès ou autres). À quoi alors d’applique la zone 0 ?

Côté ISBD les choses paraissent assez claires : on est au niveau de la manifestation. Même si, dès lors qu’on parle de contenu, on dit quelque chose de l’expression, ou des expressions de l’œuvre (ou des œuvres) réunies dans la publication, c’est bien sur le contenu global de celle-ci qu’on fournit des informations. La publication est prise comme un tout, et on donne une typologie de ce qu’elle contient.

Si la manifestation contient une seule œuvre, et une seule expression de celle-ci, la forme de contenu de la manifestation se trouve être aussi la forme de l’expression. « Texte (visuel) » est par exemple aussi bien la forme du contenu du livre Le vice-consul, de Marguerite Duras, publié par Gallimard en 1966 (manifestation) que celle de l’expression de l’œuvre contenue dans ce même livre. Cette expression constitue en effet à elle seule tout le contenu de ce livre : pas de préface, ni de postace, d’illustrations, rien que le texte de Marguerite.

Pour l’Unimarc : les zones 181 et 182 sont définies pour l’instant dans le format bibliographique seulement. La zone 181 devrait normalement être définie également dans le format des autorités à l’avenir, pour les notices d’expression.

Pour RDA, qui a son modèle FRBR à lui, l’élément Type de contenu est traité dans la partie du chapitre 6 Identification des œuvres et des expressions traitant de l’expression (§ 6.9). Il n’empêche que la pratique courante lorsque les données sont produites en Marc est d’intégrer cet élément aux notices bibliographiques (Marc21 : zone 336).

Si un jour il devient de pratique courante dans l’application de RDA de décrire systématiquement les expressions représentées dans une manifestation, je suis curieux de voir l’emploi qui sera fait de cet élément, et ce qui figurera alors dans les métadonnées des manifestations correspondantes…

Practicing for the circus, par seniwati sur Flickr
Practicing for the circus, par seniwati sur Flickr (CC BY-NC-ND 2.0)

What’s wrong with BIBFRAME

  • 5 février 2013

Je ne sais pas si j’ai compris de travers, mais il me semble que quelque chose ne va pas avec BIBFRAME. Quelque chose qui est contenu dans une phrase :

Each BIBFRAME Instance is an instance of one and only one BIBFRAME Work.
Library of Congress, Bibliographic Framework as a Web of Data : Linked Data Model and Supporting Services, 21 novembre 2012, p. 10.

« Chaque Instance BIBFRAME est une instance d’une Œuvre BIBFRAME et d’une seule. »

Instance BIBFRAME et Œuvre BIBFRAME sont des éléments du Modèle BIBFRAME, toujours en cours de développement à la Bibliothèque du Congrès — encore que « développement » soit désormais un terme un peu trop fort, puisque le socle du modèle est bien posé. Le document cité plus haut en dévoilait la conception et l’économie générale. Un site Web déjà assez étoffé (bibframe.org), mis en ligne il y a quelques jours, permet de suivre l’avancée des travaux, dont une partie est menée sur des données des bibliothèques partenaires (Library of Congress, British Library, Deutsche Nationalbibliothek et autres).

Le modèle BIBFRAME

On trouve sur cette page de bibframe.org le schéma général du modèle et ses éléments de plus haut niveau, que voici :

Le modèle BIBFRAME

Les différents éléments du modèle sont définis ainsi (même page) :

  • Œuvre de création (Creative Work) – une ressource qui reflète une essence conceptuelle de la ressource à cataloguer.
  • Instance (Instance) – une ressource qui reflète une réalisation (embodiment) matérielle et individuelle de l’Œuvre.
  • Autorité (Authority) – une ressource qui reflète des concepts d’autorité fondamentaux qui ont eux-mêmes défini des relations reflétées dans l’Œuvre et l’Instance. Par exemple des personnes (People), des lieux (Places), des sujets (Topics), des collectivités (Organizations), etc. Le domaine est un concept important dans les autorités. Il s’agit de l’entité responsable de la validation, de l’organisation et de la maintenance (préservation de l’intégrité) des ressources d’autorité.
  • Annotation (Annotation) une ressource qui complète (decorates) une autre ressource BIBFRAME par des informations supplémentaires telles que des données d’exemplaire (Library Holdings), des couvertures (Cover Art) et des recensions (Reviews)

Inutile d’y chercher les entités FRBR : elles n’y sont pas. Tout au plus peut-on déduire du schéma que l’Instance BIBFRAME est l’équivalent de la Manifestation FRBR, ou plutôt de la bonne vieille notice bibliographique. L’incipit de la page le dit d’ailleurs d’une manière qui en dit long sur la portée du projet :

In translating the MARC 21 format to a Linked Data model it is important to deconstruct and then reconstruct the informational assets that comprise MARC.

BIBFRAME est donc clairement une tentative d’expression, dans un formalisme conciliable avec le Linked Data, du format MARC 21 (conçu, rappelons-le, au milieu des années 1960 pour rendre « machine-readable » des fiches de catalogue). MARC 21 habillait la fiche traditionnelle d’étiquettes de champs et de codes de sous-champs ; BIBFRAME met tout ça en triplets. Avec il est vrai la grande découverte de l’intérêt qu’il y a à lier les entités les unes aux autres (une notice bib à une notice d’autorité, une notice d’autorité à une autre notice d’autorité, etc.). Il aura fallu attendre 2012 pour ça…

La phrase qui tue

J’y reviens :

Each BIBFRAME Instance is an instance of one and only one BIBFRAME Work.
Library of Congress, Bibliographic Framework as a Web of Data : Linked Data Model and Supporting Services, 21 novembre 2012, p. 10.

À mon sens elle est tragique. Elle dit qu’à chaque Instance BIBFRAME (chaque Manifestation FRBR) correspond une Œuvre BIBFRAME et une seule. En d’autres termes, c’est le contenu d’une Manifestation (FRBR), pris globalement à ce que je comprends, qui définit l’Œuvre BIBFRAME. Ou encore : une Œuvre BIBFRAME se déduit de son instance, et non l’inverse. Ainsi : Constantinople fin de siècle / Pierre Loti. Précédé de Devant Stamboul / Henri de Régnier publiés ensemble (c’est un exemple tiré du Guide méthodologique du Sudoc) constituraient une seule Œuvre BIBFRAME, différente de Constantinople fin de siècle et de Devant Stamboul publiés séparément ou dans d’autres combinaisons. BIBFRAME permet probablement (reste à voir comment) de déclarer que ce type particulier d’Œuvre BIBFRAME est composite, mais la question n’est pas là.

Où est le problème ?

Il est que BIBFRAME, en l’exprimant explicitement et en le figeant, rend irrémédiable un travers qui n’apparaît qu’en filigrane dans RDA, et qui aurait pu être redressé : il considère que l’unité de base de description bibliographique est encore et toujours… le livre. Ou, plus généralement, le contenant, le produit éditorial. J’y vois pour ma part la négation de tout le travail de modélisation accompli dans les années 1990 et 2000, qui a le mérite d’avoir opéré un changement de point de vue sur l’objet même de la description bibliographique : du contenant (pré-FRBR) au contenu (FRBR). Un point de vue qui est le seul pertinent dès lors que les ressources se dématérialisent.

Back to the 60s, then…?

J’espère avoir mal compris, car ayant moi-même vécu les sixties, ma matière grise s’est raréfiée depuis le temps. D’autres font sans doute une lecture différente et plus rassurante.

The Ronettes. Be my baby / Phil Spector, Jeff Barry et Ellie Greenwich, paroles et musique ; the Ronettes, trio vocal. États-Unis, années 1960.

Ph. Le Pape

Avant je m’appelais Marc, maintenant c’est Bibframe

  • 29 janvier 2013

BIBFRAME, pour ceux qui n’ont pas suivi, est en cours de dédeloppement à la Bibliothèque du Congrès. Il devrait succéder au format MARC pour l’échange des métadonnées documentaires de cette vénérable institution.

Voir les billets :

La Bibliothèque du Congrès vient de lancer bibframe.org « un nouveau site d’information détaillé sur le vocabulaire du projet BIBFRAME en cours de développement. On y trouvera également des démonstrations du modèle BIBFRAME réalisées à partir de notices MARC des institutions participant à l’expérimentation. […] Le site fournit en outre des services qui permettent à tout bibliothécaire curieux de voir à quoi pourront ressembler des ressources bibliographiques conformes au modèle BIBFRAME, de visionner des enregistrements MARC/XML provenant de la base principale de la Bibliothèque du Congrès, ainsi que des ressources BIBFRAME résultant des transformations les plus courantes. »
Extrait de l’annonce publiée par Kevin Ford (Library of Congress) dans la liste de discussion BIBFRAME le 27 janvier 2013.

(Prendre des vitamines avant consultation du site.)

Jack Ary. Les tomates (Mange des tomates) / Pierre Cour, paroles ; Barcellini, musique ; Jack Ary et son High Society Orchestra, ensemble instrumental et vocal.

S’informer et réagir :

Bibliothèque du Congrès, Washington DC (États-Unis), vers 1902. Source : Wikimedia Commons.

Du nouveau sur BIBFRAME

Ce billet fait suite à : Mais qu’est-ce qu’il se passe ? (2) Bibliothèque du Congrès

Bibliothèque du Congrès, Washington DC (États-Unis), vers 1902. Source : Wikimedia Commons
Bibliothèque du Congrès, Washington DC (États-Unis), vers 1902. Source : Wikimedia Commons.

Dans une annonce publiée le 23 novembre dernier sur les pages de son site consacrées à la « Bibliographic Framework Transition Initiative », la Bibliothèque du Congrès indique que le processus de définition du format de métadonnées destiné à succéder à MARC21, annoncé en 2011, vient de franchir deux étapes importantes :

  • la remise par Zepheira — le consultant spécialisé engagé tout exprès –, d’un document de 42 pages intitulé Bibliographic Framework as a Web of Data: Linked Data Model and Supporting Services, daté du 21 novembre 2012, qui n’est rien d’autre que le premier état du projet de nouveau format, aussitôt mis en ligne (http://www.loc.gov/marc/transition/pdf/marcld-report-11-21-2012.pdf)
  • une première réunion du « très petit groupe de testeurs pionniers » (cf. le billet cité supra) au sein duquel le modèle va désormais subir ses premiers essais.

Le document produit par Zepheira n’offre encore qu’une vue générale, non détaillée (« high level view ») du modèle, précise la LC, qui ajoute qu’elle espère des retours non seulement du « très petit groupe de testeurs pionniers » (la LC, plus : British Library, Deutsche Nationalbibliothek, Université George Washington, National Library of Medicine, OCLC, Université de Princeton) mais de l’ensemble des professionnels intéressés par la question.

Précaution oratoire de la LC : le nouveau format (nommé « BIBFRAME ») se veut indépendant des normes de contenu. En clair : il n’est pas fait seulement pour RDA, et revendique une utilisation possible au-delà des seuls besoins des bibliothèques.

S’informer et réagir :

Un mot pour un autre. 2. Format de données / Code de catalogage

C’est étonnant comme cette confusion a la vie dure. Jusque dans les documents les plus érudits, les plus récents (et même, horresco referens,… enfin bref).

Donc.

Peut-on dire (par exemple) : « passer d’UNIMARC à RDA ? »

Non. Enfin on peut, mais ça n’a pas grand sens. Pas plus qu’autrefois « passer de l’ISBD à UNIMARC ».

RDA (code de catalogage), c’est une norme de contenu (comme par exemple nos normes françaises AFNOR Z44-050 et autres). Ça dit de quels éléments se compose l’information bibliographique, ça définit précisément les éléments en question, et les relations possibles entre eux. Ça donne aussi des règles, toujours par rapport au contenu (par exemple : comment faire un point d’accès identifiant une œuvre).

RDA se veut indépendant de tout format d’encodage des données, et même de tout format d’affichage. C’est dit expressément :

In order to optimize flexibility in the storage and display of the data produced using RDA, a clear line of separation has been established between the guidelines and instructions on recording data and those on the presentation of data.

RDA § 0.1

De manière à favoriser une souplesse de stockage et d’affichage des données produites en appliquant RDA, une ligne de séparation claire a été tracée entre les recommandations et les directives relatives à l’enregistrement des données et celles concernant leur présentation.

C’est à dire que des ensembles de données appliquant la norme RDA peuvent, pour leur stockage, leur diffusion, leur affichage ou tout autre besoin, être simplement saisies dans un traitement de texte (voire tapées à la machine à écrire, ou tracées à la plume de pintade), encodées simplement en HTML, ou dans un format structuré.

Par exemple (entre maintes possibilités) dans un format MARC.

Par exemple en UNIMARC (un format qui, plus encore que le MARC21, a fait des efforts de compatibilité avec RDA, selon tous les scénarios d’implémentation des FRBR, ce qui n’est pas le cas de MARC21).

On peut donc utiliser à la fois UNIMARC et RDA, ou UNIMARC et les REICAT (Regole Italiane di Catalogazione, code italien de catalogage appliquant les FRBR), ou UNIMARC et les AACR2, ou UNIMARC et les normes françaises actuelles, ou ne respecter aucune norme de contenu, mais le faire en UNIMARC, etc.

Une bonne maîtrise de l’UNIMARC (ce format-là précisément) est d’ailleurs, comme nous le verrons dans un prochain billet, une excellente préparation à la compréhension de l’ultra-structuration des données nécessaire à l’avènement du web sémantique.

Au fond, il faudrait réapprendre l’UNIMARC maintenant, avec sérieux.

Sozialistische Toiletten, Socialist toilets. Grenz Bahnhof - Border Crossing, Bahnhof Oebisfelde DDR, Apr 1990 Passer à RDA (en UNIMARC si on veut).
Sozialistische Toiletten, Socialist toilets. Grenz Bahnhof – Border Crossing, Bahnhof Oebisfelde DDR, Apr 1990, par sludgegulper sur Flickr.

Mais qu’est-ce qu’il se passe ? (2) Bibliothèque du Congrès

  • 31 octobre 2012

Là-bas ils sont engagés dans la définition de leur futur format de données. Ce processus, ils l’ont appelé Bibliographic Framework Transition Initiative, BFI parfois, Bibframe pour les intimes.

Il en avait été question ici même en son temps, c’est à dire au moment du lancement du processus il y a un an.

Les choses ont avancé depuis.

La LC a recruté un consultant spécialisé (Zepheira) pour accélérer la définition du futur format de données, avec deux maîtres mots : le web de données comme contexte et RDF (Resource Description Framework) comme modèle de base.

Ce consultant est chargé de « produire un (ou des) modèle(s) qui serviront de base de discussion, et de fournir une analyse d’initiatives analogues. La Bibliothèque prévoit un processus itératif se nourrissant des retours de l’ensemble des professionnels, permettant d’affiner les spécifications. L’objectif est de parvenir à un format bibliographique souple, un code de référence robuste, une infrastructure fiable de déploiement, et un plan opérationnel de migration de MARC vers le nouveau format » (« a flexible bibliographic framework, a robust reference code, a supporting infrastructure for deployment, and an effective migration plan from MARC to a new framework. »). Voilà ce qu’on lit sur la page du site de la LC donnant accès à la transmission vidéo de la conférence d’Eric Miller, de Zepheira (16 juillet 2012) : Library of Congress New Bibliographic Framework Initiative: Update Forum with Eric Miller (en anglais).

Voici le diaporama correspondant (accessible sur Slideshare) :

Voir notamment la diapo 21, qui présente le schéma du « modèle de haut niveau » destiné à servir d’appui à l’ensemble du processus. Ça ressemble un peu aux FRBR… mais ça surprend.

On consultera par ailleurs la présentation [.pptx] de Sally McCallum (LC) au congrès annuel de l’IGeLU (Groupe international des utilisateurs d’Ex Libris) : Bibliographic Framework Initiative Approach for MARC Data as Linked Data (Zürich, 13 septembre 2012), qui précise les étapes du processus en cours (en particulier : une première expérimentation du modèle « de haut niveau » fourni par Zepheira doit être conduite par un « très petit groupe de testeurs pionniers » en octobre et novembre, c’est à dire en ce moment même).

S’informer :

Testing Large Turbines, Westinghouse Co. Works. États-Unis : American Mutoscope and Biograph Company, 1904.
Filmé le 5 mai 1904, probablement à la Westinghouse Machine Company, East Pittsburgh, Pennsylvanie. Mis en ligne par la Bibliothèque du Congrès (États-Unis).