Archives du blog

RDA, le code de catalogage qui fait grossir

  • 16 juin 2014

Lucques Photo Philippe Le Pape

Il importe absolument de faire la différence entre des métadonnées RDA produites en format Marc et d’autres, qui pourraient être produites elles aussi en appliquant RDA, mais selon des modalités plus modernes, directement destinées à une exploitation dans le L.O.D. par exemple, et sans aucune référence au dispositif longuement éprouvé des catalogues informatisés des dernières décennies du XXe siècle. De telles métadonnées existeront peut-être un jour.

Les métadonnées RDA produites en Marc sont des notices Marc. Elles peuvent, ou non, tirer avantage des facilités de mise en relation des notices Marc entre elles proposées par des formats comme Marc 21, ou plus encore Unimarc.

Les formats Marc et le modèle FRBR

Le format Marc 21, qui reste celui dans lequel produisent les grands établissements bibliographes dans lesquels le code RDA est pratiqué depuis 2013, a connu quelques mises à jour qui reflètent non une remodélisation en faveur des FRBR, mais le passage d’AACR2 à RDA. Des zones, sous-zones, codes etc. supplémentaires ont été définis dans les formats des notices bibliographiques et d’autorité pour des éléments de RDA sans correspondance dans les AACR (voir RDA in MARC).

Quid des entités FRBR du groupe 1 les plus novatrices (œuvre & expression), et des relations qui en partent ou y aboutissent ? D’après les exemples de notices Marc 21 auxquelles on peut accéder depuis le RDA Toolkit [.pdf] on comprend que ces deux entités peuvent être l’une et l’autre exprimées en tant qu’autorités titre, ou nom-titre. Cependant, il n’y a aucun moyen de déclarer une autorité comme décrivant soit une œuvre soit une expression. Rien. Pas le moindre code quelque part, dans le label ou ailleurs. Les étiquettes et les intitulés des zones n’ont même pas été modifiées pour refléter la terminologie FRBR en vigueur dans RDA : c’est toujours « 130 – Main Entry – Uniform Title » pour les œuvres sans créateur associé ou leurs expressions ; « 100 – Heading-Personal Name », « 110 – Heading-Corporate Name » pour celles avec créateur associé, et ça sert indifféremment pour les œuvres et pour les expressions.

La structure des points d’accès, notamment celle des points d’accès autorisés, n’a pas bougé. C’est-à-dire que les points d’accès autorisés de ces notices — qui en application de RDA doivent suffire à identifier une œuvre ou une expression selon le cas — sont identiques aux titres uniformes d’avant le modèle FRBR.

Aucune instruction pour l’enregistrement des relations suivantes : œuvre ↔ expression (a pour expression / est une expression de) ; créateur ↔ œuvre (en particulier en cas de créateurs multiples) ; contributeur ↔ expression ; sujet ↔ œuvre.

Dans le format Marc21 bibliographique, les zones qui permettent d’établir un point d’accès autorisé identifiant l’ « œuvre manifestée » et l’ « expression manifestée », en faisant éventuellement un lien vers les autorités correspondantes, n’ont pas été modifiées elles non plus : ce sont celles des titres uniformes d’autrefois. Comme dans le format des autorités, il n’y a pas de différence d’étiquette selon que le point d’accès identifie une œuvre ou une expression. Ni d’indicateur qui pourrait tenir ce rôle. Et pourtant selon RDA l’ « œuvre manifestée » et l’ « expression manifestée » sont deux relations distinctes. À l’évidence, on considère que « qui fait le plus fait le moins », c’est-à-dire qu’un titre uniforme « d’expression » identifie aussi l’œuvre. Seulement si la zone ad hoc tient aussi lieu de lien vers une notice d’autorité, quel identifiant y met-on : celui de l’expression, ou celui de l’œuvre ?

Les choses sont plus claires en Unimarc. Les entités œuvre et expression, traitées comme en Marc 21 dans le format des autorités, sont clairement distinguées l’une de l’autre. Un code dans une zone spécifique (154) permet de déclarer une autorité comme décrivant soit une œuvre soit une expression. Par ailleurs des zones nouvelles ont été définies pour ce qu’on pourrait appeler des titres uniformes FRBRisés, et les étiquettes sont différentes pour les œuvres et pour les expressions. Ces distinctions se retrouvent dans le format bibliographique : un « titre uniforme d’expression » n’a pas la même étiquette qu’un « titre uniforme d’œuvre ».

Toutes les relations entre entités ont été ajustées selon le modèle FRBR, et dûment identifiées. Dans le format des autorités : œuvre ↔ expression (a pour expression / est une expression de) ; créateur ↔ œuvre (en particulier en cas de créateurs multiples) ; contributeur ↔ expression ; sujet ↔ œuvre. Dans le format bibliographique : lien vers l’œuvre et lien vers l’expression, comme indiqué plus haut.

RDA en Marc dans la pratique

C’est à dire qu’on serait vraiment beaucoup mieux armé pour appliquer un RDA « FRBRisé » en Unimarc qu’en Marc 21 (or c’est sur la base du Marc 21 qu’est conçu Bibframe, rappelons-le au passage).

Seulement la LC, la British Library, la NLA (National Library of Australia), la BAC (Bibliothèque et Archives Canada) etc. utilisent le Marc 21.

Qu plus est, dans la pratique actuelle de la LC et des autres il n’y a pas d’identification systématique de l’ « œuvre manifestée » dans les notices bibliographiques. Apparemment lorsque le titre propre de la publication décrite suffit à identifier l’œuvre, ou les œuvres contenue(s), on s’en tient là. Encore moins d’identification de l’expression dans ce cas, bien entendu. C’est le chapitre 17 de RDA qui traite des « relations fondamentales » du modèle FRBR (c’est à dire les relations entre les entités du groupe 1, œuvre, expression, manifestation, item). Ceci est le profil d’application de la LC pour ce chapitre (copie d’écran du RDA Toolkit) :

RDA-LCPCC-ch17

« Do not apply chapter 17 in the current implementation scenario. » « N’appliquez pas le chapitre 17 dans le scénario d’implémentation actuel. » C’est réaffirmé sur la même page pour les parties « œuvre manifestée » et « expression manifestée ». Voilà. Comme ça, si on avait encore un doute sur la FRBRisation du catalogue de la LC (et des bibliothèques participant au PCC, c’est à dire le Program for Cooperative Cataloging), on n’en a plus. Voir la page du profil d’application de RDA (« Policy statements ») LC-PCC sur le site de la LC.

Voyons la NLA :

RDA-NLA-ch17

« There are no policy statements for this chapter. »  Ça alors, qu’est-ce qu’on fait si on travaille dans cette bibliothèque-là ?

La British Library n’a pas de profil d’application dans le RDA Toolkit, mais elle y a publié des « flux de travail ». On lit ce qui suit dans celui élaboré pour les « monographies » :

General Guidelines for Choosing the Preferred Title (6.2.2.3)
The preferred title for a work is a core element of the description. It is the title chosen as the basis for the authorised access point representing the work. This may simply consist of the title proper recorded in the 245 subfield $a if the title is unique and there is no person, family or corporate body responsible for creating the work. If that title is not unique, additional identifying elements must be included in a new preferred title recorded in field 130, or in the 240 in combination with a 100 or 110 field.

The preferred title is also used to refer to a related work or expression, for example, as the stem of an authorised access point given in the $t of fields 700-711 or $a of field 730.
British Library. Monograph Workflow (Last updated 05.06.14, Aligned with RDA Update April 2014)

Il y est clairement indiqué :

  • que dans certains cas le titre propre (245$a en Marc 21) suffit à identifier une œuvre dans la notice bibliographique, mais les critères sont assez restrictifs, et les directives précises quant à la rédaction d’une entrée au titre privilégié de l’œuvre.
  • que « le titre privilégié est également utilisé pour faire référence à une œuvre ou une expression en relation [avec la ressource décrite], par exemple en formant la racine d’un point d’accès privilégié donné dans les $t des zones [Marc 21] 700-711 [c’est à dire : la sous-zone permettant d’encoder un titre dans des entrées supplémentaires nom-titre] ou $a d’une 730 [idem, pour une entrée titre]. »

Il en résulte que cette notice RDA que j’ai montrée aux Journées Abes 2014 (je l’avais faite moi-même) :

Notice Alice 1

n’est pas juste. Si elle avait été obtenue par conversion du Marc 21, les « titres d’œuvre » auraient été étiquetés 500 (Titre uniforme) en Unimarc, et non 577 (Identification d’une expression), et ces 500 n’auraient pas été liées à l’autorité correspondante, il aurait fallu le faire à la main :

Notice Alice 2

Si elle avait été produite directement en Unimarc, et en respectant les conventions de ce format pour des données complètement FRBRisées il aurait fallu des zones 577 identifiant chacune des deux expressions contenues, et éventuellement des 576 identifiant les œuvres correspondantes.

Qu’appelle-t-on relation dans RDA ?

Les quatre premières sections de RDA sont consacrées aux entités FRBR, les six dernières aux relations entre ces entités. Mais qu’appelle-t-on au juste relation dans RDA ?

RDA sert clairement à décrire des publications (FRBR : manifestations). Si on travaille en Marc, on peut le reformuler ainsi : RDA sert à faire des notices bibliographiques.

Cependant RDA exige que toute notice bibliographique fasse état de certaines des relations qui existent entre la ressource décrite et d’autres entités du modèle FRBR. Par exemple entre la publication et son éditeur. Entre la publication et l’œuvre, ou les œuvres, qu’elle contient — à moins que celles-ci soient en trop grand nombre — de même qu’avec leurs créateurs s’ils sont connus.

Il n’est pas obligatoire pour cela de mettre la notice bibliographique formellement en relation avec d’autres notices (par exemple : celle(s) décrivant l’œuvre, ou les œuvres, contenue(s), ou leurs expressions respectives ; les notices d’autorité établies pour les créateurs de l’œuvre, ou des œuvres, contenue(s) ; celle établie pour la maison d’édition). RDA ne fait pas d’obligation de ce genre, tout simplement parce que techniquement ce n’est pas possible dans bien des systèmes informatiques.

Ce qui est désigné par le terme de relation dans RDA, c’est simplement la mention que l’entité décrite est en relation avec d’autres. Cette mention peut prendre différentes formes, au choix :

  1. le type de la relation + un identifiant de l’entité liée (équivalent Unimarc : les zones de lien des blocs 5XX, 6XX, 7XX avec $3, celles des 4XX avec $0)
  2. le type de la relation, + un point d’accès autorisé identifiant l’entité liée (équivalent Unimarc : les zones de lien des blocs 5XX, 6XX, 7XX sans $3, celles des 4XX sans $0)
  3. une mention textuelle, par exemple une note, identifiant à la fois l’entité liée et le type de relation

Une zone Unimarc 210 telle que :

210 ## $a Paris $c Grund $d [etc.]

suffit à exprimer la relation à l’éditeur (210$c signifie « est l’éditeur de la ressource »).

De même, une note textuelle (Unimarc 3XX) telle que :

304 ## $a Traduit de : Alices’s adventures in Wonderland

suffit à rendre compte à la fois de la relation à l’œuvre contenue et de celle à l’expression originale ; RDA n’en exige pas davantage (mais ne l’interdit pas non plus, bien entendu). En toute orthodoxie vis-à-vis des FRBR, il s’agit là d’une relation entre deux expressions (la traduction française réalisée par André Bay de Alices’s adventures in Wonderland et le texte original anglais de Lewis Carroll). Mais vu qu’Alice’s adventures in Wonderland est aussi le titre par lequel l’œuvre est identifiée, on peut à la rigueur convenir que cette même note fait aussi référence à l’« œuvre manifestée » (ce qui est en principe obligatoire).

Dalí. Todas las sugestiones poéticas y todas las posibilidades plásticas, par Museo Reina Sofía sur Flickr (CC BY-NC-ND 2.0) Dalí. Todas las sugestiones poéticas y todas las posibilidades plásticas, par Museo Reina Sofía sur Flickr (CC BY-NC-ND 2.0)

La différence avec le catalogage « à l’ancienne » ? Eh bien… Hum… Mettons qu’il réside dans le fait que « le catalogueur » est dorénavant conscient que par cette 210 et par cette note 304 il fait œuvre FRBRisatrice. Que sa 210 n’est pas une simple zone de l’adresse bibliographique, mais l’enregistrement de la relation manifestation → éditeur. Qu’il n’a pas simplement transcrit en note le titre original trouvé sur l’ouvrage comme le lui demande sa norme, mais qu’il a mis en évidence une relation entre le livre qu’il décrit et une des « œuvres » qu’elle contient.

Voilà.

Un pâté de FRBR

Les bibliothèques appliquant actuellement RDA (en format Marc donc) se contentent généralement d’enregistrer les relations selon les formes 2 et 3 de la liste ci-dessus (c’est à dire sans faire de lien entre notices). La structure de la notice traditionnelle n’a pas été bouleversée, en dépit de quelques modifications, la plus spectaculaire étant le remplacement de l’indication générale du type de document par un ensemble de trois éléments distincts :

  • RDA 6.9 Type de contenu (Marc 21 336, Unimarc 181)
  • RDA 3.2 Type de média (Marc 21 337, Unimarc 182)
  • RDA 3.3 Type de support matériel (Marc 21 338, Unimarc 183)

(voir La zone 0).

Une notice bibliographique Marc se suffit à elle-même, en RDA comme en AACR2. Tel est le principe qui semble prévaloir dans le monde anglo-saxon, et singulièrement à la Bibliothèque du Congrès. La notice bibliographique Marc contient tout :

  • l’identification de la manifestation (elle est faite pour cela)
  • l’identification de l’œuvre, ou des œuvres, contenue(s)
  • l’identification de leurs expressions s’il y a lieu
  • la mention, sous forme textuelle ou sous forme de points d’accès normalisés, des relations de la manifestation et/ou de l’expression et/ou de l’œuvre aux entités de type personne, collectivité ou famille.

Tout cela se trouve réuni au sein d’une même notice bibliographique RDA en Marc. Il arrive même qu’une zone Marc réunisse des attributs de plusieurs entités FRBR. Ainsi par exemple de la zone de la description physique (Unimarc 215, Marc 21 300) :

215 ## $a 479 pages $c illustrations, en couleurs $d 31 cm (Unimarc)
300 ## $a 479 pages :$b illustrations, en couleurs ;$c 31 cm (Marc 21)

où $a (Unimarc et Marc 21) correspond à l’élément Importance matérielle (attribut de la manifestation), $c (Unimarc) / $b (Marc 21) à des attributs de l’expression (en l’occurrence RDA 7.15 Contenu illustratif et RDA 7.17 Contenu de couleur), et $d (Unimarc) / $c (Marc 21) à l’élément Dimensions, autre attribut de la manifestation.

Les couleurs utilisées dans les notices présentées aux Journées Abes 2014 (voir la diapo ci-dessus) indiquent à quelle entité FRBR, telle qu’elle est traitée dans le code RDA, renvoie chacun des éléments constitutifs de la notice. Noir : manifestation. Bleu : expression. Rouge : œuvre.

On le voit d’une manière flagrante, RDA en format Marc c’est un pâté de FRBR : œuvres, expressions, manifestations etc. hachées, mélangées, mises en terrine.

Une fois qu’on l’a devant soi ce pâté, comment y résister ? La tentation est trop forte. Du pain, un joli vin rouge pour accompagner, quelques radis qu’on a toujours sur soi, des olives. Un pélardon, un Paris-Brest, un café.

Notice suivante. Plus de Paris-Brest c’est vrai ? Y a des mille-feuilles je crois. De toute façon y a le far aux pruneaux en cas de lacune. Côté fromage c’est bon ? Le vin si, j’ai vérifié en arrivant ce matin. Y a du blanc aussi, du muscadet. Oui je sais mais bon. Houlà c’est quoi ce truc encore.

Img0133, par Luca Cerabona (« ckOrange ») sur Flickr (CC BY-NC-ND 2.0) Img0133, par Luca Cerabona (« ckOrange ») sur Flickr (CC BY-NC-ND 2.0)

Publicité

Avant je m’appelais Marc, maintenant c’est Bibframe

  • 29 janvier 2013

BIBFRAME, pour ceux qui n’ont pas suivi, est en cours de dédeloppement à la Bibliothèque du Congrès. Il devrait succéder au format MARC pour l’échange des métadonnées documentaires de cette vénérable institution.

Voir les billets :

La Bibliothèque du Congrès vient de lancer bibframe.org « un nouveau site d’information détaillé sur le vocabulaire du projet BIBFRAME en cours de développement. On y trouvera également des démonstrations du modèle BIBFRAME réalisées à partir de notices MARC des institutions participant à l’expérimentation. […] Le site fournit en outre des services qui permettent à tout bibliothécaire curieux de voir à quoi pourront ressembler des ressources bibliographiques conformes au modèle BIBFRAME, de visionner des enregistrements MARC/XML provenant de la base principale de la Bibliothèque du Congrès, ainsi que des ressources BIBFRAME résultant des transformations les plus courantes. »
Extrait de l’annonce publiée par Kevin Ford (Library of Congress) dans la liste de discussion BIBFRAME le 27 janvier 2013.

(Prendre des vitamines avant consultation du site.)

Jack Ary. Les tomates (Mange des tomates) / Pierre Cour, paroles ; Barcellini, musique ; Jack Ary et son High Society Orchestra, ensemble instrumental et vocal.

S’informer et réagir :

Bibliothèque du Congrès, Washington DC (États-Unis), vers 1902. Source : Wikimedia Commons.

Un mot pour un autre. 2. Format de données / Code de catalogage

C’est étonnant comme cette confusion a la vie dure. Jusque dans les documents les plus érudits, les plus récents (et même, horresco referens,… enfin bref).

Donc.

Peut-on dire (par exemple) : « passer d’UNIMARC à RDA ? »

Non. Enfin on peut, mais ça n’a pas grand sens. Pas plus qu’autrefois « passer de l’ISBD à UNIMARC ».

RDA (code de catalogage), c’est une norme de contenu (comme par exemple nos normes françaises AFNOR Z44-050 et autres). Ça dit de quels éléments se compose l’information bibliographique, ça définit précisément les éléments en question, et les relations possibles entre eux. Ça donne aussi des règles, toujours par rapport au contenu (par exemple : comment faire un point d’accès identifiant une œuvre).

RDA se veut indépendant de tout format d’encodage des données, et même de tout format d’affichage. C’est dit expressément :

In order to optimize flexibility in the storage and display of the data produced using RDA, a clear line of separation has been established between the guidelines and instructions on recording data and those on the presentation of data.

RDA § 0.1

De manière à favoriser une souplesse de stockage et d’affichage des données produites en appliquant RDA, une ligne de séparation claire a été tracée entre les recommandations et les directives relatives à l’enregistrement des données et celles concernant leur présentation.

C’est à dire que des ensembles de données appliquant la norme RDA peuvent, pour leur stockage, leur diffusion, leur affichage ou tout autre besoin, être simplement saisies dans un traitement de texte (voire tapées à la machine à écrire, ou tracées à la plume de pintade), encodées simplement en HTML, ou dans un format structuré.

Par exemple (entre maintes possibilités) dans un format MARC.

Par exemple en UNIMARC (un format qui, plus encore que le MARC21, a fait des efforts de compatibilité avec RDA, selon tous les scénarios d’implémentation des FRBR, ce qui n’est pas le cas de MARC21).

On peut donc utiliser à la fois UNIMARC et RDA, ou UNIMARC et les REICAT (Regole Italiane di Catalogazione, code italien de catalogage appliquant les FRBR), ou UNIMARC et les AACR2, ou UNIMARC et les normes françaises actuelles, ou ne respecter aucune norme de contenu, mais le faire en UNIMARC, etc.

Une bonne maîtrise de l’UNIMARC (ce format-là précisément) est d’ailleurs, comme nous le verrons dans un prochain billet, une excellente préparation à la compréhension de l’ultra-structuration des données nécessaire à l’avènement du web sémantique.

Au fond, il faudrait réapprendre l’UNIMARC maintenant, avec sérieux.

Sozialistische Toiletten, Socialist toilets. Grenz Bahnhof - Border Crossing, Bahnhof Oebisfelde DDR, Apr 1990 Passer à RDA (en UNIMARC si on veut).
Sozialistische Toiletten, Socialist toilets. Grenz Bahnhof – Border Crossing, Bahnhof Oebisfelde DDR, Apr 1990, par sludgegulper sur Flickr.

Chais pas quoi faire !

Extrait de Pierrot le fou / Jean-Luc Godard, réalisateur. France, 1965.

Qu’est-ce que j’peux faire !
Chais pas quoi faire !
Qu’est-ce que j’peux faire !
Chais pas quoi faire !
Qu’est-ce que j’peux faire !
Chais pas quoi faire !

T’es pas la seule si ça peut te consoler.

Parce qu’à la lecture des interviews de fournisseurs de systèmes pour bibliothèques (Innovative, VTLS, BiblioMondo, Ex Libris, SirsiDynix etc.) ou de métadonnées (SkyRiver, OCLC) qui ont été publiées tout au long de l’été sur le blog du RDA Toolkit, on ne sent pas un mouvement franc, massif et enthousiaste, ni vers une FRBRisation effective des données, ni vers des solutions alternatives à MARC.

Savent pas trop quoi faire.

Les vendeurs considèrent globalement que MARC reste — et restera encore assez longtemps — un socle solide pour les catalogues de bibliothèques ; et que les données existantes, dont la masse est considérable, ne migreront vers d’autres formats que si le rapport coût / bénéfice penche clairement en faveur de ce dernier. Dans la plupart des systèmes les nouvelles zones définies en MARC21 pour RDA ont été déclarées, mais rarement avec les mécanismes de liens entre notices qui font l’intérêt des FRBR. 

Dans leur majorité, les fournisseurs interrogés semblent assez peu disposés à s’aventurer hors du rassurant format MARC, quittes à se contenter d’une FRBRisation générée par algorithmes à partir de données classiques.

Perplexité, attentisme. Savent pas quoi faire.

No future for MARC?

  • 1er juin 2011

L’annonce faite la semaine dernière par la bibliothèque du Congrès (lancement d’une étude et d’une consultation sur le cadre général de ses formats bibliographiques, avec en point de mire les formats du web et le probable abandon à terme de MARC21) a été amplement relayée sur le web. On peut en lire des extraits traduits dans le Fil Abes du 27 mai dernier.

Cette annonce intervient peu de temps avant que les trois bibliothèques nationales américaines (LC, NLA et NLM) ne révèlent leur décision quant à RDA — même s’il n’y a paraît-il aucun lien entre les deux événements.

Sally McCallum, responsable du Network Development and MARC Standards Office, et Deanna B. Marcum, responsable de l’étude Bibliographic Framework Transition Initiative donnent quelques renseignements supplémentaires dans un récent entretien avec Michael Kelley publié le 26 mai dans LibraryJournal. com (Library of Congress May Begin Transitioning Away from MARC).

En quelques mots :

  • Cette étude est une priorité haute pour la LC
  • MARC a rendu de bons et loyaux services, mais « il incombe à la communauté de se familiariser avec d’autres structures de données telles que XML ou RDF »
  • La transition se fera en douceur ; l’espérance de vie de MARC est estimée à environ 10 ans.

Bien sûr on y met les formes : officiellement il est question de voir dans quelles conditions MARC21 peut faire face aux nouveaux défis. Vu la manière dont la question est posée, la réponse s’impose d’elle-même.

Corollaire : il y a lieu de s’interroger dans les mêmes termes sur le devenir d’UNIMARC.

Mort à la norme Photo Jean-Philippe Aynié