Archives du blog

Souvenir de Lisbonne

  • 1er avril 2017

En plus il a fait moche.

En plus de quoi ?

Lisbonne, le Tage, 23 mars 2017.
Le Tage à Lisbonne, mars 2017. Photo Ph. Le Pape.

Depuis le temps qu’il se dit que les formats Marc ont déjà un pied dans la tombe et que si une bonne âme se dévouait pour crocheter l’autre ce serait un service à rendre à l’humanité, sans qu’apparaisse jamais dans les pages nécrologiques d’aucune gazette au monde aucun faire-part, sur aucun membre de la famille, l’annonce en 2011 par la Bibliothèque du Congrès du lancement d’une étude (qui allait se concrétiser dans le projet Bibframe) et, par la même occasion, celle de l’abandon du format Marc21 dans un délai de 10 ans, avait arraché au peuple un soupir d’aise collectif (et provoqué un excès temporaire de gaz carbonique dans la stratosphère).

Cette annonce ayant été faite en juin 2011, il resterait environ 4 ans à attendre.

Il ne s’agit que de la Bibliothèque du Congrès et du format Marc21, mais enfin ce n’était pas une bonne nouvelle pour la famille Marc.

Nous voici au printemps 2017 : non seulement les formats Marc ne donnent aucun signe de faiblesse, mais ils continuent à se développer. Paradoxalement la publication et le succès grandissant de RDA leur procurent une vitalité nouvelle.

RDA et Marc21

RDA, attendu comme un standard en rupture avec ceux d’avant (d’avant le modèle FRBR, s’entend), en est en réalité très proche. Il n’est aucune notion du RDA actuel qui ne puisse être prise en change par un format Marc. Les choses changeront peut-être lorsque la révision majeure qui a lieu cette année sera achevée. Il s’agit en effet d’intégrer dans RDA les principes du modèle LRM, successeur de FRBR, FRAD et FRSAD, en lieu et place des principes issus de ces derniers.

Quoi qu’il en soit les bibliothèques utilisent encore massivement les formats Marc, qu’il faut donc mettre à jour pour les adapter à RDA. Marc21 a connu depuis 2010 — et connaît encore — de nombreuses évolutions : création de nouvelles zones, de listes contrôlées de termes et/ou de codes etc.

Unimarc et FRBR

Les utilisateurs de l’Unimarc, généralement tournés vers les standards publiés par l’IFLA (ISBD et règles associées) plutôt que vers ceux issus du monde anglo-saxon, ne se sont guère souciés de ces agitations. Sauf le CfU (Comité français de l’Unimarc, désormais rattaché au programme national Transition bibliographique).

Dès 2010 le CfU a élaboré un nombre considérable de propositions de création de nouvelles zones destinées à « traduire » le modèle FRBR en Unimarc, en donnant au format des notices bibliographiques et surtout à celui des autorités les moyens de rendre compte des entités Œuvre et Expression et de toutes les relations associées, y compris celles avec les autres entités du modèle. Ces propositions, acceptées par le PUC (Permanent Unimarc Committee, l’instance internationale qui administre l’Unimarc), font désormais partie du format.

Le CfU a eu plus de difficulté à faire accepter la création de nouvelles zones (181 et 182) pour les notions de Type de contenu et Type de médiation, pourtant présentes dans l’ISBD consolidé autant que dans RDA, et davantage encore pour le Type de support (183), complément des deux premiers mais présent seulement dans RDA.

RDA et Unimarc

Cette année il s’agissait de faire valider la création de deux nouvelles zones, à l’occasion de la publication des règles de RDA-FR portant d’une part sur les éléments qui, ensemble, se substituent à la zone de l’adresse de l’ISBD (Mention de production, Mention de publication, Mention de distribution, Mention de fabrication et Date de copyright), et d’autre part sur les Caractéristiques du fichier numérique.

Ces éléments ne trouvent pas leur place dans les zones existantes (210 pour la zone de l’adresse, 230 pour la zone 3 spécifique aux ressources électroniques, d’ailleurs rendue obsolète dans l’ISBD consolidé). Le CfU a donc proposé une zone 214 pour les éléments de l’ex-zone de l’adresse, 231 pour ce qui concerne les fichiers numériques. L’une et l’autre étaient largement calquées sur les zones correspondantes créées en Marc21 pour les mêmes besoins (la 214 sur la 264 Marc21, la 231 sur la 347 Marc21)

La réunion annuelle du PUC qui devait décider de leur sort s’est tenue la semaine dernière à Lisbonne, à la jolie Biblioteca nacional de Portugal, rose et modeste, malheureusement survolée en rase-mottes par les avions qui vont atterrir sur les pistes toutes proches de l’aéroport. Bonne cantine (bien meilleure que celle de la BNF).

La zone 231 a été validée, moyennant quelques retouches.

Le projet de zone 214 en revanche, qui pourtant avait été transmis aux membres du PUC en juin 2016 accompagné d’un appel à commentaires (qui ne sont jamais venus), a fait d’emblée l’objet d’un tir de barrage de la part des représentants italien et portugais, soutenus par la Slovénie. Tous préconisaient l’aménagement de la zone 210. Représentant le CfU, j’ai eu beau leur remontrer que c’était impossible, que j’avais commencé par envisager moi-même cette possibilité avant de reconnaître qu’elle ne fonctionnait pas et que force était, comme cela avait été fait en Marc21, de recourir à une nouvelle zone, rien n’y a fait. Le débat s’est conclu sur un vote. Nous n’étions que 6 pays ou organismes représentés (manquaient la Chine, la Lituanie et le CIEPS). Résultat : 3 pour (France, OCLC, Russie), 3 contre (Italie, Portugal, Slovénie). La décision a été prise de rédiger un projet d’aménagement de la 210 et de statuer sur cette 210 remaniée à la prochaine réunion. Dans un an.

Or nous avons déjà défini la zone 214 dans le Sudoc (sous l’étiquette provisoire de 219). Elle entre en application le 18 avril.

Comment faire à l’avenir ?

Je ne sais pas.

Soit on attend, avant de pratiquer dans le Sudoc toute évolution de format nécessitée par l’application de RDA-FR — mais l’attente peut être longue et la décision finale est imprévisible. Le PUC examinait encore cette année des propositions datées de 2008 et de 2010 : l’une a été définitivement validée, l’autre définitivement rejetée.

Soit on fait ce qu’il y a à faire dans le format de catalogage, quitte à ce que celui-ci s’éloigne du format de diffusion.

Autre option : les évolutions indispensables, lorsqu’elles sont refusées par le PUC ou que la décision prend trop de temps, sont validées au niveau national pour l’échange entre institutions françaises.

À voir.

………

Salvador Sobral. Nem eu / Dorival Caymmi, paroles et musique.
Salvador Sobral, chant ; Júlio Resende, piano.
Vidéo : prod. Edições Valentim de Carvalho S.A., 2016.

Publicités

Un atelier pour propulser l’Unimarc dans le Web sémantique

En direction de l’Atlantique, espérons-le.

  • 24 mars 2016

Unleashing UNIMARC to the Semantic Web: UNIMARC in RDF

L’atelier, organisé par la Biblioteca Nacional de Portugal en liaison avec le PUC (Permanent Unimarc Committee), aura lieu à Lisbonne le 6 avril prochain (14h30 – 16h30 | Auditório [auditorium] BNP | Entrée libre).

Il est cornaqué par Gordon Dunsire (tiens) et Mirna Willer, professeur à l’Université de Zadar (Croatie), Département des sciences de l’information.

Voici une traduction rapide de la présentation de l’atelier sur le site qui lui est consacré :

« L’atelier s’ouvrira sur une introduction au concept de données liées (« linked data ») et au standard RDF (Resource Description Framework) du W3C qui constitue la technologie sous-jacente du Web sémantique ou du Web de Données. Suivra une illustration d’une méthodologie de représentation des standards en RDF prenant comme exemple le format UNIMARC bibliographique, à partir d’un travail co-financé par le PUC proprement dit et par l’IFLA entre 2013 et 2015. La première partie de l’atelier se conclura sur une présentation du CMS (Content management system, c’est à dire Système de gestion de contenu) utilisé pour publier les vocabulaires Unimarc de données liées dans l’OMR (Open Metadata Registry, Registre de métadonnées ouvert). »

« Dans la deuxième partie de l’atelier on verra des exemples de données liées utilisant les vocabulaires Unimarc, illustrant les problèmes spécifiques posés par les données codées de longueur fixe et les questions posées par la publication de données liées issues de systèmes bibliographiques en Unimarc. »

« La troisième partie de l’atelier sera consacrée aux travaux de recherche en cours et aux projets : 1 – la réduction des écarts entre étiquettes et sous-zones ; les problèmes spécifiques posés par les sous-zones répétables, l’ordre des éléments, les éléments de données parallèles ; le profil d’application. 2 – la représentation en RDF des autorités Unimarc. 3 – l’alignement sémantique de l’Unimarc avec l’ISBD. 4 – BIBFRAME (MARC21 en RDF) et Unimarc : différences d’approche dans la représentation du stockage de données et des formats d’échange. »

Un prétexte acceptable pour voir, ou revoir, Lisbonne.

………

Senhora do Tejo. OqueStrada, groupe vocal et instrumental ; José Luís Gordo, paroles ; José Fontes Rocha, musique.
Vidéo : Marta Miranda, réalisation. Sony Music, 2011.

RDA, le code de catalogage qui fait grossir

  • 16 juin 2014

Lucques Photo Philippe Le Pape

Il importe absolument de faire la différence entre des métadonnées RDA produites en format Marc et d’autres, qui pourraient être produites elles aussi en appliquant RDA, mais selon des modalités plus modernes, directement destinées à une exploitation dans le L.O.D. par exemple, et sans aucune référence au dispositif longuement éprouvé des catalogues informatisés des dernières décennies du XXe siècle. De telles métadonnées existeront peut-être un jour.

Les métadonnées RDA produites en Marc sont des notices Marc. Elles peuvent, ou non, tirer avantage des facilités de mise en relation des notices Marc entre elles proposées par des formats comme Marc 21, ou plus encore Unimarc.

Les formats Marc et le modèle FRBR

Le format Marc 21, qui reste celui dans lequel produisent les grands établissements bibliographes dans lesquels le code RDA est pratiqué depuis 2013, a connu quelques mises à jour qui reflètent non une remodélisation en faveur des FRBR, mais le passage d’AACR2 à RDA. Des zones, sous-zones, codes etc. supplémentaires ont été définis dans les formats des notices bibliographiques et d’autorité pour des éléments de RDA sans correspondance dans les AACR (voir RDA in MARC).

Quid des entités FRBR du groupe 1 les plus novatrices (œuvre & expression), et des relations qui en partent ou y aboutissent ? D’après les exemples de notices Marc 21 auxquelles on peut accéder depuis le RDA Toolkit [.pdf] on comprend que ces deux entités peuvent être l’une et l’autre exprimées en tant qu’autorités titre, ou nom-titre. Cependant, il n’y a aucun moyen de déclarer une autorité comme décrivant soit une œuvre soit une expression. Rien. Pas le moindre code quelque part, dans le label ou ailleurs. Les étiquettes et les intitulés des zones n’ont même pas été modifiées pour refléter la terminologie FRBR en vigueur dans RDA : c’est toujours « 130 – Main Entry – Uniform Title » pour les œuvres sans créateur associé ou leurs expressions ; « 100 – Heading-Personal Name », « 110 – Heading-Corporate Name » pour celles avec créateur associé, et ça sert indifféremment pour les œuvres et pour les expressions.

La structure des points d’accès, notamment celle des points d’accès autorisés, n’a pas bougé. C’est-à-dire que les points d’accès autorisés de ces notices — qui en application de RDA doivent suffire à identifier une œuvre ou une expression selon le cas — sont identiques aux titres uniformes d’avant le modèle FRBR.

Aucune instruction pour l’enregistrement des relations suivantes : œuvre ↔ expression (a pour expression / est une expression de) ; créateur ↔ œuvre (en particulier en cas de créateurs multiples) ; contributeur ↔ expression ; sujet ↔ œuvre.

Dans le format Marc21 bibliographique, les zones qui permettent d’établir un point d’accès autorisé identifiant l’ « œuvre manifestée » et l’ « expression manifestée », en faisant éventuellement un lien vers les autorités correspondantes, n’ont pas été modifiées elles non plus : ce sont celles des titres uniformes d’autrefois. Comme dans le format des autorités, il n’y a pas de différence d’étiquette selon que le point d’accès identifie une œuvre ou une expression. Ni d’indicateur qui pourrait tenir ce rôle. Et pourtant selon RDA l’ « œuvre manifestée » et l’ « expression manifestée » sont deux relations distinctes. À l’évidence, on considère que « qui fait le plus fait le moins », c’est-à-dire qu’un titre uniforme « d’expression » identifie aussi l’œuvre. Seulement si la zone ad hoc tient aussi lieu de lien vers une notice d’autorité, quel identifiant y met-on : celui de l’expression, ou celui de l’œuvre ?

Les choses sont plus claires en Unimarc. Les entités œuvre et expression, traitées comme en Marc 21 dans le format des autorités, sont clairement distinguées l’une de l’autre. Un code dans une zone spécifique (154) permet de déclarer une autorité comme décrivant soit une œuvre soit une expression. Par ailleurs des zones nouvelles ont été définies pour ce qu’on pourrait appeler des titres uniformes FRBRisés, et les étiquettes sont différentes pour les œuvres et pour les expressions. Ces distinctions se retrouvent dans le format bibliographique : un « titre uniforme d’expression » n’a pas la même étiquette qu’un « titre uniforme d’œuvre ».

Toutes les relations entre entités ont été ajustées selon le modèle FRBR, et dûment identifiées. Dans le format des autorités : œuvre ↔ expression (a pour expression / est une expression de) ; créateur ↔ œuvre (en particulier en cas de créateurs multiples) ; contributeur ↔ expression ; sujet ↔ œuvre. Dans le format bibliographique : lien vers l’œuvre et lien vers l’expression, comme indiqué plus haut.

RDA en Marc dans la pratique

C’est à dire qu’on serait vraiment beaucoup mieux armé pour appliquer un RDA « FRBRisé » en Unimarc qu’en Marc 21 (or c’est sur la base du Marc 21 qu’est conçu Bibframe, rappelons-le au passage).

Seulement la LC, la British Library, la NLA (National Library of Australia), la BAC (Bibliothèque et Archives Canada) etc. utilisent le Marc 21.

Qu plus est, dans la pratique actuelle de la LC et des autres il n’y a pas d’identification systématique de l’ « œuvre manifestée » dans les notices bibliographiques. Apparemment lorsque le titre propre de la publication décrite suffit à identifier l’œuvre, ou les œuvres contenue(s), on s’en tient là. Encore moins d’identification de l’expression dans ce cas, bien entendu. C’est le chapitre 17 de RDA qui traite des « relations fondamentales » du modèle FRBR (c’est à dire les relations entre les entités du groupe 1, œuvre, expression, manifestation, item). Ceci est le profil d’application de la LC pour ce chapitre (copie d’écran du RDA Toolkit) :

RDA-LCPCC-ch17

« Do not apply chapter 17 in the current implementation scenario. » « N’appliquez pas le chapitre 17 dans le scénario d’implémentation actuel. » C’est réaffirmé sur la même page pour les parties « œuvre manifestée » et « expression manifestée ». Voilà. Comme ça, si on avait encore un doute sur la FRBRisation du catalogue de la LC (et des bibliothèques participant au PCC, c’est à dire le Program for Cooperative Cataloging), on n’en a plus. Voir la page du profil d’application de RDA (« Policy statements ») LC-PCC sur le site de la LC.

Voyons la NLA :

RDA-NLA-ch17

« There are no policy statements for this chapter. »  Ça alors, qu’est-ce qu’on fait si on travaille dans cette bibliothèque-là ?

La British Library n’a pas de profil d’application dans le RDA Toolkit, mais elle y a publié des « flux de travail ». On lit ce qui suit dans celui élaboré pour les « monographies » :

General Guidelines for Choosing the Preferred Title (6.2.2.3)
The preferred title for a work is a core element of the description. It is the title chosen as the basis for the authorised access point representing the work. This may simply consist of the title proper recorded in the 245 subfield $a if the title is unique and there is no person, family or corporate body responsible for creating the work. If that title is not unique, additional identifying elements must be included in a new preferred title recorded in field 130, or in the 240 in combination with a 100 or 110 field.

The preferred title is also used to refer to a related work or expression, for example, as the stem of an authorised access point given in the $t of fields 700-711 or $a of field 730.
British Library. Monograph Workflow (Last updated 05.06.14, Aligned with RDA Update April 2014)

Il y est clairement indiqué :

  • que dans certains cas le titre propre (245$a en Marc 21) suffit à identifier une œuvre dans la notice bibliographique, mais les critères sont assez restrictifs, et les directives précises quant à la rédaction d’une entrée au titre privilégié de l’œuvre.
  • que « le titre privilégié est également utilisé pour faire référence à une œuvre ou une expression en relation [avec la ressource décrite], par exemple en formant la racine d’un point d’accès privilégié donné dans les $t des zones [Marc 21] 700-711 [c’est à dire : la sous-zone permettant d’encoder un titre dans des entrées supplémentaires nom-titre] ou $a d’une 730 [idem, pour une entrée titre]. »

Il en résulte que cette notice RDA que j’ai montrée aux Journées Abes 2014 (je l’avais faite moi-même) :

Notice Alice 1

n’est pas juste. Si elle avait été obtenue par conversion du Marc 21, les « titres d’œuvre » auraient été étiquetés 500 (Titre uniforme) en Unimarc, et non 577 (Identification d’une expression), et ces 500 n’auraient pas été liées à l’autorité correspondante, il aurait fallu le faire à la main :

Notice Alice 2

Si elle avait été produite directement en Unimarc, et en respectant les conventions de ce format pour des données complètement FRBRisées il aurait fallu des zones 577 identifiant chacune des deux expressions contenues, et éventuellement des 576 identifiant les œuvres correspondantes.

Qu’appelle-t-on relation dans RDA ?

Les quatre premières sections de RDA sont consacrées aux entités FRBR, les six dernières aux relations entre ces entités. Mais qu’appelle-t-on au juste relation dans RDA ?

RDA sert clairement à décrire des publications (FRBR : manifestations). Si on travaille en Marc, on peut le reformuler ainsi : RDA sert à faire des notices bibliographiques.

Cependant RDA exige que toute notice bibliographique fasse état de certaines des relations qui existent entre la ressource décrite et d’autres entités du modèle FRBR. Par exemple entre la publication et son éditeur. Entre la publication et l’œuvre, ou les œuvres, qu’elle contient — à moins que celles-ci soient en trop grand nombre — de même qu’avec leurs créateurs s’ils sont connus.

Il n’est pas obligatoire pour cela de mettre la notice bibliographique formellement en relation avec d’autres notices (par exemple : celle(s) décrivant l’œuvre, ou les œuvres, contenue(s), ou leurs expressions respectives ; les notices d’autorité établies pour les créateurs de l’œuvre, ou des œuvres, contenue(s) ; celle établie pour la maison d’édition). RDA ne fait pas d’obligation de ce genre, tout simplement parce que techniquement ce n’est pas possible dans bien des systèmes informatiques.

Ce qui est désigné par le terme de relation dans RDA, c’est simplement la mention que l’entité décrite est en relation avec d’autres. Cette mention peut prendre différentes formes, au choix :

  1. le type de la relation + un identifiant de l’entité liée (équivalent Unimarc : les zones de lien des blocs 5XX, 6XX, 7XX avec $3, celles des 4XX avec $0)
  2. le type de la relation, + un point d’accès autorisé identifiant l’entité liée (équivalent Unimarc : les zones de lien des blocs 5XX, 6XX, 7XX sans $3, celles des 4XX sans $0)
  3. une mention textuelle, par exemple une note, identifiant à la fois l’entité liée et le type de relation

Une zone Unimarc 210 telle que :

210 ## $a Paris $c Grund $d [etc.]

suffit à exprimer la relation à l’éditeur (210$c signifie « est l’éditeur de la ressource »).

De même, une note textuelle (Unimarc 3XX) telle que :

304 ## $a Traduit de : Alices’s adventures in Wonderland

suffit à rendre compte à la fois de la relation à l’œuvre contenue et de celle à l’expression originale ; RDA n’en exige pas davantage (mais ne l’interdit pas non plus, bien entendu). En toute orthodoxie vis-à-vis des FRBR, il s’agit là d’une relation entre deux expressions (la traduction française réalisée par André Bay de Alices’s adventures in Wonderland et le texte original anglais de Lewis Carroll). Mais vu qu’Alice’s adventures in Wonderland est aussi le titre par lequel l’œuvre est identifiée, on peut à la rigueur convenir que cette même note fait aussi référence à l’« œuvre manifestée » (ce qui est en principe obligatoire).

Dalí. Todas las sugestiones poéticas y todas las posibilidades plásticas, par Museo Reina Sofía sur Flickr (CC BY-NC-ND 2.0) Dalí. Todas las sugestiones poéticas y todas las posibilidades plásticas, par Museo Reina Sofía sur Flickr (CC BY-NC-ND 2.0)

La différence avec le catalogage « à l’ancienne » ? Eh bien… Hum… Mettons qu’il réside dans le fait que « le catalogueur » est dorénavant conscient que par cette 210 et par cette note 304 il fait œuvre FRBRisatrice. Que sa 210 n’est pas une simple zone de l’adresse bibliographique, mais l’enregistrement de la relation manifestation → éditeur. Qu’il n’a pas simplement transcrit en note le titre original trouvé sur l’ouvrage comme le lui demande sa norme, mais qu’il a mis en évidence une relation entre le livre qu’il décrit et une des « œuvres » qu’elle contient.

Voilà.

Un pâté de FRBR

Les bibliothèques appliquant actuellement RDA (en format Marc donc) se contentent généralement d’enregistrer les relations selon les formes 2 et 3 de la liste ci-dessus (c’est à dire sans faire de lien entre notices). La structure de la notice traditionnelle n’a pas été bouleversée, en dépit de quelques modifications, la plus spectaculaire étant le remplacement de l’indication générale du type de document par un ensemble de trois éléments distincts :

  • RDA 6.9 Type de contenu (Marc 21 336, Unimarc 181)
  • RDA 3.2 Type de média (Marc 21 337, Unimarc 182)
  • RDA 3.3 Type de support matériel (Marc 21 338, Unimarc 183)

(voir La zone 0).

Une notice bibliographique Marc se suffit à elle-même, en RDA comme en AACR2. Tel est le principe qui semble prévaloir dans le monde anglo-saxon, et singulièrement à la Bibliothèque du Congrès. La notice bibliographique Marc contient tout :

  • l’identification de la manifestation (elle est faite pour cela)
  • l’identification de l’œuvre, ou des œuvres, contenue(s)
  • l’identification de leurs expressions s’il y a lieu
  • la mention, sous forme textuelle ou sous forme de points d’accès normalisés, des relations de la manifestation et/ou de l’expression et/ou de l’œuvre aux entités de type personne, collectivité ou famille.

Tout cela se trouve réuni au sein d’une même notice bibliographique RDA en Marc. Il arrive même qu’une zone Marc réunisse des attributs de plusieurs entités FRBR. Ainsi par exemple de la zone de la description physique (Unimarc 215, Marc 21 300) :

215 ## $a 479 pages $c illustrations, en couleurs $d 31 cm (Unimarc)
300 ## $a 479 pages :$b illustrations, en couleurs ;$c 31 cm (Marc 21)

où $a (Unimarc et Marc 21) correspond à l’élément Importance matérielle (attribut de la manifestation), $c (Unimarc) / $b (Marc 21) à des attributs de l’expression (en l’occurrence RDA 7.15 Contenu illustratif et RDA 7.17 Contenu de couleur), et $d (Unimarc) / $c (Marc 21) à l’élément Dimensions, autre attribut de la manifestation.

Les couleurs utilisées dans les notices présentées aux Journées Abes 2014 (voir la diapo ci-dessus) indiquent à quelle entité FRBR, telle qu’elle est traitée dans le code RDA, renvoie chacun des éléments constitutifs de la notice. Noir : manifestation. Bleu : expression. Rouge : œuvre.

On le voit d’une manière flagrante, RDA en format Marc c’est un pâté de FRBR : œuvres, expressions, manifestations etc. hachées, mélangées, mises en terrine.

Une fois qu’on l’a devant soi ce pâté, comment y résister ? La tentation est trop forte. Du pain, un joli vin rouge pour accompagner, quelques radis qu’on a toujours sur soi, des olives. Un pélardon, un Paris-Brest, un café.

Notice suivante. Plus de Paris-Brest c’est vrai ? Y a des mille-feuilles je crois. De toute façon y a le far aux pruneaux en cas de lacune. Côté fromage c’est bon ? Le vin si, j’ai vérifié en arrivant ce matin. Y a du blanc aussi, du muscadet. Oui je sais mais bon. Houlà c’est quoi ce truc encore.

Img0133, par Luca Cerabona (« ckOrange ») sur Flickr (CC BY-NC-ND 2.0) Img0133, par Luca Cerabona (« ckOrange ») sur Flickr (CC BY-NC-ND 2.0)

Un mot pour un autre. 2. Format de données / Code de catalogage

C’est étonnant comme cette confusion a la vie dure. Jusque dans les documents les plus érudits, les plus récents (et même, horresco referens,… enfin bref).

Donc.

Peut-on dire (par exemple) : « passer d’UNIMARC à RDA ? »

Non. Enfin on peut, mais ça n’a pas grand sens. Pas plus qu’autrefois « passer de l’ISBD à UNIMARC ».

RDA (code de catalogage), c’est une norme de contenu (comme par exemple nos normes françaises AFNOR Z44-050 et autres). Ça dit de quels éléments se compose l’information bibliographique, ça définit précisément les éléments en question, et les relations possibles entre eux. Ça donne aussi des règles, toujours par rapport au contenu (par exemple : comment faire un point d’accès identifiant une œuvre).

RDA se veut indépendant de tout format d’encodage des données, et même de tout format d’affichage. C’est dit expressément :

In order to optimize flexibility in the storage and display of the data produced using RDA, a clear line of separation has been established between the guidelines and instructions on recording data and those on the presentation of data.

RDA § 0.1

De manière à favoriser une souplesse de stockage et d’affichage des données produites en appliquant RDA, une ligne de séparation claire a été tracée entre les recommandations et les directives relatives à l’enregistrement des données et celles concernant leur présentation.

C’est à dire que des ensembles de données appliquant la norme RDA peuvent, pour leur stockage, leur diffusion, leur affichage ou tout autre besoin, être simplement saisies dans un traitement de texte (voire tapées à la machine à écrire, ou tracées à la plume de pintade), encodées simplement en HTML, ou dans un format structuré.

Par exemple (entre maintes possibilités) dans un format MARC.

Par exemple en UNIMARC (un format qui, plus encore que le MARC21, a fait des efforts de compatibilité avec RDA, selon tous les scénarios d’implémentation des FRBR, ce qui n’est pas le cas de MARC21).

On peut donc utiliser à la fois UNIMARC et RDA, ou UNIMARC et les REICAT (Regole Italiane di Catalogazione, code italien de catalogage appliquant les FRBR), ou UNIMARC et les AACR2, ou UNIMARC et les normes françaises actuelles, ou ne respecter aucune norme de contenu, mais le faire en UNIMARC, etc.

Une bonne maîtrise de l’UNIMARC (ce format-là précisément) est d’ailleurs, comme nous le verrons dans un prochain billet, une excellente préparation à la compréhension de l’ultra-structuration des données nécessaire à l’avènement du web sémantique.

Au fond, il faudrait réapprendre l’UNIMARC maintenant, avec sérieux.

Sozialistische Toiletten, Socialist toilets. Grenz Bahnhof - Border Crossing, Bahnhof Oebisfelde DDR, Apr 1990 Passer à RDA (en UNIMARC si on veut).
Sozialistische Toiletten, Socialist toilets. Grenz Bahnhof – Border Crossing, Bahnhof Oebisfelde DDR, Apr 1990, par sludgegulper sur Flickr.

L’été 11

Près de moi cette plage comble, cette révolution solaire dans le cercle du soleil.
Marguerite Duras (1914-1996). L’été 80 (1980).

Qu’est-ce qui se passe ?

On prépare l’avenir.

RDA en France (comité stratégique, groupe technique)

Comme on sait, le comité stratégique français sur RDA a estimé que les bibliothèques françaises ne pouvait pas appliquer RDA en l’état, mais qu’elles le feraient, un jour. Les bibliothèques nationales américaines sont arrivées à la même conclusion. Elles ont assorti leur décision de la liste assez précise des points à revoir, et d’un calendrier prévisionnel de révision, point par point : 18 mois tout compris. De sorte qu’au 1er janvier 2013, à condition que les révisions prescrites aient été menées à bien, RDA pourrait être applicable en Amérique.

Contrairement aux bibliothèques américaines, le comité français n’est pas entré dans le détail d’un calendrier, c’était pour lui une impossibilité vu qu’il doit tenir compte des faits et gestes des véritables protagonistes. La 2e réunion dudit comité est programmée pour le 16 novembre prochain (sainte Marguerite).

Le groupe technique « RDA en France » travaille dorénavant en sous-groupes, certains ayant déjà fonctionné pendant environ 2 mois :

  • Description des Manifestations (i.e. mise à jour des normes françaises de description, à partir de l’ISBD intégré et de RDA)
  • Formation
  • Modèle de données et évolution des SID (chargé notamment des réunions avec les éditeurs de systèmes)

d’autres commençant en septembre :

  • FRBRisation
  • Notices d’autorité pour les Collectivés et les Lieux
  • Notices d’autorité pour les Œuvres
  • Notices d’autorité pour les Personnes et les Familles

Le sous-groupe FRBRisation est chargé de définir les contours des entités FRBR du groupe 1, pour l’usage français. C’est un point important, car la BnF et l’ABES doivent dès que possible expérimenter la FRBRisation de leurs catalogues respectifs, selon le scénario 1 d’implémentation de RDA / FRBR.

(Soit dit en passant ces groupes de travail sont ouverts : à bon entendeur…)

Voir : Groupe technique sur l’adoption de RDA en France

Comité français UNIMARC

Le plan de travail est établi. Il consiste essentiellement à passer les données codées aux cribles des FRBR et de RDA : une tâche périlleuse, acrobatique et forcément angoissante. Forcément. Le CfU espére pouvoir présenter ses propositions à la prochaine réunion régulière du PUC (Permanent UNIMARC Committee), en mars 2012.

UNIMARC sera alors le plus beau format du monde. Une merveille. Lorsqu’il mourra, ce sera dans la gloire de sa dernière splendeur.

Bologne (Italie), juillet 2011. Vitrine d'une librairie Des livres pour l’été.

À l’étranger

On suivra attentivement les annonces, les communications, les débats qui se produiront dans le cadre du prochain congrès de l’IFLA — à Puerto Rico, au bord de l’eau.

Et bon été !

2e réunion avec les éditeurs de systèmes informatisés

Mercredi 8 juin, à la bibliothèque Buffon à Paris (de l’autre côté de la rue : le Museum, ses squelettes) avait lieu la 2e réunion GE6/CfU/FULBI avec les éditeurs de systèmes informatisés. La première s’était tenue le 25 novembre 2010, un jeudi.

Tu ne sais pas ce que c’est, le GE6, le CfU, le FULBI ? GE6, c’est le groupe d’experts qui fait évoluer les règles de catalogage dans le cadre de l’AFNOR, et qui s’est provisoirement transformé en groupe technique « RDA en France » ; le CfU, c’est le Comité français UNIMARC, et la FULBI la Fédération des utilisateurs de logiciels pour bibliothèques, documentation & information.

Au programme :

  • point sur le processus de choix d’un nouveau code de catalogage (Françoise Leresche, GE6)
  • impacts sur les formats UNIMARC (Philippe Le Pape, CfU)
  • présentation d’un projet enquête sur les pratiques de récupération de données bibliographiques par les bibliothèques et sur les utilisations qui en sont faites (Philippe Bourdenet, FULBI)
  • questions / réponses

La plupart des fournisseurs opérant sur le marché français, grands et petits, était venue.

Françoise Leresche a essentiellement rappelé que le comité stratégique considère indispensable la FRBRisation des catalogues, et ceci en privilégiant le « scénario 1 » (voir ici pour la version complète et officielle, ou les trois diapos citées plus bas) ; que RDA, vers lequel il faut aller, n’est pas applicable en France en l’état, et qu’il faut mettre à jour nos normes en les modelant sur les FRBR et FRAD tout en les rendant compatibles avec RDA pour le jour où.

RDA / FRBR -- Scénario 1 
RDA / FRBR -- Scénario 2 RDA / FRBR -- Scénario 3

Les adaptations nécessaires — du moins les plus importantes — ont été pratiquées dans le format UNIMARC : voir la présentation FRBR en UNIMARC. Celles restant à élaborer (avant-dernière diapo de la présentation) sont au programme de travail du CfU, qui vise une validation pour mars 2012. Cela malgré le déclin annoncé des formats MARC, car à l’évidence le besoin de formats d’échange traditionnels perdurera pendant une bonne dizaine d’années (davantage selon certains éditeurs).

La dernière intervention, par Philippe Bourdenet, présentait un projet d’enquête, une esquisse déjà assez détaillée, qui sera proposée aux bibliothèques à la rentrée. On en reparlera certainement ici.

Les questions des éditeurs, de manière assez inattendue, ont beaucoup porté sur la formation à des pré-requis qui restent à définir (c’est le travail d’un sous-groupe ad hoc du GE6, qui se réunissait l’après-midi même). Autre sujet de préoccupation : celui des calendriers. Quand la BnF proposera-t-elle des données FRBRisées ? (Beaucoup moins de curiosité vis-à-vis de l’ABES, peut-être parce que le réseau de l’enseignement supérieur est perçu comme très structuré grâce au Sudoc ?) Et dans quel(s) format(s), selon quelles spécifications ? C’est comme s’il était impossible, ou aventureux, de développer quoi que ce soit avant de le savoir précisément, malgré l’affirmation réitérée que les échanges de données FRBRisées auraient lieu en UNIMARC, outre d’éventuels autres formats de mise à disposition ou d’exposition sur le web. On sent le désir de proposer des produits adaptés aux nouveaux besoins, et la crainte du risque mal évalué. La période est mauvaise, comme on sait.

Qui vivra verra.

Au Museum d'histoire naturelle, Paris Photo Gilles Couteau

No future for MARC?

  • 1er juin 2011

L’annonce faite la semaine dernière par la bibliothèque du Congrès (lancement d’une étude et d’une consultation sur le cadre général de ses formats bibliographiques, avec en point de mire les formats du web et le probable abandon à terme de MARC21) a été amplement relayée sur le web. On peut en lire des extraits traduits dans le Fil Abes du 27 mai dernier.

Cette annonce intervient peu de temps avant que les trois bibliothèques nationales américaines (LC, NLA et NLM) ne révèlent leur décision quant à RDA — même s’il n’y a paraît-il aucun lien entre les deux événements.

Sally McCallum, responsable du Network Development and MARC Standards Office, et Deanna B. Marcum, responsable de l’étude Bibliographic Framework Transition Initiative donnent quelques renseignements supplémentaires dans un récent entretien avec Michael Kelley publié le 26 mai dans LibraryJournal. com (Library of Congress May Begin Transitioning Away from MARC).

En quelques mots :

  • Cette étude est une priorité haute pour la LC
  • MARC a rendu de bons et loyaux services, mais « il incombe à la communauté de se familiariser avec d’autres structures de données telles que XML ou RDF »
  • La transition se fera en douceur ; l’espérance de vie de MARC est estimée à environ 10 ans.

Bien sûr on y met les formes : officiellement il est question de voir dans quelles conditions MARC21 peut faire face aux nouveaux défis. Vu la manière dont la question est posée, la réponse s’impose d’elle-même.

Corollaire : il y a lieu de s’interroger dans les mêmes termes sur le devenir d’UNIMARC.

Mort à la norme Photo Jean-Philippe Aynié