Archives du blog

Qu’allions-nous faire à Berlin ?

Berlin (Allemagne), septembre 2011

C’est un voyage ancien déjà. La réunion annuelle des « partenaires CBS » avait lieu à Berlin les 20 & 21 septembre derniers, dans la Staatsbibliothek zu Berlin, celle qui… tu sais ? Oui un film, c’est ça. 1987. Tu vas trouver.

CBS est la base de données qui sous-tend le Sudoc, et les « partenaires » sont le vendeur de ce système (OCLC) et ses utilisateurs (des réseaux hollandais et allemands, un suisse et un français — nous —, deux bibliothèques nationales : la DNB, Deutsche Nationalbibliothek, et la NLA, National Library of Australia, non représentée à Berlin). On nous servait du café et des sandwiches dans un vestibule garni des portraits de tous les directeurs qui se sont succédés à la tête de cette bibliothèque depuis sa création. Tous ils nous regardaient manger, ils ne comprenaient plus rien aux conversations tu penses…

Au cours de ces deux jours : plein d’exposés des uns et des autres sur ce qu’on a fait, pensé, combiné l’année dernière, sur ce qu’on compte faire, combiner, devenir etc. l’année prochaine ; une intoxication alimentaire encore non élucidée qui a failli décimer la délégation française ; et les FRBR.

OCLC & les FRBR

Berlin (Allemagne), septembre 2011

OCLC dispose de deux outils :

  • FRBR (c’est le nom de l’outil), un algorithme de ferbérisation qui s’exerce au moment de la recherche sur les données existantes,
  • et GLIMIR (on dirait du bordure mais c’est de l’anglais : GLobal LIbrary Manifestation IdentifieR), dont l’objectif premier est d’attribuer des identifiants pérennes aux manifestations (au sens FRBR) ; du moins à celles signalées dans WorldCat.

In petto tu te dis : mais, et les ISBN, c’est fait pour les ours ? Et les ISSN ? Les ISSN oui c’est vrai. Mais les ISBN n’ont que quarante ans tu sais, et parfois les éditeurs en ont attribué en dépit du bon sens. Sans parler des autres types de ressources, celles qui ne peuvent recevoir ni ISBN, ni ISSN, ni ISMN etc. Et puis il y a la rançon de la globalisation : WorldCat renferme des notices établies pour la même manifestation en différentes langues (il s’agit bien ici de la langue de catalogage, celle dans laquelle on rédige les notes, la collation etc.). Ce sont des doublons, mais des doublons utiles, car à Sanlúcar de Barrameda on lira plus volontiers une notice rédigée en espagnol qu’en hollandais.

Une fois purgées des doublons inutiles, les notices reconnues par le programme comme décrivant la même manifestation reçoivent un identifiant de manifestation (OMI : OCLC manifestation identifier), puis sont regroupées selon leur contenu (originaux, reproductions numérisées ou en microformes, reprints). Ces regroupements (qui ne correspondent pas au niveau de l’expression des FRBR), identifiés par un OCI (OCLC content identifier), sont enfin rattachés aux œuvres (OWI : OCLC work identifier), placées comme il se doit au sommet de la pyramide.

Le Sudoc & les FRBR

Berlin (Allemagne), septembre 2011

Le Comité stratégique sur l’adoption de RDA en France a demandé à la BnF et à l’ABES d’expérimenter la structuration de leurs catalogues respectifs selon le modèle FRBR — dont RDA est une application —, dans son implémentation la plus élaborée (dite « scénario 1 »).

Pour l’ABES, il s’agit de vérifier que le Sudoc, dans sa configuration technique actuelle, est capable de répondre à cette demande. C’est à dire qu’il nous faut travailler à un paramétrage inédit, appliquant le modèle FRBR, de CBS. Vu que ce système est peu documenté, l’ABES a besoin de l’appui d’OCLC et si possible de demandes concordantes d’autres utilisateurs de CBS.

C’est ce que nous recherchions à Berlin, où s’est tenue à notre demande une réunion « satellite » ad hoc.

Un flop total auprès des réseaux étrangers.

Par bonheur la DNB (Deutsche Nationalbibliothek), dont on connait le parti pris favorable à l’application de RDA, s’est déclarée intéressée, de même qu’OCLC (bureau de Leiden). De sorte qu’une première réunion entre l’ABES et un représentant d’OCLC (Leiden) est prévue à Montpellier le 1er décembre prochain. Un cahier des charges, de préférence commun à l’ABES et à la DNB, devrait ensuite être produit. Si l’implication d’OCLC (Leiden) se confirme, on peut espérer la mise en place d’une base-test à brève échéance, prélude aux tests proprement dits.

Berlin (Allemagne), septembre 2011

Publicités

Le Val d’Oise enchanté

Une fée a pris sur elle de propager la connaissance des FRBR dans le monde.

Ainsi que l’atteste la vidéo ci-dessous elle est apparue à deux collègues en détresse de la BDP du Val d’Oise, puis les a charmées grâce à ses boîtes FRBR.

C’est une fée de tous les jours, sans baguette ni poudre magique, une fée au pouvoir d’achat en berne, une fée de crise — d’origine grecque ou portugaise peut-être ? — mais au français impeccable.


La fée RBR du Val d’Oise, ceinte du ruban rouge de militante du Sidaction, enchantant deux bibliothécaires grâce à ses boîtes FRBR. Conseil général du Val d’Oise, 2011.

Qui sait si elle ne va pas t’apparaître à toi aussi ?

Chais pas quoi faire !

Extrait de Pierrot le fou / Jean-Luc Godard, réalisateur. France, 1965.

Qu’est-ce que j’peux faire !
Chais pas quoi faire !
Qu’est-ce que j’peux faire !
Chais pas quoi faire !
Qu’est-ce que j’peux faire !
Chais pas quoi faire !

T’es pas la seule si ça peut te consoler.

Parce qu’à la lecture des interviews de fournisseurs de systèmes pour bibliothèques (Innovative, VTLS, BiblioMondo, Ex Libris, SirsiDynix etc.) ou de métadonnées (SkyRiver, OCLC) qui ont été publiées tout au long de l’été sur le blog du RDA Toolkit, on ne sent pas un mouvement franc, massif et enthousiaste, ni vers une FRBRisation effective des données, ni vers des solutions alternatives à MARC.

Savent pas trop quoi faire.

Les vendeurs considèrent globalement que MARC reste — et restera encore assez longtemps — un socle solide pour les catalogues de bibliothèques ; et que les données existantes, dont la masse est considérable, ne migreront vers d’autres formats que si le rapport coût / bénéfice penche clairement en faveur de ce dernier. Dans la plupart des systèmes les nouvelles zones définies en MARC21 pour RDA ont été déclarées, mais rarement avec les mécanismes de liens entre notices qui font l’intérêt des FRBR. 

Dans leur majorité, les fournisseurs interrogés semblent assez peu disposés à s’aventurer hors du rassurant format MARC, quittes à se contenter d’une FRBRisation générée par algorithmes à partir de données classiques.

Perplexité, attentisme. Savent pas quoi faire.

Un mot pour un autre. 1, « Modèle »

MADAME
Cher comte (désignant son haut-de-forme) posez donc votre candidature !… Là… (poussant vers lui un fauteuil) et prenez donc ce galopin. Vous devez être caribou ?

LE COMTE, s’asseyant
Oui, vraiment caribou ! Le saupiquet s’est prolongé fort dur. On a frétillé, rançonné, re-rançonné, re-frétillé, câliné des boulettes à pleins flocons : je me demande où nous cuivrera tout ce potage !
Jean Tardieu (1903-1995). Un mot pour un autre (1951).

On ne le sait pas encore, où il va nous cuivrer ce potage, ni comment.

Ce que l’on sait, c’est qu’il vaut mieux lever les approximations, et ne pas employer un mot pour un autre — format, norme, modèle, code etc. —, sous peine d’être vraiment caribou.

« L’Unimarc va être remplacé par les FRBR », c’est juste ça, ça peut se dire ? 

Non ça ne peut pas se dire ; c’est grave de dire ça, très grave.

Les FRBR sont un modèle conceptuel, tandis que l’Unimarc est un format d’encodage de données. Des données « FRBRisées » peuvent être encodées en Unimarc — ou non. Ça n’a rien à voir.

C’est quoi alors, un modèle conceptuel ?

Voici un menu :

Foie gras mi-cuit & pain d’épices
Loup au gros sel, pommes de terre au four
Fromage du jour de chez Betty
Mille-feuilles

Encore un :

Salade de tomates
Steak frites
Danette vanille

L’un et l’autre sont conformes à un modèle, qui est celui du repas traditionnel français : entrée, plat principal (viande ou poisson, accompagnement de légumes, riz, pâtes ou autre), fromage, dessert. Le plat principal est en général présent, le reste pas toujours. Les différentes entrées se succèdent dans l’ordre indiqué.

Le modèle du repas italien est différent : antipasto, primo piatto, secondo piatto, contorno, dolce. Tout est facultatif, l’antipasto et le dolce étant souvent absents du repas. Dans les primi piatti on trouve les pâtes, les risottos, les soupes. Le secondo piatto, de viande ou de poisson, est en général servi à part de l’accompagnement (contorno). L’ordre habituel est le suivant : antipasto, [primo piatto et/ou secondo piatto et/ou contorno], dolce.

Les livres de cuisine français et italiens sont de ce fait organisés différemment.

Les habitudes alimentaires évoluent : les livres de cuisine doivent s’adapter à de nouveaux modèles. Les livres de cuisine, ça pourrait être les normes.

Un modèle pour les données bibliographiques

Pour ce qui est des données des catalogues de bibliothèque, disons que depuis bien longtemps on se conformait à un modèle implicite — non formalisé —, qui semblait convenir. Ça marchait, du moins tant que les livres formaient le principal type de ressource disponible en bibliothèque.

Et puis tout à coup ça ne marchait plus. La part du livre imprimé s’est mise à décliner, de nouveaux types de ressource sont apparus, et on ne savait pas très bien à quelles catégories rattacher leurs caractéristiques dans les normes. On l’a fait cependant, parce qu’il fallait le faire, mais de manière empirique, comme si, les mangeurs français s’étant entichés de primi piatti à l’italienne, on en avait décrit les recettes au chapitre des accompagnements des plats principaux, faute de mieux. Par ailleurs les catalogues s’étaient informatisés, des systèmes de catalogage partagé s’étaient développés, parfois dans des proportions considérables.

Les FRBR (Functional requirements for bibliographic records = Spécifications fonctionnelles des notices bibliographiques), c’est le modèle qui manquait. Il a été élaboré au cours des années 1990, au moment où les outils normatifs et les principes de catalogage qui sont à leur base commençaient à craquer.

Il s’agissait de tout remettre à plat, pour comprendre exactement où se produisaient les craquements, et ce qui les causait.

C’est à dire qu’il fallait d’abord établir précisément à quoi et à qui sert l’information bibliographique, puis mettre cet inventaire en correspondance avec les différentes pièces de ladite information. Le modèle qui en résulte, élaboré selon une approche entité-relation, définit donc 10 entités réparties en 3 groupes (1 : la notice bibliographique ; 2 : les agents ; 3 : les sujets), leurs attributs respectifs, et les relations susceptibles de les lier entre elles. En voici une illustration :

Diagramme FRBR pour La lunga strada di sabbia / Pier Paolo Pasolini

Le modèle dit aussi, parmi les différents éléments qu’il définit, lesquels sont indispensables, utiles, accessoires, superflus etc., en fonction des différents besoins et situations.

À travers la définition des entités du groupe 1 (œuvre, expression, manifestation, item) les FRBR mettaient en évidence ce qui peut apparaître comme une importante erreur d’analyse dans les anciens principes de catalogage. Une erreur qui, pour être corrigée, bouleverserait la structure des catalogues. Voilà qui explique probablement que seul le besoin de faire entrer les données des catalogues de bibliothèque dans le web sémantique, rendant indispensable une modélisation précise et efficace, ait assuré au modèle FRBR une fortune dépassant largement le succès d’estime qui l’avait accueilli en 1998.

Un modèle pour les données d’autorité

Une analyse comparable, pratiquée sur les données d’autorité, a produit le modèle FRAD (Functional requirements for authority data = Fonctionnalités requises des données d’autorité), publié en décembre 2008. Pas d’erreur d’analyse ici, juste quelques précisions manquantes.

FRBR et FRAD charpentent le code de catalogage RDA (Ressources : description & accès), publié en 2010.

« Primi piatti », Osteria Santo Spirito, Florence (Toscane)