Archives de Catégorie: Modèles

Vingt ans après : LRM, un pour tous !

  • 21 août 2017

Ce billet est une version longue d’un article à paraître dans la prochaine livraison (87) d’Arabesques, consacrée à la Transition bibliographique.

Fusione #3, par Paolo Torrisi sur Flickr (CC BY-NC-ND 2.0)
Fusione #3, par Paolo Torrisi sur Flickr (CC BY-NC-ND 2.0).

Bientôt on parlera de FRBR comme d’une chose révolue. Le début de l’effort de modélisation des métadonnées bibliographiques entrepris au début des années 1990. Le texte fondateur de cet effort : le « modèle FRBR » contenu dans le rapport final sur les Fonctionnalités requises des notices bibliographiques, achevé en 1997, publié en 1998, aura constitué le point de départ d’une évolution profonde dans la compréhension de l’univers complexe des métadonnées bibliographiques.

Deux autres modèles ont suivi : FRAD (2009) pour les données « d’autorité » et FRSAD (2010) pour les données « d’autorité matière », périphériques dans FRBR qui se concentrait sur ses 4 entités centrales : œuvre, expression, manifestationitem, et sur les relations de et vers ces entités.

IFLA LRM (IFLA Library reference model : Modèle de référence des bibliothèques, 2017) résulte de la fusion et de l’évolution des trois modèles FRxx, qu’il remplace intégralement.

Pourquoi fusionner les trois modèles ?

Globalement, leur rédaction s’est échelonnée sur une quinzaine d’années, au cours desquelles s’accomplissait un événement bouleversant : le déferlement de l’Internet sur le monde. Les FRBR sont encore dans l’ignorance de cette chose-là, bien qu’elles prennent acte d’un changement en cours dans les besoins des publics. Elles ne savent pas non plus très bien ce qu’elles sont, vu qu’elles poursuivent deux objectifs distincts : « élaborer un cadre conceptuel permettant de comprendre clairement […] l’essence même de ce sur quoi la notice bibliographique est censée renseigner, et l’essence même de ce que nous attendons de la notice en termes d’adéquation aux besoins des utilisateurs » d’une part, et « recommander un niveau  minimal  de  fonctionnalité  et  de  spécification  de  données  à  appliquer  aux  notices  produites  par  les  agences  bibliographiques nationales » d’autre part. C’est ce second objectif que semble exprimer le titre : « Fonctionnalités requises des notices bibliographiques ». Tous les mots comptent.

Le fameux « modèle FRBR » qui s’y trouve contenu s’érige sur un terrain encore imprégné des Principes de Paris (1961). Il en est nourri. Il n’y avait que ça comme nourriture à l’époque. Pourtant le cadre général qu’il pose n’a pas été profondément remis en cause par la suite : un cœur bibliographique réparti en quatre entités principales, œuvre, expression, manifestation et item (« WEMI[1] »), sur lequel des personnes ou des collectivités exercent des responsabilités de création, transformation, publication, possession etc. S’y ajoute la relation de sujet (absente des Principes de Paris), qui associe n’importe laquelle des six entités déjà citées, plus quatre autres (objet, concept, lieu et événement) à l’entité œuvre et à elle seule.

Modèle FRBR : schéma général
Modèle FRBR : schéma général.

Tout cela dans la perspective des quatre types d’opération identifiées comme pouvant être effectuées par l’utilisateur d’un catalogue : trouver, sélectionner, identifier, obtenir. Chacune des entités du modèle est dotée d’un certain nombre d’attributs, qui pourraient être autant de zones d’une notice MARC qui en décrirait une instance.

FRAD et FRSAD approfondiront la modélisation des données dites « d’autorité » : pour FRAD, celles constituant les entités FRBR œuvre, personne et collectivité auxquelles s’en ajoute une nouvelle (famille) ; pour FRSAD, toutes les entités du modèle, mais dans la perspective exclusive de leur utilisation en tant que sujet.

Ces points de vue particuliers nécessitent la création de nouvelles entités. Par exemple nom dans FRAD et nomen dans FRSAD, tant il est vrai que le travail sur les « autorités » consiste essentiellement à rassembler les différents noms par lesquels une même entité peut être désignée. Ou encore thema dans FRSAD, définie comme une super-classe de toutes les entités FRBR, ce qui permet de formaliser la relation de sujet de manière générique : œuvre a pour sujet thema, thema est sujet de œuvre. FRAD et FRSAD, qui englobent dans les processus liés aux données d’autorité les tâches réalisées par les créateurs et les gestionnaires desdites données, identifient en outre des opérations d’utilisateur inconnues de FRBR : contextualiser et justifier (FRAD), explorer (FRSAD).

Les modèles FRAD et FRSAD, développés à part des FRBR tout en y faisant constamment référence, étendent le modèle d’origine et l’affinent, quittes à en redéfinir parfois les concepts d’une manière adaptée à leurs points de vue respectifs. Conçus également à part l’un de l’autre, ils peuvent établir des concepts voisins mais pas entièrement superposables (par exemple nom et nomen cités plus haut). Enfin certains de ces nouveaux concepts ne sont plus en cohérence avec l’approche des FRBR : l’association d’un nom à une entité, définie comme une relation pour les données « d’autorité » est traitée comme un attribut de l’entité dans FRBR (un titre de manifestation par exemple).

Il y avait donc lieu d’envisager enfin les trois modèles comme un tout, d’autant que la modélisation des agrégats avait fait parallèlement l’objet d’un rapport[2], publié séparément en 2011 et jamais intégré au corps des FRBR. Sans compter que de FRBR à FRAD et FRSAD, on est passé d’une modélisation « entité-association » basique à une modélisation qu’on sent tentée par un formalisme d’ontologie.

FRBRoo

Au moment même où s’élaboraient FRAD et FRSAD naissait une autre initiative liée à FRBR.

FRBRoo[3] (FRBR « orienté objet »), publié dans sa première version en 2009, est une formalisation de FRBR en ontologie, par le biais d’une harmonisation avec CIDOC CRM[4], modèle conceptuel créé pour les objets de musée. FRBRoo, qui se présente comme « une ontologie ou modèle conceptuel de haut niveau pour les données bibliographiques[5] »,  en est une extension. Son édition actuelle (version 2.4, 2015) intègre les modèles FRAD et FRSAD.

FRBRoo, au lieu d’entités et de relations, met en œuvre des classes et des propriétés. Les classes sont organisées hiérarchiquement (une classe lègue toutes ses propriétés aux sous-classes qui en dépendent).

On y retrouve globalement l’analyse des FRBR, avec cependant quelques différences notables. Le temps y est envisagé de manière dynamique (notion de laps de temps, aussi court soit-il, dans lequel se déroule toute opération liée à la production bibliographique, au lieu de celle, fixe, de date, d’ailleurs envisagée comme attribut et non comme relation dans les modèles FRxx). Dans FRBR la manifestation n’est qu’un avatar d’une œuvre réalisée dans une expression, tandis que FRBRoo distingue un processus de production d’une manifestation à exemplaire unique (tel qu’un manuscrit) de celui aboutissant à la production de copies multiples. Ce dernier est considéré comme un travail de création : FRBRoo reconnaît l’œuvre de publication, dont l’expression englobe les expressions individuelles des œuvres qui font l’objet de la publication. L’expression de publication de FRBRoo est plus ou moins un équivalent en relief de la manifestation de FRBR. En revanche, la manifestation à exemplaire unique est considérée comme un objet, et confondue avec son item.

IFLA LRM

L’influence de FRBRoo sur LRM est sensible, et cela dès son nom dans lequel on perçoit un écho de celui du CIDOC CRM. « IFLA LRM se veut un modèle conceptuel de référence de haut niveau développé dans un cadre de modélisation entité-association enrichi »[6], ce qui n’est pas très éloigné de ce que FRBRoo dit de lui-même (cf. supra).

Formalisme

IFLA LRM se donne en effet des airs d’ontologie. Les entités y sont organisées hiérarchiquement en classes et sous-classes, avec une entité de niveau supérieur, res (« chose » en latin — mais c’est aussi le début de resource, comme dans Resource Description Framework ou RDF). Toutes les autres entités du modèle sont donc des sous-classes de res, défini comme « toute entité de l’univers du discours ». Res était en quelque sorte annoncé par thema de FRSAD, dont il est une généralisation. LRM compte 3 niveaux d’entités.

LRM, hiérarchie des entités
LRM, hiérarchie des entités. Source : IFLA Library Reference Model, IFLA, 2017, page 18.

Comme dans les modèles FRxx, les entités sont dotées d’attributs.

Les relations se caractérisent chacune par leur domaine et leur codomaine (c’est à dire l’entité depuis laquelle et celle vers laquelle la relation peut être établie) ainsi que par leur cardinalité (pour une relation donnée, le nombre d’instances possibles d’entités de son domaine et de son codomaine). De même qu’est définie une entité de niveau supérieur, de même est établie une relation générique Est associé à, dont le domaine et le codomaine sont l’entité res : res est associée à res. Les autres relations définies dans le modèle en sont des spécialisations.

Chaque entité, attribut, relation de LRM est doté d’un identifiant (LRM-En pour les entités, LRM-En-An pour les attributs, LRM-Rn pour les relations).

Entités

L’organisation hiérarchique des entités dans LRM abolit la répartition en trois groupes de FRBR (groupe 1 : WEMI ; groupe 2 : agents ; groupe 3 : entités supplémentaires définies pour la relation de sujet) et fait disparaître la notion d’autorité.

On y compte moins d’entités que dans l’ensemble FRBR + FRAD + FRSAD (11 au lieu de 18) : une entité LRM n’est établie qu’à condition de présenter des attributs ou relations spécifiques (qui ne peuvent pas être définies à un niveau supérieur) — ce qui a par exemple conduit à l’extinction des entités concept et objet, désormais inutiles puisque la relation de sujet ne porte plus que sur res.

Les WEMI voient leurs définitions légèrement modifiées (œuvre et manifestation dans un sens plus abstrait), tandis qu’il devient possible, pour une œuvre donnée, d’en déterminer une « expression représentative » dont certaines caractéristiques peuvent être enregistrées en tant qu’attributs de l’œuvre (exemple : la langue originale d’une œuvre textuelle).

Une entité générique agent est désormais déclarée dans le modèle, avec comme sous-classes personne et agent collectif (au détriment des entités famille et collectivité). Mais surtout un agent est défini comme « une entité capable d’actions délibérées, qui peut bénéficier de droits et être tenu pour responsable de ses actions » alors que pour FRAD une personne est un « individu, ou identité d’emprunt ou autre identité attribuée ou adoptée par un individu ou un groupe » et une collectivité « comprend des organismes ou des groupes de personnes fictifs ». Ce glissement — influence directe de FRBRoo — constitue un important changement de point de vue qui mériterait une analyse particulière.

Les entités lieu et événement sont profondément transformées : elles deviennent respectivement lieu et laps de temps, et peuvent être désormais associées à res (c’est-à-dire à n’importe quelle entité du modèle) par la relation « Est associé à » (LRM-R33) : elles ne sont plus confinées à la relation de sujet. Concrètement, les attributs FRBR tels que : lieu de publication, localisation (d’une collectivité) etc. ou date de l’œuvre, de l’expression, de publication, de naissance etc. n’existent plus et doivent être remplacés chacun par une relation entre l’entité concernée (œuvre, expression, manifestation, agent…) et l’entité lieu ou laps de temps suivant le cas.

Attributs

Ils sont beaucoup moins nombreux que dans l’ensemble FRBR + FRAD + FRSAD. Là où ils ont pu être remplacés par des associations entre entités, ou lorsqu’ils semblaient relever davantage d’applications du modèle que du modèle lui-même, ils ont disparu.

En contrepartie, quelques créations. L’un de ces nouveaux attributs, établi au niveau de res, c’est à dire autorisé dans toutes les entités, est catégorie, qui permet de ne déclarer dans le modèle lui-même que les entités jugées nécessaires au niveau de généralisation qui est le sien. La catégorisation de certaines d’entre elles en entités plus spécifiques aura lieu si besoin est dans les applications du modèle (règles de catalogage par exemple).

Signalons également l’attribut mention de manifestation dans l’entité manifestation : « une mention apparaissant sur les exemplaires d’une manifestation et jugée importante pour la compréhension que peuvent avoir les utilisateurs de la façon dont la ressource se représente elle-même ». À lui seul cet attribut prend en charge l’intégralité des données transcrites — que les règles de catalogage peuvent détailler autant que nécessaire.

Relations

Les relations dans LRM, vue d'ensemble
Les relations dans LRM, vue d’ensemble. Source : IFLA Library Reference Model, IFLA, 2017, page 84.

Les relations entre entités étaient parfois définies de manière différente d’un modèle FRxx à un autre. Ces conflits sont résolus dans LRM, où les relations (en dehors de celles entre WEMI qui restent le cœur du modèle) sont généralement plus abstraites que dans les modèles précédents et moins nombreuses. Exemple : les relations de supplément, complément et même de résumé définies entre œuvres dans FRBR sont englobées dans celle de accompagnement / complément dans LRM.

La relation de sujet, on l’a vu, est établie simplement entre l’entité res et l’entité œuvre, ce qui revient à dire que toute entité du modèle peut être sujet d’une œuvre (y compris une œuvre, qui est elle-même une res).

Les relations d’agent sur les WEMI sont retouchées par rapport à FRBR (ainsi la relation A créé / Est créé par est étendue à l’expression et à la manifestation, probable influence de FRBRoo).

La relation d’appellation, reprise de FRSAD, est peut-être la plus troublante pour qui ne connaissait que le modèle FRBR dans lequel elle n’est pas définie. Dans FRBR, les noms que peut prendre une instance de telle ou telle entité sont des attributs de ladite entité. Dans LRM, toute forme particulière de nom liée à une entité est une instance d’une autre entité, nomen, associée à la première par la relation A pour appellation / Est une appellation de (LRM-R13). Ce dispositif permet à chaque forme de nom d’être doté d’attributs : d’abord la chaîne de caractères qui compose ce nom, son type (identifiant, point d’accès normalisé, variante de nom…), sa langue, son écriture, son contexte d’utilisation, sa source etc. et d’être mis en relation avec d’autres entités (la personne ou la collectivité qui a assigné cette forme particulière du nom, par exemple).

Les opérations des utilisateurs (« user tasks »)

Comme FRBR, LRM est construit en fonction des besoins des utilisateurs de l’information bibliographique. En revanche il ne prend pas en compte les processus de gestion interne des métadonnées présents dans FRAD et FRSAD. Les sept opérations des utilisateurs définies conjointement dans FRBR, FRAD et FRSAD sont donc réduites à cinq dans LRM, certaines étant devenues caduques et déclarées hors modèle, les autres s’ajustant en une liste unique dans laquelle on retrouve les quatre opérations de base dégagées dans FRBR (trouver, identifier, sélectionner, obtenir) définies d’une manière plus synthétique, auxquelles s’ajoute « explorer », fusion de l’opération du même nom dans FRSAD et de « contextualiser » de FRAD.

LRM, un modèle conceptuel de haut niveau

LRM se présente comme un modèle « de haut niveau », c’est-à-dire qu’il n’entre pas dans certains détails de spécificité considérés comme relevant de ses applications particulières (codes de catalogage ou autres) — à l’image de feu l’ISBD(G), matrice des ISBD spécialisés. Il se tient au contraire à un niveau de généralité qui lui procure davantage de souplesse que les modèles FRxx.

Il revient aux créateurs d’applications de LRM d’en élaborer éventuellement des extensions (à l’instar de FRBRoo, extension de CIDOC CRM) en créant par exemple des sous-classes des entités existantes, des relations spécifiques à partir de celles définies dans le modèle, ou de nouveaux attributs aux entités. Ils peuvent aussi, sans définir de nouvelles entités, se contenter d’utiliser l’attribut catégorie de res afin de répartir les entités existantes selon une typologie à définir en fonction de l’application.

À l’inverse, une application de LRM est libre de n’en utiliser qu’une partie des entités, des attributs ou des relations. « Cependant, une implémentation du modèle ne sera considérée comme fidèle à celui-ci qu’à la condition qu’elle respecte la structure fondamentale des entités et des relations définies entre elles (y compris leurs contraintes de cardinalité), ainsi que le rattachement des attributs aux entités pertinentes. » (IFLA LRM 2.2.)

RDA et LRM

Dès novembre 2016 le RSC (RDA Steering Committee) a pris la décision de réviser en profondeur RDA afin de l’aligner sur LRM, dont le texte était alors considéré comme stabilisé.

Ce travail est en cours. La publication d’une nouvelle édition de RDA, dans un RDA Toolkit lui-même rénové, est annoncée pour avril 2018 [mise à jour : juin 2018]. Ce sera l’épreuve de vérité : on verra si RDA est finalement autre chose qu’un ravalement de façade des AACR2.

À suivre particulièrement : la mise en œuvre de la modélisation des agrégats et celle de la relation d’appellation. Cette dernière est difficile à rendre dans un format MARC.

[1] Pour: Work, Expression, Manifestation, Item

[2] Final report of the Working group on aggregates, IFLA, 2011. En ligne : https://www.ifla.org/files/assets/cataloguing/frbrrg/AggregatesFinalReport.pdf

[3] Voir : Definition of FRBRoo : a conceptual model for bibliographic information in object-oriented formalism, version 2.4, IFLA, 2016. En ligne : https://www.ifla.org/publications/node/11240

[4] CIDOC : Comité international pour la documentation de l’ICOM [International council of museums ] ; CRM : Conceptual reference model. Voir : http://www.cidoc-crm.org/

[5] « FRBRoo is an ontology or high-level conceptual model for bibliographic data. » https://www.ifla.org/publications/node/11240 déjà cité.

[6] IFLA LRM, § 2.1 Scope and objectives

………

The three musketeers (1921), extrait. Fred Niblo, réalisation ; Douglas Fairbanks, Edward Knoblock et Lotta Woods, scénario ; Douglas Fairbanks (D’Artagnan), Léon Bary (Athos), George Siegmann (Porthos), Eugene Pallette (Aramis),… acteurs.
D’après Les trois mousquetaires d’Alexandre Dumas.
États-Unis, 1921.

Publicités

AlKindi : un catalogue FRBRisé

  • 13 juin 2016

Un petit tour sur AlKindi, le catalogue en ligne de la bibliothèque de l’Idéo (Institut dominicain d’études orientales, Le Caire), à travers quelques captures d’écran évidemment bien réductrices (et d’ailleurs à peu près illisibles). Il faut aller voir par soi-même.

AlKindi — du moins son interface de recherche — met en œuvre le modèle FRBR d’une manière assez poussée, au point par exemple que les relations de type agent (créateur, contributeur, éditeur, possesseur etc.) se font réellement à l’entité du groupe 1 pertinente (œuvre, expression, manifestation, item). En visitant le site, explorer notamment les nombreux liens regroupés dans des encadrés sur le côté droit de l’affichage.

AlKindi. Affichage d'une notice biliographique

1. Affichage d’une notice de manifestation. Cliquer sur l’image pour la voir dans Alkindi et ici pour voir la même dans le Sudoc.


AlKindi - Notice d'œuvre

2. Affichage de la notice de l’œuvre correspondante.


AlKindi - Notice de collectivité

3. Affichage d’une notice de collectivité (l’éditeur commercial de la manifestation).

………

Une femme sur la route = امرأة في الطريق . Extrait. Ezz Eldine Zulficar = عزالدين ذو الفقار, réalisateur ; Rouchdi Abaza = رشدي أباظة, Hoda Soltan = هدى سلطان…, acteurs. Égypte, 1958.

Elle dit quoi, la dame ?

RDA-thon

  • 16 mars 2016

Some Days, par Gareth sur Flickr
Some Days…, par Gareth sur Flickr (CC BY-SA 2.0).

La Bibliothèque nationale de France annonce la tenue prochaine dans ses murs d’un RDA-thon, dont le Verne-athon constituera le plat de résistance.

Le Verne-athon [prononcer : vernaton] est un atelier collaboratif de production de métadonnées liées portant sur l’œuvre de Jules Verne, sur le modèle des Jane-athons (Jane Austen), du Cervathon (Cervantes) ou autres Ag-athons (Agatha Christie) déjà organisés à l’étranger.

Cet événement, programmé le mercredi 4 mai prochain de 9h à 17h, est destiné à toute personne désireuse de se confronter pour de vrai à la création de métadonnées organisées selon les nouveaux modèles. On pourra enfin les voir de près ces métadonnées, les toucher, les façonner, leur parler, s’énerver sur elles et sur soi-même.

Le Verne-athon est précédé de deux hors-d’œuvre plus ou moins appétissants :

RDA et Bibframe pour les périodiques (mercredi 27 avril de 14h à 16h30) : une présentation de RDA pour les périodiques par Regina Reynolds, directrice du centre ISSN des États-Unis, avec un focus sur Bibframe, outil de FRBRisation développé par la Bibliothèque du Congrès.

FRBR from abroad: meet Gordon Dunsire, chair of the RDA Steering Committee (lundi 2 mai de 14h à 17h). Gordon Dunsire est le président du RDA Steering Committee (ex JSC : Joint Steering Committee for Development of RDA). Cette « rencontre-atelier » portera sur les modalités pratiques de l’implémentation de RDA dans le contexte bibliographique actuel (comment concilier MARC et FRBR, comment RDA réagit à l’évolution du modèle FRBR, comment s’y retrouver parmi les différents formats RDF). Attention, la langue de cette session est l’anglais. Attention, Gordon Dunsire est écossais.

………

[L’ascenseur à reconnaissance vocale]. Iain Davidson, réalisation ; Robert Florence, Iain Connell, dialogues ; Robert Florence, Iain Connell, acteurs. Extrait de : Burnistoun, Série 1, Épisode 1. Production : Écosse, The Comedy Unit. Première diffusion : BBC Two Scotland, 1er mars 2010.

Écosse, banlieue de Glasgow. L’ascenseur à reconnaissance vocale, importé des États-Unis, ne comprend pas l’accent écossais.

FRBR-LRM

  • 17 juin 2015

Fusione #2, par Paolo Torrisi sur Flickr (CC BY-NC-ND 2.0)
Fusione #2, par Paolo Torrisi sur Flickr (CC BY-NC-ND 2.0).

FRBR-LRM : tel est le nom sous lequel on désignera le résultat de la fusion en un seul modèle des trois FR (FRBRER, FRAD et FRSAD). LRM pour Library Reference Model.

Le travail de consolidation, qui aura duré plusieurs années, sera présenté cet été au congrès annuel de l’IFLA, au Cap, en Afrique du Sud. On peut d’ores et déjà prendre connaissance du texte (en anglais) de la communication de Pat Riva et Maja Žumer, membres du comité éditorial de FRBR-LRM, qui fait très clairement ressortir les caractéristiques principales du modèle.

On y retrouve un FRBRER retouché (le groupe 1 reste intact), et enrichi des apports de FRAD et FRSAD.

Une fois finalisé au sein du FRBR Review Group, le texte de FRBR-LRM sera présenté pour approbation aux instances ad hoc de l’IFLA (c’est à dire les Standing Committees for Cataloguing, Classification & Indexing et Bibliography), et devrait être soumis à enquête internationale début 2016.

Notes en vrac

  • 25 octobre 2013

Giorgio de Chirico (1888-1978). La stazione di Montparnasse (1914 ; Paris), 140 x 184,5 cm. Museum of Modern Art, New York, États-Unis.
Giorgio de Chirico (1888-1978). La stazione di Montparnasse (1914), 140 x 184,5 cm. New York (États-Unis), Museum of Modern Art.

J’écris ces notes — qui sortent en vrac — dans le train, après la journée RDA, FRBR état des lieux organisée par la FULBI jeudi 17. (J’y étais invité pour présenter les progrès de la FRBRisation du Sudoc : je n’avais rien à dire, rien. Une situation des plus gênantes. Réduit à un babil d’ameublement. Heureusement les autres intervenants avaient des choses à dire quant à eux, et j’ai trouvé la journée très intéressante.)

Je me pose encore les mêmes questions à propos de ce projet SGBM et d’un futur Sudoc : faut-il passer au RDA ou pas, est-ce qu’un code de catalogage peut vraiment intégrer les FRBR, est-ce qu’il ne faut pas dépasser les FRBR, est-ce qu’on peut trouver une autre inspiration dans FRBRoo … Je ne sais pas.

Mais il me semble qu’il faut découpler les problématiques respectives du RDA et du modèle FRBR. On le voit, la Bibliothèque du Congrès le montre : on peut appliquer le RDA sans vraiment produire de données FRBRisées. Et plus j’y pense, plus je crois que des catalogueurs d’une BU ou autre ne feront jamais l’effort d’identifier l’œuvre, encore moins les œuvres, contenue(s) dans la publication à traiter. Cela tant que les règles de catalogage, et les interfaces de saisie, privilégieront l’aspect contenant par rapport à l’aspect contenu. Ou plutôt : obligeront à voir l’objet à décrire par ce bout-là de la lorgnette.

C’est pourquoi je me dis parfois : passons au RDA quoiqu’il en coûte, faisons-le, débarrassons-nous de ce problème-là. Ce qui nous permettra de nous poser la vraie question : maintenant comment fait-on pour sortir du catalogue traditionnel ? (Pour le dynamiter.)

Autre chose : pour construire des applications FRBR, il importe de ne considérer le modèle que comme une référence (rappelons qu’il a été conçu dans les années 1990, à partir des données de l’époque). Il faut le critiquer, le discuter, l’adapter. C’est ce qui a été fait par exemple pour la conception du nouveau système de production d’Electre  (présenté à la journée FULBI), et dans une moindre mesure dans Data.bnf.fr. Je ne suis pas sûr que la notion d’œuvre au sens strictement FRBR soit réellement représentée dans le modèle Electre, et c’est tant mieux. À mon sens les contours de l’entité œuvrefrbr sont difficiles, sinon impossibles, à normaliser (ce qui est d’ailleurs anticipé dans le modèle). L’entité expressionfrbr ou un équivalent, niveau pertinent pour la gestion des droits d’auteur sur les contenus, me semble moins problématique. De ce point de vue le RDA n’est certainement pas le bon outil, à moins d’être appliqué très librement. Tel qu’il est, le RDA est au contraire un bon moyen de cantonner un peu plus longtemps les bibliothécaires (et les bibliothèques) dans leur culture propre.

Ce qui est remarquable dans la réalisation d’Electre, c’est que compte tenu d’un éventail d’utilisateurs potentiels incluant les professionnels de l’édition, de la librairie et des bibliothèques, on s’est sincèrement interrogé sur les besoins qu’on avait ou qu’on allait avoir, et qu’on n’a pas hésité à changer complètement de point de vue, d’angle d’attaque, dans la production des métadonnées. On n’a pas craint de se projeter dans un univers entièrement différent.

À ce moment précis, je suis distrait de mes réflexions désordonnées par le type à côté de moi, qui téléphone aussi discrètement que possible, mais que j’entends distinctement dire ceci : il n’est pas bête, pas comme sa mère. Qui est cette mère ? Son ex-femme ? Sa belle-sœur ? Une collègue ? Puis un nouvel incident assez amusant, relatif cette fois à mon antipathique vis-à-vis, renchérit sur celui-ci. Plus moyen de penser aux FRBR etc. De toute façon je tourne en rond.

Avec ça on n’est même pas à Bordeaux encore. Ce retour en train est interminable.

Rébus Express. Émission du 8 mars 1962. 1ère partie / Maurice Brunot, réalisateur ; Office national de radiodiffusion télévision française, producteur. (Interlude).
Diffusion : INA [Institut national de l’audiovisuel (France)]. Accès : http://www.ina.fr/video/CPF86643387/rebus-express-1-ere-partie-video.html.

FRBR : de l’expression bordel !

  • 30 août 2013

Two strange monsters, par G33G (Fabio Dellutri) sur Flickr
Two strange monsters, par G33G (Fabio Dellutri) sur Flickr (Creative Commons BY-NC-SA 2.0)

Le mois d’août

Pour sortir d’une impasse il faut en prendre une autre.
Monsieur Songe

Robert Pinget (1919-1997). Monsieur Songe (1982).
Minuit, 1982. ISBN 2-7073–0612-6, page 26.
Minuit, 2011. (Double ; 74). ISBN 978-2-7073-2158-9, page 23.

………………

Le modèle FRBR, rappelons-le, se présentait comme une tentative de clarifier les éléments constitutifs des « notices bibliographiques » (FRBR : bibliographic records) produites selon les règles appliquées dans les années 1990.

Il s’agissait d’élaborer un cadre conceptuel permettant de comprendre clairement, sous une forme précisément exprimée et dans un langage qui soit parlant pour tout le monde, l’essence même de ce sur quoi la notice bibliographique est censée renseigner, et l’essence même de ce que nous attendons de la notice en termes d’adéquation aux besoins des utilisateurs.
FRBR § 1.1 Contexte

Il n’avait pas pour objectif direct de servir de socle à une conception nouvelle de la description bibliographique. C’est pourtant le rôle qu’on lui assigne aujourd’hui, et c’est ainsi qu’il a été utilisé, par exemple pour la rédaction du RDA.

Il n’aurait pas été inutile de vérifier au préalable qu’il y était apte, en l’état.

L’ « arborescence FRBR »

On retient essentiellement du modèle le premier groupe des entités qu’il définit (œuvre, expression, manifestation, item), et qui semblent dépendre hiérarchiquement l’une de l’autre, l’ « œuvre » se situant au plus haut niveau.

Entités du groupe 1 et relations fondamentales. FRBR § 3.1.1 Entités du groupe 1 : Œuvre, Expression, Manifestation, Item
Entités du groupe 1 et relations fondamentales. FRBR § 3.1.1 Entités du groupe 1 : Œuvre, Expression, Manifestation, Item

Le fait est que les entités sont présentées dans cet ordre, et que tout dans le rapport lui-même, les schémas d’accompagnement comme le texte proprement dit, conduit à cette impression que le modèle consiste en une arborescence dont l’œuvrefrbr est la racine, ou le tronc, qui se ramifie en expressionsfrbr, puis en manifestationsfrbr, pour s’épanouir finalement en itemsfrbr.

Or cette vision est discutable, au moins en deux des trois charnières de la chaîne Œ–E–M–I, à savoir les deux premières (Œ–E et E–M). Ça fait beaucoup. Il ne va être question dans ce billet que de la première ; pour la seconde, qui mérite un développement spécifique, on verra plus tard, un autre mois.

Dissocier le contenu de son, ou de ses, support(s)

Un des plus grands mérites du modèle FRBR est d’avoir signalé à la communauté des bibliothécaires cette réalité jusque là ignorée d’elle qu’est l’expressionfrbr.

La deuxième entité définie dans le modèle est celle d’expression : c’est-à-dire, la réalisation intellectuelle ou artistique d’une œuvre sous la forme d’une notation alphanumérique, musicale ou chorégraphique, ou sous une forme sonore, visuelle, objectale, cinétique, etc., ou bien sous l’aspect d’une combinaison de ces formes.
FRBR § 3.2.2 L’entité Expression

Par la même occasion le rapport attire l’attention sur le fait que les données qui permettraient d’identifier l’expressionfrbr sont, plus que toutes les autres, diluées dans la notice bibliographique normalisée traditionnelle, et par conséquent extrêmement difficiles à en dégager.

L’expressionfrbr correspond pourtant à un niveau d’analyse bien réel du point de vue des usages.

C’est celui que nous manipulons tous lorsque nous cherchons des contenus : un enregistrement sonore précis (par exemple :  la version des Nuits d’été de Berlioz par Régine Crespin, Ernest Ansermet et l’Orchestre de la Suisse romande de 1963) ou un texte (par exemple : la directive 2001/29/CE du Parlement européen ; la thèse de Roger Hameçon-Bernique sur l’évolution sociologique de la population des consommateurs d’andouille de Guéméné entre 1945 et 1962 dans les départements du Finistère, des Côtes-du-Nord et du Morbihan, ainsi que dans les arrondissements de Redon et de Saint-Nazaire), ou un film, une image, de la musique notée ou autre, sans nous soucier du contexte éditorial dans lequel ce que nous cherchons est publié.

L’expressionfrbr est en outre une entité manipulée par les éditeurs et par les gestionnaires de droits. En témoigne la définition, depuis les dernières décennies du XXe siècle, d’identifiants normalisés ad hoc, tels que :

  • l’ISRC (identifiant international normalisé des enregistrements, ISO 3901),
  • l’ISAN (numéro international normalisé d’œuvre audiovisuelle, ISO 15706-1) et le V-ISAN (Numéro international normalisé d’oeuvre audiovisuelle, identifiant de version, ISO 15706-2),
  • l’ISTC (identifiant international normalisé des œuvres textuelles, ISO 21047),
  • et l’ISWC (identifiant international normalisé des œuvres musicales, ISO 15707).

De fait, ces identifiants s’appliquent à des expressionsfrbr, et non à des œuvresfrbr. Le terme d’œuvre présent dans l’intitulé de la plupart d’entre eux ne doit pas être compris au sens du modèle FRBR, mais plutôt dans celui du langage courant, qui est peu ou prou celui qu’il revêt dans les différentes législations nationales sur le droit d’auteur.

7/7, par [auro] sur Flickr
7/7 par [auro] sur Flickr (Creative Commons BY-NC-SA 2.0)

L’ expressionfrbr versus l’ « œuvre de l’esprit »

La législation française parle en la matière  d’« œuvre de l’esprit », qui correspond exactement à l’expressionfrbr :

Sont considérés notamment comme oeuvres de l’esprit au sens du présent code :
1° Les livres, brochures et autres écrits littéraires, artistiques et scientifiques ;
2° Les conférences, allocutions, sermons, plaidoiries et autres oeuvres de même nature ;
3° Les oeuvres dramatiques ou dramatico-musicales ;
4° Les oeuvres chorégraphiques, les numéros et tours de cirque, les pantomimes, dont la mise en oeuvre est fixée par écrit ou autrement ;
5° Les compositions musicales avec ou sans paroles ;
6° Les oeuvres cinématographiques et autres oeuvres consistant dans des séquences animées d’images, sonorisées ou non, dénommées ensemble oeuvres audiovisuelles ;
7° Les oeuvres de dessin, de peinture, d’architecture, de sculpture, de gravure, de lithographie ;
8° Les oeuvres graphiques et typographiques ;
9° Les oeuvres photographiques et celles réalisées à l’aide de techniques analogues à la photographie ;
10° Les oeuvres des arts appliqués ;
11° Les illustrations, les cartes géographiques ;
12° Les plans, croquis et ouvrages plastiques relatifs à la géographie, à la topographie, à l’architecture et aux sciences ;
13° Les logiciels, y compris le matériel de conception préparatoire ;
14° Les créations des industries saisonnières de l’habillement et de la parure. Sont réputées industries saisonnières de l’habillement et de la parure les industries qui, en raison des exigences de la mode, renouvellent fréquemment la forme de leurs produits, et notamment la couture, la fourrure, la lingerie, la broderie, la mode, la chaussure, la ganterie, la maroquinerie, la fabrique de tissus de haute nouveauté ou spéciaux à la haute couture, les productions des paruriers et des bottiers et les fabriques de tissus d’ameublement.
France. Code de la propriété intellectuelle – Article Article L 112-2

Voilà donc ce qui est protégé par le droit d’auteur. Certains termes semblent faire référence à un support matériel (« livre » et « brochure »), mais désignent en réalité les contenus de ces supports (le texte initial date des années 1950). Car il est bien stipulé que le droit d’auteur protège les « œuvres de l’esprit » indépendamment de leur support (acquérir un livre n’entraîne pas qu’on ait acquis en même temps de droit de propriété sur le contenu de celui-ci) :

La propriété incorporelle définie par l’article L. 111-1 est indépendante de la propriété de l’objet matériel.
France. Code de la propriété intellectuelle – Article L111-3

L’œuvrefrbr versus la « conception de l’auteur » de l’« œuvre de l’esprit »

Seulement une « œuvre de l’esprit » n’existe (pour le législateur) que dès lors qu’elle est créée, c’est à dire « réalisée » selon la formulation employée dans la définition de l’expressionfrbr (cf. supra).

L’auteur d’une œuvre de l’esprit jouit sur cette œuvre, du seul fait de sa création, d’un droit de propriété incorporelle exclusif et opposable à tous.
France. Code de la propriété intellectuelle – Article L111-1

L’oeuvre est réputée créée, indépendamment de toute divulgation publique, du seul fait de la réalisation, même inachevée, de la conception de l’auteur.
France. Code de la propriété intellectuelle – Article L111-2

En d’autres termes : une idée, même déjà structurée, ne peut pas être protégée si elle n’est pas exprimée, et même manifestée — pour reprendre la terminologie FRBR. Il est bien fait référence à la « conception de l’auteur » (voir l’article L111-2 cité ci-dessus) — qui pourrait être l’équivalent de l’œuvrefrbr –, mais c’est pour ne pas en tenir compte.

L’articulation œuvrefrbr – expressionfrbr

No Day Is So Bad, par Brian Talbot sur Flickr
No Day Is So Bad, par Brian Talbot sur Flickr (Creative Commons BY-NC 2.0)

La définition de l’œuvrefrbr la voici :

La première entité que définit le modèle est celle d’œuvre : une création intellectuelle ou artistique déterminée.

Une œuvre est une entité abstraite ; il n’y a aucun objet matériel isolé auquel on puisse renvoyer comme étant « l’œuvre ». On reconnaît l’œuvre à travers des réalisations individuelles, ou expressions de l’œuvre, mais l’œuvre elle-même ne réside que dans une identité de contenu au sein des diverses expressions de l’œuvre. Lorsque l’on parle de l’Iliade d’Homère en tant qu’œuvre, on ne fait pas référence à telle ou telle lecture en public ou à tel ou tel état du texte de l’œuvre, mais à la création intellectuelle sous-jacente à toute la palette d’expressions que connaît l’œuvre.
FRBR § 3.2.1 L’entité Œuvre

Définition ambiguë. Elle hésite entre l’œuvrefrbr comme produit de l’activité humaine (« une création intellectuelle ou artistique déterminée ») et comme abstraction utile aux traitements bibliographiques (« l’œuvre elle-même ne réside que dans une identité de contenu au sein des diverses expressions de l’œuvre »).

Du moins ce second point de vue est-il énoncé. Mais le modèle lui-même a tendance à l’occulter, ne serait-ce que parce que la terminologie employée est à sens unique : on parle, dans les FRBR, de l’ « expression » d’une « œuvre », ce qui implique une subordination de la première à la seconde. C’est-à-dire qu’on en infère logiquement que l’œuvrefrbr a une substance propre, et qu’elle est antérieure à toutes ses expressionsfrbr. De fait on peut nommer  l’œuvrefrbr (le titre de l’œuvre est le premier de ses attributs) et la doter de toute une panoplie d’attributs supplémentaires tels que sa forme, sa date, etc. (voir FRBR §4.2 Attributs d’une œuvre).

Or la réalité est exactement inverse. C’est d’abord l’ « œuvre de l’esprit » qui voit le jour, c’est-à-dire l’expressionfrbr. Nul doute que cette dernière soit en effet l’expression de quelque chose qui a pris naissance dans l’esprit de son créateur ( la « conception de l’auteur », cf. supra). Mais ce quelque chose n’intéresse ni les bibliographes ni les autres métiers liés à la diffusion et à la gestion des œuvres, ni les utilisateurs des catalogues des bibliothèques. Ce quelque chose n’est pas l’œuvrefrbr, laquelle est une construction a posteriori, dont les éléments (à commencer par son titre) sont en fait le plus souvent relatifs à une expressionfrbr particulière, à savoir l’expressionfrbr originale d’une œuvrefrbr qui peut en compter plusieurs.

Au vrai, l’expressionfrbr n’est pas l’expression de l’œuvrefrbr, pas plus que cette dernière n’est l’œuvre de l’auteur.

La « conception de l'auteur », l' « œuvre de l'esprit » et l'œuvre FRBR

En la matière, plutôt que de spéculer sur le processus (cognitif) de production d’une « œuvre de l’esprit », il vaudrait mieux se borner à considérer les objets résultant de ce processus, puisque ce sont eux, et eux seuls qu’on manipule, aussi bien lors de l’activité bibliographique qui consiste à les décrire que dans toute autre activité liée à leur mise à disposition et à leur gestion, et in fine, à leur découverte.

Malheureusement, dans le RDA encore plus que dans FRBR, une évidente hiérarchie subordonne l’expressionfrbr à l’œuvrefrbr : il est obligatoire, lorsqu’on décrit une manifestationfrbr (qui reste dans RDA l’entité bibliographique sur laquelle repose l’organisation du catalogue), d’identifier l’œuvrefrbr qu’elle contient (« Lors de l’enregistrement des relations principales, inclure au minimum l’œuvre manifestée. », RDA § 17.3).

L’identification de l’expressionfrbr contenue n’est obligatoire que dès lors qu’il en existe plusieurs (« S’il existe plus d’une expression de l’œuvre, enregistrer l’expression manifestée », RDA § 17.3). C’est à dire qu’il faut déjà vérifier ce fait. Conséquence : lors de l’apparition d’une seconde expressionfrbr d’une  œuvrefrbr, il faut agir rétrospectivement sur les données déjà enregistrées.

On pourrait d’ailleurs montrer que l’expressionfrbr dans RDA semble moins définie pour elle-même que constituée d’éléments qui n’ont pas été attribués aux autres entités.

Le problème des œuvres dérivées

Side effects of spending three centuries in Eisenstadt, Austria, par Paolo Crosetto sur Flickr
Side effects of spending three centuries in Eisenstadt, Austria par Paolo Crosetto sur Flickr (Creative Commons BY-NC-SA 2.0)

La transformation d’une « œuvre de l’esprit » préexistante (par traduction, adaptation etc.) est protégée par le droit d’auteur, et cette protection est indépendante de celle qui couvre l’œuvre originale :

Les auteurs de traductions, d’adaptations, transformations ou arrangements des oeuvres de l’esprit jouissent de la protection instituée par le présent code sans préjudice des droits de l’auteur de l’oeuvre originale. Il en est de même des auteurs d’anthologies ou de recueils d’oeuvres ou de données diverses, tels que les bases de données, qui, par le choix ou la disposition des matières, constituent des créations intellectuelles.
France. Code de la propriété intellectuelle – Article L112-3

C’est à dire que l’ « œuvre de l’esprit » résultant d’une transformation d’une « œuvre de l’esprit » préexistante est protégée à la fois au titre de l’œuvre originale et à celui du travail de transformation de celle-ci. Pratiquement, il convient donc d’identifier clairement, pour chaque « œuvre de l’esprit » dérivée, l’ « œuvre de l’esprit » dont elle est une transformation.

C’est ainsi que les métadonnées d’enregistrement d’un identifiant tel que l’ISTC permettent de préciser si l’œuvre est originale ou dérivée. En cas de dérivation, la nature de celle-ci doit être consignée (10 types différents, parmi lesquels : annotation, compilation, révision, traduction, adaptation), et l’ISTC de l’œuvre originale fournie (source : ONIX for ISTC Registration : message format overview. Version 1.0.1, 24 August 2009, revised 5th September 2011, § 8 ISTC Registration Record [fichier .pdf])

En termes FRBR : les liens s’effectuent d’expressionfrbr à expressionfrbr sans passer par une instance de regroupement telle qu’une œuvrefrbr.

Dans FRBR (et dans RDA), les « œuvres de l’esprit » réalisées par transformation d’une « œuvre de l’esprit » préexistante sont réparties en deux catégories : soit elles constituent de nouvelles expressionsfrbr de l’œuvrefrbr dont dépend la première, soit elles relèvent d’une nouvelle œuvrefrbr. Dans la première catégorie on trouve par exemple une traduction d’une « œuvre de l’esprit » textuelle, tandis qu’une adaptation cinématographique relèverait de la seconde.

Quoi qu’il en soit, toutes les expressionsfrbr d’une même œuvrefrbr sont placées sur le même plan, l’expressionfrbr originale ne jouissant d’aucun statut particulier, ni même d’un attribut la signalant comme telle. C’est seulement en établissant, en plus du lien à l’œuvrefrbr appropriée, des relations entre expressionsfrbr (du type est une traduction de ou autre) qu’on peut pallier en partie cet inconvénient. Résultat : dans RDA, qui sur ce point applique FRBR à la lettre, il n’est pas actuellement possible de mentionner, sinon sous forme d’information textuelle, que la langue originale de Moderato cantabile, de Marguerite Duras, est le français.

Autre problème : dans FRBR, la décision de faire d’une œuvre dérivée, soit une nouvelle expressionfrbr d’une même œuvrefrbr, soit une expressionfrbr d’une œuvrefrbr distincte, relève de choix de catalogage :

En raison du caractère abstrait de la notion d’œuvre, il est difficile de définir avec précision les frontières de cette entité. En fait, il peut très bien arriver que d’une culture à l’autre on ne conçoive pas de la même manière ce qui constitue la substance d’une œuvre et le moment où l’on passe d’une œuvre donnée à une autre œuvre. Il s’ensuit que dans le cadre de conventions bibliographiques les critères permettant de déterminer les limites entre une œuvre et une autre peuvent varier selon l’appartenance à tel ou tel contexte culturel ou géopolitique.
FRBR § 3.2.1 L’entité Œuvre

C’est-à-dire qu’il est impossible d’attribuer à une œuvrefrbr donnée un identifiant qui ait une valeur universelle.

Faut-il se débarrasser de l’œuvrefrbr ?

Aie! they will see you! par Julie Kertesz sur Flickr
Aie! they will see you! par Julie Kertesz sur Flickr (Creative Commons BY-NC-SA 2.0)

Si l’expressionfrbr est la ligne de force sur laquelle s’appuyer pour que les métadonnées bibliographiques « frbérisées » deviennent effectivement utilisables indifféremment par tous les métiers impliqués dans la production et la mise à disposition des « œuvres de l’esprit », l’œuvrefrbr est-elle utile ?

Elle l’est s’il peut être démontré qu’un regroupement explicite d’expressionsfrbr parentes est utile dans certains cas. L’œuvrefrbr devrait se définir alors comme l’ensemble des métadonnées communes au regroupement qu’on décide d’opérer.

On peut convenir par exemple que la mise en commun, au sein d’une entité bibliographique spécifique, de métadonnées partagées par plusieurs expressionsfrbr est économique quant à la production de ces dernières, en même temps qu’elle en facilite la cohérence. Par exemple : l’auteur d’une « œuvre de l’esprit » textuelle est aussi celui de ses traductions, une éventuelle indexation matières établie pour le texte original est également valide pour les traductions etc.

En outre il n’est pas toujours possible, ni utile, de mettre en relation une œuvre dérivée (expressionfrbr) avec la version précise (expressionfrbr) de l’œuvre originale dont elle découle. Exemple : on ne dispose pas nécessairement de l’information permettant d’établir à partir de laquelle des différentes versions des Canterbury Tales de Chaucer telle traduction est effectuée.

The Canterbury Tales (1)

Ou bien : le film Plein soleil réalisé par René Clément (1960) est adapté du roman The talented Mr. Ripley de Patricia Highsmith, probablement par l’intermédiaire de la traduction française de celui-ci, Monsieur Ripley — détail sans importance aucune en l’occurrence.

The talented Mr. Ripley

Quoique le 2e cas puisse à vrai dire se résoudre sans œuvrefrbr, le premier nécessite au moins la définition d’une sorte d’expressionfrbr neutre, comme un joker auquel recourir le cas échéant. Ou bien une œuvrefrbr.

The Canterbury Tales

L’emploi d’œuvresfrbr dans un système donné peut par ailleurs se révéler un moyen de mieux répondre à des recherches vagues ne portant pas sur une expressionfrbr précise, et de faciliter la navigation entre expressionsfrbr.

Pour sortir d’une impasse…

Il faudrait inverser la règle du RDA. Au lieu de « Lors de l’enregistrement des relations principales, inclure au minimum l’œuvre manifestée. », RDA § 17.3 et de « S’il existe plus d’une expression de l’œuvre, enregistrer l’expression manifestée », RDA § 17.3, avoir pour règles :

Lors de l’enregistrement des relations principales, inclure au minimum l’expression manifestée.
et éventuellement
S’il existe plus d’une expression de l’œuvre, enregistrer l’œuvre manifestée.

Il faudrait en outre définir pour elles-mêmes les métadonnées décrivant l’expressionfrbr, et non considérer que relèvent de l’expressionfrbr les éléments de la notice traditionnelle qu’on n’arrive à caser ni dans l’œuvrefrbr ni dans la manifestationfrbr.

Il faudrait aussi instituer un statut particulier pour les « œuvres de l’esprit » (expressionsfrbr) originales, celles découlant directement de la « conception de l’auteur » et qui sont, directement ou non, au départ de toute éventuelle transformation ultérieure.

Refaire RDA, quoi.

On en reparle en 2040.


N.246 : SoRRy, MaDaMe ANNèTTe, ThE WoRLd iS iN a TeRRibLe MeSS (e un ragazzino cerca di metterlo a posto con un sorriso 😉 ) par Encore! (Stefano Coviello) sur Flickr (Creative Commons BY-NC-SA 2.0)

Préparer la FRBRisation des données

L’une des difficultés à surmonter au cours du processus du passage aux FRBR — et non la moindre — sera la mise à niveau des données rétrospectives, qu’il faudra « FRBRiser » à coup de procédures informatiques reposant sur des algorithmes de conversion.

Ces algorithmes s’efforceront d’identifier les Œuvres et si possible les différentes Expressions de celles-ci contenues dans chacune des Manifestations décrites dans le catalogue, puis de créer automatiquement les notices et/ou les points d’accès correspondants.  Ceci bien entendu à partir des données du catalogue. La qualité du résultat sera donc fonction de celle des données à traiter.

Les quelques recommandations que voici constituent un socle, et pourront être complétées dans les consignes qui seront prochainement publiées dans le Guide méthodologique du Sudoc, notamment pour des types de ressource qui ne sont pas évoquées dans ce petit billet.

On peut aussi s’en inspirer pour la préparation des catalogues locaux.

Ce qui est fait est fait, il n’est pas question de revenir « à la main» sur les millions de notices déjà produites, ce serait comme écoper la mer d’Iroise avec une poêle à frire. Mais on peut, s’agissant des données à créer, prendre les précautions nécessaires pour leur assurer le moment venu une FRBRisation élégante.

Une règle simple : appliquer les règles de catalogage en vigueur (pour le Sudoc, celles énoncées dans le Guide méthodologique), voilà la meilleure des garanties.

Cependant il importe de veiller tout spécialement à quelques points précis, cruciaux pour une FRBRisation efficace.

Les titres

Les titres constituent l’élément fondamental d’identification des Manifestations, mais aussi, et c’est ce qui importe dans le processus de FRBRisation, des Œuvres qui y sont contenues. C’est pourquoi il est essentiel de les transcrire avec exactitude.

Lorsqu’on décrit une traduction, il est nécessaire de transcrire systématiquement le titre original de l’œuvre (Unimarc 454) : c’est le seul lien entre les différentes versions linguistiques de ladite.

Le cas échéant, la transcription fidèle des titres des œuvres contenues et des responsabilités associées sera d’un grand secours le moment venu.

Les codes de langue (Unimarc 101)

Ils sont indispensables à l’identification des Expressions (pour les œuvres textuelles ou s’exprimant au travers d’une ou plusieurs langues). Il faut au minimum que les données suivantes soient présentes (et correctes) :

  • la (les) langue(s) de la publication ($a)
  • la (les) langue(s) originale(s) en cas de traduction ($c)
  • l’indicateur de traduction

Les accès auteurs (Unimarc 7xx)

Il faudra pouvoir les attribuer automatiquement à l’entité FRBR pertinente (Œuvre, Expression, ou Manifestation). Ce sera possible si :

  • le choix de l’étiquette Unimarc (7×0, 7×1 ou 7×2) est correct
  • le(s) code(s) de fonction est / sont présent(s) et juste(s)

Les dates

Des dates saisies dans les notices bibliographiques, on pourra dans certains cas inférer celle de l’Œuvre correspondante : par exemple pour les travaux universitaires, thèses et mémoires.

En revanche il sera difficile de dater les Expressions à partir des données présentes, cette notion étant depuis toujours absente des règles de catalogage.

Pour les œuvres textuelles, la date de copyright y correspond assez bien, mais elle est rarement saisie vu que les normes actuelles n’en font pas grand cas. Il serait utile de le faire désormais, en Unimarc 210$d, exemple :

$d impr. 2012, cop. 2004

et dans les données codées de date.

D’une manière générale, il importe de dater correctement les ressources décrites, dans la zone de l’adresse bien sûr, mais surtout dans la zone de données codées (même — et surtout —  lorsque plusieurs dates sont liées à une même ressource : dates de copyright et d’impression déjà évoquées, date d’une reproduction en fac-similé et date de l’original, dates des publications en série, dates de publication et de protection des enregistrements sonores ou audiovisuels, etc.)

La zone de l’édition (Unimarc 205)

Une édition, au sens donné à ce terme dans l’ISBD (zone 2) constitue une Expression particulière d’une Œuvre donnée.

Ceci à l’exception des reproductions en fac-similé (cf. Z 44-050, § 2.1.2), qui à vrai dire ne devraient pas faire l’objet d’une zone de l’édition.

Identifiants

Identifiants normalisés et autres

Les identifiants normalisés (ISBN, ISMN, ISSN etc.) de même que certains identifiants commerciaux (EAN, numéros d’éditeurs des publications audiovisuelles) pourront être mis à contribution pour reconstituer des métadonnées incomplètes ou erronées, et sont susceptibles de faciliter la mise en relation d’entités apparentées.

C’est pourquoi ils doivent être scrupuleusement incorporés aux notices, même si certains (ISBN) sont comme on le sait moins fiables que d’autres (ISSN).

Identifiants de notice

Il est important de conserver les identifiants des notices importées ou dérivées, et de supprimer ceux dont on hériterait dans une nouvelle notice obtenue par copie.

Conserver aussi les identifiants des notices d’autorité liées figurant dans les sous-zones $3 des points d’accès contrôlés (Unimarc 500, 60x, 7xx), et ceux des notices bibliographiques liées (sous-zones $0 des zones Unimarc 4xx). Ceci vaut surtout pour les catalogues locaux

Ceci n’est pas une œuvre

Gian Lorenzo Bernini. Transverbération de sainte Thérèse (1652). Rome, Église Santa Maria della Vittoria

Dans le modèle FRBR, l’entité désignée par le nom d’œuvre constitue comme on sait la racine de l’arborescence censée rendre compte de la complexité des objets documentaires.

L’objet documentaire lui-même, celui que l’on manipule et pour lequel on cherche à créer des métadonnées, est un item, cet item étant le représentant d’une manifestation d’une ou de plusieurs expression(s) d’une œuvre chacune.

Manifestation, expression et œuvre sont autant d’entités abstraites dans le modèle.

La manifestation correspond aux opérations de publication d’une ressource. L’expression, c’est le produit intellectuel ou artistique proprement dit : la suite de mots et de signes qui constituent un texte, la suite de séquences filmées composant une œuvre cinématographique… et voilà ça y est, j’ai employé le mot fatal, celui qu’il fallait éviter à tout prix. J’ai dit œuvre en parlant de l’expression.

Comment faire autrement ? Dans la langue ordinaire, une œuvre littéraire, artistique etc. est un produit. Les dictionnaires eux-mêmes associent généralement au terme d’œuvre celui de production, ou de produit (de l’activité créatrice d’un individu).

Oui, mais pas le modèle FRBR. Il est indispensable de s’en convaincre. Une œuvre n’est pas une œuvre.

Qu’est-ce qu’une œuvre ?

Le modèle la définit ainsi (§ 3.2.1) :

une création intellectuelle ou artistique déterminée.

Mais il ajoute quelques lignes plus loin :

… l’œuvre elle-même ne réside que dans une identité de contenu au sein des diverses expressions de l’œuvre.

Tu vois, l’œuvre ne se définit qu’à partir de ses expressions. C’est ce qu’elles ont en commun, ce qui n’est pas distinctif de chacune d’elles.

Il est précisé ensuite (toujours § 3.2.1) :

D’un point de vue pratique, le fait de définir la notion d’œuvre comme l’une des entités du modèle sert à plusieurs choses. Cela permet de nommer la création intellectuelle ou artistique abstraite qui englobe toutes les expressions individuelles d’une même œuvre et d’établir des relations avec celle-ci.
[…]
Cela permet également d’établir des liens indirects entre plusieurs expressions de la même œuvre lorsqu’il est impossible d’établir des liens directs entre ces expressions elles-mêmes.
[…]
Ce lien indirect entre expressions d’une œuvre par le biais des liens établis entre chacune des expressions et l’œuvre qu’elles réalisent constitue souvent le moyen le plus efficace de regrouper des expressions parentes.

On comprend que l’institution de cette notion d’œuvre a une portée essentiellement utilitaire, et ceci dans le cadre d’un système de métadonnées bibliographiques.

L’œuvre n’est donc pas l’œuvre mais son nom. Une œuvre est le plus petit commun dénominateur de toutes ses expressions. Par conséquent une notice d’œuvre est faite essentiellement de la (des) désignation(s) de celle-ci ; elle est le lieu où sont consignées les différentes relations de l’ensemble de ses expressions avec d’autres entités du modèle (en particulier — mais pas seulement — les métadonnées décrivant son ou ses créateurs).

Qu’allions-nous faire à Berlin ?

Berlin (Allemagne), septembre 2011

C’est un voyage ancien déjà. La réunion annuelle des « partenaires CBS » avait lieu à Berlin les 20 & 21 septembre derniers, dans la Staatsbibliothek zu Berlin, celle qui… tu sais ? Oui un film, c’est ça. 1987. Tu vas trouver.

CBS est la base de données qui sous-tend le Sudoc, et les « partenaires » sont le vendeur de ce système (OCLC) et ses utilisateurs (des réseaux hollandais et allemands, un suisse et un français — nous —, deux bibliothèques nationales : la DNB, Deutsche Nationalbibliothek, et la NLA, National Library of Australia, non représentée à Berlin). On nous servait du café et des sandwiches dans un vestibule garni des portraits de tous les directeurs qui se sont succédés à la tête de cette bibliothèque depuis sa création. Tous ils nous regardaient manger, ils ne comprenaient plus rien aux conversations tu penses…

Au cours de ces deux jours : plein d’exposés des uns et des autres sur ce qu’on a fait, pensé, combiné l’année dernière, sur ce qu’on compte faire, combiner, devenir etc. l’année prochaine ; une intoxication alimentaire encore non élucidée qui a failli décimer la délégation française ; et les FRBR.

OCLC & les FRBR

Berlin (Allemagne), septembre 2011

OCLC dispose de deux outils :

  • FRBR (c’est le nom de l’outil), un algorithme de ferbérisation qui s’exerce au moment de la recherche sur les données existantes,
  • et GLIMIR (on dirait du bordure mais c’est de l’anglais : GLobal LIbrary Manifestation IdentifieR), dont l’objectif premier est d’attribuer des identifiants pérennes aux manifestations (au sens FRBR) ; du moins à celles signalées dans WorldCat.

In petto tu te dis : mais, et les ISBN, c’est fait pour les ours ? Et les ISSN ? Les ISSN oui c’est vrai. Mais les ISBN n’ont que quarante ans tu sais, et parfois les éditeurs en ont attribué en dépit du bon sens. Sans parler des autres types de ressources, celles qui ne peuvent recevoir ni ISBN, ni ISSN, ni ISMN etc. Et puis il y a la rançon de la globalisation : WorldCat renferme des notices établies pour la même manifestation en différentes langues (il s’agit bien ici de la langue de catalogage, celle dans laquelle on rédige les notes, la collation etc.). Ce sont des doublons, mais des doublons utiles, car à Sanlúcar de Barrameda on lira plus volontiers une notice rédigée en espagnol qu’en hollandais.

Une fois purgées des doublons inutiles, les notices reconnues par le programme comme décrivant la même manifestation reçoivent un identifiant de manifestation (OMI : OCLC manifestation identifier), puis sont regroupées selon leur contenu (originaux, reproductions numérisées ou en microformes, reprints). Ces regroupements (qui ne correspondent pas au niveau de l’expression des FRBR), identifiés par un OCI (OCLC content identifier), sont enfin rattachés aux œuvres (OWI : OCLC work identifier), placées comme il se doit au sommet de la pyramide.

Le Sudoc & les FRBR

Berlin (Allemagne), septembre 2011

Le Comité stratégique sur l’adoption de RDA en France a demandé à la BnF et à l’ABES d’expérimenter la structuration de leurs catalogues respectifs selon le modèle FRBR — dont RDA est une application —, dans son implémentation la plus élaborée (dite « scénario 1 »).

Pour l’ABES, il s’agit de vérifier que le Sudoc, dans sa configuration technique actuelle, est capable de répondre à cette demande. C’est à dire qu’il nous faut travailler à un paramétrage inédit, appliquant le modèle FRBR, de CBS. Vu que ce système est peu documenté, l’ABES a besoin de l’appui d’OCLC et si possible de demandes concordantes d’autres utilisateurs de CBS.

C’est ce que nous recherchions à Berlin, où s’est tenue à notre demande une réunion « satellite » ad hoc.

Un flop total auprès des réseaux étrangers.

Par bonheur la DNB (Deutsche Nationalbibliothek), dont on connait le parti pris favorable à l’application de RDA, s’est déclarée intéressée, de même qu’OCLC (bureau de Leiden). De sorte qu’une première réunion entre l’ABES et un représentant d’OCLC (Leiden) est prévue à Montpellier le 1er décembre prochain. Un cahier des charges, de préférence commun à l’ABES et à la DNB, devrait ensuite être produit. Si l’implication d’OCLC (Leiden) se confirme, on peut espérer la mise en place d’une base-test à brève échéance, prélude aux tests proprement dits.

Berlin (Allemagne), septembre 2011

Le Val d’Oise enchanté

Une fée a pris sur elle de propager la connaissance des FRBR dans le monde.

Ainsi que l’atteste la vidéo ci-dessous elle est apparue à deux collègues en détresse de la BDP du Val d’Oise, puis les a charmées grâce à ses boîtes FRBR.

C’est une fée de tous les jours, sans baguette ni poudre magique, une fée au pouvoir d’achat en berne, une fée de crise — d’origine grecque ou portugaise peut-être ? — mais au français impeccable.


La fée RBR du Val d’Oise, ceinte du ruban rouge de militante du Sidaction, enchantant deux bibliothécaires grâce à ses boîtes FRBR. Conseil général du Val d’Oise, 2011.

Qui sait si elle ne va pas t’apparaître à toi aussi ?