Archives du blog

Vingt ans après : LRM, un pour tous !

  • 21 août 2017

Ce billet est une version longue d’un article à paraître dans la prochaine livraison (87) d’Arabesques, consacrée à la Transition bibliographique.

Fusione #3, par Paolo Torrisi sur Flickr (CC BY-NC-ND 2.0)
Fusione #3, par Paolo Torrisi sur Flickr (CC BY-NC-ND 2.0).

Bientôt on parlera de FRBR comme d’une chose révolue. Le début de l’effort de modélisation des métadonnées bibliographiques entrepris au début des années 1990. Le texte fondateur de cet effort : le « modèle FRBR » contenu dans le rapport final sur les Fonctionnalités requises des notices bibliographiques, achevé en 1997, publié en 1998, aura constitué le point de départ d’une évolution profonde dans la compréhension de l’univers complexe des métadonnées bibliographiques.

Deux autres modèles ont suivi : FRAD (2009) pour les données « d’autorité » et FRSAD (2010) pour les données « d’autorité matière », périphériques dans FRBR qui se concentrait sur ses 4 entités centrales : œuvre, expression, manifestationitem, et sur les relations de et vers ces entités.

IFLA LRM (IFLA Library reference model : Modèle de référence des bibliothèques, 2017) résulte de la fusion et de l’évolution des trois modèles FRxx, qu’il remplace intégralement.

Pourquoi fusionner les trois modèles ?

Globalement, leur rédaction s’est échelonnée sur une quinzaine d’années, au cours desquelles s’accomplissait un événement bouleversant : le déferlement de l’Internet sur le monde. Les FRBR sont encore dans l’ignorance de cette chose-là, bien qu’elles prennent acte d’un changement en cours dans les besoins des publics. Elles ne savent pas non plus très bien ce qu’elles sont, vu qu’elles poursuivent deux objectifs distincts : « élaborer un cadre conceptuel permettant de comprendre clairement […] l’essence même de ce sur quoi la notice bibliographique est censée renseigner, et l’essence même de ce que nous attendons de la notice en termes d’adéquation aux besoins des utilisateurs » d’une part, et « recommander un niveau  minimal  de  fonctionnalité  et  de  spécification  de  données  à  appliquer  aux  notices  produites  par  les  agences  bibliographiques nationales » d’autre part. C’est ce second objectif que semble exprimer le titre : « Fonctionnalités requises des notices bibliographiques ». Tous les mots comptent.

Le fameux « modèle FRBR » qui s’y trouve contenu s’érige sur un terrain encore imprégné des Principes de Paris (1961). Il en est nourri. Il n’y avait que ça comme nourriture à l’époque. Pourtant le cadre général qu’il pose n’a pas été profondément remis en cause par la suite : un cœur bibliographique réparti en quatre entités principales, œuvre, expression, manifestation et item (« WEMI[1] »), sur lequel des personnes ou des collectivités exercent des responsabilités de création, transformation, publication, possession etc. S’y ajoute la relation de sujet (absente des Principes de Paris), qui associe n’importe laquelle des six entités déjà citées, plus quatre autres (objet, concept, lieu et événement) à l’entité œuvre et à elle seule.

Modèle FRBR : schéma général
Modèle FRBR : schéma général.

Tout cela dans la perspective des quatre types d’opération identifiées comme pouvant être effectuées par l’utilisateur d’un catalogue : trouver, sélectionner, identifier, obtenir. Chacune des entités du modèle est dotée d’un certain nombre d’attributs, qui pourraient être autant de zones d’une notice MARC qui en décrirait une instance.

FRAD et FRSAD approfondiront la modélisation des données dites « d’autorité » : pour FRAD, celles constituant les entités FRBR œuvre, personne et collectivité auxquelles s’en ajoute une nouvelle (famille) ; pour FRSAD, toutes les entités du modèle, mais dans la perspective exclusive de leur utilisation en tant que sujet.

Ces points de vue particuliers nécessitent la création de nouvelles entités. Par exemple nom dans FRAD et nomen dans FRSAD, tant il est vrai que le travail sur les « autorités » consiste essentiellement à rassembler les différents noms par lesquels une même entité peut être désignée. Ou encore thema dans FRSAD, définie comme une super-classe de toutes les entités FRBR, ce qui permet de formaliser la relation de sujet de manière générique : œuvre a pour sujet thema, thema est sujet de œuvre. FRAD et FRSAD, qui englobent dans les processus liés aux données d’autorité les tâches réalisées par les créateurs et les gestionnaires desdites données, identifient en outre des opérations d’utilisateur inconnues de FRBR : contextualiser et justifier (FRAD), explorer (FRSAD).

Les modèles FRAD et FRSAD, développés à part des FRBR tout en y faisant constamment référence, étendent le modèle d’origine et l’affinent, quittes à en redéfinir parfois les concepts d’une manière adaptée à leurs points de vue respectifs. Conçus également à part l’un de l’autre, ils peuvent établir des concepts voisins mais pas entièrement superposables (par exemple nom et nomen cités plus haut). Enfin certains de ces nouveaux concepts ne sont plus en cohérence avec l’approche des FRBR : l’association d’un nom à une entité, définie comme une relation pour les données « d’autorité » est traitée comme un attribut de l’entité dans FRBR (un titre de manifestation par exemple).

Il y avait donc lieu d’envisager enfin les trois modèles comme un tout, d’autant que la modélisation des agrégats avait fait parallèlement l’objet d’un rapport[2], publié séparément en 2011 et jamais intégré au corps des FRBR. Sans compter que de FRBR à FRAD et FRSAD, on est passé d’une modélisation « entité-association » basique à une modélisation qu’on sent tentée par un formalisme d’ontologie.

FRBRoo

Au moment même où s’élaboraient FRAD et FRSAD naissait une autre initiative liée à FRBR.

FRBRoo[3] (FRBR « orienté objet »), publié dans sa première version en 2009, est une formalisation de FRBR en ontologie, par le biais d’une harmonisation avec CIDOC CRM[4], modèle conceptuel créé pour les objets de musée. FRBRoo, qui se présente comme « une ontologie ou modèle conceptuel de haut niveau pour les données bibliographiques[5] »,  en est une extension. Son édition actuelle (version 2.4, 2015) intègre les modèles FRAD et FRSAD.

FRBRoo, au lieu d’entités et de relations, met en œuvre des classes et des propriétés. Les classes sont organisées hiérarchiquement (une classe lègue toutes ses propriétés aux sous-classes qui en dépendent).

On y retrouve globalement l’analyse des FRBR, avec cependant quelques différences notables. Le temps y est envisagé de manière dynamique (notion de laps de temps, aussi court soit-il, dans lequel se déroule toute opération liée à la production bibliographique, au lieu de celle, fixe, de date, d’ailleurs envisagée comme attribut et non comme relation dans les modèles FRxx). Dans FRBR la manifestation n’est qu’un avatar d’une œuvre réalisée dans une expression, tandis que FRBRoo distingue un processus de production d’une manifestation à exemplaire unique (tel qu’un manuscrit) de celui aboutissant à la production de copies multiples. Ce dernier est considéré comme un travail de création : FRBRoo reconnaît l’œuvre de publication, dont l’expression englobe les expressions individuelles des œuvres qui font l’objet de la publication. L’expression de publication de FRBRoo est plus ou moins un équivalent en relief de la manifestation de FRBR. En revanche, la manifestation à exemplaire unique est considérée comme un objet, et confondue avec son item.

IFLA LRM

L’influence de FRBRoo sur LRM est sensible, et cela dès son nom dans lequel on perçoit un écho de celui du CIDOC CRM. « IFLA LRM se veut un modèle conceptuel de référence de haut niveau développé dans un cadre de modélisation entité-association enrichi »[6], ce qui n’est pas très éloigné de ce que FRBRoo dit de lui-même (cf. supra).

Formalisme

IFLA LRM se donne en effet des airs d’ontologie. Les entités y sont organisées hiérarchiquement en classes et sous-classes, avec une entité de niveau supérieur, res (« chose » en latin — mais c’est aussi le début de resource, comme dans Resource Description Framework ou RDF). Toutes les autres entités du modèle sont donc des sous-classes de res, défini comme « toute entité de l’univers du discours ». Res était en quelque sorte annoncé par thema de FRSAD, dont il est une généralisation. LRM compte 3 niveaux d’entités.

LRM, hiérarchie des entités
LRM, hiérarchie des entités. Source : IFLA Library Reference Model, IFLA, 2017, page 18.

Comme dans les modèles FRxx, les entités sont dotées d’attributs.

Les relations se caractérisent chacune par leur domaine et leur codomaine (c’est à dire l’entité depuis laquelle et celle vers laquelle la relation peut être établie) ainsi que par leur cardinalité (pour une relation donnée, le nombre d’instances possibles d’entités de son domaine et de son codomaine). De même qu’est définie une entité de niveau supérieur, de même est établie une relation générique Est associé à, dont le domaine et le codomaine sont l’entité res : res est associée à res. Les autres relations définies dans le modèle en sont des spécialisations.

Chaque entité, attribut, relation de LRM est doté d’un identifiant (LRM-En pour les entités, LRM-En-An pour les attributs, LRM-Rn pour les relations).

Entités

L’organisation hiérarchique des entités dans LRM abolit la répartition en trois groupes de FRBR (groupe 1 : WEMI ; groupe 2 : agents ; groupe 3 : entités supplémentaires définies pour la relation de sujet) et fait disparaître la notion d’autorité.

On y compte moins d’entités que dans l’ensemble FRBR + FRAD + FRSAD (11 au lieu de 18) : une entité LRM n’est établie qu’à condition de présenter des attributs ou relations spécifiques (qui ne peuvent pas être définies à un niveau supérieur) — ce qui a par exemple conduit à l’extinction des entités concept et objet, désormais inutiles puisque la relation de sujet ne porte plus que sur res.

Les WEMI voient leurs définitions légèrement modifiées (œuvre et manifestation dans un sens plus abstrait), tandis qu’il devient possible, pour une œuvre donnée, d’en déterminer une « expression représentative » dont certaines caractéristiques peuvent être enregistrées en tant qu’attributs de l’œuvre (exemple : la langue originale d’une œuvre textuelle).

Une entité générique agent est désormais déclarée dans le modèle, avec comme sous-classes personne et agent collectif (au détriment des entités famille et collectivité). Mais surtout un agent est défini comme « une entité capable d’actions délibérées, qui peut bénéficier de droits et être tenu pour responsable de ses actions » alors que pour FRAD une personne est un « individu, ou identité d’emprunt ou autre identité attribuée ou adoptée par un individu ou un groupe » et une collectivité « comprend des organismes ou des groupes de personnes fictifs ». Ce glissement — influence directe de FRBRoo — constitue un important changement de point de vue qui mériterait une analyse particulière.

Les entités lieu et événement sont profondément transformées : elles deviennent respectivement lieu et laps de temps, et peuvent être désormais associées à res (c’est-à-dire à n’importe quelle entité du modèle) par la relation « Est associé à » (LRM-R33) : elles ne sont plus confinées à la relation de sujet. Concrètement, les attributs FRBR tels que : lieu de publication, localisation (d’une collectivité) etc. ou date de l’œuvre, de l’expression, de publication, de naissance etc. n’existent plus et doivent être remplacés chacun par une relation entre l’entité concernée (œuvre, expression, manifestation, agent…) et l’entité lieu ou laps de temps suivant le cas.

Attributs

Ils sont beaucoup moins nombreux que dans l’ensemble FRBR + FRAD + FRSAD. Là où ils ont pu être remplacés par des associations entre entités, ou lorsqu’ils semblaient relever davantage d’applications du modèle que du modèle lui-même, ils ont disparu.

En contrepartie, quelques créations. L’un de ces nouveaux attributs, établi au niveau de res, c’est à dire autorisé dans toutes les entités, est catégorie, qui permet de ne déclarer dans le modèle lui-même que les entités jugées nécessaires au niveau de généralisation qui est le sien. La catégorisation de certaines d’entre elles en entités plus spécifiques aura lieu si besoin est dans les applications du modèle (règles de catalogage par exemple).

Signalons également l’attribut mention de manifestation dans l’entité manifestation : « une mention apparaissant sur les exemplaires d’une manifestation et jugée importante pour la compréhension que peuvent avoir les utilisateurs de la façon dont la ressource se représente elle-même ». À lui seul cet attribut prend en charge l’intégralité des données transcrites — que les règles de catalogage peuvent détailler autant que nécessaire.

Relations

Les relations dans LRM, vue d'ensemble
Les relations dans LRM, vue d’ensemble. Source : IFLA Library Reference Model, IFLA, 2017, page 84.

Les relations entre entités étaient parfois définies de manière différente d’un modèle FRxx à un autre. Ces conflits sont résolus dans LRM, où les relations (en dehors de celles entre WEMI qui restent le cœur du modèle) sont généralement plus abstraites que dans les modèles précédents et moins nombreuses. Exemple : les relations de supplément, complément et même de résumé définies entre œuvres dans FRBR sont englobées dans celle de accompagnement / complément dans LRM.

La relation de sujet, on l’a vu, est établie simplement entre l’entité res et l’entité œuvre, ce qui revient à dire que toute entité du modèle peut être sujet d’une œuvre (y compris une œuvre, qui est elle-même une res).

Les relations d’agent sur les WEMI sont retouchées par rapport à FRBR (ainsi la relation A créé / Est créé par est étendue à l’expression et à la manifestation, probable influence de FRBRoo).

La relation d’appellation, reprise de FRSAD, est peut-être la plus troublante pour qui ne connaissait que le modèle FRBR dans lequel elle n’est pas définie. Dans FRBR, les noms que peut prendre une instance de telle ou telle entité sont des attributs de ladite entité. Dans LRM, toute forme particulière de nom liée à une entité est une instance d’une autre entité, nomen, associée à la première par la relation A pour appellation / Est une appellation de (LRM-R13). Ce dispositif permet à chaque forme de nom d’être doté d’attributs : d’abord la chaîne de caractères qui compose ce nom, son type (identifiant, point d’accès normalisé, variante de nom…), sa langue, son écriture, son contexte d’utilisation, sa source etc. et d’être mis en relation avec d’autres entités (la personne ou la collectivité qui a assigné cette forme particulière du nom, par exemple).

Les opérations des utilisateurs (« user tasks »)

Comme FRBR, LRM est construit en fonction des besoins des utilisateurs de l’information bibliographique. En revanche il ne prend pas en compte les processus de gestion interne des métadonnées présents dans FRAD et FRSAD. Les sept opérations des utilisateurs définies conjointement dans FRBR, FRAD et FRSAD sont donc réduites à cinq dans LRM, certaines étant devenues caduques et déclarées hors modèle, les autres s’ajustant en une liste unique dans laquelle on retrouve les quatre opérations de base dégagées dans FRBR (trouver, identifier, sélectionner, obtenir) définies d’une manière plus synthétique, auxquelles s’ajoute « explorer », fusion de l’opération du même nom dans FRSAD et de « contextualiser » de FRAD.

LRM, un modèle conceptuel de haut niveau

LRM se présente comme un modèle « de haut niveau », c’est-à-dire qu’il n’entre pas dans certains détails de spécificité considérés comme relevant de ses applications particulières (codes de catalogage ou autres) — à l’image de feu l’ISBD(G), matrice des ISBD spécialisés. Il se tient au contraire à un niveau de généralité qui lui procure davantage de souplesse que les modèles FRxx.

Il revient aux créateurs d’applications de LRM d’en élaborer éventuellement des extensions (à l’instar de FRBRoo, extension de CIDOC CRM) en créant par exemple des sous-classes des entités existantes, des relations spécifiques à partir de celles définies dans le modèle, ou de nouveaux attributs aux entités. Ils peuvent aussi, sans définir de nouvelles entités, se contenter d’utiliser l’attribut catégorie de res afin de répartir les entités existantes selon une typologie à définir en fonction de l’application.

À l’inverse, une application de LRM est libre de n’en utiliser qu’une partie des entités, des attributs ou des relations. « Cependant, une implémentation du modèle ne sera considérée comme fidèle à celui-ci qu’à la condition qu’elle respecte la structure fondamentale des entités et des relations définies entre elles (y compris leurs contraintes de cardinalité), ainsi que le rattachement des attributs aux entités pertinentes. » (IFLA LRM 2.2.)

RDA et LRM

Dès novembre 2016 le RSC (RDA Steering Committee) a pris la décision de réviser en profondeur RDA afin de l’aligner sur LRM, dont le texte était alors considéré comme stabilisé.

Ce travail est en cours. La publication d’une nouvelle édition de RDA, dans un RDA Toolkit lui-même rénové, est annoncée pour avril 2018 [mise à jour : juin 2018]. Ce sera l’épreuve de vérité : on verra si RDA est finalement autre chose qu’un ravalement de façade des AACR2.

À suivre particulièrement : la mise en œuvre de la modélisation des agrégats et celle de la relation d’appellation. Cette dernière est difficile à rendre dans un format MARC.

[1] Pour: Work, Expression, Manifestation, Item

[2] Final report of the Working group on aggregates, IFLA, 2011. En ligne : https://www.ifla.org/files/assets/cataloguing/frbrrg/AggregatesFinalReport.pdf

[3] Voir : Definition of FRBRoo : a conceptual model for bibliographic information in object-oriented formalism, version 2.4, IFLA, 2016. En ligne : https://www.ifla.org/publications/node/11240

[4] CIDOC : Comité international pour la documentation de l’ICOM [International council of museums ] ; CRM : Conceptual reference model. Voir : http://www.cidoc-crm.org/

[5] « FRBRoo is an ontology or high-level conceptual model for bibliographic data. » https://www.ifla.org/publications/node/11240 déjà cité.

[6] IFLA LRM, § 2.1 Scope and objectives

………

The three musketeers (1921), extrait. Fred Niblo, réalisation ; Douglas Fairbanks, Edward Knoblock et Lotta Woods, scénario ; Douglas Fairbanks (D’Artagnan), Léon Bary (Athos), George Siegmann (Porthos), Eugene Pallette (Aramis),… acteurs.
D’après Les trois mousquetaires d’Alexandre Dumas.
États-Unis, 1921.

Publicités

AlKindi : un catalogue FRBRisé

  • 13 juin 2016

Un petit tour sur AlKindi, le catalogue en ligne de la bibliothèque de l’Idéo (Institut dominicain d’études orientales, Le Caire), à travers quelques captures d’écran évidemment bien réductrices (et d’ailleurs à peu près illisibles). Il faut aller voir par soi-même.

AlKindi — du moins son interface de recherche — met en œuvre le modèle FRBR d’une manière assez poussée, au point par exemple que les relations de type agent (créateur, contributeur, éditeur, possesseur etc.) se font réellement à l’entité du groupe 1 pertinente (œuvre, expression, manifestation, item). En visitant le site, explorer notamment les nombreux liens regroupés dans des encadrés sur le côté droit de l’affichage.

AlKindi. Affichage d'une notice biliographique

1. Affichage d’une notice de manifestation. Cliquer sur l’image pour la voir dans Alkindi et ici pour voir la même dans le Sudoc.


AlKindi - Notice d'œuvre

2. Affichage de la notice de l’œuvre correspondante.


AlKindi - Notice de collectivité

3. Affichage d’une notice de collectivité (l’éditeur commercial de la manifestation).

………

Une femme sur la route = امرأة في الطريق . Extrait. Ezz Eldine Zulficar = عزالدين ذو الفقار, réalisateur ; Rouchdi Abaza = رشدي أباظة, Hoda Soltan = هدى سلطان…, acteurs. Égypte, 1958.

Elle dit quoi, la dame ?

FRBR-LRM

  • 17 juin 2015

Fusione #2, par Paolo Torrisi sur Flickr (CC BY-NC-ND 2.0)
Fusione #2, par Paolo Torrisi sur Flickr (CC BY-NC-ND 2.0).

FRBR-LRM : tel est le nom sous lequel on désignera le résultat de la fusion en un seul modèle des trois FR (FRBRER, FRAD et FRSAD). LRM pour Library Reference Model.

Le travail de consolidation, qui aura duré plusieurs années, sera présenté cet été au congrès annuel de l’IFLA, au Cap, en Afrique du Sud. On peut d’ores et déjà prendre connaissance du texte (en anglais) de la communication de Pat Riva et Maja Žumer, membres du comité éditorial de FRBR-LRM, qui fait très clairement ressortir les caractéristiques principales du modèle.

On y retrouve un FRBRER retouché (le groupe 1 reste intact), et enrichi des apports de FRAD et FRSAD.

Une fois finalisé au sein du FRBR Review Group, le texte de FRBR-LRM sera présenté pour approbation aux instances ad hoc de l’IFLA (c’est à dire les Standing Committees for Cataloguing, Classification & Indexing et Bibliography), et devrait être soumis à enquête internationale début 2016.

Les doigts dans l’eau bénite du RDA

  • 23 mai 2014

Os olhos do meu amor
São grãozinhos de pimenta
Namorei-os na igreja
Ao tomar da água benta.

Les yeux de mon amour
Sont des grains de poivre
J’en suis tombée amoureuse
En prenant l’eau bénite.

Arlindo de Carvalho (né en 1930). Verde limão

(Prudence lorsqu’on trempe les doigts dans l’eau bénite.)

C’est terrible comme le stress de devoir parler devant un auditoire, dans une circonstance et dans un lieu assez solennels — du moins insolites — vous enlève à vous-même. On y est plus ou moins sujet, mais moi, le trac me rend malade, même bien avant l’instant redouté. Quand cet instant arrive, et pendant toute le temps où il faut parler, dire des choses, et ensuite répondre à des questions, je suis incapable de raisonner normalement. Et l’âge bien sûr n’arrange rien, vu le nombre de neurones qui s’anéantissent à chaque minute qui passe.

Je ne sais pas ce que j’ai dit sur RDA avant-hier, aux Journées Abes. D’après des personnes qui sont venues me voir ensuite, j’ai dit que ça n’avait aucun intérêt, que ce n’était ni fait ni à faire. Ce que j’ai dit sur les formats Marc, je ne sais pas trop.

Non, je ne pense pas que RDA soit sans intérêt. Je pense au contraire que dans son genre il a de grandes qualités. C’est le premier code de catalogage complet qui envisage vraiment les données bibliographiques comme étant constituées d’entités distinctes en relation les unes avec les autres, et qui suggère qu’elles puissent aussi être mises en relation avec d’autres données (du web) dont la portée ne soit pas essentiellement bibliographique.

Nos règles françaises actuelles ne disent rien de cela. Cependant l’application que nous en faisons dans le Sudoc (par exemple) témoigne d’une approche comparable. Dans le Sudoc, on met réellement des notices bibliographiques en relation avec d’autres notices bibliographiques, des notices d’autorité avec d’autres notices d’autorité, et des notices bibliographiques avec des notices d’autorité. Autrement dit : ce qui est produit actuellement dans le Sudoc n’est pas très différent de ce qu’on peut produire en appliquant le RDA dans un système en Marc capable de gérer des liens entre notices. En tout cas structurellement, il n’y a aucune différence.

Sur certains points, RDA apporte du mieux. Il est possible d’intégrer ce mieux si nous le jugeons utile. Par exemple la mise en relation (obligatoire selon RDA) de la notice bibliographique avec une notice d’écrivant l’œuvre, ou les œuvres contenue(s). Ou encore l’élément Type de support matériel (RDA 3.3) qui complète les éléments Type de contenu (RDA 6.9) et Type de média (RDA 3.2). Le type de support y est exprimé dans un vocabulaire contrôlé pour lequel des valeurs codées peuvent être utilisées. C’est mieux que de le donner sous forme textuelle comme nous le faisons actuellement (dans la zone Unimarc 215/$a) : plus pratique pour l’échange international de données, et pour une sortie en RDF. Cet élément n’a pas de correspondance dans l’ISBD, contrairement aux deux autres (qui équivalent peu ou prou à Forme du contenu et Type de médiation dans la zone 0, bientôt implémentée dans le Sudoc).

Ce qui me semble un peu manqué dans RDA, c’est que cette FRBRisation du code s’apparente davantage (selon moi) à un lifting terminologique qu’à un changement profond. Dans RDA il y en a à la pelle du FRBR et du FRAD, il s’en est mis partout. Mais il n’y a pas eu d’effort de clarification de la notion d’expression par opposition à la notion d’œuvre (voir le billet De l’expression bordel !). Dans RDA la notion d’expression est à l’évidence confondue avec celle de contenu de la manifestation, ce qui n’est pas la même chose. Cette dernière est à rapprocher de l’œuvre de publication (ou plutôt de son expression en l’occurrence) dans FRBRoo.

Il n’y a pas eu non plus de réexamen de la méthode de description des publications de type ISBD, essentiellement fondée sur la transcription ordonnée des éléments d’information recueillis sur la publication à décrire. Loin d’être un spécialiste du RDF, j’ai quand même appris certaines choses dans le groupe de travail interne à l’Abes sur la restitution des données du Sudoc dans ce formalisme. Notamment, que les zones ISBD dans lesquelles l’ordre des éléments est signifiant sont compliquées à faire passer en RDF, parce que certains de ces éléments ne sont en réalité pas indépendants alors qu’ils sont déclarés comme tels. Ils n’ont de sens que mis en rapport avec celui auquel ils sont subordonnés. Exemple : une page de titre portant deux titres, un complément de titre et trois mentions de responsabilité. Se contenter d’étiqueter chacun des éléments indépendamment les uns des autres, c’est comme donner en vrac des pièces détachées sans aucune instruction d’assemblage. Quelle est la bonne combinaison ? Titre : complément du titre / mention de responsabilité. Titre / mention de responsabilité ; mention de responsabilité, ou Titre / mention de responsabilité ; mention de responsabilité. Titre : complément du titre / mention de responsabilité, ou une autre combinaison ? Si on tient à cette méthode d’identification des publications, autant considérer ce type de séquence comme un tout et donner des instructions en ce sens (ce qui n’est pas fait dans le RDA). Ou autoriser le recours à une technique d’encodage des éléments de la source d’information, genre TEI, qui pourrait être utilisée conjointement avec du RDF.

Ou encore considérer que, du moins pour les ressources contemporaines, la description d’une ressource à des fins d’identification peut se faire autrement. D’ailleurs, c’est encore et toujours la suprématie des ressources textuelles qui a décidé de l’orientation des règles. Les enregistrements sonores n’ont jamais eu de page de titre, ni rien qui puisse en tenir lieu. L’identification de cette sorte de ressource passe par l’usage de titres normalisés (identification des œuvres et des expressions musicales), la consignation des noms des interprètes, des circonstances de l’enregistrement (la date surtout), et des données éditoriales et commerciales.

Quant aux formats Marc, ils sont faits pour des notices « à l’ancienne », que par la force des choses nous produisons encore. Et RDA entre parfaitement dedans. Les formats Marc lui vont à merveille. Il est fait pour les vêtements démodés — ou plutôt tellement classiques qu’ils sont indémodables. Il n’aime pas ces matières modernes, ces coupes d’avant-garde, non… dès qu’il essaie d’entrer dedans il les fait craquer, quelque chose ne va pas. Les bras, le buste ça passe, ça le rajeunirait même, mais ça coince au niveau de la taille.

Roma Foro Boario água benta, par patcarmo sur Flickr
Roma, Foro Boario, água benta, par patcarmo sur Flickr

………

Dans la même session RDA vu de l’intérieur aux Journées Abes 2014 : Formations aux pré-requis : retours d’expérience, par Émilie Liard, SCD de l’université de Poitiers.

Notes en vrac

  • 25 octobre 2013

Giorgio de Chirico (1888-1978). La stazione di Montparnasse (1914 ; Paris), 140 x 184,5 cm. Museum of Modern Art, New York, États-Unis.
Giorgio de Chirico (1888-1978). La stazione di Montparnasse (1914), 140 x 184,5 cm. New York (États-Unis), Museum of Modern Art.

J’écris ces notes — qui sortent en vrac — dans le train, après la journée RDA, FRBR état des lieux organisée par la FULBI jeudi 17. (J’y étais invité pour présenter les progrès de la FRBRisation du Sudoc : je n’avais rien à dire, rien. Une situation des plus gênantes. Réduit à un babil d’ameublement. Heureusement les autres intervenants avaient des choses à dire quant à eux, et j’ai trouvé la journée très intéressante.)

Je me pose encore les mêmes questions à propos de ce projet SGBM et d’un futur Sudoc : faut-il passer au RDA ou pas, est-ce qu’un code de catalogage peut vraiment intégrer les FRBR, est-ce qu’il ne faut pas dépasser les FRBR, est-ce qu’on peut trouver une autre inspiration dans FRBRoo … Je ne sais pas.

Mais il me semble qu’il faut découpler les problématiques respectives du RDA et du modèle FRBR. On le voit, la Bibliothèque du Congrès le montre : on peut appliquer le RDA sans vraiment produire de données FRBRisées. Et plus j’y pense, plus je crois que des catalogueurs d’une BU ou autre ne feront jamais l’effort d’identifier l’œuvre, encore moins les œuvres, contenue(s) dans la publication à traiter. Cela tant que les règles de catalogage, et les interfaces de saisie, privilégieront l’aspect contenant par rapport à l’aspect contenu. Ou plutôt : obligeront à voir l’objet à décrire par ce bout-là de la lorgnette.

C’est pourquoi je me dis parfois : passons au RDA quoiqu’il en coûte, faisons-le, débarrassons-nous de ce problème-là. Ce qui nous permettra de nous poser la vraie question : maintenant comment fait-on pour sortir du catalogue traditionnel ? (Pour le dynamiter.)

Autre chose : pour construire des applications FRBR, il importe de ne considérer le modèle que comme une référence (rappelons qu’il a été conçu dans les années 1990, à partir des données de l’époque). Il faut le critiquer, le discuter, l’adapter. C’est ce qui a été fait par exemple pour la conception du nouveau système de production d’Electre  (présenté à la journée FULBI), et dans une moindre mesure dans Data.bnf.fr. Je ne suis pas sûr que la notion d’œuvre au sens strictement FRBR soit réellement représentée dans le modèle Electre, et c’est tant mieux. À mon sens les contours de l’entité œuvrefrbr sont difficiles, sinon impossibles, à normaliser (ce qui est d’ailleurs anticipé dans le modèle). L’entité expressionfrbr ou un équivalent, niveau pertinent pour la gestion des droits d’auteur sur les contenus, me semble moins problématique. De ce point de vue le RDA n’est certainement pas le bon outil, à moins d’être appliqué très librement. Tel qu’il est, le RDA est au contraire un bon moyen de cantonner un peu plus longtemps les bibliothécaires (et les bibliothèques) dans leur culture propre.

Ce qui est remarquable dans la réalisation d’Electre, c’est que compte tenu d’un éventail d’utilisateurs potentiels incluant les professionnels de l’édition, de la librairie et des bibliothèques, on s’est sincèrement interrogé sur les besoins qu’on avait ou qu’on allait avoir, et qu’on n’a pas hésité à changer complètement de point de vue, d’angle d’attaque, dans la production des métadonnées. On n’a pas craint de se projeter dans un univers entièrement différent.

À ce moment précis, je suis distrait de mes réflexions désordonnées par le type à côté de moi, qui téléphone aussi discrètement que possible, mais que j’entends distinctement dire ceci : il n’est pas bête, pas comme sa mère. Qui est cette mère ? Son ex-femme ? Sa belle-sœur ? Une collègue ? Puis un nouvel incident assez amusant, relatif cette fois à mon antipathique vis-à-vis, renchérit sur celui-ci. Plus moyen de penser aux FRBR etc. De toute façon je tourne en rond.

Avec ça on n’est même pas à Bordeaux encore. Ce retour en train est interminable.

Rébus Express. Émission du 8 mars 1962. 1ère partie / Maurice Brunot, réalisateur ; Office national de radiodiffusion télévision française, producteur. (Interlude).
Diffusion : INA [Institut national de l’audiovisuel (France)]. Accès : http://www.ina.fr/video/CPF86643387/rebus-express-1-ere-partie-video.html.

FRBR : de l’expression bordel !

  • 30 août 2013

Two strange monsters, par G33G (Fabio Dellutri) sur Flickr
Two strange monsters, par G33G (Fabio Dellutri) sur Flickr (Creative Commons BY-NC-SA 2.0)

Le mois d’août

Pour sortir d’une impasse il faut en prendre une autre.
Monsieur Songe

Robert Pinget (1919-1997). Monsieur Songe (1982).
Minuit, 1982. ISBN 2-7073–0612-6, page 26.
Minuit, 2011. (Double ; 74). ISBN 978-2-7073-2158-9, page 23.

………………

Le modèle FRBR, rappelons-le, se présentait comme une tentative de clarifier les éléments constitutifs des « notices bibliographiques » (FRBR : bibliographic records) produites selon les règles appliquées dans les années 1990.

Il s’agissait d’élaborer un cadre conceptuel permettant de comprendre clairement, sous une forme précisément exprimée et dans un langage qui soit parlant pour tout le monde, l’essence même de ce sur quoi la notice bibliographique est censée renseigner, et l’essence même de ce que nous attendons de la notice en termes d’adéquation aux besoins des utilisateurs.
FRBR § 1.1 Contexte

Il n’avait pas pour objectif direct de servir de socle à une conception nouvelle de la description bibliographique. C’est pourtant le rôle qu’on lui assigne aujourd’hui, et c’est ainsi qu’il a été utilisé, par exemple pour la rédaction du RDA.

Il n’aurait pas été inutile de vérifier au préalable qu’il y était apte, en l’état.

L’ « arborescence FRBR »

On retient essentiellement du modèle le premier groupe des entités qu’il définit (œuvre, expression, manifestation, item), et qui semblent dépendre hiérarchiquement l’une de l’autre, l’ « œuvre » se situant au plus haut niveau.

Entités du groupe 1 et relations fondamentales. FRBR § 3.1.1 Entités du groupe 1 : Œuvre, Expression, Manifestation, Item
Entités du groupe 1 et relations fondamentales. FRBR § 3.1.1 Entités du groupe 1 : Œuvre, Expression, Manifestation, Item

Le fait est que les entités sont présentées dans cet ordre, et que tout dans le rapport lui-même, les schémas d’accompagnement comme le texte proprement dit, conduit à cette impression que le modèle consiste en une arborescence dont l’œuvrefrbr est la racine, ou le tronc, qui se ramifie en expressionsfrbr, puis en manifestationsfrbr, pour s’épanouir finalement en itemsfrbr.

Or cette vision est discutable, au moins en deux des trois charnières de la chaîne Œ–E–M–I, à savoir les deux premières (Œ–E et E–M). Ça fait beaucoup. Il ne va être question dans ce billet que de la première ; pour la seconde, qui mérite un développement spécifique, on verra plus tard, un autre mois.

Dissocier le contenu de son, ou de ses, support(s)

Un des plus grands mérites du modèle FRBR est d’avoir signalé à la communauté des bibliothécaires cette réalité jusque là ignorée d’elle qu’est l’expressionfrbr.

La deuxième entité définie dans le modèle est celle d’expression : c’est-à-dire, la réalisation intellectuelle ou artistique d’une œuvre sous la forme d’une notation alphanumérique, musicale ou chorégraphique, ou sous une forme sonore, visuelle, objectale, cinétique, etc., ou bien sous l’aspect d’une combinaison de ces formes.
FRBR § 3.2.2 L’entité Expression

Par la même occasion le rapport attire l’attention sur le fait que les données qui permettraient d’identifier l’expressionfrbr sont, plus que toutes les autres, diluées dans la notice bibliographique normalisée traditionnelle, et par conséquent extrêmement difficiles à en dégager.

L’expressionfrbr correspond pourtant à un niveau d’analyse bien réel du point de vue des usages.

C’est celui que nous manipulons tous lorsque nous cherchons des contenus : un enregistrement sonore précis (par exemple :  la version des Nuits d’été de Berlioz par Régine Crespin, Ernest Ansermet et l’Orchestre de la Suisse romande de 1963) ou un texte (par exemple : la directive 2001/29/CE du Parlement européen ; la thèse de Roger Hameçon-Bernique sur l’évolution sociologique de la population des consommateurs d’andouille de Guéméné entre 1945 et 1962 dans les départements du Finistère, des Côtes-du-Nord et du Morbihan, ainsi que dans les arrondissements de Redon et de Saint-Nazaire), ou un film, une image, de la musique notée ou autre, sans nous soucier du contexte éditorial dans lequel ce que nous cherchons est publié.

L’expressionfrbr est en outre une entité manipulée par les éditeurs et par les gestionnaires de droits. En témoigne la définition, depuis les dernières décennies du XXe siècle, d’identifiants normalisés ad hoc, tels que :

  • l’ISRC (identifiant international normalisé des enregistrements, ISO 3901),
  • l’ISAN (numéro international normalisé d’œuvre audiovisuelle, ISO 15706-1) et le V-ISAN (Numéro international normalisé d’oeuvre audiovisuelle, identifiant de version, ISO 15706-2),
  • l’ISTC (identifiant international normalisé des œuvres textuelles, ISO 21047),
  • et l’ISWC (identifiant international normalisé des œuvres musicales, ISO 15707).

De fait, ces identifiants s’appliquent à des expressionsfrbr, et non à des œuvresfrbr. Le terme d’œuvre présent dans l’intitulé de la plupart d’entre eux ne doit pas être compris au sens du modèle FRBR, mais plutôt dans celui du langage courant, qui est peu ou prou celui qu’il revêt dans les différentes législations nationales sur le droit d’auteur.

7/7, par [auro] sur Flickr
7/7 par [auro] sur Flickr (Creative Commons BY-NC-SA 2.0)

L’ expressionfrbr versus l’ « œuvre de l’esprit »

La législation française parle en la matière  d’« œuvre de l’esprit », qui correspond exactement à l’expressionfrbr :

Sont considérés notamment comme oeuvres de l’esprit au sens du présent code :
1° Les livres, brochures et autres écrits littéraires, artistiques et scientifiques ;
2° Les conférences, allocutions, sermons, plaidoiries et autres oeuvres de même nature ;
3° Les oeuvres dramatiques ou dramatico-musicales ;
4° Les oeuvres chorégraphiques, les numéros et tours de cirque, les pantomimes, dont la mise en oeuvre est fixée par écrit ou autrement ;
5° Les compositions musicales avec ou sans paroles ;
6° Les oeuvres cinématographiques et autres oeuvres consistant dans des séquences animées d’images, sonorisées ou non, dénommées ensemble oeuvres audiovisuelles ;
7° Les oeuvres de dessin, de peinture, d’architecture, de sculpture, de gravure, de lithographie ;
8° Les oeuvres graphiques et typographiques ;
9° Les oeuvres photographiques et celles réalisées à l’aide de techniques analogues à la photographie ;
10° Les oeuvres des arts appliqués ;
11° Les illustrations, les cartes géographiques ;
12° Les plans, croquis et ouvrages plastiques relatifs à la géographie, à la topographie, à l’architecture et aux sciences ;
13° Les logiciels, y compris le matériel de conception préparatoire ;
14° Les créations des industries saisonnières de l’habillement et de la parure. Sont réputées industries saisonnières de l’habillement et de la parure les industries qui, en raison des exigences de la mode, renouvellent fréquemment la forme de leurs produits, et notamment la couture, la fourrure, la lingerie, la broderie, la mode, la chaussure, la ganterie, la maroquinerie, la fabrique de tissus de haute nouveauté ou spéciaux à la haute couture, les productions des paruriers et des bottiers et les fabriques de tissus d’ameublement.
France. Code de la propriété intellectuelle – Article Article L 112-2

Voilà donc ce qui est protégé par le droit d’auteur. Certains termes semblent faire référence à un support matériel (« livre » et « brochure »), mais désignent en réalité les contenus de ces supports (le texte initial date des années 1950). Car il est bien stipulé que le droit d’auteur protège les « œuvres de l’esprit » indépendamment de leur support (acquérir un livre n’entraîne pas qu’on ait acquis en même temps de droit de propriété sur le contenu de celui-ci) :

La propriété incorporelle définie par l’article L. 111-1 est indépendante de la propriété de l’objet matériel.
France. Code de la propriété intellectuelle – Article L111-3

L’œuvrefrbr versus la « conception de l’auteur » de l’« œuvre de l’esprit »

Seulement une « œuvre de l’esprit » n’existe (pour le législateur) que dès lors qu’elle est créée, c’est à dire « réalisée » selon la formulation employée dans la définition de l’expressionfrbr (cf. supra).

L’auteur d’une œuvre de l’esprit jouit sur cette œuvre, du seul fait de sa création, d’un droit de propriété incorporelle exclusif et opposable à tous.
France. Code de la propriété intellectuelle – Article L111-1

L’oeuvre est réputée créée, indépendamment de toute divulgation publique, du seul fait de la réalisation, même inachevée, de la conception de l’auteur.
France. Code de la propriété intellectuelle – Article L111-2

En d’autres termes : une idée, même déjà structurée, ne peut pas être protégée si elle n’est pas exprimée, et même manifestée — pour reprendre la terminologie FRBR. Il est bien fait référence à la « conception de l’auteur » (voir l’article L111-2 cité ci-dessus) — qui pourrait être l’équivalent de l’œuvrefrbr –, mais c’est pour ne pas en tenir compte.

L’articulation œuvrefrbr – expressionfrbr

No Day Is So Bad, par Brian Talbot sur Flickr
No Day Is So Bad, par Brian Talbot sur Flickr (Creative Commons BY-NC 2.0)

La définition de l’œuvrefrbr la voici :

La première entité que définit le modèle est celle d’œuvre : une création intellectuelle ou artistique déterminée.

Une œuvre est une entité abstraite ; il n’y a aucun objet matériel isolé auquel on puisse renvoyer comme étant « l’œuvre ». On reconnaît l’œuvre à travers des réalisations individuelles, ou expressions de l’œuvre, mais l’œuvre elle-même ne réside que dans une identité de contenu au sein des diverses expressions de l’œuvre. Lorsque l’on parle de l’Iliade d’Homère en tant qu’œuvre, on ne fait pas référence à telle ou telle lecture en public ou à tel ou tel état du texte de l’œuvre, mais à la création intellectuelle sous-jacente à toute la palette d’expressions que connaît l’œuvre.
FRBR § 3.2.1 L’entité Œuvre

Définition ambiguë. Elle hésite entre l’œuvrefrbr comme produit de l’activité humaine (« une création intellectuelle ou artistique déterminée ») et comme abstraction utile aux traitements bibliographiques (« l’œuvre elle-même ne réside que dans une identité de contenu au sein des diverses expressions de l’œuvre »).

Du moins ce second point de vue est-il énoncé. Mais le modèle lui-même a tendance à l’occulter, ne serait-ce que parce que la terminologie employée est à sens unique : on parle, dans les FRBR, de l’ « expression » d’une « œuvre », ce qui implique une subordination de la première à la seconde. C’est-à-dire qu’on en infère logiquement que l’œuvrefrbr a une substance propre, et qu’elle est antérieure à toutes ses expressionsfrbr. De fait on peut nommer  l’œuvrefrbr (le titre de l’œuvre est le premier de ses attributs) et la doter de toute une panoplie d’attributs supplémentaires tels que sa forme, sa date, etc. (voir FRBR §4.2 Attributs d’une œuvre).

Or la réalité est exactement inverse. C’est d’abord l’ « œuvre de l’esprit » qui voit le jour, c’est-à-dire l’expressionfrbr. Nul doute que cette dernière soit en effet l’expression de quelque chose qui a pris naissance dans l’esprit de son créateur ( la « conception de l’auteur », cf. supra). Mais ce quelque chose n’intéresse ni les bibliographes ni les autres métiers liés à la diffusion et à la gestion des œuvres, ni les utilisateurs des catalogues des bibliothèques. Ce quelque chose n’est pas l’œuvrefrbr, laquelle est une construction a posteriori, dont les éléments (à commencer par son titre) sont en fait le plus souvent relatifs à une expressionfrbr particulière, à savoir l’expressionfrbr originale d’une œuvrefrbr qui peut en compter plusieurs.

Au vrai, l’expressionfrbr n’est pas l’expression de l’œuvrefrbr, pas plus que cette dernière n’est l’œuvre de l’auteur.

La « conception de l'auteur », l' « œuvre de l'esprit » et l'œuvre FRBR

En la matière, plutôt que de spéculer sur le processus (cognitif) de production d’une « œuvre de l’esprit », il vaudrait mieux se borner à considérer les objets résultant de ce processus, puisque ce sont eux, et eux seuls qu’on manipule, aussi bien lors de l’activité bibliographique qui consiste à les décrire que dans toute autre activité liée à leur mise à disposition et à leur gestion, et in fine, à leur découverte.

Malheureusement, dans le RDA encore plus que dans FRBR, une évidente hiérarchie subordonne l’expressionfrbr à l’œuvrefrbr : il est obligatoire, lorsqu’on décrit une manifestationfrbr (qui reste dans RDA l’entité bibliographique sur laquelle repose l’organisation du catalogue), d’identifier l’œuvrefrbr qu’elle contient (« Lors de l’enregistrement des relations principales, inclure au minimum l’œuvre manifestée. », RDA § 17.3).

L’identification de l’expressionfrbr contenue n’est obligatoire que dès lors qu’il en existe plusieurs (« S’il existe plus d’une expression de l’œuvre, enregistrer l’expression manifestée », RDA § 17.3). C’est à dire qu’il faut déjà vérifier ce fait. Conséquence : lors de l’apparition d’une seconde expressionfrbr d’une  œuvrefrbr, il faut agir rétrospectivement sur les données déjà enregistrées.

On pourrait d’ailleurs montrer que l’expressionfrbr dans RDA semble moins définie pour elle-même que constituée d’éléments qui n’ont pas été attribués aux autres entités.

Le problème des œuvres dérivées

Side effects of spending three centuries in Eisenstadt, Austria, par Paolo Crosetto sur Flickr
Side effects of spending three centuries in Eisenstadt, Austria par Paolo Crosetto sur Flickr (Creative Commons BY-NC-SA 2.0)

La transformation d’une « œuvre de l’esprit » préexistante (par traduction, adaptation etc.) est protégée par le droit d’auteur, et cette protection est indépendante de celle qui couvre l’œuvre originale :

Les auteurs de traductions, d’adaptations, transformations ou arrangements des oeuvres de l’esprit jouissent de la protection instituée par le présent code sans préjudice des droits de l’auteur de l’oeuvre originale. Il en est de même des auteurs d’anthologies ou de recueils d’oeuvres ou de données diverses, tels que les bases de données, qui, par le choix ou la disposition des matières, constituent des créations intellectuelles.
France. Code de la propriété intellectuelle – Article L112-3

C’est à dire que l’ « œuvre de l’esprit » résultant d’une transformation d’une « œuvre de l’esprit » préexistante est protégée à la fois au titre de l’œuvre originale et à celui du travail de transformation de celle-ci. Pratiquement, il convient donc d’identifier clairement, pour chaque « œuvre de l’esprit » dérivée, l’ « œuvre de l’esprit » dont elle est une transformation.

C’est ainsi que les métadonnées d’enregistrement d’un identifiant tel que l’ISTC permettent de préciser si l’œuvre est originale ou dérivée. En cas de dérivation, la nature de celle-ci doit être consignée (10 types différents, parmi lesquels : annotation, compilation, révision, traduction, adaptation), et l’ISTC de l’œuvre originale fournie (source : ONIX for ISTC Registration : message format overview. Version 1.0.1, 24 August 2009, revised 5th September 2011, § 8 ISTC Registration Record [fichier .pdf])

En termes FRBR : les liens s’effectuent d’expressionfrbr à expressionfrbr sans passer par une instance de regroupement telle qu’une œuvrefrbr.

Dans FRBR (et dans RDA), les « œuvres de l’esprit » réalisées par transformation d’une « œuvre de l’esprit » préexistante sont réparties en deux catégories : soit elles constituent de nouvelles expressionsfrbr de l’œuvrefrbr dont dépend la première, soit elles relèvent d’une nouvelle œuvrefrbr. Dans la première catégorie on trouve par exemple une traduction d’une « œuvre de l’esprit » textuelle, tandis qu’une adaptation cinématographique relèverait de la seconde.

Quoi qu’il en soit, toutes les expressionsfrbr d’une même œuvrefrbr sont placées sur le même plan, l’expressionfrbr originale ne jouissant d’aucun statut particulier, ni même d’un attribut la signalant comme telle. C’est seulement en établissant, en plus du lien à l’œuvrefrbr appropriée, des relations entre expressionsfrbr (du type est une traduction de ou autre) qu’on peut pallier en partie cet inconvénient. Résultat : dans RDA, qui sur ce point applique FRBR à la lettre, il n’est pas actuellement possible de mentionner, sinon sous forme d’information textuelle, que la langue originale de Moderato cantabile, de Marguerite Duras, est le français.

Autre problème : dans FRBR, la décision de faire d’une œuvre dérivée, soit une nouvelle expressionfrbr d’une même œuvrefrbr, soit une expressionfrbr d’une œuvrefrbr distincte, relève de choix de catalogage :

En raison du caractère abstrait de la notion d’œuvre, il est difficile de définir avec précision les frontières de cette entité. En fait, il peut très bien arriver que d’une culture à l’autre on ne conçoive pas de la même manière ce qui constitue la substance d’une œuvre et le moment où l’on passe d’une œuvre donnée à une autre œuvre. Il s’ensuit que dans le cadre de conventions bibliographiques les critères permettant de déterminer les limites entre une œuvre et une autre peuvent varier selon l’appartenance à tel ou tel contexte culturel ou géopolitique.
FRBR § 3.2.1 L’entité Œuvre

C’est-à-dire qu’il est impossible d’attribuer à une œuvrefrbr donnée un identifiant qui ait une valeur universelle.

Faut-il se débarrasser de l’œuvrefrbr ?

Aie! they will see you! par Julie Kertesz sur Flickr
Aie! they will see you! par Julie Kertesz sur Flickr (Creative Commons BY-NC-SA 2.0)

Si l’expressionfrbr est la ligne de force sur laquelle s’appuyer pour que les métadonnées bibliographiques « frbérisées » deviennent effectivement utilisables indifféremment par tous les métiers impliqués dans la production et la mise à disposition des « œuvres de l’esprit », l’œuvrefrbr est-elle utile ?

Elle l’est s’il peut être démontré qu’un regroupement explicite d’expressionsfrbr parentes est utile dans certains cas. L’œuvrefrbr devrait se définir alors comme l’ensemble des métadonnées communes au regroupement qu’on décide d’opérer.

On peut convenir par exemple que la mise en commun, au sein d’une entité bibliographique spécifique, de métadonnées partagées par plusieurs expressionsfrbr est économique quant à la production de ces dernières, en même temps qu’elle en facilite la cohérence. Par exemple : l’auteur d’une « œuvre de l’esprit » textuelle est aussi celui de ses traductions, une éventuelle indexation matières établie pour le texte original est également valide pour les traductions etc.

En outre il n’est pas toujours possible, ni utile, de mettre en relation une œuvre dérivée (expressionfrbr) avec la version précise (expressionfrbr) de l’œuvre originale dont elle découle. Exemple : on ne dispose pas nécessairement de l’information permettant d’établir à partir de laquelle des différentes versions des Canterbury Tales de Chaucer telle traduction est effectuée.

The Canterbury Tales (1)

Ou bien : le film Plein soleil réalisé par René Clément (1960) est adapté du roman The talented Mr. Ripley de Patricia Highsmith, probablement par l’intermédiaire de la traduction française de celui-ci, Monsieur Ripley — détail sans importance aucune en l’occurrence.

The talented Mr. Ripley

Quoique le 2e cas puisse à vrai dire se résoudre sans œuvrefrbr, le premier nécessite au moins la définition d’une sorte d’expressionfrbr neutre, comme un joker auquel recourir le cas échéant. Ou bien une œuvrefrbr.

The Canterbury Tales

L’emploi d’œuvresfrbr dans un système donné peut par ailleurs se révéler un moyen de mieux répondre à des recherches vagues ne portant pas sur une expressionfrbr précise, et de faciliter la navigation entre expressionsfrbr.

Pour sortir d’une impasse…

Il faudrait inverser la règle du RDA. Au lieu de « Lors de l’enregistrement des relations principales, inclure au minimum l’œuvre manifestée. », RDA § 17.3 et de « S’il existe plus d’une expression de l’œuvre, enregistrer l’expression manifestée », RDA § 17.3, avoir pour règles :

Lors de l’enregistrement des relations principales, inclure au minimum l’expression manifestée.
et éventuellement
S’il existe plus d’une expression de l’œuvre, enregistrer l’œuvre manifestée.

Il faudrait en outre définir pour elles-mêmes les métadonnées décrivant l’expressionfrbr, et non considérer que relèvent de l’expressionfrbr les éléments de la notice traditionnelle qu’on n’arrive à caser ni dans l’œuvrefrbr ni dans la manifestationfrbr.

Il faudrait aussi instituer un statut particulier pour les « œuvres de l’esprit » (expressionsfrbr) originales, celles découlant directement de la « conception de l’auteur » et qui sont, directement ou non, au départ de toute éventuelle transformation ultérieure.

Refaire RDA, quoi.

On en reparle en 2040.


N.246 : SoRRy, MaDaMe ANNèTTe, ThE WoRLd iS iN a TeRRibLe MeSS (e un ragazzino cerca di metterlo a posto con un sorriso 😉 ) par Encore! (Stefano Coviello) sur Flickr (Creative Commons BY-NC-SA 2.0)

Sudoc et FRBR : parution de la première série de consignes de catalogage

  • 20 février 2013

sudocfrbr

Le Guide méthodologique du Sudoc s’enrichit aujourd’hui même d’une nouvelle page intitulée Sudoc / FRBR : consignes de catalogage, dont l’introduction précise le contexte et l’objectif :

Les travaux de modélisation des données bibliographiques (FRBR : Fonctionnalités requises des notices bibliographiques) et d’autorité (FRAD : Fonctionnalités requises des données d’autorité, FRSAD : Fonctionnalités requises des données d’autorité matière) menés au cours des deux dernières décennies ont depuis quelques années trouvé des applications concrètes dans certains codes de catalogage, et en particulier dans RDA (Ressources : description et accès) qui devrait entrer en vigueur en France à terme. D’ici là, le groupe « RDA en France », réuni dans le cadre de l’AFNOR, s’efforce :

  • de proposer des aménagements au code RDA sur les points qui apparaissent exagérément conservateurs, ou sur des règles trop ancrées dans un contexte anglosaxon ;
  • de réviser les règles de catalogage françaises en vigueur, toutes obsolètes, en s’inspirant des modèles FRBR et FRAD et en les rapprochant autant que possible de RDA, qui est la cible vers laquelle elles tendent.

Les consignes qui suivent concernent le catalogage courant dans le Sudoc. Elles précisent le billet Préparer la FRBRisation des données publié le 20 avril 2012 sur le site rda@abes.

Pour des raisons techniques, les consignes sont découpées en trois « vagues » successives, dont voici la première.

Les vagues suivantes introduiront :

  • le mécanisme d’appariement des titres d’œuvres contenues et des accès auteurs et contributeurs correspondants
  • les consignes pour les titres normalisés des œuvres.

T’as perdu ta langue ?

língua língua merda # 01 par Fernando Neves sur Flickr
língua | língua | merda #01 par Fernando Neves sur Flickr.

En application du RDA (Ressources : description et accès), qui lui-même en l’espèce se conforme au modèle FRBR, une œuvre est privée de sa langue.

Une œuvre n’a pas de langue

Dans le modèle FRBR, une œuvre — même textuelle — n’a pas de langue. Pas même de langue(s) originale(s). L’attribut de langue se trouve exclusivement au niveau de l’expression :

4.3.4 Langue de l’expression
On entend par « langue de l’expression » la langue dans laquelle l’œuvre est exprimée. Elle peut regrouper plusieurs langues, chacune d’entre elles étant la langue d’un élément individuel de l’expression.

On voit par là que des trois entités abstraites du groupe 1 (Œuvre, Expression, Manifestation), l’œuvre est la plus abstraite de toutes. C’est à dire que dans une masse de métadonnées structurées (par exemple, un catalogue de bibliothèque), une œuvre doit être envisagée comme un dossier permettant de rassembler, pour un meilleur confort d’utilisation, l’ensemble des métadonnéees se rapportant à une seule et même « création intellectuelle ou artistique déterminée » (FRBR, § 3.2.1). Dossier renfermant un ou plusieurs sous-dossier(s) (les expressions de l’œuvre considérée), et ainsi de suite jusqu’à l’item, dernier échelon de ce principe de classement. La langue se trouve au 2e échelon, elle est un élément discriminant des expressions.

Il n’y a pas de langue originale

Dans ces conditions, qu’est-ce qu’une langue originale dans le modèle ? C’est une notion qui gêne, un peu dans les FRBR, davantage dans RDA, qui souvent se prend les pieds dans le tapis lorsqu’il en traite.

Dans les FRBR :

Les traductions d’une langue dans une autre, les transcriptions et arrangements musicaux, les versions doublées ou sous-titrées d’un film sont également réputés n’être que des expressions différentes de la même œuvre originale. (3.2.1 L’entité Œuvre)

Seulement se contenter de (par exemple) :

œuvre [œ1] Il consiglio d’Egitto | Sciascia, Leonardo (1921-1989)
expression [e1] Il consiglio d’Egitto | Sciascia, Leonardo (1921-1989). Français (Pressac)

c’est faire l’impasse sur une information importante : [e1] n’est pas une expression « directe » de [œ1]. On ne peut pas la mettre sur le même plan que :

expression [e2] Il consiglio d’Egitto | Sciascia, Leonardo (1921-1989). Italien

réalisée par le créateur même de [œ1]. Il faudrait pouvoir mentionner que [e1] est une transformation (en l’occurrence : une traduction) d’une expression « directe » de [œ1].

La relation de traduction dans les FRBR et dans RDA

Une telle relation entre expressions est définie dans le modèle FRBR, au § 3.2.2 L’entité Expression :

L’existence d’une entité expression permet également d’établir des relations entre les expressions spécifiques d’une œuvre. Il est ainsi possible, par exemple, de se servir de l’entité expression pour identifier l’état du texte sur lequel a été établie une traduction, ou la partition spécifique suivie par les interprètes d’une composition musicale.
FRBR.

Et dans le chapitre 5 qui traite des relations, où l’on trouve un « Tableau 5.3 Relations entre une expression et une expression » :

Entre des expressions de la même œuvre

Traduction
a une traduction à
ß est une traduction de

[…]

Les relations entre des expressions de la même œuvre (Tableau 5.3) se rencontrent lorsqu’une expression a été tirée d’une autre. Dans ces types de relations, une expression est considérée comme une modification de l’autre. La modification peut être une traduction littérale, dont le but est de restituer le contenu intellectuel de l’expression antérieure aussi fidèlement que possible (à noter que dans le modèle les traductions libres sont traitées comme de nouvelles œuvres).

Mais nulle part dans le modèle n’est évoquée la notion de langue originale, qui, pour reprendre la logique des FRBR, serait celle de la première expression de l’œuvre (ou celles des premières expressions simultanées de l’œuvre dans le cas d’une œuvre créée par une collectivité multilingue par exemple). Une telle expression a pour autre caractéristique qu’elle est le fait du créateur (ou des créateurs) de l’œuvre qu’elle représente.

Résultat : il n’y a pas de moyen simple dans le modèle d’indiquer si une traduction a été effectuée depuis une expression qui est elle-même une traduction.

Fait aggravant : pour des raisons de commodité le modèle FRBR consent à ce qu’une traduction soit reliée directement à l’œuvre dont elle est une expression :

Cela [le fait de définir la notion d’œuvre comme l’une des entités du modèle] permet également d’établir des liens indirects entre plusieurs expressions de la même œuvre lorsqu’il est impossible d’établir des liens directs entre ces expressions elles-mêmes. Par exemple, il peut y avoir plusieurs traductions d’une même œuvre (par exemple, Anne of Green Gables) sans qu’il soit toujours possible ou nécessaire de préciser quel est le texte dont tel traducteur est parti pour élaborer sa propre traduction. Dans ce cas on n’établira pas de lien direct entre les expressions particulières de l’œuvre (c’est-à-dire, entre la traduction et le ou les textes sur lesquels elle s’est appuyée), mais le fait de relier individuellement chacun des états du texte et chacune des traductions avec l’entité dénommée œuvre permet de relier implicitement entre eux tous ces différents états et toutes ces traductions.
(FRBR. § 3.2.1 L’entité Œuvre)

RDA profite tout naturellement de cette facilité. Bien que les relations translation of / translated as soient définies dans l’annexe J3 (Relationship Designators for Related Expressions), les exemples fournis dans le corps même du code en font peu de cas (si ce n’est sous la forme de la traditionnelle note sur le titre original), et les règles de construction des points d’accès identifiant les expressions encore moins :

Goncourt, Edmond de, 1822–1896. Frères Zemganno. English

Resource described: The Zemganno brothers / by Edmond de Goncourt. An English translation of a French novel

(RDA § 6.27.3 Authorized Access Point Representing an Expression)

Qu’est-ce qui manque ?

  • Le contenu linguistique d’une expression devrait pouvoir être étiqueté comme étant soit « original » (i.e. le fait du ou des créateur(s) de l’œuvre), soit « traduit ».
  • Lorsqu’une expression est une traduction d’une autre expression, il faudrait fournir des éléments permettant d’identifier cette dernière.

Par exemple :

œuvre Il consiglio d’Egitto | Sciascia, Leonardo (1921-1989)
expression Il consiglio d’Egitto | Sciascia, Leonardo (1921-1989). Italien [original]
expression Il consiglio d’Egitto | Sciascia, Leonardo (1921-1989). Français [traduit de l’original italien] (Pressac)

œuvre ’n Seisoen in die paradys | Breytenbach, Breyten, 1939-
expression ’n Seisoen in die paradys | Breytenbach, Breyten, 1939- . Afrikaans [original]
expression ’n Seisoen in die paradys | Breytenbach, Breyten, 1939- . Français [traduit d’une traduction anglaise] (Guiloineau)

Il y a sûrement des façons plus lisibles et plus précises de présenter ces informations, d’autant qu’elles le sont ici sous forme de points d’accès (il manque les liens entre expressions et de quoi identifier de ces dernières). Il suffit qu’elles soient effectivement présentes, sous une forme ou une autre, dans les métadonnées.

Le groupement européen EURIG a introduit une demande d’évolution du code RDA sur ce point à partir du travail effectué par le groupe RDA en France : 6JSC/EURIG/3 Language of expression – Revision of RDA 6.11, 6.11.1.3, 6.11.1.4, 7.12.1.3, 26.1.1.3 [.pdf].

Extrait de : The mark of Zorro / Fred Niblo et Theodore Reed, réalisation ; Douglas Fairbanks (Don Diego de la Vega / Zorro), Noah Beery (le sergent Pedro), Charles Hill Mailes (Don Carlos Pulido), Claire McDowell (Doña Catalina), Marguerite De La Motte (Lolita)… [et al.], acteurs. 1920.

Préparer la FRBRisation des données

L’une des difficultés à surmonter au cours du processus du passage aux FRBR — et non la moindre — sera la mise à niveau des données rétrospectives, qu’il faudra « FRBRiser » à coup de procédures informatiques reposant sur des algorithmes de conversion.

Ces algorithmes s’efforceront d’identifier les Œuvres et si possible les différentes Expressions de celles-ci contenues dans chacune des Manifestations décrites dans le catalogue, puis de créer automatiquement les notices et/ou les points d’accès correspondants.  Ceci bien entendu à partir des données du catalogue. La qualité du résultat sera donc fonction de celle des données à traiter.

Les quelques recommandations que voici constituent un socle, et pourront être complétées dans les consignes qui seront prochainement publiées dans le Guide méthodologique du Sudoc, notamment pour des types de ressource qui ne sont pas évoquées dans ce petit billet.

On peut aussi s’en inspirer pour la préparation des catalogues locaux.

Ce qui est fait est fait, il n’est pas question de revenir « à la main» sur les millions de notices déjà produites, ce serait comme écoper la mer d’Iroise avec une poêle à frire. Mais on peut, s’agissant des données à créer, prendre les précautions nécessaires pour leur assurer le moment venu une FRBRisation élégante.

Une règle simple : appliquer les règles de catalogage en vigueur (pour le Sudoc, celles énoncées dans le Guide méthodologique), voilà la meilleure des garanties.

Cependant il importe de veiller tout spécialement à quelques points précis, cruciaux pour une FRBRisation efficace.

Les titres

Les titres constituent l’élément fondamental d’identification des Manifestations, mais aussi, et c’est ce qui importe dans le processus de FRBRisation, des Œuvres qui y sont contenues. C’est pourquoi il est essentiel de les transcrire avec exactitude.

Lorsqu’on décrit une traduction, il est nécessaire de transcrire systématiquement le titre original de l’œuvre (Unimarc 454) : c’est le seul lien entre les différentes versions linguistiques de ladite.

Le cas échéant, la transcription fidèle des titres des œuvres contenues et des responsabilités associées sera d’un grand secours le moment venu.

Les codes de langue (Unimarc 101)

Ils sont indispensables à l’identification des Expressions (pour les œuvres textuelles ou s’exprimant au travers d’une ou plusieurs langues). Il faut au minimum que les données suivantes soient présentes (et correctes) :

  • la (les) langue(s) de la publication ($a)
  • la (les) langue(s) originale(s) en cas de traduction ($c)
  • l’indicateur de traduction

Les accès auteurs (Unimarc 7xx)

Il faudra pouvoir les attribuer automatiquement à l’entité FRBR pertinente (Œuvre, Expression, ou Manifestation). Ce sera possible si :

  • le choix de l’étiquette Unimarc (7×0, 7×1 ou 7×2) est correct
  • le(s) code(s) de fonction est / sont présent(s) et juste(s)

Les dates

Des dates saisies dans les notices bibliographiques, on pourra dans certains cas inférer celle de l’Œuvre correspondante : par exemple pour les travaux universitaires, thèses et mémoires.

En revanche il sera difficile de dater les Expressions à partir des données présentes, cette notion étant depuis toujours absente des règles de catalogage.

Pour les œuvres textuelles, la date de copyright y correspond assez bien, mais elle est rarement saisie vu que les normes actuelles n’en font pas grand cas. Il serait utile de le faire désormais, en Unimarc 210$d, exemple :

$d impr. 2012, cop. 2004

et dans les données codées de date.

D’une manière générale, il importe de dater correctement les ressources décrites, dans la zone de l’adresse bien sûr, mais surtout dans la zone de données codées (même — et surtout —  lorsque plusieurs dates sont liées à une même ressource : dates de copyright et d’impression déjà évoquées, date d’une reproduction en fac-similé et date de l’original, dates des publications en série, dates de publication et de protection des enregistrements sonores ou audiovisuels, etc.)

La zone de l’édition (Unimarc 205)

Une édition, au sens donné à ce terme dans l’ISBD (zone 2) constitue une Expression particulière d’une Œuvre donnée.

Ceci à l’exception des reproductions en fac-similé (cf. Z 44-050, § 2.1.2), qui à vrai dire ne devraient pas faire l’objet d’une zone de l’édition.

Identifiants

Identifiants normalisés et autres

Les identifiants normalisés (ISBN, ISMN, ISSN etc.) de même que certains identifiants commerciaux (EAN, numéros d’éditeurs des publications audiovisuelles) pourront être mis à contribution pour reconstituer des métadonnées incomplètes ou erronées, et sont susceptibles de faciliter la mise en relation d’entités apparentées.

C’est pourquoi ils doivent être scrupuleusement incorporés aux notices, même si certains (ISBN) sont comme on le sait moins fiables que d’autres (ISSN).

Identifiants de notice

Il est important de conserver les identifiants des notices importées ou dérivées, et de supprimer ceux dont on hériterait dans une nouvelle notice obtenue par copie.

Conserver aussi les identifiants des notices d’autorité liées figurant dans les sous-zones $3 des points d’accès contrôlés (Unimarc 500, 60x, 7xx), et ceux des notices bibliographiques liées (sous-zones $0 des zones Unimarc 4xx). Ceci vaut surtout pour les catalogues locaux

Ceci n’est pas une œuvre

Gian Lorenzo Bernini. Transverbération de sainte Thérèse (1652). Rome, Église Santa Maria della Vittoria

Dans le modèle FRBR, l’entité désignée par le nom d’œuvre constitue comme on sait la racine de l’arborescence censée rendre compte de la complexité des objets documentaires.

L’objet documentaire lui-même, celui que l’on manipule et pour lequel on cherche à créer des métadonnées, est un item, cet item étant le représentant d’une manifestation d’une ou de plusieurs expression(s) d’une œuvre chacune.

Manifestation, expression et œuvre sont autant d’entités abstraites dans le modèle.

La manifestation correspond aux opérations de publication d’une ressource. L’expression, c’est le produit intellectuel ou artistique proprement dit : la suite de mots et de signes qui constituent un texte, la suite de séquences filmées composant une œuvre cinématographique… et voilà ça y est, j’ai employé le mot fatal, celui qu’il fallait éviter à tout prix. J’ai dit œuvre en parlant de l’expression.

Comment faire autrement ? Dans la langue ordinaire, une œuvre littéraire, artistique etc. est un produit. Les dictionnaires eux-mêmes associent généralement au terme d’œuvre celui de production, ou de produit (de l’activité créatrice d’un individu).

Oui, mais pas le modèle FRBR. Il est indispensable de s’en convaincre. Une œuvre n’est pas une œuvre.

Qu’est-ce qu’une œuvre ?

Le modèle la définit ainsi (§ 3.2.1) :

une création intellectuelle ou artistique déterminée.

Mais il ajoute quelques lignes plus loin :

… l’œuvre elle-même ne réside que dans une identité de contenu au sein des diverses expressions de l’œuvre.

Tu vois, l’œuvre ne se définit qu’à partir de ses expressions. C’est ce qu’elles ont en commun, ce qui n’est pas distinctif de chacune d’elles.

Il est précisé ensuite (toujours § 3.2.1) :

D’un point de vue pratique, le fait de définir la notion d’œuvre comme l’une des entités du modèle sert à plusieurs choses. Cela permet de nommer la création intellectuelle ou artistique abstraite qui englobe toutes les expressions individuelles d’une même œuvre et d’établir des relations avec celle-ci.
[…]
Cela permet également d’établir des liens indirects entre plusieurs expressions de la même œuvre lorsqu’il est impossible d’établir des liens directs entre ces expressions elles-mêmes.
[…]
Ce lien indirect entre expressions d’une œuvre par le biais des liens établis entre chacune des expressions et l’œuvre qu’elles réalisent constitue souvent le moyen le plus efficace de regrouper des expressions parentes.

On comprend que l’institution de cette notion d’œuvre a une portée essentiellement utilitaire, et ceci dans le cadre d’un système de métadonnées bibliographiques.

L’œuvre n’est donc pas l’œuvre mais son nom. Une œuvre est le plus petit commun dénominateur de toutes ses expressions. Par conséquent une notice d’œuvre est faite essentiellement de la (des) désignation(s) de celle-ci ; elle est le lieu où sont consignées les différentes relations de l’ensemble de ses expressions avec d’autres entités du modèle (en particulier — mais pas seulement — les métadonnées décrivant son ou ses créateurs).