Archives du blog

Vingt ans après : LRM, un pour tous !

  • 21 août 2017

Ce billet est une version longue d’un article à paraître dans la prochaine livraison (87) d’Arabesques, consacrée à la Transition bibliographique.

Fusione #3, par Paolo Torrisi sur Flickr (CC BY-NC-ND 2.0)
Fusione #3, par Paolo Torrisi sur Flickr (CC BY-NC-ND 2.0).

Bientôt on parlera de FRBR comme d’une chose révolue. Le début de l’effort de modélisation des métadonnées bibliographiques entrepris au début des années 1990. Le texte fondateur de cet effort : le « modèle FRBR » contenu dans le rapport final sur les Fonctionnalités requises des notices bibliographiques, achevé en 1997, publié en 1998, aura constitué le point de départ d’une évolution profonde dans la compréhension de l’univers complexe des métadonnées bibliographiques.

Deux autres modèles ont suivi : FRAD (2009) pour les données « d’autorité » et FRSAD (2010) pour les données « d’autorité matière », périphériques dans FRBR qui se concentrait sur ses 4 entités centrales : œuvre, expression, manifestationitem, et sur les relations de et vers ces entités.

IFLA LRM (IFLA Library reference model : Modèle de référence des bibliothèques, 2017) résulte de la fusion et de l’évolution des trois modèles FRxx, qu’il remplace intégralement.

Pourquoi fusionner les trois modèles ?

Globalement, leur rédaction s’est échelonnée sur une quinzaine d’années, au cours desquelles s’accomplissait un événement bouleversant : le déferlement de l’Internet sur le monde. Les FRBR sont encore dans l’ignorance de cette chose-là, bien qu’elles prennent acte d’un changement en cours dans les besoins des publics. Elles ne savent pas non plus très bien ce qu’elles sont, vu qu’elles poursuivent deux objectifs distincts : « élaborer un cadre conceptuel permettant de comprendre clairement […] l’essence même de ce sur quoi la notice bibliographique est censée renseigner, et l’essence même de ce que nous attendons de la notice en termes d’adéquation aux besoins des utilisateurs » d’une part, et « recommander un niveau  minimal  de  fonctionnalité  et  de  spécification  de  données  à  appliquer  aux  notices  produites  par  les  agences  bibliographiques nationales » d’autre part. C’est ce second objectif que semble exprimer le titre : « Fonctionnalités requises des notices bibliographiques ». Tous les mots comptent.

Le fameux « modèle FRBR » qui s’y trouve contenu s’érige sur un terrain encore imprégné des Principes de Paris (1961). Il en est nourri. Il n’y avait que ça comme nourriture à l’époque. Pourtant le cadre général qu’il pose n’a pas été profondément remis en cause par la suite : un cœur bibliographique réparti en quatre entités principales, œuvre, expression, manifestation et item (« WEMI[1] »), sur lequel des personnes ou des collectivités exercent des responsabilités de création, transformation, publication, possession etc. S’y ajoute la relation de sujet (absente des Principes de Paris), qui associe n’importe laquelle des six entités déjà citées, plus quatre autres (objet, concept, lieu et événement) à l’entité œuvre et à elle seule.

Modèle FRBR : schéma général
Modèle FRBR : schéma général.

Tout cela dans la perspective des quatre types d’opération identifiées comme pouvant être effectuées par l’utilisateur d’un catalogue : trouver, sélectionner, identifier, obtenir. Chacune des entités du modèle est dotée d’un certain nombre d’attributs, qui pourraient être autant de zones d’une notice MARC qui en décrirait une instance.

FRAD et FRSAD approfondiront la modélisation des données dites « d’autorité » : pour FRAD, celles constituant les entités FRBR œuvre, personne et collectivité auxquelles s’en ajoute une nouvelle (famille) ; pour FRSAD, toutes les entités du modèle, mais dans la perspective exclusive de leur utilisation en tant que sujet.

Ces points de vue particuliers nécessitent la création de nouvelles entités. Par exemple nom dans FRAD et nomen dans FRSAD, tant il est vrai que le travail sur les « autorités » consiste essentiellement à rassembler les différents noms par lesquels une même entité peut être désignée. Ou encore thema dans FRSAD, définie comme une super-classe de toutes les entités FRBR, ce qui permet de formaliser la relation de sujet de manière générique : œuvre a pour sujet thema, thema est sujet de œuvre. FRAD et FRSAD, qui englobent dans les processus liés aux données d’autorité les tâches réalisées par les créateurs et les gestionnaires desdites données, identifient en outre des opérations d’utilisateur inconnues de FRBR : contextualiser et justifier (FRAD), explorer (FRSAD).

Les modèles FRAD et FRSAD, développés à part des FRBR tout en y faisant constamment référence, étendent le modèle d’origine et l’affinent, quittes à en redéfinir parfois les concepts d’une manière adaptée à leurs points de vue respectifs. Conçus également à part l’un de l’autre, ils peuvent établir des concepts voisins mais pas entièrement superposables (par exemple nom et nomen cités plus haut). Enfin certains de ces nouveaux concepts ne sont plus en cohérence avec l’approche des FRBR : l’association d’un nom à une entité, définie comme une relation pour les données « d’autorité » est traitée comme un attribut de l’entité dans FRBR (un titre de manifestation par exemple).

Il y avait donc lieu d’envisager enfin les trois modèles comme un tout, d’autant que la modélisation des agrégats avait fait parallèlement l’objet d’un rapport[2], publié séparément en 2011 et jamais intégré au corps des FRBR. Sans compter que de FRBR à FRAD et FRSAD, on est passé d’une modélisation « entité-association » basique à une modélisation qu’on sent tentée par un formalisme d’ontologie.

FRBRoo

Au moment même où s’élaboraient FRAD et FRSAD naissait une autre initiative liée à FRBR.

FRBRoo[3] (FRBR « orienté objet »), publié dans sa première version en 2009, est une formalisation de FRBR en ontologie, par le biais d’une harmonisation avec CIDOC CRM[4], modèle conceptuel créé pour les objets de musée. FRBRoo, qui se présente comme « une ontologie ou modèle conceptuel de haut niveau pour les données bibliographiques[5] »,  en est une extension. Son édition actuelle (version 2.4, 2015) intègre les modèles FRAD et FRSAD.

FRBRoo, au lieu d’entités et de relations, met en œuvre des classes et des propriétés. Les classes sont organisées hiérarchiquement (une classe lègue toutes ses propriétés aux sous-classes qui en dépendent).

On y retrouve globalement l’analyse des FRBR, avec cependant quelques différences notables. Le temps y est envisagé de manière dynamique (notion de laps de temps, aussi court soit-il, dans lequel se déroule toute opération liée à la production bibliographique, au lieu de celle, fixe, de date, d’ailleurs envisagée comme attribut et non comme relation dans les modèles FRxx). Dans FRBR la manifestation n’est qu’un avatar d’une œuvre réalisée dans une expression, tandis que FRBRoo distingue un processus de production d’une manifestation à exemplaire unique (tel qu’un manuscrit) de celui aboutissant à la production de copies multiples. Ce dernier est considéré comme un travail de création : FRBRoo reconnaît l’œuvre de publication, dont l’expression englobe les expressions individuelles des œuvres qui font l’objet de la publication. L’expression de publication de FRBRoo est plus ou moins un équivalent en relief de la manifestation de FRBR. En revanche, la manifestation à exemplaire unique est considérée comme un objet, et confondue avec son item.

IFLA LRM

L’influence de FRBRoo sur LRM est sensible, et cela dès son nom dans lequel on perçoit un écho de celui du CIDOC CRM. « IFLA LRM se veut un modèle conceptuel de référence de haut niveau développé dans un cadre de modélisation entité-association enrichi »[6], ce qui n’est pas très éloigné de ce que FRBRoo dit de lui-même (cf. supra).

Formalisme

IFLA LRM se donne en effet des airs d’ontologie. Les entités y sont organisées hiérarchiquement en classes et sous-classes, avec une entité de niveau supérieur, res (« chose » en latin — mais c’est aussi le début de resource, comme dans Resource Description Framework ou RDF). Toutes les autres entités du modèle sont donc des sous-classes de res, défini comme « toute entité de l’univers du discours ». Res était en quelque sorte annoncé par thema de FRSAD, dont il est une généralisation. LRM compte 3 niveaux d’entités.

LRM, hiérarchie des entités
LRM, hiérarchie des entités. Source : IFLA Library Reference Model, IFLA, 2017, page 18.

Comme dans les modèles FRxx, les entités sont dotées d’attributs.

Les relations se caractérisent chacune par leur domaine et leur codomaine (c’est à dire l’entité depuis laquelle et celle vers laquelle la relation peut être établie) ainsi que par leur cardinalité (pour une relation donnée, le nombre d’instances possibles d’entités de son domaine et de son codomaine). De même qu’est définie une entité de niveau supérieur, de même est établie une relation générique Est associé à, dont le domaine et le codomaine sont l’entité res : res est associée à res. Les autres relations définies dans le modèle en sont des spécialisations.

Chaque entité, attribut, relation de LRM est doté d’un identifiant (LRM-En pour les entités, LRM-En-An pour les attributs, LRM-Rn pour les relations).

Entités

L’organisation hiérarchique des entités dans LRM abolit la répartition en trois groupes de FRBR (groupe 1 : WEMI ; groupe 2 : agents ; groupe 3 : entités supplémentaires définies pour la relation de sujet) et fait disparaître la notion d’autorité.

On y compte moins d’entités que dans l’ensemble FRBR + FRAD + FRSAD (11 au lieu de 18) : une entité LRM n’est établie qu’à condition de présenter des attributs ou relations spécifiques (qui ne peuvent pas être définies à un niveau supérieur) — ce qui a par exemple conduit à l’extinction des entités concept et objet, désormais inutiles puisque la relation de sujet ne porte plus que sur res.

Les WEMI voient leurs définitions légèrement modifiées (œuvre et manifestation dans un sens plus abstrait), tandis qu’il devient possible, pour une œuvre donnée, d’en déterminer une « expression représentative » dont certaines caractéristiques peuvent être enregistrées en tant qu’attributs de l’œuvre (exemple : la langue originale d’une œuvre textuelle).

Une entité générique agent est désormais déclarée dans le modèle, avec comme sous-classes personne et agent collectif (au détriment des entités famille et collectivité). Mais surtout un agent est défini comme « une entité capable d’actions délibérées, qui peut bénéficier de droits et être tenu pour responsable de ses actions » alors que pour FRAD une personne est un « individu, ou identité d’emprunt ou autre identité attribuée ou adoptée par un individu ou un groupe » et une collectivité « comprend des organismes ou des groupes de personnes fictifs ». Ce glissement — influence directe de FRBRoo — constitue un important changement de point de vue qui mériterait une analyse particulière.

Les entités lieu et événement sont profondément transformées : elles deviennent respectivement lieu et laps de temps, et peuvent être désormais associées à res (c’est-à-dire à n’importe quelle entité du modèle) par la relation « Est associé à » (LRM-R33) : elles ne sont plus confinées à la relation de sujet. Concrètement, les attributs FRBR tels que : lieu de publication, localisation (d’une collectivité) etc. ou date de l’œuvre, de l’expression, de publication, de naissance etc. n’existent plus et doivent être remplacés chacun par une relation entre l’entité concernée (œuvre, expression, manifestation, agent…) et l’entité lieu ou laps de temps suivant le cas.

Attributs

Ils sont beaucoup moins nombreux que dans l’ensemble FRBR + FRAD + FRSAD. Là où ils ont pu être remplacés par des associations entre entités, ou lorsqu’ils semblaient relever davantage d’applications du modèle que du modèle lui-même, ils ont disparu.

En contrepartie, quelques créations. L’un de ces nouveaux attributs, établi au niveau de res, c’est à dire autorisé dans toutes les entités, est catégorie, qui permet de ne déclarer dans le modèle lui-même que les entités jugées nécessaires au niveau de généralisation qui est le sien. La catégorisation de certaines d’entre elles en entités plus spécifiques aura lieu si besoin est dans les applications du modèle (règles de catalogage par exemple).

Signalons également l’attribut mention de manifestation dans l’entité manifestation : « une mention apparaissant sur les exemplaires d’une manifestation et jugée importante pour la compréhension que peuvent avoir les utilisateurs de la façon dont la ressource se représente elle-même ». À lui seul cet attribut prend en charge l’intégralité des données transcrites — que les règles de catalogage peuvent détailler autant que nécessaire.

Relations

Les relations dans LRM, vue d'ensemble
Les relations dans LRM, vue d’ensemble. Source : IFLA Library Reference Model, IFLA, 2017, page 84.

Les relations entre entités étaient parfois définies de manière différente d’un modèle FRxx à un autre. Ces conflits sont résolus dans LRM, où les relations (en dehors de celles entre WEMI qui restent le cœur du modèle) sont généralement plus abstraites que dans les modèles précédents et moins nombreuses. Exemple : les relations de supplément, complément et même de résumé définies entre œuvres dans FRBR sont englobées dans celle de accompagnement / complément dans LRM.

La relation de sujet, on l’a vu, est établie simplement entre l’entité res et l’entité œuvre, ce qui revient à dire que toute entité du modèle peut être sujet d’une œuvre (y compris une œuvre, qui est elle-même une res).

Les relations d’agent sur les WEMI sont retouchées par rapport à FRBR (ainsi la relation A créé / Est créé par est étendue à l’expression et à la manifestation, probable influence de FRBRoo).

La relation d’appellation, reprise de FRSAD, est peut-être la plus troublante pour qui ne connaissait que le modèle FRBR dans lequel elle n’est pas définie. Dans FRBR, les noms que peut prendre une instance de telle ou telle entité sont des attributs de ladite entité. Dans LRM, toute forme particulière de nom liée à une entité est une instance d’une autre entité, nomen, associée à la première par la relation A pour appellation / Est une appellation de (LRM-R13). Ce dispositif permet à chaque forme de nom d’être doté d’attributs : d’abord la chaîne de caractères qui compose ce nom, son type (identifiant, point d’accès normalisé, variante de nom…), sa langue, son écriture, son contexte d’utilisation, sa source etc. et d’être mis en relation avec d’autres entités (la personne ou la collectivité qui a assigné cette forme particulière du nom, par exemple).

Les opérations des utilisateurs (« user tasks »)

Comme FRBR, LRM est construit en fonction des besoins des utilisateurs de l’information bibliographique. En revanche il ne prend pas en compte les processus de gestion interne des métadonnées présents dans FRAD et FRSAD. Les sept opérations des utilisateurs définies conjointement dans FRBR, FRAD et FRSAD sont donc réduites à cinq dans LRM, certaines étant devenues caduques et déclarées hors modèle, les autres s’ajustant en une liste unique dans laquelle on retrouve les quatre opérations de base dégagées dans FRBR (trouver, identifier, sélectionner, obtenir) définies d’une manière plus synthétique, auxquelles s’ajoute « explorer », fusion de l’opération du même nom dans FRSAD et de « contextualiser » de FRAD.

LRM, un modèle conceptuel de haut niveau

LRM se présente comme un modèle « de haut niveau », c’est-à-dire qu’il n’entre pas dans certains détails de spécificité considérés comme relevant de ses applications particulières (codes de catalogage ou autres) — à l’image de feu l’ISBD(G), matrice des ISBD spécialisés. Il se tient au contraire à un niveau de généralité qui lui procure davantage de souplesse que les modèles FRxx.

Il revient aux créateurs d’applications de LRM d’en élaborer éventuellement des extensions (à l’instar de FRBRoo, extension de CIDOC CRM) en créant par exemple des sous-classes des entités existantes, des relations spécifiques à partir de celles définies dans le modèle, ou de nouveaux attributs aux entités. Ils peuvent aussi, sans définir de nouvelles entités, se contenter d’utiliser l’attribut catégorie de res afin de répartir les entités existantes selon une typologie à définir en fonction de l’application.

À l’inverse, une application de LRM est libre de n’en utiliser qu’une partie des entités, des attributs ou des relations. « Cependant, une implémentation du modèle ne sera considérée comme fidèle à celui-ci qu’à la condition qu’elle respecte la structure fondamentale des entités et des relations définies entre elles (y compris leurs contraintes de cardinalité), ainsi que le rattachement des attributs aux entités pertinentes. » (IFLA LRM 2.2.)

RDA et LRM

Dès novembre 2016 le RSC (RDA Steering Committee) a pris la décision de réviser en profondeur RDA afin de l’aligner sur LRM, dont le texte était alors considéré comme stabilisé.

Ce travail est en cours. La publication d’une nouvelle édition de RDA, dans un RDA Toolkit lui-même rénové, est annoncée pour avril 2018 [mise à jour : juin 2018]. Ce sera l’épreuve de vérité : on verra si RDA est finalement autre chose qu’un ravalement de façade des AACR2.

À suivre particulièrement : la mise en œuvre de la modélisation des agrégats et celle de la relation d’appellation. Cette dernière est difficile à rendre dans un format MARC.

[1] Pour: Work, Expression, Manifestation, Item

[2] Final report of the Working group on aggregates, IFLA, 2011. En ligne : https://www.ifla.org/files/assets/cataloguing/frbrrg/AggregatesFinalReport.pdf

[3] Voir : Definition of FRBRoo : a conceptual model for bibliographic information in object-oriented formalism, version 2.4, IFLA, 2016. En ligne : https://www.ifla.org/publications/node/11240

[4] CIDOC : Comité international pour la documentation de l’ICOM [International council of museums ] ; CRM : Conceptual reference model. Voir : http://www.cidoc-crm.org/

[5] « FRBRoo is an ontology or high-level conceptual model for bibliographic data. » https://www.ifla.org/publications/node/11240 déjà cité.

[6] IFLA LRM, § 2.1 Scope and objectives

………

The three musketeers (1921), extrait. Fred Niblo, réalisation ; Douglas Fairbanks, Edward Knoblock et Lotta Woods, scénario ; Douglas Fairbanks (D’Artagnan), Léon Bary (Athos), George Siegmann (Porthos), Eugene Pallette (Aramis),… acteurs.
D’après Les trois mousquetaires d’Alexandre Dumas.
États-Unis, 1921.

Publicités

FRBR-LRM

  • 17 juin 2015

Fusione #2, par Paolo Torrisi sur Flickr (CC BY-NC-ND 2.0)
Fusione #2, par Paolo Torrisi sur Flickr (CC BY-NC-ND 2.0).

FRBR-LRM : tel est le nom sous lequel on désignera le résultat de la fusion en un seul modèle des trois FR (FRBRER, FRAD et FRSAD). LRM pour Library Reference Model.

Le travail de consolidation, qui aura duré plusieurs années, sera présenté cet été au congrès annuel de l’IFLA, au Cap, en Afrique du Sud. On peut d’ores et déjà prendre connaissance du texte (en anglais) de la communication de Pat Riva et Maja Žumer, membres du comité éditorial de FRBR-LRM, qui fait très clairement ressortir les caractéristiques principales du modèle.

On y retrouve un FRBRER retouché (le groupe 1 reste intact), et enrichi des apports de FRAD et FRSAD.

Une fois finalisé au sein du FRBR Review Group, le texte de FRBR-LRM sera présenté pour approbation aux instances ad hoc de l’IFLA (c’est à dire les Standing Committees for Cataloguing, Classification & Indexing et Bibliography), et devrait être soumis à enquête internationale début 2016.