Archives du blog

RDA-thon

  • 16 mars 2016

Some Days, par Gareth sur Flickr
Some Days…, par Gareth sur Flickr (CC BY-SA 2.0).

La Bibliothèque nationale de France annonce la tenue prochaine dans ses murs d’un RDA-thon, dont le Verne-athon constituera le plat de résistance.

Le Verne-athon [prononcer : vernaton] est un atelier collaboratif de production de métadonnées liées portant sur l’œuvre de Jules Verne, sur le modèle des Jane-athons (Jane Austen), du Cervathon (Cervantes) ou autres Ag-athons (Agatha Christie) déjà organisés à l’étranger.

Cet événement, programmé le mercredi 4 mai prochain de 9h à 17h, est destiné à toute personne désireuse de se confronter pour de vrai à la création de métadonnées organisées selon les nouveaux modèles. On pourra enfin les voir de près ces métadonnées, les toucher, les façonner, leur parler, s’énerver sur elles et sur soi-même.

Le Verne-athon est précédé de deux hors-d’œuvre plus ou moins appétissants :

RDA et Bibframe pour les périodiques (mercredi 27 avril de 14h à 16h30) : une présentation de RDA pour les périodiques par Regina Reynolds, directrice du centre ISSN des États-Unis, avec un focus sur Bibframe, outil de FRBRisation développé par la Bibliothèque du Congrès.

FRBR from abroad: meet Gordon Dunsire, chair of the RDA Steering Committee (lundi 2 mai de 14h à 17h). Gordon Dunsire est le président du RDA Steering Committee (ex JSC : Joint Steering Committee for Development of RDA). Cette « rencontre-atelier » portera sur les modalités pratiques de l’implémentation de RDA dans le contexte bibliographique actuel (comment concilier MARC et FRBR, comment RDA réagit à l’évolution du modèle FRBR, comment s’y retrouver parmi les différents formats RDF). Attention, la langue de cette session est l’anglais. Attention, Gordon Dunsire est écossais.

………

[L’ascenseur à reconnaissance vocale]. Iain Davidson, réalisation ; Robert Florence, Iain Connell, dialogues ; Robert Florence, Iain Connell, acteurs. Extrait de : Burnistoun, Série 1, Épisode 1. Production : Écosse, The Comedy Unit. Première diffusion : BBC Two Scotland, 1er mars 2010.

Écosse, banlieue de Glasgow. L’ascenseur à reconnaissance vocale, importé des États-Unis, ne comprend pas l’accent écossais.

Sudoc et FRBR : parution de la première série de consignes de catalogage

  • 20 février 2013

sudocfrbr

Le Guide méthodologique du Sudoc s’enrichit aujourd’hui même d’une nouvelle page intitulée Sudoc / FRBR : consignes de catalogage, dont l’introduction précise le contexte et l’objectif :

Les travaux de modélisation des données bibliographiques (FRBR : Fonctionnalités requises des notices bibliographiques) et d’autorité (FRAD : Fonctionnalités requises des données d’autorité, FRSAD : Fonctionnalités requises des données d’autorité matière) menés au cours des deux dernières décennies ont depuis quelques années trouvé des applications concrètes dans certains codes de catalogage, et en particulier dans RDA (Ressources : description et accès) qui devrait entrer en vigueur en France à terme. D’ici là, le groupe « RDA en France », réuni dans le cadre de l’AFNOR, s’efforce :

  • de proposer des aménagements au code RDA sur les points qui apparaissent exagérément conservateurs, ou sur des règles trop ancrées dans un contexte anglosaxon ;
  • de réviser les règles de catalogage françaises en vigueur, toutes obsolètes, en s’inspirant des modèles FRBR et FRAD et en les rapprochant autant que possible de RDA, qui est la cible vers laquelle elles tendent.

Les consignes qui suivent concernent le catalogage courant dans le Sudoc. Elles précisent le billet Préparer la FRBRisation des données publié le 20 avril 2012 sur le site rda@abes.

Pour des raisons techniques, les consignes sont découpées en trois « vagues » successives, dont voici la première.

Les vagues suivantes introduiront :

  • le mécanisme d’appariement des titres d’œuvres contenues et des accès auteurs et contributeurs correspondants
  • les consignes pour les titres normalisés des œuvres.

Mais qu’est-ce qu’il se passe ? (3) Sudoc

  • 19 décembre 2012

(Bon ben alors qu’est-ce qu’i’ fabriquent à l’Abes, i’ nous bassinent avec leur FRBRisation, là, et i’ s’ passe rien, quels pignoufs ceux-là alors.)

La base de production

Elle ne sera pas réellement FRBRisée comme il en avait été question (elle ne sera pas redéfinie, avec des notices pour chacune des entités FRBR du groupe 1, notamment œuvre et expression, s’ajoutant à manifestation et item qui existent déjà). Il faudra se contenter d’une FRBRisation « à plat », avec dans les notices bibliographiques une zone d’identification des œuvres (l’actuelle zone 500 Titre uniforme, insatisfaisante mais qui permet un contrôle par autorité), en attendant peut-être les nouvelles zones Unimarc spécifiques (507 et 577, qui permettent aussi d’identifier clairement les expressions).

De nouvelles consignes de catalogage

Elles sont en cours de définition. Une première vague sera publiée très prochainement, probablement dès janvier. Il s’agit essentiellement d’une formalisation des indications fournies dans le billet Préparer la FRBRisation des données du 20 avril 2012. En voici les têtes de chapitre :

1. Traductions
2. Note de contenu et accès aux titres des œuvres contenues
3. Accès au titre parallèle (Unimarc 510)
4. Accès au titre de couverture (Unimarc 512)
5. Les accès auteurs (Unimarc 7xx)
6. Identifiants normalisés et autres identifiants
7. Dates

Deux autres vagues devraient suivre, introduisant successivement :

  • le mécanisme d’appariement des titres d’œuvres contenues avec les accès auteurs et contributeurs correspondants
  • les consignes pour les titres normalisés des œuvres.

Le rétrospectif et l’expression des données du Sudoc en RDF

Parallèlement est en cours un travail de mise au point de traitements automatiques à appliquer aux données du Sudoc.

Ces traitements permettront d’une part de mettre à niveau la base de production elle-même (principalement : identification des œuvres et création des autorités associées, génération de la zone 0 de l’ISBD 2011), d’autre part de raffiner l’actuel mécanisme de restitution en RDF des données bibliographiques du Sudoc.

Et après ? Le Sudoc déménage

Dans un nuage : cumulonimbus, altostratus, cirrostratus, traînée de condensation, on ne sait pas encore, le choix n’est pas fait.

Mais de fait, quoique cet avenir proche peine encore à émerger de la brume de décembre, il faut envisager que dès 2014 probablement, ou peut-être 2015 s’il se produit comme on dit un « glissement de calendrier », certaines des bibliothèques qui créent actuellement leurs données dans la base CBS au moyen de WinIBW pourraient le faire dans ce nuage (dans ce cloud plutôt, prononcé clawd et non cloude, à éviter en société).

Ledit cloud sera sous influence anglosaxonne, on y appliquera donc probablement RDA. Pour les ressources sur support physique, le catalogage devrait se faire en MARC, et le niveau de FRBRisation restera vraisemblablement aussi bas que dans la base CBS (« à plat »), c’est à dire sans amélioration notable par rapport à l’existant.

À suivre, dès dissipation des brouillards hivernaux. Ce sera la grande affaire de 2013.

2013 Testa coronata, 12e siècle. Florence (Italie), Palazzo Vecchio, Collezione Loeser. (Projet de carte de vœux non retenu officiellement.)

———

Se renseigner sur le projet de SGB mutualisé :

l’un et l’autre alimentés par Jean Bernon, responsable du projet SGBM à l’Abes.

Préparer la FRBRisation des données

L’une des difficultés à surmonter au cours du processus du passage aux FRBR — et non la moindre — sera la mise à niveau des données rétrospectives, qu’il faudra « FRBRiser » à coup de procédures informatiques reposant sur des algorithmes de conversion.

Ces algorithmes s’efforceront d’identifier les Œuvres et si possible les différentes Expressions de celles-ci contenues dans chacune des Manifestations décrites dans le catalogue, puis de créer automatiquement les notices et/ou les points d’accès correspondants.  Ceci bien entendu à partir des données du catalogue. La qualité du résultat sera donc fonction de celle des données à traiter.

Les quelques recommandations que voici constituent un socle, et pourront être complétées dans les consignes qui seront prochainement publiées dans le Guide méthodologique du Sudoc, notamment pour des types de ressource qui ne sont pas évoquées dans ce petit billet.

On peut aussi s’en inspirer pour la préparation des catalogues locaux.

Ce qui est fait est fait, il n’est pas question de revenir « à la main» sur les millions de notices déjà produites, ce serait comme écoper la mer d’Iroise avec une poêle à frire. Mais on peut, s’agissant des données à créer, prendre les précautions nécessaires pour leur assurer le moment venu une FRBRisation élégante.

Une règle simple : appliquer les règles de catalogage en vigueur (pour le Sudoc, celles énoncées dans le Guide méthodologique), voilà la meilleure des garanties.

Cependant il importe de veiller tout spécialement à quelques points précis, cruciaux pour une FRBRisation efficace.

Les titres

Les titres constituent l’élément fondamental d’identification des Manifestations, mais aussi, et c’est ce qui importe dans le processus de FRBRisation, des Œuvres qui y sont contenues. C’est pourquoi il est essentiel de les transcrire avec exactitude.

Lorsqu’on décrit une traduction, il est nécessaire de transcrire systématiquement le titre original de l’œuvre (Unimarc 454) : c’est le seul lien entre les différentes versions linguistiques de ladite.

Le cas échéant, la transcription fidèle des titres des œuvres contenues et des responsabilités associées sera d’un grand secours le moment venu.

Les codes de langue (Unimarc 101)

Ils sont indispensables à l’identification des Expressions (pour les œuvres textuelles ou s’exprimant au travers d’une ou plusieurs langues). Il faut au minimum que les données suivantes soient présentes (et correctes) :

  • la (les) langue(s) de la publication ($a)
  • la (les) langue(s) originale(s) en cas de traduction ($c)
  • l’indicateur de traduction

Les accès auteurs (Unimarc 7xx)

Il faudra pouvoir les attribuer automatiquement à l’entité FRBR pertinente (Œuvre, Expression, ou Manifestation). Ce sera possible si :

  • le choix de l’étiquette Unimarc (7×0, 7×1 ou 7×2) est correct
  • le(s) code(s) de fonction est / sont présent(s) et juste(s)

Les dates

Des dates saisies dans les notices bibliographiques, on pourra dans certains cas inférer celle de l’Œuvre correspondante : par exemple pour les travaux universitaires, thèses et mémoires.

En revanche il sera difficile de dater les Expressions à partir des données présentes, cette notion étant depuis toujours absente des règles de catalogage.

Pour les œuvres textuelles, la date de copyright y correspond assez bien, mais elle est rarement saisie vu que les normes actuelles n’en font pas grand cas. Il serait utile de le faire désormais, en Unimarc 210$d, exemple :

$d impr. 2012, cop. 2004

et dans les données codées de date.

D’une manière générale, il importe de dater correctement les ressources décrites, dans la zone de l’adresse bien sûr, mais surtout dans la zone de données codées (même — et surtout —  lorsque plusieurs dates sont liées à une même ressource : dates de copyright et d’impression déjà évoquées, date d’une reproduction en fac-similé et date de l’original, dates des publications en série, dates de publication et de protection des enregistrements sonores ou audiovisuels, etc.)

La zone de l’édition (Unimarc 205)

Une édition, au sens donné à ce terme dans l’ISBD (zone 2) constitue une Expression particulière d’une Œuvre donnée.

Ceci à l’exception des reproductions en fac-similé (cf. Z 44-050, § 2.1.2), qui à vrai dire ne devraient pas faire l’objet d’une zone de l’édition.

Identifiants

Identifiants normalisés et autres

Les identifiants normalisés (ISBN, ISMN, ISSN etc.) de même que certains identifiants commerciaux (EAN, numéros d’éditeurs des publications audiovisuelles) pourront être mis à contribution pour reconstituer des métadonnées incomplètes ou erronées, et sont susceptibles de faciliter la mise en relation d’entités apparentées.

C’est pourquoi ils doivent être scrupuleusement incorporés aux notices, même si certains (ISBN) sont comme on le sait moins fiables que d’autres (ISSN).

Identifiants de notice

Il est important de conserver les identifiants des notices importées ou dérivées, et de supprimer ceux dont on hériterait dans une nouvelle notice obtenue par copie.

Conserver aussi les identifiants des notices d’autorité liées figurant dans les sous-zones $3 des points d’accès contrôlés (Unimarc 500, 60x, 7xx), et ceux des notices bibliographiques liées (sous-zones $0 des zones Unimarc 4xx). Ceci vaut surtout pour les catalogues locaux