Web de données

Est-ce que FRBR et RDA feront apparaitre les notices des catalogues de bibliothèques dans les premiers résultats de Google, Bing... ?

L'ambition de la nouvelle structuration de l'information bibliographique est bien de mettre les données des catalogues dans le Web de données, pour qu'elles soient exploitées par les moterus de recherche.
Toutefois les algorithmes de référencement dépendent des moteurs et peuvent varier. Toutefois, un critère important pour les moteurs de recherche est la présence de liens (et leur nombre).  
RDA seul, et même FRBR dans un catalogue isolé ne suffisent donc pas à assurer un bon référencement. C'est une organisation mutualisée de l'information bibliographique autour d'un réservoir national de données bibliographiques FRBRisées et disponibles sur le Web de données qui assurera une bonne visibilité des catalogues de bibliothèques dans les moteurs de recherche, tout en évitant le bruit.

Est-ce que grâce au web de données on peut imaginer un signalement "intelligent" d'erreurs possibles de catalogage par les systèmes : par exemple essayer de mettre un code langue sans rapport avec la langue du titre ou des auteurs ?

Cela relève d'algorithmes d'analyse linguistique, probablement facilitée dans le cas de données très structurées, mais qui n'en découlent pas directement.

Dans le web de données, dans quelle langue les autorités seront présentées ?

Celle qu'on veut. Ça peut même être, si les données sont bien faites, celle que l'utilisateur choisit. Par exemple, la notion d'image en ISBD, si on la regarde dans l'open metadata registry (http://metadataregistry.org/concept/show/id/1201.html), on verra que le libellé, la définition etc. sont présentés en plusieurs langues (pas encore en français). Le but est de pouvoir servir l'utilisateur final dans la langue qu'il préfère.

Dans le web de données, tous les liens seront bien "qualifiés" ou "signifiants", par exemple les liens entre œuvres pour définir la nature du lien : tout ou partie, œuvre dérivées de, œuvre sujet de... ?

Si on veut le faire on le peut (RDA le permet en tout cas, FRBR aussi). On peut aussi en rester à un niveau plus grossier (un peu comme actuellement en UNIMARC : on peut utilier dans certains cas des étiquettes plus ou moins précises).

Que devient XML dont on nous a tant parlé ces dernières années ?

XML est un langage qui sert notamment à la structuration de documents et à la programmation. C'est un des langages utilisés sur le Web et il continuera de l'être pour certaines applications.  Mais la structure arborescente de XML est moins adaptée au réseau de données que constitue l'information bibliographique, surtout FRBRisée, que le modèle de graphes sur lequel repose RDF. Par ailleurs, RDF peut être exprimé en XML (c'est une des notations possibles).

Quelle différence y a-t-il entre un catalogue « dans les nuages » (cloud computing) et un catalogue dans le Web de données (Linked Data) ?

Cloud computing = c’est d’abord un choix technologique qui n’implique pas de changement quant à la structuration des données : on peut rester en MARC (voir définition sur le site ABES). Pour le fournisseur, plus qu’une seule version logicielle, « dans les nuages » : les données comme le logiciel sont chez le fournisseur ; l’emplacement et le fonctionnement ne sont pas forcément connus des utilisateurs.

Cette solution repose sur le principe d’abonnement pour l’accès aux données comme aux applications logicielles.

Un catalogue dans le Web de données est un catalogue dont les données sont exposées en utilisant les standards du Web sémantique (structuration en RDF, identifiants URI, ontologies), et en reliant ces données à d’autres jeux de données (référentiels, mais aussi tout autre jeux de données susceptible d’enrichir l’information).

Syndiquer le contenu