Les données et métadonnées structurées et liées

« Rendre une information découvrable, dans un monde numérique, c’est la rendre accessible sous forme de donnée, la lier à d’autres informations pour que nos traces numériques se déploient, à l’image des réseaux de neurones dans le corps humain. »

– Josée Plamondon, 2019

Définitions

Donnée : c’est un élément d’information. Il existe plusieurs types de données (d’usage, de fréquentation, descriptives, etc.) qui ont des statuts propres, et qui sont encadrées par des licences juridiques qui déterminent leur réutilisation et leur accessibilité dans le Web (données ouvertes ou données fermées). Aussi, celles-ci peuvent avoir différents langages de programmation et codages. Toutefois, si la donnée n’est pas décrite suffisamment, elle manque de sens et de mise en contexte nécessaires pour que les machines la comprennent. C’est à ce moment-là qu’interviennent les métadonnées.

Métadonnée : c’est une donnée qui fournit du sens à une autre donnée. Autrement dit, elle permet de préciser le contexte nécessaire pour interpréter la donnée première. Les métadonnées ont pour mission d’organiser, de trier l’information et la documenter. Celles-ci peuvent avoir plusieurs impacts sur les outils spécialisés des moteurs de recherche : Amazon pour les achats en tout genre, Spotify pour la musique, Netflix pour les films, Etsy pour les métiers d’art, etc., mais aussi sur le Web. 

Dans cette fiche, nous appliquerons essentiellement la structuration des métadonnées aux résultats des recherches dans le Web. En ce sens, intégrer des métadonnées à ces contenus numériques, c’est aider les machines, à long terme, à comprendre les informations que vous désirez partager sur la Toile.

 

À partir de ce constat, il ne suffit pas de décrire ses propres informations à l’aide de métadonnées pour être visible dans le Web : cette bonne pratique constitue seulement une base pour documenter ses contenus. Il est primordial de structurer ses données à l’aide de métadonnées. Il faut également lier celles-ci à d’autres ensembles de données pour qu’elles répondent au Web d’aujourd’hui.

Le concept de structuration de l’information est nécessaire pour que les moteurs de recherche puissent repérer et interpréter l'information que vous mettez en ligne.

Structurer son information : ranger et documenter 

Le concept de structuration de l’information est nécessaire pour que les moteurs de recherche (Google, Bing, Yahoo, DuckDuckGo, etc.) puissent repérer et interpréter l’information que vous mettez en ligne. Pour ce faire, des balisages sont mis en place — une sorte de vocabulaire organisé, un standard, qui est compris par les moteurs de recherche. C’est le cas notamment de Schema qui est un vocabulaire standard utilisé par Google et Microsoft qui permet d’associer un sens sémantique aux données. Techniquement, c’est un vocabulaire qui peut être utilisé dans différents formats d’encodage, à savoir le RDFa et le JSON-LD. À ce moment-là, avec des données structurées, il est possible d’établir notamment des logiques SEO à votre site Web.

Comment structurer mon information ? 

Il existe deux façons de le faire:

1- Des extensions permettent d’intégrer automatiquement certaines balises Schema sur des sites Web développés seulement par WordPress. C’est le cas notamment de Yoast SEO et de Schema Pro. Cela peut aider notamment des organismes qui n’auraient pas d’expertise sur ce sujet au sein de leur équipe permanente.

 

2- Pour les sites qui n’utilisent pas WordPress, ou pour avoir des données plus personnalisées et plus évoluées que celles offertes par les extensions, il faut demander au développeur de votre site d’ajouter les balises nécessaires dans le gabarit de vos pages Web. Il est recommandé de se faire accompagner dans cette démarche pour l’élaboration de la structure de données.

Par la suite, si vous souhaitez vérifier que vous répondez bien aux exigences de Google en appliquant une utilisation WordPress ou une autre technique, il existe des outils en ligne permettant de tester vos données structurées ou encore, il vous suffit de consulter l’aide au balisage de Google. Le guide Bien documenter pour favoriser la découverte en ligne, dans sa section « Technologie », explique sous forme d’exercices l’utilisation de ces outils en ligne.


Prenons l’image d’une boîte de conserve, laquelle serait la « donnée », et les informations qui y sont écrites (identification, provenance, valeurs nutritives, etc.) seraient les « métadonnées ». L’illustration ci-dessous représente ces métadonnées structurées et non structurées : 

Lier l’information : circuler dans le Web

Lier une donnée dans le Web d’aujourd’hui, c’est complexe ! Il n’y a pas de secret, et il est conseillé d’être accompagné d’experts, ce qui nécessite une bonne préparation. Pour chacune des données que l’on publie sur le Web, on doit lui associer une adresse ou un URI unique (Uniform Resource Identifier). À l’aide de ces ressources décrites dans les URI, il est possible dans le Web d’aujourd’hui de lier les données à d’autres ensembles de données.

Certains experts, tels que Josée Plamondon, recommandent des données ouvertes liées (DOL). En effet, une donnée ouverte est une information qui est diffusée de manière structurée, selon une licence ouverte qui garantit la disponibilité, l’accessibilité et la réutilisation de celle-ci. En plus, elle est lisible par les machines. Les DOL permettent de favoriser l’adoption des standards du Web, de réduire les dépendances relatives au GAFAM et d’accroître le potentiel de découvrabilité des informations en favorisant les interconnexions entre celles-ci.

Pour aller plus loin 

Jean-Robert Bisaillon, Les identifiants d’artistes en ligne : métadonnées et présence sur les réseaux, Blogue du LATICCE, mars 2019.

Josée Plamondon, Trois enjeux communs pour les métadonnées en culture, Sérendipité, février 2018

Josée Plamondon, Nous sommes nuls en documentation de contenu, Sérendipité, janvier 2018

Observatoire de la culture et des communications du Québec, État des lieux sur les métadonnées relatives aux contenus culturels (+ Glossaire), Institut de la statistique du Québec, février 2018.

Portail Données Québec, Gouvernement du Québec, 2016