Le Web d'aujourd'hui

« J’ai fait un rêve pour le Web [dans lequel les ordinateurs] deviennent capables d’analyser toutes les données sur le Web — le contenu, les liens et les transactions entre les personnes et les ordinateurs.»

— Tim Berners-Lee, Weaving the Web, 1999

Définitions

Web sémantique : c’est une extension du Web actuel qui permet aux machines — des agents automatisés, par exemple les algorithmes — de comprendre la sémantique, c’est-à-dire la signification de l’information sur le Web. Cela permet de créer des liens entre des informations. Cela aide aussi les machines à accéder plus efficacement aux différentes sources de données contenues dans le Web et, de cette façon, effectuer des tâches (de recherche, ou autres) plus facilement.

 

Web des données : pour y parvenir, le Web sémantique met en œuvre le Web des données qui consiste à lier et structurer l’information sur Internet pour accéder plus simplement aux connaissances qu’il contient déjà.

Graphe de connaissances / Base de données en graphe : il n’y a pas de consensus quant à la définition de ce terme. En réalité, cette notion est la combinaison de deux choses :

1— un modèle conceptuel pour représenter les informations sous forme de données et les relations entre celles-ci.

2— des données entreposées dans une base de données orientée en graphe : cette base est représentée par des nœuds qui sont les données, et par des arcs qui sont les relations des données entre elles. 

Brève histoire du Web

Le Web d’avant : Si vous ne comprenez pas pourquoi vos parents sont parfois dépassés par le Web, cela s’explique notamment parce qu’ils ont grandi en même temps que son avènement ! Disons qu’à la fin du XXe et au début du XXIe siècle, le Web est devenu progressivement populaire, et cela, partout dans le monde. Cette révolution numérique a totalement bouleversé notre quotidien, comme notre façon de circuler, de vivre ensemble, d’apprendre, de travailler, de discuter, de créer, etc.

 

Toutefois, le Web a bien évolué depuis ! Auparavant, celui-ci était syntaxique : les ressources qui le composaient étaient définies, mais le contenu, soit l’information, n’était pas compris par les machines et les algorithmes de ce monde. Seuls les humains pouvaient interpréter le contenu sur le Web. Victime de son succès, le Web est maintenant inondé d’informations. C’est ce qu’on appelle plus communément le Big data. L’ensemble des données est devenu si volumineux qu’il dépasse l’intuition et les capacités humaines d’analyse, de même que celles des outils informatiques classiques.

Le Web sémantique permet de favoriser l’émergence de nouvelles connaissances utiles et nécessaires pour les individus.

Le Web d’aujourd’hui : Face à cette surcharge d’informations et de données dans le Web, il est devenu impératif d’indexer celles-ci dans un langage et un vocabulaire standards. De cette manière, il devient possible de déployer des liens qui relient une information à toutes autres informations pertinentes, tout en favorisant l’interopérabilité des systèmes informatiques entre eux. En effet, lorsque les machines informatiques sont capables de fonctionner ensemble, elles doivent pouvoir communiquer entre elles.
 
Faciliter la compréhension de l’information par les machines est un atout incontestable pour le partage des connaissances et du savoir entre les humains. Le Web sémantique permet de favoriser l’émergence de nouvelles connaissances utiles et nécessaires pour les individus. Prenons l’exemple d’un trait caractéristique d’une sculpture antique qui aurait été documentée et dont les informations auraient été publiées sur le Web. Une œuvre aux mêmes caractéristiques pourrait également y être identifiée et ainsi de suite. Ainsi, un-e historien-ne serait en mesure de faire des corrélations entre plusieurs artefacts qu’il ou elle n’aurait jamais envisagées ! Imaginons maintenant que cela s’applique à tous les domaines et secteurs confondus, comme une connexion neuronale interreliée, comme une mémoire collective croisée.
À titre d’exemple, le projet Signé Laval, en partenariat avec Caligram et Culture Creates, s’inscrit dans le Web d’aujourd’hui. En effet, il participe au développement d’une technologie permettant d’aider les acteurs culturels lavallois à structurer leurs données relatives à leurs événements, pour ensuite les publier dans un calendrier qui encodera cette information en JSON-LD, soit un langage standard présent dans le Web sémantique. Avec la création d’un graphe de connaissances par Culture Creates, les données descriptives des événements sont ensuite liées à celles de Wikidata dans le cadre du projet de Signé Laval, mais aussi à d’autres dépôts de données. Voici en trois étapes, les processus technologiques mis en place dans le projet Signé Laval :

Quelques conseils pour répondre au Web des données 

  • Lorsque vous créez un nouveau site Web ou tout autre projet technologique lié au Web, posez la question à votre développeur et aux experts pour multiplier les perspectives et les apprentissages ;
  • Pensez à moyen et à long terme, et non à court terme, car les effets ne sont pas immédiats ;
  • Ayez des métadonnées structurées ;
  • Créez des hyperliens de qualité dans vos contenus Web ;
  • Prenez soin de bannir les formats PDF sur le Web ;
  • Choisissez un langage standard codé et adapté au Web (JSON-LD, RDF, etc.) ;
  • Utilisez des références et des interprétations communes pour chacun des secteurs ;
  • Favorisez l’utilisation d’identifiants ou de systèmes de classification communs dans un secteur ;
  • Favorisez des données ouvertes.
Pour aller plus loin 

Beat Estermann et Frédéric Julien, Lier l’avenir numérique des arts de la scène : Comment mobiliser les synergies de la chaîne de valeur, Association canadienne des organismes artistiques (CAPACOA) en coopération avec la Haute École spécialisée bernoise, 2019.

Josée Plamondon, Web sémantique : De choc culturel à transformation numérique, Serendipité, Québec, juillet 2018

Josée Plamondon, Produire des données: Entre outils de marketing et bases de connaissances, Serendipité, Québec, août 2019