Projet d’atelier (Avril 2012)
(Image thanks : Street art rue Edouard Lockroy, Paris 75011)
"Verifiction : Web de données, logique modale, création numérique"
Le Web de données, ou Web sémantique, en « libérant les données », est-il de nature à faciliter la création numérique ?
Depuis quelques années[1], cette question est ouverte. À l’heure actuelle, le Web des données pourrait être décrit comme un foisonnement d’ambitions diverses convergeant vers un objectif commun : une réutilisation intelligente des données indépendamment de leur contexte numérique d’origine et à l’échelle du Web. Une solution consiste à offrir un accès structuré et sémantisé au contenu hétérogène du Web grâce à des procédés de médiation ou d’agrégation de contenus. Ces procédés s’appuient sur des langages de représentation des connaissances standardisés et munis de capacités de raisonnement. Ceci permet notamment de pouvoir qualifier les connaissances considérées pour évaluer leur pertinence et ainsi d’ouvrir les possibles pour de nouveaux champs applicatifs.
La quantité de données produites sur le Web suit une progression exponentielle depuis plus d’une dizaine d’années. Le web n’est donc plus en mesure d’être exploité « humainement » dans toutes les potentialités quantitatives et surtout qualitatives requises par de nombreux besoins socio-culturels. De plus, les outils informatiques associés au Web montrent leurs limites en matière d’interopérabilité et de recherche d’information.
Une des voies d’innovation se trouve à la croisée des trois domaines Web Sémantique, Logique Modale et théories de la Fiction. Cette voie peut être définie comme la préservation du « contexte de validité » de l’information. A l’heure actuelle, les langages standards du web sémantique ne permettent pas de définir précisément le périmètre de validité des connaissances. Afin d’offrir un accès homogène à l’information, les méthodes d’agrégation ou de médiation négligent souvent - faute de moyens - le contexte initialement associé aux connaissances en dehors duquel elles n’ont plus la même sémantique. En effet, certaines informations ne sont valables qu’à un certain moment dans le passé ou le futur, d’autres ne le sont que si elles vérifient certains présupposés, d’autres encore relèvent uniquement d’une croyance… Dans les disciplines de la Linguistique et de la Logique, ce concept de « contexte de validité » est appelé « modalité » et fait l’objet de nombreuses recherches depuis quelques décennies. Malheureusement, ces dernières ont rarement croisé les résultats obtenus dans chacune des deux disciplines, et encore moins dans le cadre plus récent offert par le Web Sémantique.
Indépendamment de l’évolution du Web, il est un domaine où les questions de référence et de contexte sont particulièrement étudiées, celui des théories de la fiction, concernant les discours narratifs, la littérature et de nombreux domaines de représentation esthétique.
La fiction en effet peut être considérée comme discours à dénotation nulle, ou « dénotation métaphorique, référence non-dénotationnelle » (Goodman) : « Selon Frege, les énoncés fictionnels ont un sens (Sinn) mais pas de référent (Bedeutung) »[2].
Factuelle dans un contexte, une donnée peut être fictive, sinon fausse dans un autre. Le domaine de la création joue pleinement sur ces changements de perspective.
Ainsi dans le roman ont été particulièrement étudiées les distinctions narratives entre auteur et narrateur (Genette) ou distinctions ou ambiguïté entre réel et virtuel. Ces distinctions relèvent de la pragmatique, dans la mesure où elles impliquent également les lecteurs, utilisateurs, acteurs ou spectateurs (T. Pavel), et pas seulement la syntaxe ou la sémantique des discours[3].
Or, de plus en plus sur Internet, de nombreux énoncés ont du sens, mais perdent toute dimension référentielle. Du moins, la recherche de référence, de dénotation et l’établissement (ou non) de vérification s’avèrent de plus en plus nécessaire (liens aux sources, auctorialité, contexte de preuve, etc.)
De plus Internet, comme réseau social, amplifie cette dimension pragmatique : ce sont les processus de requête, de consultation, communication et opération en réseau qui doivent être pris en compte pour fixer ou préciser les références aux données (modalités conditionnelles, etc.).
Les acquis des théories de la fiction et de la narration (très liées à la logique des mondes possibles) devraient donc être portés au profit des avancées du Web sémantique
*
Dans le cadre d’une action de veille stratégique sur l’ingénierie de représentation des connaissances, nous vous proposons de participer à un atelier exploratoire sur les présupposés théoriques de ces questions, mais aussi sur les perspectives applicatives et de recherche des relations entre Web sémantique et logiques modales. L’objectif de cet atelier consiste à dégager les moyens entrevus pour surmonter les frontières existantes entre ces disciplines en ce qui concerne la problématique liée au contexte de validité de l’intormation et proposer des pistes pour le développement d’outils de « vérifiction ».
Le but préalable serait d’identifier dans une première réunion les différentes compétences pouvant entrer en collaboration fructueuse et faire avancer résolument ces questions lors de 4 ou 5 séances. Le séminaire fermé, ou sur invitation, devrait comporter de 15 à 20 participants. Chaque séance se déroulerait autour d’un point problématique d’état de l’art ou d’une présentation de problème applicatif.
Cet atelier s’adresse donc à des créateurs, informaticiens, designer, philosophes, netartistes, développeurs, logiciens, etc.
Contacts :
Florence Amardeilh, Olivier Carloni, Charles Teissèdre, ([email protected]), Mondeca R&D
Yannick Maignien ( [email protected]), MY Consulting
Pour aller plus loin :
Web sémantique et les langages…
Le Web sémantique s’appuie principalement sur trois langages dits « standards » : RDF, SPARQL et OWL. RDF est un langage qui a initialement été conçu pour représenter les métadonnées (ou annotations) des ressources web. Il peut aussi être perçu comme un langage permettant la représentation des connaissances sous forme graphique (au sens théorie des graphes). SPARQL est un langage permettant de définir des requêtes pour interroger les connaissances définies en RDF. OWL est un langage de définition d’ontologies formelles. Une ontologie formelle consiste en un vocabulaire structuré de « types » dont les « propriétés » ont été mathématiquement définies. Ces types sont ensuite utilisés à un niveau plus concret pour décrire des connaissances factuelles.
Le web sémantique ne se limite pas non plus à ces trois langages (bien qu’ils soient très majoritairement utilisés). Il en existe d’autres comme RQL (autre langage d’interrogation), SKOS qui est un langage de définition de ressources terminologiques, RuleML/RIF/SWRL qui sont des langages de définition de règles. Ou encore des langages dédiés à des usages précis comme FOAF (réseaux sociaux), Geonames (données géographiques), SIOC (ressources Web), etc…
Logique Modale…
Le secteur de l’intelligence artificielle produit depuis plus d’une centaine d’années des résultats autour de thèmes variés comme l’expressivité et l’interopérabilité de langages mathématiquement fondés, la conception de systèmes de raisonnement automatisé, etc. La clef de voûte de ce secteur est la logique dite « classique » autour de laquelle s’articulent une multitude d’autres langages, dont un appelé « la logique modale ». La logique modale a été créée dans les années 60 pour répondre au besoin des logiciens d’attribuer un « contexte de validité » à une assertion logique et d’en tenir compte durant les déductions. Au cours du demi-siècle précédent, une multitude de logiques modales ont été développées et appliquées à des usages précis : les logiques temporelles (futur/passé), aléthiques (possibilité/nécessité), déontiques (interdiction/obligation), épistémiques ((in)contestabilité d’une connaissance), contrefactuelles (remises en question), etc.
Une logique modale est déjà présente dans le web sémantique par l’intermédiaire du langage OWL (dont un fragment correspond à une logique dite multi-modale). Cependant, il est difficile de l’utiliser dans OWL pour définir des « contextes de validité » car sa fonction modale est déjà exclusivement destinée à la représentation des relations. Mais d’autres logiques modales pourraient apporter au web sémantique les moyens intelligents pour contextualiser la validité des connaissances. Notamment RDF pourrait être étendu par une couche « modale » puisqu’il n’en dispose pas à ce jour. L’usage de la modalité aurait une plus-value certaine dans les secteurs ayant pignon sur Web. Par exemple, la prise en compte des modalités temporelles ou déontiques seraient d’un intérêt majeur dans les applications liées au domaine juridique. Par ailleurs, la mise à disposition récente des données publiques sur le Web et leur interconnexion mutuelle conduit également à s’interroger sur leur contexte d’usage.
Théorie de la Fiction…
Les développements informatiques et logiques rejoignent ou croisent les théories de la Fiction, de la narration (G.Genette, U. Eco, T.Pavel, J-M. Schaeffer, M-L. Ryan, J. Roubaud, etc.) ou théorie des mondes possibles (S.Kripke, N.Goodman, D.Lewis, etc.), permettent de caractériser de nombreuses productions heuristiques, culturelles ou sociales (controverses, rumeurs, illusions, simulations, hypothèses prospectives, réalités augmentées, storytelling, jeux, science-fiction, etc…) où se jouent les discriminations du réel et du virtuel et où se définissent les « mises en scène » ou dispositifs pragmatiques (auteur, narrateur, lecteur, spectateur, etc.) Voir le site www.fabula.org/
Évidemment, ces réflexions ont des incidences dans les domaines où le statut de vérité des énoncés est requis (Histoire, Sciences humaines, journalisme, droit, etc.)
Soutien de Thomas Pavel, Professeur à l’Université de Chicago et auteur, notamment de l’ « Univers de la fiction » au Seuil :
"J'ai pu enfin lire votre projet sur la Vérifiction qui me semble extrêmement intéressant bien que son orientation générale dépasse de loin mes compétences. Vous faites appel à la théorie de la fiction pour mieux discriminer entre le virtuel et le réel. Effectivement, la réflexion sur la fiction s'est penchée sur ces questions. En lisant le projet je me suis dit qu'au fond la théorie de la fiction aurait bien des choses à apprendre de vos recherches. Par exemple, lorsqu'on parle de réel en littérature on pense d'ordinaire à la réalité physique du monde. Sherlock Holmes n'en fait pas partie, il est donc un être de fiction. Si cependant on cible la réalité à un niveau légèrement plus abstrait, par exemple au niveau des professions, Sherlock Holmes est l'exemple inventé d'une profession réelle, celle de détective privé. Il y aurait donc toute une théorie à développer sur les niveaux auxquels la réalité est ciblée (ou évitée). Un tel éventail de réalités serait également utile pour l'étude des discours politiques qui eux aussi jouent sur une vaste gamme de niveaux du réel."
Thomas Pavel, 20 mars 2012
[1] Cf. Y. Maignien « Vérité et fiction sur Internet «Colloque virtuel Jacques Cartier Novembre 2002, Lyon. In «Les défis de l’édition numérique Publié, 2004. Presses de l’ENSSIB. Lyon. et http://mondespossibles.typepad.com/
[2] .J.M. Schaeffer et O. Ducrot Nouveau dictionnaire encyclopédique des sciences du langage Essais Points Seuil, Paris 1995., p.373
[3] Ib. P. 383
Commentaires