Plus de 80% des internautes utilisent les moteurs de recherche comme porte d’entrée sur Internet, et parmi ceux-ci une immense majorité utilise Google. Ce moteur de recherche, en moins de 10 ans d’existence, s’est imposé par la pertinence des réponses apportées aux requêtes posées. Mais la recherche d’informations comme accès à la diversité des contenus du Web et des Blogs montre déjà ses limites et Google est engagé dans une diversité effrénée de services pour assurer son développement. Mais ce sont les conditions de navigation dans Internet qui seront alors à repenser.
Là où les moteurs linguistiques indexaient et recherchaient des mots-clés, indice de contenus, Google, on le sait module fortement cette indexation par le « Page Ranking », l’audience ou la notoriété d’un site, mesurées en fonction du nombre de liens qui pointent sur ce site. En un sens Google, comme les modèles scientométriques de citations («Qui cite qui ? Qui est cité par qui ? ») postule que la qualité d’un contenu est fonction de l’intérêt qu’il suscite. En moins de 10 ans, Google a fait de cet algorithme la base d’un pouvoir économique sans égal, (près de 100 milliards de dollars de capitalisation boursière) lui permettant d’élargir ses services à la connaissance géographique (Google Earth), et donc, potentiellement avec tous les couplages de géolocalisation ( GPS,…), au contenu des livres numérisés et des bibliothèques (Google Book) , aux images vidéo auto-produites (YouTube ) aux Blogs (GoogleBlog), à la messagerie et la correspondance privée( Gmail), à la presse (Google News), etc.
Tout ceci est connu. Ce qui l’est moins est que cette puissance économique, au fond captant la notoriété, la doxa, l’opinion croissante entourant toute information, repose sur le modèle d’élection publicitaire, de façon beaucoup plus sophistiquée qu’aucun média ne l’avait fait à ce jour. Comme le dit John Batelle [1], l’indexation à laquelle procède Google n’est pas seulement celle des sites et pages visités et accumulés par les robots d’un immense réseau d’ordinateurs. C’est aussi et d’abord la constitution de « la base de données de nos intentionnalités ». Chacun de nos milliards de clics qui chaque mois recherche de l’information, de la connaissance, des loisirs, des opportunités économiques commerciales ou financières, est répertorié et indexé. C’est cette « base de données » de nos recherches, besoins, envies, désirs de toutes natures qui est « vendue » automatiquement aux annonceurs, ciblant en retour toute proposition commerciale au plus près des requêtes sociales ou culturelles des Internautes.
Qu’un grand projet franco-allemand, Quaero, soit en route pour concurrencer Google, on ne peut que s’en réjouir. Les compétences linguistiques, statistiques des chercheurs européens sont sans doute aussi bonnes que celles de Larry Page et Sergei Brin, les créateurs de Google, en 1997. Après tout, ceux-ci s’étaient largement nourris de l’expérience de Louis Monnier, incompris en France et parti créer AltaVista dans les années 90 aux USA. Des sociétés françaises comme Exalead sont elles-mêmes les héritières de cette aventure des moteurs de recherche. Mais à l’évidence la question n’est plus posée sur le seul terrain scientifique ou technologique. La masse critique économique et sociale de Google oblige à considérer d’autres voies, à repenser la problématique de référence.
D’une part, en mois de 10 ans, le Web s’est considérablement développé dans la socialisation qu’on attendait de lui. D’autre part, cette socialisation s’est développée dans la virtualité qui dés l’origine caractérisait la communication informatique.
En premier lieu, Google est en effet en passe d’atteindre les limites de ce qui fait sa force. Le modèle de « notoriété démocratique » qui est au fond de l’algorithme, la pertinence corrélée à l’audience, est un modèle en passe de se vicier. La notoriété de l’information, le nombre de liens qui pointent sur celle-ci, ne peut être que l’indice de sa valeur partagée, non de sa valeur intrinsèque. Être largement cité (et citer largement !) dans beaucoup de domaines de rationalité, peut autant être le signe d’un intérêt foncier que d’un engouement de mode. Certes un article scientifique très cité peut être supposé plus pertinent qu’un article peu cité. Mais aux marges, l’inverse est tout aussi vrai : un article réellement novateur sera largement incompris, délaissé pendant un temps donné, comme l’ont été, à leur époque les théories de la thermodynamique de Sadi Carnot ou la génétique de Mendel.
Questions de "confiance"
Certes, Internet est autre chose qu’un espace de publication scientifique, et le sexe, le jeu le business et la rumeur y règnent massivement. Mais justement, si toute création esthétique ou culturelle se trouve également marginalisée, broyée, - quelles que soient les justifications libertaires avancées- si l’information de qualité se trouve nivelée par la presse gratuite et l’accès libre, c’est le signe que l’algorithme de Google ne parvient pas à être autre chose qu’un thermomètre de l’opinion commune. Pour un marché de masse et d’entertainement, c’est bien suffisant. Pour asseoir une hégémonie cognitive et heuristique (se repérer dans le foisonnement du réseau), ça ne l’est plus. L’entreprise de Mountain View l’a bien vu, en venant de déposer la notion de « Trust Ranking » (rang de confiance) , qui devrait remplacer celle de Page Ranking, pour classer, filtrer et hiérarchiser les connaissances. Cette indexation renverrait alors à la capacité de placer des indices de confiance (de vérification, d’authentification) en plus des indices de notoriété déjà utilisés. On se doute bien que c’est autant pour des raisons économiques et financières que cognitives ou éthiques que ce besoin de « confiance » s’impose désormais dans la recherche d’information.
D’une part, il n’est pas certain que ce soit ni simple ni faisable d’attribuer ainsi de tels « indices de confiance ». Cela suppose de classer des sites et des contenus de références, démarche encyclopédique ou ontologique assez étrangère à la culture de Google. Mais surtout, difficulté parce qu’Internet n’est pas une bibliothèque statique, où les documents conservés attendraient qu’on les lisent. C’est un univers qui à chaque instant se déforme, se développe, pousse des rhizomes, efface, retranche, ajoute, bouture et lie des images, textes, données et calculs en tout sens.
Au fond, Google se heurte à ce qui se révèle être la caractéristique principale de l’Internet : l’information s’enfle là où elle est sensible, controversée, culturellement, politiquement : d’où vient le réchauffement climatique ? Qui a tué Habyarimana le 6 avril 1994 au Rwanda ? Comment se répand la Grippe aviaire ? Quels sont les causes et effets du 11 septembre ? etc. Au fond, le « Multiverse » qu’est Internet se fait l’écho des énigmes et controverses du siècle. Même si on peut aussi y trouver la recette de la tarte Tatin ou acheter une voiture…
Autant dire qu’en la matière, la référence à des « tiers de confiance » (des institutions académiques, des gouvernements, des grands média, etc…) ne peut être qu’une réponse partielle, leur fonction (et leur pouvoir) ne pouvant trancher ou résoudre des controverses aussi foisonnantes.
Cette limite intrinsèque de Google, au fond Bachelard l’avait déjà supposé, doit être trouvée du côté du sens même de ce qu’on nomme « chercher », activité qui va de la quête de l’horaire d’un train à la question métaphysique ultime : « Quand on ne sait pas ce qu’on cherche, on ne comprend pas ce qu’on trouve »
D’autre part, Internet a re-découvert (ce qu’on feint d’appeler le Web 2.0), que l’indexation qui préside à l’efficacité de la recherche d’information pouvait aussi, et plus judicieusement être recherchée du côté des prescripteurs ou évaluateurs de l’information que sont les internautes eux-mêmes. Un marquage ou étiquetage libre de toute information pré-conçue la contextualise plus sûrement que toute catégorisation sémantique ou logique d’ordre encyclopédique. Le monde n’est pas un annuaire hiérarchisé, mais si j’identifie, par des chaînes de repérages assez efficaces les communautés qui indexent telle ou telle connaissance, ce repérage social sera qualitativement d’une rare efficacité. Nul n’est alors besoin d’un thesaurus fermé, de termes d’ « autorité », intangible, pour marquer les connaissances. Un « nuage » de tags, de marques, suffit à repérer les « folksonomies », les ontologies sociales qui ne cessent de se former et de se déformer dans l’univers du réseau en fonction des communautés d’intérêt. La blogosphère, par ses capacités éditoriales canalisant les flux d’informations, « syndicant » les réseaux de contenus, mutualisant les thématiques, est le type même de cette socialisation dynamique accrue que seul Internet est capable de faire naître.
Il y a fort à parier cependant que ces logiques, aussi prometteuses soient-elles ne pourront dépasser la création « d’ontologies régionales », partielles, et n’apporter qu’une réponse limitée à la recherche de « confiance » comme clé de la recherche du futur. Le Web sémantique, promu par Tims Berners Lee, se heurte à un autre type de contrainte, d’ordre logique. Internet, comme automate, a besoin de composer les unités d’information repérées sur le Web, par exemple, au sein de suites causales propre à enrichir l’information, à la produire dans sa complexité. De fait, tant que l’on navigue dans un espace thématiquement, ontologiquement, homogène (la médecine par exemple, ou la viticulture, etc.) rien n’interdit à des opérateurs logiques d’extraire des contenus édités d’origines diverses pour les reconstruire logiquement en réponse à une requête donnée.
Un croisement du Web sémantique, au sens logique, et des marquages sociaux en terme de « foksonomie » est-il possible ? C’est un des domaines ouvert dans la recherche informatique et documentaire actuelle.
Pour un moteur virtuel !
Mais c’est dans un sens très différent et beaucoup plus prometteur qu’on est en train d’entrevoir le futur des moteurs de recherche. Paradoxalement, ce n’est pas vers une réduction rationnelle, logique (et au fond de rigueur éthique) qu’il faille se diriger. Mais plutôt vers une amplification de ce qui fait le défaut même d’Internet, sa virtualité. Au fond, Internet relève d’une production industrielle et d’une division du travail de création de contenus d’une richesse anarchique sans égale. Pourquoi ne pas partir de ce qui non seulement permet, mais promeut cette création virtuelle, a priori hors du champs du « vérifiable » (ne serait-ce que par l’anonymat des avatars). On se souvient de ce dessin de Steiner en 1993 « On Internet, Nobody knows you are a dog ». Potentiellement, dés l’origine du Web, tout un chacun peut devenir créateur, ou du moins transformateur de contenu, de telle sorte que la « réalité informationnelle » des supports matériels se trouve maintenant totalement dépassée, subjuguée, par la profusion virtuelle des contenus. Des jeux comme Second Life, par l’ambiguïté qu’ils entretiennent entre réalité et fiction, la seconde amplifiant les possibilités de la première, montrent le chemin. La « confiance » recherchée n’a de sens que si elle se confronte aux univers virtuels, qualifiés à juste titre d’ « univers persistants », seule référence suffisamment large et stable pour évaluer progressivement et pérenniser des informations. Justement parce que les univers du jeu en réseau ne sont pas nécessairement liés au temps et à l’espace (il est possible de se téléporter) ; parce qu’ils introduisent un « jeu du monde » où tout semble possible, alors ils permettent, presque par excès là où Google se heurte par défaut, d’imaginer les moteurs de recherche du futur.
La page d’accueil du Web de demain sera l’entrée dans un jeu comme Second Life. Au fond, « la base de données de nos intentionnalités » incluera « logiquement » aussi nos rêves, nos désirs de connaissance aux limites, tout en mobilisant des « communautés virtuelles » pour accéder petit à petit à l’objet même de la requête. Le « réel » sera un sous ensemble d’un univers plus large, « virtuel », où les possibilités apparemment interdites ou contraintes du réel « actuel » s’ouvriront, comme pour expérimenter socialement leur devenir. La controverse n’est plus enfermée dans ce qui la rend énigmatique. Elle se déploie dans autant d’hypothèses que ce nouveau Web peut en produire, à partir des contenus eux-mêmes produits par chaque résident virtuel. etc. La petite boite de requête de Google deviendra un véritable voyage initiatique, ...où il sera aussi possible de trouver la recette de la tarte Tatin ou d’acheter une voiture.
Plus sérieusement, la virtualisation de l’information devrait être en effet une réponse au manque de « confiance » qui fragilise l’accès et la navigation au sein d’Internet actuellement : c’est en se confrontant aux divers « mondes possibles » dont l’information est porteuse que peut lui être restituée sa valeur, cognitive, esthétique, éthique, donc sa valeur de confiance. Une vision restrictive, autoritaire, académique, de la « vérification » n’est sûrement plus de mise. De fait avons nous vraiment besoin de « vérifier » l’information, la connaissance, les faits, par une vaine réduction au réel, ou avons nous besoin de les « virtualiser », pour nous apprendre de quoi est gros ce « réel » ?
Allez MM. Schmidt, Page et Brin, encore un effort ! Après le Page Ranking et le Trust Ranking, voilà le Dream Ranking ! Après avoir racheté You Tube 1,65 milliard de dollars, combien êtes vous capable d’investir dans le rachat de Second Life ?
Aix en Provence 11 décembre 2006
[1] La révolution Google - Comment les moteurs de recherche ont réinventé notre économie et notre culture; J. Battelle - Eyrolles; Juin 2006
Commentaires