Vous n'aurez peut-être plus jamais à lire un article d'actualité de votre vie si vous disposez d'une intelligence artificielle capable d'assimiler toutes les informations du web et d'en proposer un résumé à la demande. C'est le cauchemar des barons de la presse, car Google et d'autres expérimentent ce qu'on appelle l'IA générative, qui crée de nouveaux contenus à partir de données antérieures. Depuis le mois de mai, Google a commencé à déployer une nouvelle forme de recherche alimentée par l'IA générative, après que des observateurs du secteur se soient interrogés sur la future importance du géant technologique dans la fourniture d'informations aux consommateurs à la suite de la montée en puissance du chatbot d'OpenAI, ChatGPT, qui répond aux questions. Le produit, appelé Search Generative Experience (SGE), utilise l'IA pour créer des résumés en réponse à certaines requêtes de recherche, selon que le système de Google détermine ou non que le format serait utile. Ces résumés apparaissent en haut de la page d'accueil de la recherche Google, avec des liens permettant d'approfondir la question, selon la présentation de SGE par Google.

Si les éditeurs veulent empêcher que leur contenu soit utilisé par l'IA de Google pour générer ces résumés, ils doivent utiliser le même outil qui les empêcherait également d'apparaître dans les résultats de recherche de Google, ce qui les rendrait pratiquement invisibles sur le web.

La recherche de "Qui est Jon Fosse ?", le récent lauréat du prix Nobel de littérature, par exemple, génère trois paragraphes sur l'écrivain et son œuvre. Des boutons déroulants renvoient à des contenus sur Jon Fosse sur Wikipédia, NPR, le New York Times et d'autres sites web ; des liens supplémentaires apparaissent à droite du résumé.

Google explique que les résumés générés par l'IA sont synthétisés à partir de plusieurs pages web et que les liens sont conçus pour servir de point de départ pour en savoir plus. Il décrit le SGE comme une expérience à laquelle les utilisateurs peuvent participer, afin de l'aider à faire évoluer et à améliorer le produit, tout en tenant compte des commentaires des éditeurs de presse et d'autres parties prenantes. Pour les éditeurs, le nouvel outil de recherche est le dernier signal d'alarme d'une relation qui dure depuis des décennies, au cours de laquelle ils ont lutté pour concurrencer Google dans le domaine de la publicité en ligne et se sont appuyés sur le géant de la technologie pour le trafic de recherche.

Le produit, qui est encore en cours d'évolution et qui est désormais disponible aux États-Unis, en Inde et au Japon, a suscité des inquiétudes chez les éditeurs qui tentent de trouver leur place dans un monde où l'IA pourrait dominer la manière dont les utilisateurs trouvent et paient l'information, selon quatre grands éditeurs qui ont parlé à Reuters sous le couvert de l'anonymat afin de ne pas compliquer les négociations en cours avec Google.

Ces préoccupations concernent le trafic sur le web, la question de savoir si les éditeurs seront crédités en tant que source d'information apparaissant dans les résumés du SGE, et l'exactitude de ces résumés, ont déclaré ces éditeurs. Plus important encore, les éditeurs veulent être rémunérés pour le contenu sur lequel Google et d'autres entreprises d'intelligence artificielle entraînent leurs outils d'intelligence artificielle - un point de friction majeur autour de l'intelligence artificielle.

Un porte-parole de Google a déclaré dans un communiqué : Alors que nous introduisons l'IA générative dans la recherche, nous continuons à donner la priorité aux approches qui envoient un trafic précieux à un large éventail de créateurs, y compris les éditeurs de presse, afin de soutenir un web sain et ouvert.

En ce qui concerne la compensation, Google indique qu'il s'efforce de mieux comprendre le modèle économique des applications d'IA générative et de recueillir l'avis des éditeurs et d'autres parties prenantes.

Fin septembre, Google a annoncé un nouvel outil, appelé Google-Extended, qui donne aux éditeurs la possibilité de bloquer leur contenu afin qu'il ne soit pas utilisé par Google pour entraîner ses modèles d'IA.

Selon Danielle Coffey, présidente et directrice générale de la News Media Alliance, un groupe professionnel qui a fait pression sur le Congrès à ce sujet, le fait de donner aux éditeurs la possibilité de refuser d'être explorés pour l'IA est un geste de bonne foi. Reste à savoir si les paiements suivront, et dans quelle mesure il existe une ouverture à un échange de valeur plus sain.

Le nouvel outil permet aux éditeurs d'empêcher l'exploration de leur contenu pour le SGE, qu'il s'agisse des résumés ou des liens qui les accompagnent, sans pour autant disparaître de la recherche traditionnelle sur Google.

Les éditeurs veulent obtenir des clics pour sécuriser les annonceurs, et apparaître dans le moteur de recherche de Google est essentiel pour leur activité. La conception du SGE a repoussé les liens qui apparaissent dans la recherche traditionnelle vers le bas de la page, ce qui pourrait réduire le trafic vers ces liens de 40 %, selon un responsable de l'un des éditeurs.

Ce qui est encore plus alarmant, c'est la possibilité que les internautes évitent de cliquer sur l'un des liens si le passage du SGE répond au besoin d'information de l'utilisateur - satisfait, par exemple, de connaître la meilleure période de l'année pour se rendre à Paris, sans avoir à cliquer sur le site d'une publication de voyage.

Le SGE va certainement diminuer le trafic organique des éditeurs et ils vont devoir réfléchir à une autre façon de mesurer la valeur de ce contenu, voire le taux de clics, a déclaré Nikhil Lai, analyste principal chez Forrester Research. Néanmoins, il pense que la réputation des éditeurs restera solide du fait de l'apparition de leurs liens dans le SGE.

Google affirme avoir conçu le SGE pour mettre en valeur le contenu des sites web. Toute estimation de l'impact sur le trafic est spéculative et non représentative, car ce que vous voyez aujourd'hui dans SGE peut être très différent de ce qui sera finalement lancé plus largement dans Search, a déclaré un porte-parole de l'entreprise dans un communiqué.

Alors que les éditeurs et d'autres secteurs d'activité ont passé des décennies à adapter leurs sites web pour qu'ils apparaissent en bonne place dans les recherches traditionnelles de Google, ils ne disposent pas de suffisamment d'informations pour faire de même avec les nouveaux résumés du SGE, affirment ces éditeurs.

La nouvelle section sur l'IA est une boîte noire pour nous, a déclaré un cadre d'une maison d'édition. Nous ne savons pas comment nous assurer que nous en faisons partie, ni quel est l'algorithme sous-jacent.

Google a déclaré que les éditeurs n'ont pas besoin de faire quoi que ce soit de différent pour apparaître dans les recherches.

Les éditeurs autorisent depuis longtemps Google à explorer leur contenu en vue d'apparaître dans les résultats de recherche, en utilisant un robot, ou un logiciel, pour l'analyser et l'indexer automatiquement. L'exploration est la manière dont Google indexe le web pour faire apparaître le contenu dans les résultats de recherche.

Les préoccupations des éditeurs à l'égard du SGE se résument à un point essentiel : Ils affirment que Google explore leur contenu, gratuitement, pour créer des résumés que les utilisateurs peuvent lire au lieu de cliquer sur leurs liens, et que Google n'a pas été clair sur la façon dont ils peuvent empêcher le contenu d'être exploré pour le SGE.

Le nouvel outil de recherche de Google, a déclaré un éditeur, est encore plus menaçant pour nous et notre activité qu'un robot d'exploration qui explore notre activité illégalement.

Google n'a pas commenté cette évaluation.

Lorsqu'ils en ont la possibilité, les sites web empêchent l'utilisation de leur contenu pour l'IA si cela n'a pas d'impact sur la recherche, selon les données exclusives du détecteur de contenu d'IA Originality.ai. Depuis son lancement le 7 août, 27,4 % des principaux sites web bloquent le bot de ChatGPT, y compris le New York Times et le Washington Post. Ce chiffre est à comparer aux 6 % de sites qui bloquent Google-Extended depuis son lancement le 28 septembre. (Reportage d'Helen Coster ; rédaction de Kenneth Li et Claudia Parsons)