Intelligence Artificielle : le journaliste « augmenté » arrive dans les salles de rédaction
L'IA dans le journalisme prend de l'ampleur. A ce stade précoce, les salles de rédaction regardent comment ces outils peuvent être utilisés pour aider les journalistes à écrire des articles encore plus poussés.
Cet article est-il écrit par un bot ? Dans quelques années, il risque d'être difficile de répondre oui ou non. L'intelligence artificielle s'applique à de nombreux secteurs, et les domaines de l'information et du journalisme ne font pas exception.
En fait, le journalisme automatisé aide déjà à créer des articles d'actualité et à en améliorer la narration. Le Washington Post a fait savoir, l'année dernière, que son propre robot AI, Heliograf, avait publié de manière autonome 850 articles, principalement sur le sport et sur les résultats des élections politiques régionales.
The Motley Fool prévoit de son côté que 20 % du contenu lié aux lettres destinées aux actionnaires, aux documents juridiques, aux études de marché, aux communiqués de presse et même à certains articles et livres blancs seront générés par l'IA cette année.
L'application de l'intelligence artificielle dans ce secteur très compétitif, ou le temps compte, et où les marges sont faibles, commence donc à s'accélérer.
La génération de contenu en langage naturel gagne en popularité
Une grande partie du contenu généré par l'intelligence artificielle et l'apprentissage statistique (Machine Learning) concerne des informations d'intérêt public, mais qui ne nécessitent pas la présence d'un grand nombre d'employés rémunérés.
L'IA est utilisée à bon escient pour produire des bulletins météorologiques, des résumés financiers, des couvertures de news et d'événements régionaux ou locaux, des résumés d'événements sportifs et d'autres actualités à base de données et de chiffres. Ces systèmes peuvent quantifier ce type d'informations et les transformer en un texte, en langage naturel, lisible par l'Homme.
L'IA est également utilisée pour générer du contenu à la volée (des Breaking News) en attendant que les journalistes humains se rendent sur les lieux. Reuters, par exemple, l'utilise pour parcourir Twitter pour trouver des faits avant qu'ils ne fassent la une. De cette façon, des informations précieuses sont transmises aux journalistes dès qu'elles sont disponibles.
Comme nous l'avons mentionné, le Washington Post a utilisé une approche qu'il appelle « journalisme robotisé » (robot journalism). Connu sous le nom d'Heliograf, son bot a fait ses débuts en 2016, aux Jeux olympiques de Rio de Janeiro. Heliograf assemble automatiquement des récits en interprétant les données sportives et en les structurant narrativement à partir de modèles tirés de l'analyse d'articles passés du Washington Post.
Ce système a permis de faire une couverture continue et de compter les médailles avec exactitude, même pour les compétitions qui étaient peu suivies par les journalistes.
Yahoo Sports a aussi adopté cette approche pour couvrir les compétitions sportives d'équipes universitaires.
« Augmenter » le processus journalistique
Le journalisme automatisé aide les salles de rédaction en réduisant le temps, le coût et la complexité du processus d'écriture et de diffusion des articles.
Le New York Times, par exemple, utilise une technologie d'intelligence augmentée connue sous le nom de Editor, qui aide les journalistes et identifie les phrases clés, les titres et les détails du texte. Le système peut fournir des résultats de recherches à la volée, des suggestions de contenus, des liens, des vérifications de faits et de citations, ou des points pour aider à améliorer la qualité globale de l'article. Ce qui contribuerait à réduire considérablement la charge de travail des journalistes et leur permettrait d'écrire plus rapidement un contenu de meilleure qualité.
Dans le même esprit, BBC News s'appuie, pour sa division BBC News Labs, sur un bot appelé Juicer qui suit des centaines de sources, qui rassemble des informations et en extrait des textes qui peuvent être utilisés par les journalistes qui écrivent sur ces sujets. Juicer est un méta-moteur de recherche amélioré par l'intelligence artificielle qui stocke des informations sur les organisations, les personnes, les lieux et d'autres éléments intéressants afin de pouvoir les localiser et les retrouver rapidement par la suite. De ce fait, un contenu pertinent peut être identifié rapidement et les nouvelles actualités peuvent être reliées à d'autres contenus générés précédemment.
De son côté, l'Associated Press (AP) utilise un outil de journalisme automatisé qu'elle a construit elle-même. NewsWhip observe les publications sur Twitter, Facebook, LinkedIn, Pinterest, Instagram, Snapchat et autres médias sociaux. Le système synthétise ensuite ces informations pour garder un œil sur la façon dont les utilisateurs s'engagent avec le contenu d'AP et comment ils le partagent.
AP utilise également cette information pour voir comment son contenu se comporte par rapport à ses concurrents et quels mots-clés, sujets, influenceurs et tendances émergentes pourraient être utiles pour des sujets futurs (dans le sens où ils attireront encore le plus l'attention sur les réseaux sociaux).
Améliorer la qualité du contenu
L'année 2016 a vu l'apparition des « Fake News » et d'articles qui ont été écrits pour manipuler plutôt que pour informer. Les sites d'information et les médias sociaux utilisent l'IA pour détecter des modèles de mots qui peuvent indiquer qu'il s'agit d'une fausse nouvelle. Ces articles sont ensuite signalés à des agents humains qui vérifient si les faits sont réels ou non.
Les grands organes d'information utilisent de plus en plus ces systèmes pour empêcher que des canulars ou des Fake News ne soient propagés par leurs canaux d'information légitimes. Ils les utilisent également pour dénoncer ces fausses sources et dénoncer les comportements frauduleux intentionnels.
De nombreux médias en ligne cherchent à avoir des commentaires de leurs lecteurs. Cependant, ces commentaires et les forums peuvent rapidement devenir incontrôlables avec des posts toxiques et des commentaires inappropriés ou insultants. Le New York Times, parmi d'autres organes de presse, utilisent l'IA pour modérer automatiquement les lecteurs, en regardant le ton de la langue, les mots utilisés et d'autres facteurs qui détectent les schémas non désirés.
Le groupe Jigsaw de Google a développé Perspective API qui classe les commentaires par niveaux de toxicité. La modération - automatisée ou humaine - peut ensuite naviguer dans ces catégories pour supprimer les commentaires qui ne répondent pas aux règles du forum.
Engager les lecteurs
Les systèmes automatisés aident également à mieux communiquer avec les lecteurs. Le Machine Learning peut apprendre les préférences individuelles des lecteurs et recommander des articles supplémentaires - ou même des contenus payants - que les lecteurs pourraient apprécier et trouver utiles.
Le Guardian a récemment lancé ce type de chatbot qui interagit avec ses lecteurs, permettant ainsi un plus grand engagement avec ses articles et ses dossiers. Ces chatbots peuvent fournir un contenu ou un contexte supplémentaire qui n'est pas disponible de base dans l'article.
D'autres médias utilisent des assistants vocaux, comme Alexa, pour fournir des résumés d'actualités et créer des formes plus conversationnelles d'interaction avec leurs lecteurs.
En conclusion, les médias ne cherchent pas à se passer de l'humain. Au contraire, l'AI permet aux journalistes de faire leur travail plus efficacement. Elle aide les titres à couvrir des domaines pour lesquels ils n'ont pas les ressources nécessaires et libère du temps aux journalistes pour couvrir les sujets qui comptent vraiment.