Responsables de l’axe : Maxime Gohier (histoire, UQAR) et Dominic Forest (sciences de l’information, Université de Montréal)
Cet axe analyse l’influence des développements en apprentissage-machine, en intelligence artificielle et de la fouille de données massives sur l’exploitation et la compréhension de contenus savants (texte, son et image). Il s’intéresse aux questions épistémologiques posées par l’apprentissage machine ainsi qu’aux approches connexionnistes ou symboliques pour les sciences humaines et sociales. La numérisation et l’accessibilité facilitée aux corpus ont rendu possible, dès les années 1990, de nouvelles formes de recherche portant sur plusieurs millions de textes. Récemment, l’apparition de la technologie HTR (Handwritten Text Recognition) qui exploite les nouveaux systèmes d’apprentissage profond basés sur des réseaux de neurones a aussi transformé la quantité et la qualité des textes transcrits automatiquement.
La possibilité d’analyser des corpus aussi massifs ouvre les portes à de nouveaux paradigmes expérimentaux permettant d’étendre l’analyse à des genres littéraires entiers. On nomme distant reading le type d’études portant sur des corpus étendus, d’après les travaux de Franco Moretti (2000). Les développements récents de l’intelligence artificielle, et en particulier la production de modèles entraînables plutôt que complètement précodés, ravivent les espoirs des littéraires : les méthodes computationnelles génèrent enfin quelque chose qui s’apparente à un sens. Au-delà de compter, les algorithmes semblent pouvoir comprendre (même s’ils sont surtout prédictifs). Se développent une série d’approches et de méthodes comme l’analyse des sentiments et des opinions, la vectorisation de mots, la modélisation thématique, les réseaux de neurones, la reconnaissance des entités nommées, etc.
Les chercheur·euse·s du CRIHN développent une expertise sur ces thématiques depuis de nombreuses années, de même que sur l’utilisation d’algorithmes d’analyse d’images (pour des corpus de photographies par exemple). Avec les développements récents d’applications visant à la fois les spécialistes et le grand public (ChatGPT de OpenAI étant le plus connu en ce moment), il devient incontournable de mobiliser une réflexion théorique et critique pour en comprendre les enjeux globaux et leurs implications.
Cet axe répond de manière fondamentale aux besoins de la société civile qui a plus que jamais besoin d’être accompagnée par des spécialistes capables d’offrir des analyses critiques vulgarisées de technologies qui changent déjà radicalement notre manière d’être au monde.
Ce contenu a été mis à jour le 6 décembre 2023 à 23 h 34 min.