Colloque « DH@LLM: Grands modèles de langage et humanités numériques » @ IEA & Sorbonne U
3 juillet 2025 • 9h 4 juillet 2025 • 17h
Institut d'Études Avancées de Paris & Sorbonne Cluster for Artificial Intelligence (SCAI), France
DH@LLM: Grands modèles de langage et humanités numériques
Colloque organisé par Alexandre Gefen (CNRS-Sorbonne Nouvelle), Glenn Roe (Sorbonne Université), Ayla Rigouts Terryn (Université de Montréal) et Michael Sinatra (Université de Montréal)
En collaboration avec l’Observatoire des textes, des idées et des corpus (ObTIC), le Centre de recherche interuniversitaire sur les humanités numériques (CRIHN), l’Institut d’Études Avancées de Paris et Huma-Num.
Programme
jeudi 3 juillet 2025 @ Institut des Études Avancées de paris
- 9h30-9h45 : Mots de bienvenue des organisateurs
- 9h45-10h45 : Conférence plénière de Geoffrey Rockwell (University of Alberta), « Care and Repair for Responsibility Practices in Artificial Intelligence »
- 10h45-11h45 : Session #1 (Président: Michael Sinatra)
- Marie Puren et Aurélien Pellet (EPITA), « Comprendre sans trahir : quelles garanties pour les historiens face aux grands modèles de langue ? »
- Frédéric Clavert (Université du Luxembourg), « La fin de l’historien-programmeur ? »
- 11h45-12h15 : Pause café
- 12h15-13h15 : Session #2 (Présidente: Ayla Rigouts Terryn)
- Emile Provendier (IR* Huma-Num), « Comparaison de méthodologies d’apprentissage pour différents modèles de langue : implémenter la logique du verlan dans une machine »
- Bertrand Gervais (UQAM), « De l’intelligence à l’imagination artificielle : comprendre les nouveaux agents de la culture numérique »
- 13h15-14h15 : Pause repas
- 14h15-15h15 : Session #3 (Président: Glenn Roe)
- Jim Gabaret (Université Paris 1 Panthéon-Sorbonne), « Autopsie de l’auteur par l’IA générative : introspection, perpétuation de la persona auctoriale et nouvelles modalités créatives par le journal littéraire, la correspondance et les enregistrements numériques »
- Baptiste Bohet (Université Sorbonne Nouvelle) et Nicole Vincent (Université Paris Cité), « Plateforme Littéroscope : comment proposer une nouvelle approche de l’analyse littéraire en utilisant des modèles de langage ? »
- 15h15-15h45 : Pause café
- 15h45-16h45 : Session #4 (Président: Marcello Vitali-Rosati)
- Morgan Blangeois (Université Clermont Auvergne, CLERMA), Naïs Sabatier (Université Clermont Auvergne, PHIER), Aurelia Vasile (Université Clermont Auvergne, Maison des Sciences de l’Homme) et Henri Galinon (Université Clermont Auvergne, PHIER), « Explorer l’émergence de la science économique dans l’Encyclopédie grâce aux LLM : retours d’expérience sur l’Encycloscope 2.0 »
- Jordi Brahamcha-Marin et Elsa Courant (CNRS / CELLF), « Du prompting au fine-tuning. Réflexions sur l’usage des LLM pour une édition numérique de la Bibliographie de la France (XIXe siècle) «
vendredi 4 juillet 2025 @ Sorbonne Cluster for Artificial Intelligence (SCAI)
- 9h-10h : Session #5 (Président: Alexandre Gefen)
- AMarie Petitjean (CY Cergy Paris Université), « Théories génératives du littéraire et LMM : « poser les réponses » de ChatGPT avec Milène Tournier »
- Liliane Hodieb, Bastien Sepúlveda, Peter Stockinger (INALCO), « L’IA générative et la plateforme LaCAS pour la recherche en études aréales : apports et défis »
- 10h-10h30 : Pausé café
- 10h30-12h : Session #6 (Président: Michael Sinatra)
- Alexandre Gefen (CRNS), Antoine Sylvestre de Sacy, et Marc Allassonnière Tang (Muséum national d’Histoire naturelle), « La représentation des sexes dans les romans français à la lumière de l’IA »
- Irène Langlet (Université Gustave Eiffel) et Adam Faci (IR* Huma-Num) (avec Marianne Chamboux et Fayçal Salhi), « Des canons par centaines » : comment les étiquetages manuels et automatiques du web social recomposent-ils les corpus littéraires ? »
- Simon Bréan (Sorbonne Nouvelle), Adam Faci (IR* Huma-Num), Julien Schuh (Université Paris Nanterre), « « AI Reading Club » : comment faire lire des agents d’intelligence artificielle « dans le genre » »
- 12h-13h : Pause repas
- 13h-14h30 : Session #7 (Présidente: Ayla Rigouts Terryn)
- Claire Larsonneur (Université Paris 8), « Quelle IA pour les traducteurs ? A rebours des idées reçues »
- Jean-Philippe Magué (ENS Lyon), « Vers une épistémologie critique de l’intelligence artificielle dans les sciences humaines et sociales »
- Katherine McDonough (Lancaster University), « L’historien parmi les LLMs »
- 14h30-15h : Pause café
- 15h-16h : Session #8 (Président: Glenn Roe)
- Riccardo Barontini (ALTER) et Johanna Cordova (ERTIM), « Écopoétique et LLM : analyser les usages figurés de la biodiversité dans le roman contemporain »
- Marcello Vitali-Rosati (Université de Montréal), « Les êtres humains peuvent-ils penser ? »
- 16h-16h15 : Mots de cloture des organisateurs
Merci de remplir ce formulaire pour vous inscrire au colloque et permettre votre accès aux bâtiments.
– – – – – – –
Appel à communications
Les grands modèles de langage, qu’il s’agisse des modèles grand public fortement alignés comme ChatGPT ou de modèles accessibles en Open Source, ont montré en quelques années leurs immenses capacités à traduire, analyser, récrire et synthétiser des documents ou encore produire du code informatique. Ils se sont imposés comme des outils d’augmentation linguistique et cognitive révolutionnaire. Si les Humanités Numériques ont très tôt utilisé des outils à base d’apprentissage machine (clustering des textes, topic modeling, embeddings et analyses vectorielles, etc.), quels peuvent être les usages des LLM ? Quelles tâches anciennes peuvent-ils accomplir, quels types d’analyses nouvelles peuvent-ils permettre ? Par-delà leur utilité par exemple pour l’identification des entités nommées, ou le sentiment analysis, tout laisse à penser qu’ils peuvent permettre des analyses textuelles inédites ou fortement accélérées (identification des personnages, classement des textes selon leurs modalités énonciatives, analyse de thématiques, etc. On pense aussi au gain de temps permis pour produire des scripts ou des visualisations par les possibilités de codages des IA. Plus loin, on peut imaginer que les outils de Retrieval Augmented Generation ou de fine-tuning peuvent augurer d’une manière de faire parler directement les textes sous la modalité de questions/réponses, ouvrant tout un champ d’analyse novateurs – sans parler de la possibilité de générer des images issues d’analyses textuelles. Mais quels sont aussi les biais de telles pratiques, si l’on pense aux problèmes d’explicabilité et de falsifiabilité posés par les LLM, prompte à produire des hallucinations.
Ce sont ces horizons que ce colloque veut ouvrir, en accueillant à la fois des réflexions générales et des expériences novatrices.
Les propositions sont à envoyer à glennroe@gmail.com, gefen@fabula.org, ayla.rigouts.terryn@umontreal.ca et michael.eberle.sinatra@umontreal.ca avant le 15 avril 2025.
Ce contenu a été mis à jour le 30 juin 2025 à 4 h 32 min.


