Atelier eScriptorium

Notre Centre est très heureux d’accueillir Prof. Peter Stokes (directeur d’études en humanités numériques et computationnelles appliquées à l’étude de l’écrit ancien à l’École Pratique des Hautes Études – Université PSL) qui offrira à nos membres le mercredi 2 avril prochain un atelier sur eScriptorium :

eScriptorium et kraken sont des logiciels libres et ouverts qui fonctionnent ensemble pour la transcription automatique des documents (HTR/ATR/OCR), surtout pour les langues et l’écritures rares et historiques. Bien qu’il reste de nombreux défis à relever pour développer des systèmes ATR capables de traiter toute la variété possible, eScriptorium/kraken sont déjà utilisés avec des niveaux de précision très élevés pour le latin, le grec, l’arabe, l’hébreu, le syriaque et le chinois, pour n’en citer que quelques-unes. Les logiciels peuvent être utilisés directement pour la transcription, mais ils peuvent également être exploités pour d’autres types d’analyse à grande échelle, y compris des études sur la mise en page, l’identification des textes, la paléographie et bien d’autres choses encore. Dans cet atelier, nous verrons comment eScriptorium et kraken fonctionnent, les possibilités et les limites lorsqu’ils sont appliqués à différents types de documents et de scripts, ainsi que les défis liés à la production et à la publication véritablement ouverte et FAIR de logiciels, de données et de modèles entraînés.

eScriptorium et kraken sont développées par une équipe de l’École Pratique des Hautes Études – Université PSL, laboratoire AOROC, avec des contributions importantes des partenaires tels que l’Inria et l’Université de Maryland, et avec le soutien de plusieurs institutions, dont les plus importants sont l’EPHE et AOROC, l’État français gérée par l’Agence Nationale de la Recherche (Biblissima+), la Fondation Mellon (OpenITI), et l’Union Européenne programme Horizon 2020 (MIDRASH et RESILIENCE).

[Prof. Stokes participera aussi à l’atelier « New Perspectives on Critical Editions » les 3-4 avril.]

Ce contenu a été mis à jour le 26 mars 2025 à 11 h 25 min.