Aller au contenu principal

L’IA de DeepMind comble les zones manquantes des textes historiques endommagés ou incomplets

L’outil Ithaca peut reconstituer des textes altérés, identifier leur emplacement d’origine et également estimer leur date de création

— Genja / Shutterstock.com

Afin de faciliter la recherche sur l’histoire de l’écriture humaine, la filiale de Google a mis sa technologie au service de la restauration d’anciens textes incomplets, avec un impressionnant degré de précision.

Une technologie précieuse

Au cours des cinq dernières années, l’intelligence artificielle de DeepMind a réalisé des progrès remarquables, démontrant son potentiel pratique et sa capacité à résoudre certains problèmes scientifiques complexes, tels que le repliement des protéines, améliorer la précision des prévisions météorologiques, ou même maîtriser différents jeux sans en connaître préalablement les règles.

En se penchant sur l’Histoire, DeepMind vise maintenant à apporter une nouvelle lisibilité à d’anciennes inscriptions ayant été abîmées, déplacées ou ne pouvant être datées avec précision. Pour ce faire, les chercheurs de DeepMind ont fait équipe avec des historiens et des scientifiques en Italie, en Angleterre et en Grèce, et ont entraîné leur IA sur le plus grand ensemble de données numériques relatives aux écritures grecques, en utilisant à la fois des caractères individuels et des mots complets.

Présenté dans la revue Nature, l’outil qui en résulte, que l’équipe a appelé Ithaca d’après l’île grecque Ithaque décrite dans L’Odyssée d’Homère, a pu reconstituer des textes altérés avec une précision de 62 %, identifier leur emplacement d’origine avec une précision de 71 % et estimer correctement leur date de création à 30 ans près.

Animation montrant les zones d’un texte ancien comblées par l’IA de DeepMind. Le document fait état d’un décret concernant l’Acropole d’Athènes et date de 485/4 avant J.-C. — © Marsyas, Epigraphic Museum / Yannis Assael et al. / Nature 2022

Ithaca étant conçu comme un outil de recherche, la version finale génère plusieurs hypothèses de prédiction de texte, parmi lesquelles les historiens peuvent ensuite choisir. Lorsqu’il s’agit d’identifier l’emplacement original d’un texte, au lieu d’une solution unique, il propose une carte avec une distribution de probabilité pour 84 régions antiques différentes, et fait de même pour les années probables lors de sa datation.

Des résultats impressionnants

Alors que des historiens avaient obtenu une précision de 25 % lors d’expériences impliquant la restauration de textes anciens, celle-ci est passée à 72 % lorsqu’ils ont utilisé Ithaca. Les chercheurs espèrent que cette technologie permettra d’exploiter le potentiel des systèmes d’IA supervisés par des experts humains, ce qui contribuera à améliorer notre compréhension des civilisations passées.

Le groupe DeepMind travaille actuellement sur des versions formées à d’autres langues anciennes, telles que l’hébreu, le démotique et le maya. L’entreprise a rendu le code d’Ithaca open source et en a lancé une version interactive gratuite en ligne.

Partager cet article

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *