Des experts israéliens utilisent l'intelligence artificielle pour traduire le cunéiforme ancien

Photo : Adventist UA

Ukrainian Union Conference

Des experts israéliens utilisent l'intelligence artificielle pour traduire le cunéiforme ancien

Selon les scientifiques, il s'agit d'une nouvelle étape importante vers la préservation et la diffusion du patrimoine culturel de l'ancienne Mésopotamie.

Des chercheurs de l'université de Tel Aviv et de l'université d'Ariel, en Israël, ont mis au point un modèle d'intelligence artificielle capable de traduire automatiquement en anglais un texte cunéiforme akkadien. Selon les scientifiques, il s'agit d'une nouvelle étape importante vers la préservation et la diffusion du patrimoine culturel de l'ancienne Mésopotamie.

Les spécialistes de l'assyriologie, qui se consacrent à l'étude archéologique, historique, culturelle et linguistique de l'Assyrie et du reste de l'ancienne Mésopotamie, ont passé de nombreuses années à essayer de comprendre les textes akkadiens écrits en cunéiforme, l'une des plus anciennes formes d'écriture connues. Le cunéiforme se traduit par « en forme de coin » car, dans l'Antiquité, on écrivait dans cette langue à l'aide d'un stylet en roseau, en traçant des marques en forme de coin sur une tablette d'argile.

Des chercheurs de Tel Aviv et d'Ariel ont mis au point un modèle d'intelligence artificielle qui permettra d'économiser tous ces efforts. Ce modèle peut traduire automatiquement en anglais un texte akkadien écrit en cunéiforme.

C'est ce que rapporte le projet éducatif « Biblical Archaeology » en se référant au Jerusalem Post.

L'Assyrie, nommée d'après le dieu Ashshur (le plus élevé du panthéon des dieux assyriens), était située dans la plaine mésopotamienne. En 721 avant J.-C., l'armée assyrienne est venue du nord, a capturé le Royaume du Nord d'Israël et a emmené en captivité dix tribus d'Israël, qui ont ensuite été perdues dans l'histoire.

Les archéologues ont trouvé des centaines de milliers de tablettes d'argile dans l'ancienne Mésopotamie, écrites en cunéiforme et datant de 3400 avant J.-C. Cependant, il y a beaucoup plus de tablettes que celles qui peuvent être facilement traduites par le nombre limité d'experts qui peuvent les lire.

Shai Gordin de l'université d'Ariel, Gai Gutherz et d'autres de l'université de Tel Aviv, et leurs collègues ont publié leurs résultats dans la revue PNAS Nexus le 2 mai 2023, sous le titre « Translating Akkadian to English with neural machine translation » (Gai Gutherz, Shai Gordin, Luis Sáenz, Omer Levy, Jonathan Berant. PNAS Nexus, volume 2, numéro 5, mai 2023, pgad096).

Lors du développement du nouveau modèle d'apprentissage automatique, les chercheurs ont préparé deux versions de traduction automatique à partir de l'akkadien : l'une traduit à partir d'inscriptions latinisées, et l'autre traduit à partir d'éléments cunéiformes Unicode directement en anglais.

La première version, qui utilise la translittération latine, a donné des résultats plus satisfaisants dans cette étude, obtenant un score de 37,47 dans le Best Bilingual Evaluation Understudy 4 (BLEU4), qui est un test du niveau de correspondance entre la traduction automatique et la traduction humaine d'un même texte.

Le programme est le plus efficace lorsqu'il traduit des phrases de 118 caractères ou moins. Dans certaines phrases, il a créé des « hallucinations », c'est-à-dire des résultats dont la syntaxe est correcte mais inexacts en anglais.

Le Dr Gordin a noté que dans la plupart des cas, la traduction pouvait être utilisée comme traitement primaire du texte. Les auteurs suggèrent que la traduction automatique peut être utilisée dans le cadre d'une collaboration homme-machine où les scientifiques humains corrigent et améliorent les résultats des modèles.

Des centaines de milliers de tablettes d'argile écrites en cunéiforme documentent l'histoire politique, sociale, économique et scientifique de l'ancienne Mésopotamie, selon les auteurs, « mais la plupart de ces documents restent non traduits et inaccessibles en raison de leur nombre et du nombre limité d'experts capables de les lire ».

Les scientifiques concluent que la traduction est une activité humaine fondamentale qui a une longue histoire scientifique depuis l'apparition de l'écriture. « Il peut s'agir d'un processus complexe, car il nécessite généralement non seulement des connaissances spécialisées dans deux langues différentes, mais aussi dans des environnements culturels différents. Les outils numériques d'aide à la traduction se multiplient chaque année, grâce aux progrès réalisés dans des domaines tels que la reconnaissance optique de caractères et la traduction automatique. Toutefois, les langues anciennes constituent toujours un défi de taille à cet égard. Pour les lire et les comprendre, il faut connaître une communauté linguistique disparue depuis longtemps, et les textes eux-mêmes peuvent être très fragmentaires. »

La version originale de cet article a été publiée en ukrainien sur le site de l'Union de fédérations ukrainienne.