L’outil DeepMind AI aide les historiens à restaurer des textes anciens

  • Français


  • Selon un nouvel article publié dans Nature.

    Une équipe d’informaticiens et d’experts en études classiques dirigée par DeepMind et l’Université Ca ‘Foscari de Venise a formé un réseau de neurones basé sur un transformateur pour restaurer les inscriptions écrites en grec ancien entre le 7ème siècle avant JC et le 5ème siècle après JC. Le modèle, nommé “Ithaque” d’après la maison du légendaire roi grec Ulysse, peut également estimer quand le texte a été écrit et d’où il pourrait provenir.

    En récupérant des fragments de texte sur des morceaux de poterie cassés ou des écritures floues, par exemple, les chercheurs peuvent commencer à les traduire et en apprendre davantage sur les civilisations anciennes. Thea Sommerschield, co-auteur de l’article et épigraphe du grec ancien et du romain, a déclaré Le registre que les inscriptions sont des registres vitaux, tout, des calendriers sacrés aux lois en passant par les baux, peut être préservé.

    Pourquoi le grec ancien ? Les chercheurs ont déclaré que le contenu variable et le contexte disponible dans les archives épigraphiques grecques en faisaient un “excellent défi” pour le traitement du langage, ainsi que le grand nombre de textes écrits (numérisés) actuellement disponibles – essentiels pour la formation du modèle.

    “Ces documents sont l’un des plus importants ensembles de preuves de l’histoire, de la langue, de la religion, de la politique et de la mentalité du monde antique”, a-t-elle déclaré. Sommerschield espère qu’Ithaca ouvrira la voie aux chercheurs pour étudier l’histoire avec de nouvelles techniques d’IA.

    “Tout comme les microscopes et les télescopes ont élargi la gamme de ce que les scientifiques peuvent faire – fournissant aux historiens des outils supplémentaires pour faciliter leurs découvertes et améliorer notre compréhension collective de l’histoire et de la culture. Nous espérons que ce travail établira une nouvelle norme pour le domaine de l’épigraphie numérique , en utilisant des architectures avancées d’apprentissage en profondeur pour soutenir le travail des historiens anciens », nous a-t-elle dit.

    Tout d’abord, le texte doit être transcrit en scannant une image d’un ancien objet ou script. Le texte est ensuite introduit dans Ithaque pour analyse. Il fonctionne en prédisant les caractères perdus ou flous pour restaurer les mots en tant que sorties. Le logiciel génère et classe une liste de ses meilleures prédictions ; les épigraphistes peuvent ensuite les parcourir et juger si les suppositions du modèle semblent exactes ou non.

    Les meilleurs résultats sont obtenus lorsque l’homme et la machine travaillent ensemble. Lorsque les experts travaillaient seuls, ils étaient précis à 25 % pour reconstituer des artefacts anciens, mais lorsqu’ils collaboraient avec Ithaca, le niveau de précision grimpait à 72 %. La performance d’Ithaca à elle seule est d’environ 62 %, à titre de comparaison. C’est également 71% pour localiser l’endroit où le texte a été écrit et peut dater les œuvres dans les 30 ans suivant leur création entre 800 avant JC et 800 après JC.

    Ithaca a été formé sur plus de 63 000 inscriptions grecques contenant plus de trois millions de mots de l’ensemble de données publiques Searchable Greek Inscriptions du Packard Humanities Institute. L’équipe a masqué des parties du texte et a chargé le modèle de remplir les blancs. Ithaca analyse d’autres mots dans une phrase donnée pour le contexte lors de la génération de caractères.

    Par exemple, lors de la restauration du mot grec ancien pour “alliance”, il a examiné les mots “Athéniens” et “Thessaliens”, décrivant des personnes de deux peuples anciens qui se sont regroupées pour repousser les Spartiates. Il est probable que ces trois mots sont apparus ensemble dans la même phrase dans les inscriptions précédentes non corrompues que le modèle a vues dans sa phase d’entraînement.

    « Ithaca est formé pour restaurer jusqu’à la moitié du texte manquant. Dans nos expériences, et dans le cas de la restauration en particulier, nous rapportons des résultats avec jusqu’à 10 caractères manquants », nous a dit Sommerschield.

    « Ithaque a été utilisée pour re-dater des textes clés de l’Athènes classique, contribuant ainsi aux débats d’actualité dans l’histoire ancienne. Nous espérons que de nombreuses autres découvertes de ce type suivront et que les historiens incluront Ithaque dans leur flux de travail. -les historiens du parti ont été très positifs et enthousiastes.”

    Les chercheurs de DeepMind ajustent maintenant leur modèle pour s’adapter à d’autres types d’anciens systèmes d’écriture, comme l’akkadien développé en Mésopotamie, le démotique de l’Égypte ancienne, le maya originaire d’Amérique centrale et l’hébreu ancien. “Nous espérons que des modèles comme Ithaca pourront libérer le potentiel de coopération entre l’IA et les sciences humaines, impactant de manière transformationnelle la façon dont nous étudions et écrivons sur certaines des périodes les plus importantes de l’histoire humaine”, a-t-il déclaré.

    Vous pouvez voir une démo d’Ithaca ici et trouver le code d’Ithaca ici. ®

    L'équipe de Comparaland

    L'équipe rédactionnnelle du site

    Pour contacter personnellement le taulier :

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *