ITHACA/L’intelligenza artificiale che decifra i testi antichi

Ithaca: è questo il nome del primo modello di intelligenza artificiale, frutto della collaborazione tra DeepMind di Google, l’Università Cà Foscari di Venezia, l’Università di Oxford e l’Università di Atene per decifrare testi provenienti dall’antica Grecia. Ithaca promette, attraverso l’uso di reti neurali addestrate sul più grande database digitale di iscrizioni greche, di ricostruire le parti mancanti nei testi antichi, riuscire a datarli e identificare il luogo di origine. Tutto ciò con una precisione del 62%, se utilizzata da sola, e fino al 72%, se impiegata come strumento di supporto per gli storici. L’intelligenza artificiale è già al lavoro: come riporta uno studio pubblicato sulla rivista Nature, è stata usata per aiutare a risolvere un dibattito in corso sulle date di una serie di antichi decreti ateniesi.

Per studiare gli aspetti linguistici, culturali e sociali delle civiltà passate, la storia antica si basa su diverse discipline, tra cui l’epigrafia, ossia lo studio delle iscrizioni su materiali come pietra, ceramica o metallo. Migliaia di iscrizioni, infatti, sono sopravvissute fino ai nostri giorni, ma molte sono state danneggiate nel corso dei secoli al punto da diventare illeggibili, trasportate lontano dalla loro collocazione originaria. Inoltre, l’impossibilità di usare le tecniche di datazione al radiocarbonio, rende difficile risalire a quando esse sono state scritte, con una perdita notevole di informazioni preziose. Per questo gli storici specializzati in epigrafia devono ricostruire tutto ciò che manca all’iscrizione con un processo noto come restauro del testo. Queste attività però sono complesse e necessitano di personale altamente specializzato, con un grande dispiego di tempo e risorse.

Per questi motivi i ricercatori di DeepMind, coordinati da Yannis Assael, hanno collaborato con i ricercatori dell’Università di Oxford per sviluppare Pythia, un sistema di restauro di testi antichi basato sull’intelligenza artificiale. I ricercatori hanno prima di tutto convertito il database del Packard Humanities Institute, la più grande raccolta digitale di iscrizioni greche antiche, in un testo che potesse essere utilizzato dalla macchina. Poi hanno addestrato Pythia a decifrare i testi, che corrispondevano a più di tre milioni di parole di iscrizioni risalenti dal 600 a.C al 400 d.C. Confrontando la performance dell’intelligenza artificiale con quella di studenti laureati a Oxford in epigrafia, Pythia ha dato risultati sorprendenti, riuscendo a completare quasi tremila iscrizioni con un tasso di errore pari al 30% (contro il 57,3% degli studenti) in pochi secondi.

Il progetto iniziato da Pythia adesso è stato ampliato da Ithaca che, oltre alla capacità di restauro del testo, è in grado di predire anche la collocazione geografica delle iscrizioni incomplete e attribuirne una datazione in un periodo compreso tra l’800 a.C. e l’800 d.C.. Proprio come l’algoritmo che l’ha preceduta, Ithaca promette una grande precisione: i test condotti dai ricercatori hanno rivelato che, se utilizzata da sola, essa è in grado di ottenere una precisione del 62% nel ripristino del testo danneggiato, rispetto al 25% di precisione riportata dagli storici in carne ed ossa. Ma è nella collaborazione tra esseri umani e macchine che l’intelligenza artificiale darebbe il meglio di sé: secondo i risultati dello studio, utilizzare Ithaca insieme agli strumenti tradizionali degli storici aumenterebbe la precisione complessiva di restauro del testo fino al 72%, mentre si riuscirebbe ad attribuire alle iscrizioni una collocazione geografica con un’accuratezza del 71% e postdatarle con uno scarto inferiore ai 30 anni rispetto a quanto proposto dagli storici.

Ithaca ha già dato prova della sua utilità, offrendo un contributo fondamentale alla datazione di una serie di decreti ateniesi che erano al centro di un dibattito tra storici. La maggior parte degli esperti epigrafi, infatti, aveva fissato, in base alla forma di alcune lettere, le date di queste iscrizioni a non oltre il 446 a.C. Eppure questa datazione sembrava in conflitto con quanto documentato da alcuni resoconti di Tucidide. Alla fine gli storici hanno concluso, grazie alla scoperta di nuove prove, che i decreti risalissero al 420 a.C. Nel frattempo, Ithaca aveva già datato le iscrizioni al 421 a.C., in pieno accordo con gli storici. Per consentire l’avanzamento della ricerca in questo ambito, i ricercatori hanno anche reso open source il modello e il codice di programmazione. Il passo successivo, adesso, è sviluppare versioni aggiuntive di Itacha in grado di ripristinare il testo in altre lingue antiche, tra cui accadico, demotico, ebraico e maya.