ITHACA: L’INTELLIGENZA ARTIFICIALE APPLICATA AI TESTI GRECI ANTICHI.

20 Febbraio 2023 WEIJI

I principali testi di greco antico su cui si basano gli studiosi sono spesso danneggiati irreparabilmente, poiché hanno migliaia di anni. A venire incontro agli storici in questo arduo compito potrebbe esserci un nuovo potente strumento chiamato Ithaca, un modello di apprendimento automatico creato da DeepMind – un’azienda inglese di intelligenza artificiale – che fa ipotesi sorprendentemente accurate sulle parole mancanti e sulla posizione e la data del testo. Si tratta di un’applicazione insolita dell’intelligenza artificiale, ma che dimostra quanto possa essere utile al di fuori del mondo tecnologico.

Gli esperti che lavorano in diverse discipline incontrano spesso problemi causati da testi antichi danneggiati. Il documento di partenza potrebbe essere fatto di pietra, argilla o papiro e sarà servito per gli usi più diversi: dal registro delle transazioni di un droghiere al diario di viaggio di un eroe, ma i danni accumulati nel corso di migliaia di anni sono comuni a tutti.

Le parti del testo mancanti per via del fatto che il testo stesso in quel punto è consumato o strappato sono chiamate lacune; a volte sono brevi come una lettera mancante, altre volte corrispondono a lunghi capitoli o addirittura a un’intera storia. Colmare queste lacune potrebbe essere banale o impossibile, ma da qualche parte si deve pur iniziare – ed è qui che entra in gioco Ithaca.

A partire da una vasta biblioteca di antichi testi greci, Ithaca (dal nome dell’isola natale di Ulisse) non solo può riconoscere quale sia probabilmente una parola o una frase mancante, ma può addirittura arrivare a stimare quanti anni ha e dove è stata scritta. Certamente non aspettatevi che lo strumento possa compilare da solo un intero ciclo epico: esso infatti è pensato per essere da ausilio per coloro che lavorano con questi testi, non una soluzione.

Un articolo pubblicato sulla rivista Nature ne dimostra l’efficacia, prendendo come esempio alcuni decreti dell’Atene Periclea. Inizialmente si era ipotizzato che fossero stati scritti intorno al 445 a.C.; mentre Ithaca, sulla base della sua analisi testuale, ha indicato che i testi risalivano effettivamente al 420 a.C. circa, in linea con prove più recenti. Potrebbe sembrare poca cosa, ma immaginate se la Carta dei diritti fosse stata effettivamente scritta 20 anni dopo!

Gli esperti dello studio sono riusciti a correggere il 25% del testo al primo passaggio; non esattamente un successone, anche se ovviamente il restauro di un testo non può essere un progetto a breve, bensì a lungo termine. Grazie al supporto di Itaca, tuttavia, essi sono riusciti a raggiungere un’accuratezza del 72%. Questo si verifica spesso in altre situazioni in cui gli esseri umani alla fine sono più precisi ma possono comunque velocizzare il loro processo eliminando rapidamente vicoli ciechi o grazie ad alcuni suggerimenti. Anche nei dati medici può essere facile controllare un’anomalia che l’intelligenza artificiale potrebbe segnalare rapidamente, ma alla fine è l’esperienza umana che percepisce i dettagli e trova la risposta giusta.

E’ possibile provare una versione ridotta di Ithaca qui, se si ha a portata di mano un testo greco antico lacunoso e danneggiato, oppure si possono utilizzare gli esempi forniti per vedere come colma le lacune richieste. Per pezzi più lunghi o con più di 10 lettere mancanti, provalo in questo taccuino Colab. Il codice è disponibile in questa pagina GitHub.

Oltre al greco antico, il team di Ithaca è già al lavoro anche su altre lingue. L’Accadico, il Demotico, l’Ebraico e il Maya sono tutte nella lista e, si spera, se ne aggiungeranno altre nel tempo.

“Ithaca illustra il potenziale contributo dell’elaborazione del linguaggio naturale e dell’apprendimento automatico nelle discipline umanistiche”, ha affermato Ion Androutsopoulos, professore all’Università di Atene che ha lavorato al progetto. “Per mostrare ulteriormente questo enorme potenziale abbiamo bisogno di più progetti come Ithaca, ma anche di corsi e di materiale didattico adeguati per educare i futuri ricercatori che avranno una migliore comprensione congiunta sia delle discipline umanistiche che dei metodi di intelligenza artificiale”.

, ,
Contact

Facciamo una call veloce?

Se vuoi approfondire un tema, parlarci della tua idea o semplicemente
capirci qualcosa di più puoi prenotare una call gratuita e senza impegno

Contact