Il caso

Il traduttore automatico di Google parla anche genovese (ma è ancora un principiante)

Google Translate ha implementato alcune lingue locali grazie all'intelligenza artificiale, ma il risultato divide gli attivisti: ecco come funziona il nuovo sistema

Generico luglio 2024

Genova. Da qualche giorno Google parla anche in genovese. Il motore di ricerca più popolare al mondo ha aggiunto al proprio traduttore automatico 110 nuove lingue locali, tra cui anche i cosiddetti dialetti italiani, grazie a un modello basato sull’intelligenza artificiale. E così, andando sulla pagina principale di Google Translate, nel menù a tendina adesso si trovano anche friulano, ligure, lombardo, veneto e siciliano accanto a italiano, inglese, francese, tedesco, spagnolo e centinaia di altri idiomi. Una vera e propria rivoluzione per la salvaguardia dei patrimoni linguistici di tutto il mondo, anche se i risultati per ora lasciano un po’ a desiderare.

Intanto una premessa necessaria: ligure è il nome con cui i linguisti e lo standard internazionale Iso chiamano l’insieme di varietà romanze (cioè derivate direttamente dal latino) parlate storicamente nell’attuale Liguria e nelle zone limitrofe, nel Principato di Monaco e sulle isole tabarchine in Sardegna. All’interno di questo gruppo il genovese è la varietà di maggiore prestigio, potendo vantare una produzione letteraria ininterrotta a partire dal XIII secolo e un certo uso in ambito politico accanto al latino e all’italiano. La parlata di Genova, fulcro di uno Stato indipendente per quasi 800 anni, ha fortemente influenzato quelle vicine e ha svolto per secoli la funzione di koinè. Non stupisce, dunque, che Google l’abbia scelta per rappresentare il ligure nel suo insieme. Che in effetti è suddiviso in più dialetti, come succede del resto in tutte le lingue nazionali e locali (comprese quelle riconosciute ufficialmente, come il sardo e il friulano).

La prima a raccogliere la sfida della traduzione automatica nelle lingue locali era stata Meta, la big company americana che controlla Facebook, Instagram e WhatsApp. Nel 2019 l’azienda fondata da Mark Zuckerberg ha lanciato il progetto No Language Left Behind (nessuna lingua resti indietro) con l’obiettivo di “proporre traduzioni di qualità e sottoposte a valutazione fra 200 lingue”, compreso il ligure. Non a caso in squadra c’è Jean Maillard, genovese di nascita, ricercatore in linguistica computazionale con un dottorato di ricerca a Cambridge. Nel 2023 è stato lanciato Mms (Massively Multilingual Speech), un modello linguistico di intelligenza artificiale open source in grado di riconoscere circa 4mila lingue. Pochi mesi dopo è stato presentato SeamlessM4T, sistema di traduzione testuale e vocale premiato dal Time tra le migliori invenzioni dell’anno, e anche questo supporta il genovese.

Tutti questi sistemi si fondano sul machine learning: i traduttori automatici vengono “istruiti” con enormi quantità di testi scritti e registrazioni audio in modo che riescano a riconoscere da soli i pattern per passare da una lingua all’altra. Quello applicato da Google è molto simile, ma utilizza la tecnica zero shot: il modello impara a svolgere un compito per cui non era mai stato addestrato prima. L’azienda di Mountain View ha recuperato così lo svantaggio rispetto alla concorrenza, attingendo probabilmente ai materiali open source disponibili online anche per il genovese.

Certo, la qualità della traduzione per ora è piuttosto scarsa. Non molto diversa, in fin dei conti, da quella che offriva il servizio ai suoi esordi, ormai quasi vent’anni fa. Se proviamo a inserire una semplice frase come “Oggi a Genova fa molto caldo” il risultato è “Oggi à Genova o l’é ben ben cado“. Passi che Google non conosca ancheu, ma che ignori addirittura Zena sembra paradossale. Il motivo, probabilmente, è da ricercare nel lemmario usato per allenare il sistema, ancora troppo scarso e troppo generico per fornire un esito soddisfacente. Si notano evidenti problemi di morfologia e sintassi, complice il fatto che Translate usa sempre l’inglese come lingua di passaggio. La conversione dal ligure alle altre lingue invece sembra più stabile, così come la rilevazione automatica (se scriviamo una frase in genovese, il sistema se ne accorge da solo). La grafia impiegata è quella tradizionale del genovese, fissata nelle sue norme generali a partire dal Seicento, e pare identica a quella messa a punto dal gruppo di lavoro coordinato dal compianto professor Fiorenzo Toso, già usata da anni per diverse pubblicazioni.

Ma come è stata accolta la novità a Genova? Le principali associazioni impegnate nella salvaguardia della lingua locale sono divise. “L’introduzione di nuove lingue nel traduttore di Google potrebbe, secondo alcuni, rappresentare il viatico per la salvezza di dialetti ed idiomi locali che rischiano di scomparire – scrive Franco Bampi, presidente di A Compagna, sul suo profilo Facebook -. Ciò è vero se dalle traduzioni si può dedurre la pronuncia o se la pronuncia viene riprodotta con un vocale, come succede per l’italiano, l’inglese, eccetera. Purtroppo, da esperto di genovese devo rilevare che per il ligure non è così: la grafia usata e certe scelte di deliranti etimologie non permettono di ottenere un ligure che sia quello parlato davvero. Ad esempio, se scrivo arrivâ come si può sapere che la r, diversamente dall’italiano, è detta semplice e non doppia? Attenzione quindi: se non si potrà dedurre la corretta pronuncia ci troveremo di fronte a una nuova lingua del tutto diversa da quella parlata per secoli qui in Liguria: il traduttore può diventare il mezzo per uccidere le nostre parlate“.

Tutt’altra lettura quella del Conseggio pe-o patrimònio linguistico ligure, associazione nata nel 2019, di cui lo stesso Maillard è tra i membri fondatori. “Questo rappresenta un passo significativo per la valorizzazione della nostra lingua e della nostra cultura – si legge sul sito ufficiale -. Questa aggiunta è solo l’ultima novità in fatto di tecnologie linguistiche per la nostra lingua e segue le importanti ricerche dei membri della nostra associazione, compreso l’urtimo articolo scientifico pubblicato qualche mese fa. Siamo contenti di constatare che i nostri sforzi costanti hanno contribuito a creare una base solida sulla quale è stato possibile sviluppare queste tecnologie. Ricordiamo che i traduttori automatici, come tutte le tecnologie linguistiche, devono essere usati con attenzione e che è necessario far revisionare tutti i risultati a dei linguisti esperti. Benché la qualità delle traduzioni automatiche di Google per certe tipologie testuali sia abbastanza buona, per altre (per esempio per i testi nel registro colloquiale o per i toponimi) la strada da fare è ancora lunga. Restiamo tuttavia convinti che queste tecnologie continueranno a migliorare e che diventeranno, sempre di più, uno strumento fondamentale per la promozione della nostra lingua“.

Sul web c’è già chi ha fatto ironia sulle lacune del nuovo traduttore portando un esempio clamoroso: belin – considerata una parola simbolo della genovesità – viene reso curiosamente come campana, forse perché il sistema lo associa all’inglese bell. Insomma, per ora il sistema non convince i genovesi, che sono scettici per natura. Ma la tecnologia fa passi da gigante ed è probabile che il meccanismo possa essere affinato nel giro di qualche anno. Nel frattempo altri esperti stanno lavorando a un traduttore automatico ad hoc per il genovese. E non è escluso che nei prossimi tempi possa arrivare qualche novità.

Più informazioni

Per favore, disabilita AdBlock per continuare a leggere.

Genova24 è un quotidiano online gratuito che non riceve finanziamenti pubblici: l’unica fonte di sostegno del nostro lavoro è rappresentata dalle inserzioni pubblicitarie, che ci permettono di esistere e di coprire i costi di gestione e del personale.
Per visualizzare i nostri contenuti, scritti e prodotti da giornalisti a tempo pieno, non chiediamo e non chiederemo mai un pagamento: in cambio, però, vi preghiamo di accettare la presenza dei banner, per consentire a Genova24 di restare un giornale gratuito.