Immaginate di essere nel cortile di una scuola a Bamako. È pomeriggio e vedete in un angolo un gruppo di alunni che con il loro maestro leggono delle fiabe. Sono testi scritti in bambara, e raccontano storie legate alla cultura locale. Tulonkɛw, Ji poyi yɔrɔ, Jate: i bambini possono scegliere tra più di un centinaio di titoli. Il bambara è una delle lingue più parlate in Mali. Eppure una scena del genere era impensabile solo un anno fa.

Per 63 anni, dal 1960 al 2023, la lingua ufficiale del paese è stata il francese, imposto dall’ex potenza coloniale. Poi a giugno dell’anno scorso, mentre le tensioni con Parigi crescevano, la giunta militare al potere lo ha sostituito con tredici lingue autoctone. Improvvisamente nelle classi serviva materiale didattico. Che fare?

Il governo di Bamako aveva già provato a portare il bambara negli istituti pubblici, e ogni volta era stato un fallimento: le risorse non bastavano, gli insegnanti erano impreparati e le famiglie non si erano dimostrate entusiaste all’idea che i loro figli studiassero in una lingua diversa dal francese. Rispetto al passato, però, qualcosa stava cambiando. Ora c’era una maggiore consapevolezza del valore delle lingue nazionali (basta leggere l’appello che lo scrittore keniano Ngũgĩ wa Thiong’o e il senegalese Boubacar Boris Diop hanno rivolto al presidente Bassirou Diomaye Faye, in cui si chiede per esempio di abrogare l’articolo della costituzione del Senegal che prevede la conoscenza del francese tra i requisiti per candidarsi alle presidenziali). E soprattutto c’era l’intelligenza artificiale (ia), che faceva passi da gigante. Nel 2023 il ministero dell’istruzione ha avviato una collaborazione con una startup, RobotsMali, che usa modelli linguistici di grandi dimensioni (llm, software che imitano le conversazioni umane) per elaborare testi in bambara e in altre lingue parlate dai maliani. In pochi mesi, spiega il sito Rest of world, il programma ha realizzato circa 150 libri illustrati, che poi sono stati distribuiti tra gli insegnanti volontari, come quello della scuola di Bamako. Secondo uno dei fondatori dell’azienda, Michael Leventhal, questi libri sono passati per le mani di almeno trecento alunni delle primarie.

RobotsMali è stata lanciata nel 2017 da Leventhal, uno statunitense che ha lavorato nella Silicon valley e da anni insegna informatica a Bamako, e da un maliano impegnato nel mondo dell’istruzione, Seydou Katikon. Il suo scopo principale è avvicinare i più giovani alle materie scientifiche, in particolare alla robotica, usando hardware a prezzi economici. Sul sito del progetto – sostenuto, oltre che dal ministero dell’istruzione, da molte realtà diverse, da Google all’Association des femmes ingénieurs du Mali, dall’Unesco e dalla Banca mondiale alla Fondazione Bill & Melinda Gates – si legge che finora sono stati formati più di novemila studenti. Il gruppo ha anche contribuito a creare il primo set di dati per l’apprendimento automatico dal francese al bambara, nel 2020.

Per realizzare libri per bambine e bambini, è importante che le storie riflettano la vita e la cultura del paese d’origine. Perciò, invece di tradurre in bambara testi stranieri, magari francesi, diventati dei classici (per esempio Il piccolo principe di Antoine de Saint-Exupéry), il team di RobotsMali parte da zero. Prima chiede a ChatGpt di generare testi dandogli indicazioni come “raccontami marachelle che fanno i bambini” (tipo: non finire di mangiare quello che c’è sul piatto, bisticciare con le sorelle o rispondere male a qualcuno). Esclude le proposte meno convincenti e poi si serve di Google Translate, che ha incluso il bambara nel 2022, per ottenere una prima traduzione. Alcune persone, tra cui i funzionari del dipartimento dell’istruzione non formale e delle lingue nazionali (parte del ministero dell’istruzione), correggono gli errori, mentre altre pensano a illustrare le storie con Playground, un software per creare immagini. Infine, sempre con ChatGpt, si costruiscono gli esercizi per verificare la comprensione della lettura.

Forse tra questi passaggi uno dei più delicati è la selezione delle immagini elaborate dagli algoritmi, che tendono a rappresentare gli africani in modo stereotipato. “Anche se l’ia generativa è molto brava a riprodurre le caratteristiche fisiche, i corpi degli africani sono decisamente idealizzati, l’abbigliamento non è quello reale, spesso è inappropriato, e gli ambienti riflettono abitudini occidentali che non c’entrano nulla con quelle locali”, ha detto Leventhal. “Se non forniamo alla macchina input precisi, quello che otteniamo sono uomini raffigurati a torso nudo, con muscoli sporgenti, e donne in abiti succinti, con il seno prosperoso, anche quando la storia parla, per esempio, di una famiglia. Per cui dobbiamo aggiungere parecchie richieste con il ‘non’ davanti, per evitare che il software ci proponga solo immagini con quelle caratteristiche. Quindi ‘non sexy’ o ‘no corpi nudi’”.

Un altro aspetto critico, in generale, è che le grandi piattaforme basate sull’intelligenza artificiale sfruttano i contenuti che trovano su internet per imparare. Per addestrare un llm ci vuole un terabyte di dati, che equivale a circa un milione di frasi. Di conseguenza più una lingua è presente online, più la scelta ricadrà su quella.

W3Techs, uno strumento che tiene traccia delle lingue che ricorrono più spesso su internet, rileva che il 50,8 per cento dei siti web è in inglese; al secondo posto c’è lo spagnolo, ma con parecchio distacco (si ferma al 5,7 per cento). Il norvegese, che conta in tutto quattro milioni di parlanti, è molto più presente dello swahili, usato da 200 milioni di africani. Le lingue africane (che sono circa duemila, un terzo di quelle impiegate nel mondo) compaiono in neanche lo 0,1 per cento del web.

Passando ai sistemi che usano l’ia, si ripete la sproporzione. Il Ghana, un paese che contiene più di ottanta lingue, ne ritrova solo due su Google Translate: twi e ewe (una situazione piuttosto sorprendente se si considera che ad Accra c’è la sede del primo centro di ricerca sull’intelligenza artificiale di Google in Africa). Intervistato dal Washington Post, Asmelash Teka Hadgu, a capo di una startup che sfrutta i modelli di apprendimento automatico per tradurre dall’inglese alle lingue etiopi e viceversa, dice che se si fanno a ChatGpt domande anche molto banali nelle due lingue più diffuse in Etiopia, l’amarico e il tigrino, si ottiene un’accozzaglia di frasi senza senso. Mentre “se fosse usata bene”, ha detto, “l’intelligenza artificiale ha un potenziale enorme per assicurare un accesso più democratico all’istruzione”.

Molti la pensano come Hadgu, e stanno cercando di ottenere qualcosa di simile a quello che fanno lui e il gruppo di RobotsMali. La rivista Prospect segnala che in Ghana c’è Khaya, un’applicazione basata su un software open-source che permette il riconoscimento vocale automatico di twi, ga e dagbani, e di altre lingue africane come lo yoruba, il kikuyu e il luo (i volontari che gestiscono l’app sottolineano che può essere essenziale negli ospedali, dove i medici si trovano continuamente a comunicare con pazienti che parlano lingue diverse dalle loro, o nei tribunali, dove i traduttori scarseggiano). Masakhane, anche questo un progetto open-source, cerca di traghettare le lingue africane su internet. Fuori dal continente, in Brasile, l’Ibm sta finanziando un progetto per preservare e ampliare l’uso delle lingue indigene. In Nuova Zelanda con il chatbot Reobot si può imparare il maori.

Issiaka Ballo, che insegna linguistica all’Università delle lettere e delle scienze umane di Bamako (Ulshb) e ha collaborato con il team di Leventhal e Katikon per portare il bambara su Google Translate, traducendolo anche in braille, ricorda che in Mali tra il 40 e il 60 per cento degli studenti abbandona la scuola nei primi sei anni (circa il 70 per cento della popolazione non sa leggere e scrivere). È convinto che la percentuale si ridurrebbe notevolmente se queste persone studiassero nella loro lingua madre.

Questo testo è tratto dalla newsletter Doposcuola.

Internazionale pubblica ogni settimana una pagina di lettere. Ci piacerebbe sapere cosa pensi di questo articolo. Scrivici a: posta@internazionale.it