Come i grandi modelli linguistici stanno trasformando la ricerca, l’industria e l’interazione sociale - Bnews Come i grandi modelli linguistici stanno trasformando la ricerca, l’industria e l’interazione sociale

Come i grandi modelli linguistici stanno trasformando la ricerca, l’industria e l’interazione sociale

Come i grandi modelli linguistici stanno trasformando la ricerca, l’industria e l’interazione sociale
LettereSfondoAzzurro

Alla Torre dell’Acqua di viale Sarca a Milano, il 6 giugno si discute con ricercatori, imprese e pubblica amministrazione delle potenzialità dei grandi modelli linguistici nella nostra realtà nazionale e, in particolare, di come stanno trasformando la ricerca scientifica, l'industria e l'interazione sociale.

L’evento Large Language Models nel panorama italiano: scienza, industria e società, a cui è possibile partecipare sia in presenza sia in streaming, è aperto alla cittadinanza ed è organizzato in collaborazione con l’Associazione Italiana di Linguistica Computazionale (AILC).

Incontriamo Elisabetta Fersini, docente di Informatica dell’Università di Milano-Bicocca e membro del consiglio direttivo di AILC.

Quali obiettivi vi prefiggete con questo evento di natura divulgativa?

Intendiamo offrire un'occasione di dibattito sulle urgenti sfide scientifiche, etiche e culturali che accompagnano la rivoluzione indotta dall’impatto dei Large Language Models (LLM) nella nostra società, in particolare in Italia.

Una riflessione merita sicuramente il profilo linguistico. I LLM vengono utilizzati ovunque per una serie di scopi, come la creazione di testi e la loro elaborazione, ma sono strumenti che sono stati addestrati prevalentemente per la lingua inglese: si discuterà sulle peculiarità della loro creazione per la lingua italiana e faremo il punto con la comunità scientifica sullo stato dei risultati della ricerca in Italia.

In secondo luogo, il nostro Paese è soggetto alla normativa europea, in particolare all’AI ACT e al GDPR. Le nostre aziende dovranno garantire uno standard di protezione dei dati personali e sensibili molto alto. Dobbiamo prendere coscienza delle conseguenze dell’applicazione della normativa vigente per capire insieme al mondo imprenditoriale in quale direzione indirizzare la ricerca e l’attività produttiva.

Infine attribuiamo una grande importanza alle trasformazioni indotte dall’innovazione tecnologica sul sistema produttivo italiano, costituito anche da grandi aziende ma principalmente caratterizzato da un tessuto di medie e piccole imprese. Come creare valore e mettere a frutto le potenzialità dei grandi modelli linguistici anche per le micro realtà imprenditoriali e artigiane? Ne discuteremo insieme.

Con quale velocità migliorano i LLM? Quali sono le condizioni necessarie per il loro sviluppo?

Si sta già correndo, la ricerca in questo campo è intensa e si muove verso modelli sempre più multimodali, basati non solo sull’elaborazione testuale ma anche, per esempio, di immagini e video.

Per lo sviluppo dei LLM servono ingenti risorse computazionali, come macchine di calcolo, ed enormi quantità di dati di alta qualità, ovvero caratterizzati da un basso, il più basso possibile, contenuto di bias, strumentalizzazioni, contenuti stereotipati, distorti, falsi o discriminatori. Io mi occupo anche di studiare e analizzare la “tossicità” dei contenuti, del riconoscimento della loro artificiosità e della loro attendibilità. Come costruire strumenti correttivi e guardrail è uno dei compiti della ricerca.

Anche la quantità dei dati a disposizione resta importante per il nostro lavoro e, in generale, per l’addestramento dei LLM: in certi ambiti, nonostante i dati disponibili siano anche di grande quantità, il problema resta la scarsità in termini qualitativi.

Come cambierà il nostro modo di lavorare?

L’impatto dei LLM sarà, per esempio, consistente sugli strumenti che le aziende e la pubblica amministrazione possono mettere a disposizione di clienti, utenti e cittadini in generale nell’assistenza e nella ricerca di informazioni.

Nei processi lavorativi esiste anche la possibilità di abbreviare una serie di operazioni pratiche, spesso numerose e ripetitive, che assorbono troppo tempo alle persone ma che non richiedono un sostanziale apporto critico. Il tempo risparmiato potrebbe essere prezioso e utilmente dedicato ad attività più discrezionali dove il fattore umano risulta sempre imprescindibile.

Quali sono gli aspetti più critici?

Questi modelli possono davvero risultare sorprendenti nell’interazione con l’uomo, tuttavia l’alto livello di approfondimento comporta, per ora inevitabilmente, il rischio di imperfezioni come bias e stereotipi che rispecchiano in parte anche quelli dell’essere umano. È necessario sviluppare e diffondere responsabilità e consapevolezza sull’utilizzo etico degli strumenti generativi che non sono perfetti; i modelli imparano e continueranno a imparare ma quando non trovano la risposta esatta possono dare origine alla cosiddetta allucinazione, ovvero una risposta non corretta.

Non possiamo limitarci a delegare, anche se certamente col tempo il fattore umano giocherà un ruolo sempre più di verifica e certificazione. Qual è oggi la soglia di rischio accettabile per l’essere umano mettendo sulla bilancia accuratezza e bias del linguaggio generato? Questa è la domanda su cui la comunità scientifica, la società civile e la politica devono confrontarsi per stabilire come definire, anche in Italia, il miglior bilanciamento possibile tra accuratezza dei risultati, controllo e assenza o massima riduzione delle criticità.