Skip to main content

La ricerca aumentata

19 Marzo 2024

Il mio lavoro è un gioco, un gioco molto serio

M.C. Escher

I sistemi generativi, primo fra tutti ChatGPT, sono stati inizialmente accolti come un gioco molto serio rivolto per lo più al mercato consumer. Ma assieme al successo sono presto arrivate le critiche: quei generatori sono stati chiamati “pappagalli stocastici” e sorpresi molto spesso in preda ad allucinazioni.

Quelle critiche erano (e restano) fondate: benché sia difficile crederlo, i sistemi generativi non hanno alcuna idea di quello che scrivono: sono solo molto bravi a imitare ciò che hanno appreso, badando alla somiglianza ma non alla verità. Ma allora come si possono ottenere comportamenti intelligenti da questi sistemi?

Il fatto è che nei grandi modelli neurali (Large Language Model), conoscenza linguistica (grammatica, sintassi, lessico) e conoscenza fattuale (nozioni storiche, scientifiche, ecc) sono fuse insieme. Ma mentre la prima è relativamente stabile e condivisa, la seconda è in continuo divenire e oggetto di controversie. Il falso ha le stesse proprietà linguistiche del vero: il “Manifesto della razza” (1938) è scritto nella stessa lingua della Costituzione (1948).

L’idea di separare le due capacità dei LLM viene già nel 2020 ad un gruppo di ricercatori. Si tratta del concetto di Retrieval Augmented Generation (RAG). Un RAG non risponde direttamente sulla base del Language Model, ma cerca in un database opportunamente costruito i documenti che possono contenere informazione rilevante per la risposta. Con quelli più promettenti, il RAG genera una base informativa pertinente alla domanda. Il Language Model, opportunamente istruito, sfrutterà poi la sua conoscenza linguistica per confezionare, su quella base, una risposta verificabile.

Il vantaggio di questa architettura è duplice: da una parte è possibile curare il database documentale con informazione verificata, dall’altra l’utente può risalire alla sorgente delle risposte e valutarle secondo il proprio punto di vista.

Oggi i principali vendor di tecnologia offrono funzionalità RAG basate sui propri Language Model e le proprie infrastrutture. Ma per adottare questo approccio in modo efficace c’è bisogno di flessibilità e competenza. Infatti, le strategie per estrarre dai documenti le informazioni chiave e per rappresentarle in modo appropriato dipendono dai contenuti dei documenti e dagli scopi dell’applicazione. Inoltre, molte organizzazioni hanno l’esigenza di gestire l’infrastruttura in proprio. Qui è dove Isagog entra in gioco.

La ricerca aumentata