L’intelligenza generativa
19 Marzo 2024
Io vi dico: bisogna avere ancora un caos dentro di sè per generare una stella danzante
F. Nietzsche, Così parlò Zarathustra
L’intelligenza artificiale di cui si parla oggi è quella dell’apprendimento automatico, in particolare delle reti neurali.
Fino a pochi anni fa, queste erano usate soprattutto per classificare, ad esempio per identificare il soggetto di una fotografia, il sentiment di una frase, o l’affidabilità di un titolo di borsa. Ma oggi il loro grande impiego è quello della generazione automatica di testi, programmi, immagini, filmati.
La generazione automatica funziona così: si prendono tanti dati di tipo sequenziale, ad esempio testi, con questi si addestra una rete neurale che riesce a predire come potrebbe continuare una sequenza di quel tipo di dati. Questa rete è chiamata modello. Si usa poi il modello per generare sequenze simili a quelle presenti nei dati. Ad esempio, ad un modello linguistico si può chiedere di generare la continuazione di una certa frase (prompt).
Ma un prompt può essere grande e articolato. I modelli linguistici, dopo essere stati costruiti sui testi senza alcun controllo (apprendimento non supervisionato), possono essere istruiti in modo controllato (apprendimento supervisionato) per trattare in modo specifico certi tipi di prompt.
Ecco allora che lo stesso modello linguistico di base (foundation model) si può prestare per gli scopi più vari. Non c’è limite ai giochi linguistici per i quali si può istruire un sistema generativo. Oltre ai compiti creativi (scrivi una poesia su …) si possono affidare al sistema compiti analitici (di cosa parla questa poesia?) che somigliano a certi impieghi delle reti neurali tradizionali, ma si rivelano estremamente più potenti.
Questa è la potenza che noi oggi vogliamo usare per sviluppare soluzioni di nuova concezione. Ma è una potenza che va costruita e controllata.