Case Study
Da un archivio storico a una base di conoscenza attiva
Memoria Manifesta
Il Manifesto considera il suo archivio storico (patrimonio tutelato dai Beni Culturali) come un pilastro della sua strategia digitale.
Il progetto MeMa (Memoria Manifesta) nasce nel 2020 a cura di Salvatore Iaconesi e Oriana Persico. L’idea era quella di progettare una AI di comunità basata sui principi di apertura, trasparenza, collaborazione e non-estrazione, riuscendo così a stabilire relazioni produttive tra l’archivio, la redazione, le comunità di utenti e la società in generale.
Dopo la prematura scomparsa di Salvatore, Isagog ha preso in carico il progetto. Ma nel frattempo, lo scenario tecnologico era cambiato. Le idee del progetto originale sono state sviluppate sfruttando le nuove capacità dei modelli linguistici aperti e una base di conoscenza costruita su uno specifico modello concettuale (ontologia).
Un processo di caricamento è eseguito ogni mattina per caricare i nuovi contenuti nel Knowledge Graph (KG). Questo processo integra diverse fonti, analizza i testi per estrarre informazioni rilevanti utilizzando il servizio NLP e produce fonti RDF per alimentare il KG secondo l’ontologia MeMa.
Il KG è un database a grafo della famiglia RDF (Resource Description Framework) con capacità di inferenza, basato su:
Assieme al KG, lavora un servizio di processamento del linguaggio (NLP), che fornisce uno strato di astrazione su varie funzionalità di analisy per supportare le operazioni del sistema:
e altri compiti NLP basati su trasformatori open source.
Un altro servizio è responsabile della gestione delle interrogazioni e delle operazioni di aggiornamento sul KG. Questi integrano ricerche per similarità e query SPARQL per recuperare entità rilevanti. Il servizio sfrutta gli attributi indicizzati per ottimizzare le prestazioni delle query e accelerare le operazioni di recupero, e le funzionalità di NLP per trasformare le query degli utenti e valutare il ranking delle risposte.
Per la redazione del giornale, l’archivio storico è un’importante fonte di informazione. Ma per interrogarlo è spesso necessario l’intervento dell’archivista.
MeMa oggi offre alla redazione uno strumento di consultazione dell’archivio in linguaggio naturale, che facilita il compito di chi lavora e aumenta la qualità del prodotto.
La funzione di ricerca semantica verrà resa presto disponibile anche alla comunità delle lettrici e dei lettori.
Ma MeMa è già in uso per valutare similarità tra gli articoli della edizione giornaliera e quelli presenti in archivio. Si tratta dei Consigli di MeMa, che si possono vedere nella edizione online. Questo servizio offre una prospettiva storica sui fatti del giorno, rendendo più ricca l’esperienza di lettura
Le tecnologie della conoscenza e del linguaggio sono in continua evoluzione. La base di conoscenza di MeMa offre una grande opportunità per sperimentare metodologie e strumenti.
I risultati vengono condivisi con la comunità scientifica
Paper alla Italian Conference on Computational Linguistics, CLiC-it (2023)
A Venezia tra le radici e il futuro dell’Intelligenza artificiale (Il Manifesto, 12 Dicembre 2023)