CLiC-it 2024, Tenth Italian Conference on Computational Linguistics

CLiC-it 2024, Tenth Italian Conference on Computational Linguistics

Presentazione del Progetto LiITA dell'Università Cattolica del Sacro Cuore

04 Dic 2024 > 06 Dic 2024
CLiC-it 2024, Tenth Italian Conference on Computational Linguistics
Sarà presentato nel corso di CLiC-it 2024 – Tenth Italian Conference on Computational Linguistics, la 10a conferenza italiana sulla linguistica computazionale che si terrà a Pisa dal 4 al 6 dicembre 2024, il progetto LilTa (Linking italian), uno studio dell’Università Cattolica del Sacro Cuore di Milano, coordinato della dottoressa Eleonora Litta e in collaborazione con l’Università di Torino.

Paradigmatico di una svolta in atto nel campo della Linguistica, LilTa si concentra sulla creazione di una base di conoscenza (Knowledge Base, KB) interoperabile per le risorse linguistiche italiane (dai dizionari ai testi, antichi e moderni), seguendo i principi dei dati collegati (Linked Data) utilizzati nel Web Semantico.

Il cuore di LiITA è una grande raccolta di lemmi, ovvero forme canoniche di citazione delle parole (come i nomi delle entrate lessicali nei dizionari): a ciascun lemma saranno connesse sul web le sue occorrenze nei vari corpora testuali dell’italiano linkati alla Knowledge Base, così come le sue entrate nei vari lessici e dizionari. 

Il risultato sarà un grande grafo di conoscenza fatto di nodi (come, ad esempio, i lemmi e le loro occorrenze) e di relazioni tra essi
Professor Marco Passarotti, ordinario di Linguistica Computazionale presso la Facoltà di Scienze Linguistiche e Letterature Straniere della Cattolica

Con progetti di questo tipo, che fanno incontrare dati e tecnologia, si fa fronte a una svolta nella linguistica resa evidente e inevitabile dalla diffusione dell’Intelligenza Artificiale, che è fondata proprio su modelli del funzionamento del linguaggio naturale.

Stiamo assistendo alla prima rivoluzione industriale-tecnologica che tocca l’oggetto più umanistico di sempre, il linguaggio. La disciplina che lo studia non può ignorarla
Professor Marco Passarotti, ordinario di Linguistica Computazionale presso la Facoltà di Scienze Linguistiche e Letterature Straniere della Cattolica

Il nuovo approccio guarda alla didattica del futuro e ricorda che è questo il momento di innovare, anche per annullare il pericoloso trend di abbandono dello studio della linguistica. Lo dicono i dati: solo per i corsi di laurea in Mediazione linguistica Scienze linguistiche, Scienze linguistiche per le relazioni internazionali, la riduzione degli iscritti dall’ultimo anno accademico (2023-24) al precedente (2022-23) è stata mediamente del 9,4% negli atenei italiani che da Nord a Sud offrono quei corsi. Rduzioni simili si hanno anche per lingue e letterature moderne e altre discipline umanistiche. 

LiITA nasce sulle orme di LiLa (Linking Latin), un progetto analogo ma basato su risorse per la lingua latina. Coordinato dal professor Passarotti, grazie a un finanziamento di 2 milioni di euro da parte del Consiglio Europeo della Ricerca, LiLa ha sviluppato una raccolta di più di 200 mila lemmi e ha reso interoperabili decine di risorse linguistiche per il latino. La Knowledge Base di LiLa è tuttora in continua espansione. 

L’architettura di LiLa è indipendente dalla lingua e può essere adottata per qualsiasi idioma, tutto è fatto a triple: un soggetto un oggetto e una relazione. La bellezza di basi di conoscenza come LiLa o LiITA è che possono essere usate come fonte di dati, metadati e relazioni esplicite tra essi per raffinare modelli di intelligenza artificiale
Professor Marco Passarotti, ordinario di Linguistica Computazionale presso la Facoltà di Scienze Linguistiche e Letterature Straniere della Cattolica