L’aumento esponenziale della produzione scientifica rende sempre più complessa l’individuazione rapida dei contributi rilevanti nella letteratura. In questo contesto, i metodi di sintesi automatica dei testi offrono soluzioni promettenti, permettendo la generazione di riassunti informativi da documenti lunghi e strutturati. Questo studio introduce l’Integrated Text Summarization (ITS), un nuovo approccio estrattivo non supervisionato progettato specificamente per i testi scientifici. L’algoritmo combina l’analisi strutturale del documento con l’integrazione di parole chiave fornite dagli autori e/o estratte automaticamente dal testo, al fine di selezionare le frasi più rilevanti in ciascuna sezione. L’ITS è stato valutato su un campione multidisciplinare di articoli, confrontando i risultati con frasi indicate dai loro autori. Le prestazioni sono state inoltre messe a confronto con due metodi di riferimento: l’algoritmo TextRank e il modello GPT-4o. I risultati mostrano che l’ITS raggiunge una maggiore accuratezza e stabilità nella selezione dei contenuti rilevanti, anche in contesti disciplinari diversi. L’approccio si configura quindi come una soluzione trasparente, interpretabile ed efficace per la sintesi automatica della conoscenza scientifica.
Sintetizzare la conoscenza: un approccio integrato per l’estrazione di contenuti rilevanti nella letteratura scientifica / Aria, Massimo; Cuccurullo, Corrado; D'Aniello, Luca; Misuraca, Michelangelo; Spano, Maria. - 1:(2026), pp. 57-75.
Sintetizzare la conoscenza: un approccio integrato per l’estrazione di contenuti rilevanti nella letteratura scientifica
Massimo Aria;Luca D'Aniello
;Maria Spano
2026
Abstract
L’aumento esponenziale della produzione scientifica rende sempre più complessa l’individuazione rapida dei contributi rilevanti nella letteratura. In questo contesto, i metodi di sintesi automatica dei testi offrono soluzioni promettenti, permettendo la generazione di riassunti informativi da documenti lunghi e strutturati. Questo studio introduce l’Integrated Text Summarization (ITS), un nuovo approccio estrattivo non supervisionato progettato specificamente per i testi scientifici. L’algoritmo combina l’analisi strutturale del documento con l’integrazione di parole chiave fornite dagli autori e/o estratte automaticamente dal testo, al fine di selezionare le frasi più rilevanti in ciascuna sezione. L’ITS è stato valutato su un campione multidisciplinare di articoli, confrontando i risultati con frasi indicate dai loro autori. Le prestazioni sono state inoltre messe a confronto con due metodi di riferimento: l’algoritmo TextRank e il modello GPT-4o. I risultati mostrano che l’ITS raggiunge una maggiore accuratezza e stabilità nella selezione dei contenuti rilevanti, anche in contesti disciplinari diversi. L’approccio si configura quindi come una soluzione trasparente, interpretabile ed efficace per la sintesi automatica della conoscenza scientifica.| File | Dimensione | Formato | |
|---|---|---|---|
|
SPECIALISSUE_analysing_business_data_iss_1_def.pdf
accesso aperto
Tipologia:
Versione Editoriale (PDF)
Licenza:
Creative commons
Dimensione
2.89 MB
Formato
Adobe PDF
|
2.89 MB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.


