L’aumento esponenziale della produzione scientifica rende sempre più complessa l’individuazione rapida dei contributi rilevanti nella letteratura. In questo contesto, i metodi di sintesi automatica dei testi offrono soluzioni promettenti, permettendo la generazione di riassunti informativi da documenti lunghi e strutturati. Questo studio introduce l’Integrated Text Summarization (ITS), un nuovo approccio estrattivo non supervisionato progettato specificamente per i testi scientifici. L’algoritmo combina l’analisi strutturale del documento con l’integrazione di parole chiave fornite dagli autori e/o estratte automaticamente dal testo, al fine di selezionare le frasi più rilevanti in ciascuna sezione. L’ITS è stato valutato su un campione multidisciplinare di articoli, confrontando i risultati con frasi indicate dai loro autori. Le prestazioni sono state inoltre messe a confronto con due metodi di riferimento: l’algoritmo TextRank e il modello GPT-4o. I risultati mostrano che l’ITS raggiunge una maggiore accuratezza e stabilità nella selezione dei contenuti rilevanti, anche in contesti disciplinari diversi. L’approccio si configura quindi come una soluzione trasparente, interpretabile ed efficace per la sintesi automatica della conoscenza scientifica.

Sintetizzare la conoscenza: un approccio integrato per l’estrazione di contenuti rilevanti nella letteratura scientifica / Aria, Massimo; Cuccurullo, Corrado; D'Aniello, Luca; Misuraca, Michelangelo; Spano, Maria. - 1:(2026), pp. 57-75.

Sintetizzare la conoscenza: un approccio integrato per l’estrazione di contenuti rilevanti nella letteratura scientifica

Massimo Aria;Luca D'Aniello
;
Maria Spano
2026

Abstract

L’aumento esponenziale della produzione scientifica rende sempre più complessa l’individuazione rapida dei contributi rilevanti nella letteratura. In questo contesto, i metodi di sintesi automatica dei testi offrono soluzioni promettenti, permettendo la generazione di riassunti informativi da documenti lunghi e strutturati. Questo studio introduce l’Integrated Text Summarization (ITS), un nuovo approccio estrattivo non supervisionato progettato specificamente per i testi scientifici. L’algoritmo combina l’analisi strutturale del documento con l’integrazione di parole chiave fornite dagli autori e/o estratte automaticamente dal testo, al fine di selezionare le frasi più rilevanti in ciascuna sezione. L’ITS è stato valutato su un campione multidisciplinare di articoli, confrontando i risultati con frasi indicate dai loro autori. Le prestazioni sono state inoltre messe a confronto con due metodi di riferimento: l’algoritmo TextRank e il modello GPT-4o. I risultati mostrano che l’ITS raggiunge una maggiore accuratezza e stabilità nella selezione dei contenuti rilevanti, anche in contesti disciplinari diversi. L’approccio si configura quindi come una soluzione trasparente, interpretabile ed efficace per la sintesi automatica della conoscenza scientifica.
2026
9788893262811
Sintetizzare la conoscenza: un approccio integrato per l’estrazione di contenuti rilevanti nella letteratura scientifica / Aria, Massimo; Cuccurullo, Corrado; D'Aniello, Luca; Misuraca, Michelangelo; Spano, Maria. - 1:(2026), pp. 57-75.
File in questo prodotto:
File Dimensione Formato  
SPECIALISSUE_analysing_business_data_iss_1_def.pdf

accesso aperto

Tipologia: Versione Editoriale (PDF)
Licenza: Creative commons
Dimensione 2.89 MB
Formato Adobe PDF
2.89 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11588/1041997
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact