In questo contributo viene presentato un avanzamento dei lavori relativi al progetto di annotazione semiautomatica di corpora non standard (Dovetto, Panunzi & Gregori 2017), con particolare riferimento alla applicazione al Corpus di parlato patologico prodotto da soggetti schizofrenici (corpus CIPPS, cfr. Dovetto & Gemelli 20132). Il progetto è funzionale all’analisi del lessico sia dal punto di vista delle classi di parole, sia per quanto riguarda la presenza e incidenza di altri specifici fenomeni del parlato che, nella dimensione non normofasica, possono presentarsi con maggiore incidenza (ad es. marcatori discorsivi, disfluenze in genere). Un aspetto di particolare problematicità è rappresentato inoltre dalla trascrizione del parlato dialettale alternato allo standard. L’obiettivo del progetto resta la realizzazione di uno strumento efficace per l’etichettatura multilivello, concepito per il corpus CIPPS ma adattabile ad altre tipologie di corpora non–standard, e in grado di automatizzare il più possibile le funzioni di annotazione.

Ancora sull'annotazione di corpora 'speciali' / Panunzi, Alessandro; Gregori, Lorenzo; Dovetto, Francesca M.; Trillocco, Simona; Sorrentino, Assunta. - 8:(2023), pp. 377-407.

Ancora sull'annotazione di corpora 'speciali'

Francesca M. Dovetto
;
Simona Trillocco;Assunta Sorrentino
2023

Abstract

In questo contributo viene presentato un avanzamento dei lavori relativi al progetto di annotazione semiautomatica di corpora non standard (Dovetto, Panunzi & Gregori 2017), con particolare riferimento alla applicazione al Corpus di parlato patologico prodotto da soggetti schizofrenici (corpus CIPPS, cfr. Dovetto & Gemelli 20132). Il progetto è funzionale all’analisi del lessico sia dal punto di vista delle classi di parole, sia per quanto riguarda la presenza e incidenza di altri specifici fenomeni del parlato che, nella dimensione non normofasica, possono presentarsi con maggiore incidenza (ad es. marcatori discorsivi, disfluenze in genere). Un aspetto di particolare problematicità è rappresentato inoltre dalla trascrizione del parlato dialettale alternato allo standard. L’obiettivo del progetto resta la realizzazione di uno strumento efficace per l’etichettatura multilivello, concepito per il corpus CIPPS ma adattabile ad altre tipologie di corpora non–standard, e in grado di automatizzare il più possibile le funzioni di annotazione.
2023
979-12-218-1165-0
Ancora sull'annotazione di corpora 'speciali' / Panunzi, Alessandro; Gregori, Lorenzo; Dovetto, Francesca M.; Trillocco, Simona; Sorrentino, Assunta. - 8:(2023), pp. 377-407.
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11588/963428
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact