Nell’ambito dei metodi di classificazione e regressione ad albero si mostrerà come l’algoritmo STP (Cappelli et al, 2001) costituisca un utile strumento di overfitting avoidance. Il problema dell’ overfitting si sostanzia nella presenza di “false” suddivisioni che riflettono peculiarità dei dati piuttosto che relazioni realmente esistenti tra la variabile di risposta ed i predittori. I metodi classici utilizzati per far fronte a tale problema essendo basati sulla valutazione dell’overfitting in termini di errore appaiono non del tutto appropriati all’uopo. Per contro, la procedura STP, essendo impostata sulla valutazione della relazione di dipendenza tra la variabile di risposta e le variabili di split, è in grado di valutare la presenza di sovradattamento e conservare le sole suddivisoni realmente esplicative.
The STP Algorithm as Overfitting Avoidance Tool in Tree Based Methodologies / Cappelli, Carmela; F., Mola. - STAMPA. - (2004), pp. 3-13.
The STP Algorithm as Overfitting Avoidance Tool in Tree Based Methodologies
CAPPELLI, CARMELA;
2004
Abstract
Nell’ambito dei metodi di classificazione e regressione ad albero si mostrerà come l’algoritmo STP (Cappelli et al, 2001) costituisca un utile strumento di overfitting avoidance. Il problema dell’ overfitting si sostanzia nella presenza di “false” suddivisioni che riflettono peculiarità dei dati piuttosto che relazioni realmente esistenti tra la variabile di risposta ed i predittori. I metodi classici utilizzati per far fronte a tale problema essendo basati sulla valutazione dell’overfitting in termini di errore appaiono non del tutto appropriati all’uopo. Per contro, la procedura STP, essendo impostata sulla valutazione della relazione di dipendenza tra la variabile di risposta e le variabili di split, è in grado di valutare la presenza di sovradattamento e conservare le sole suddivisoni realmente esplicative.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.