strumenti

Metodi e software del processo statistico

UnivOutl

I contenuti relativi a univOutl sono riportati nelle seguenti sezioni:

Il package univOutl è un software open source per l’ambiente R che mette a disposizione le principali tecniche per l’individuazione di valori anomali (outlier) nei dati relativi a una singola variabile quantitativa (outlier univariati) oppure nel caso in cui la stessa variabile quantitativa venga osservata sulle medesime unità in occasioni diverse, come accade, ad esempio, nelle indagini panel.

I metodi per l’individuazione degli outlier univariati resi disponibili in univOutl si basano essenzialmente su due approcci:

  • l’assunzione di un modello gaussiano per la distribuzione dei dati;
  • un approccio non parametrico fondato sull’uso del boxplot.

Nel caso dell’assunzione di una distribuzione gaussiana, il package univOutl offre diverse soluzioni per la stima robusta dei parametri della distribuzione (media e deviazione standard), al fine di ridurre l’influenza dei valori estremi.

L’approccio non parametrico risulta invece più flessibile, poiché non richiede l’adozione di un modello specifico, ma soltanto la valutazione del grado di simmetria della distribuzione dei dati. Nel caso di distribuzioni simmetriche, gli outlier vengono individuati tramite il boxplot tradizionale. Nel caso di distribuzioni asimmetriche, situazione particolarmente frequente per variabili osservate sulle imprese, sulle aziende agricole o per variabili economiche riferite alle famiglie, vengono impiegati metodi basati sul boxplot, opportunamente modificati per tenere conto dell’asimmetria.

Infine, il package include strumenti specifici per l’individuazione di outlier nel caso di variabili continue osservate sulle stesse unità in due diverse occasioni temporali. Si tratta di metodi basati sulla costruzione di rapporti (ratios), tra cui il metodo di Hidiroglou-Berthelot (1986) e una sua estensione di tipo non parametrico, che introduce un ulteriore grado di flessibilità.

Va inoltre segnalato che, nel contesto delle indagini campionarie, alcune funzioni del package univOutl consentono di incorporare nelle analisi i pesi di indagine.

 

Principali riferimenti bibliografici

Hidiroglou, M.A. and Berthelot, J.-M. (1986) “Statistical editing and Imputation for Periodic Business Surveys”. Survey Methodology, Vol 12, pp. 73-83.

McGill, R., Tukey, J. W. and Larsen, W. A. (1978) “Variations of box plots”. The American Statistician, 32, pp. 12-16.

Rousseeuw, P.J. and Croux, C. (1993) “Alternatives to the Median Absolute Deviation”, Journal of the American Statistical Association, 88, pp. 1273-1283.

Hubert, M., and Vandervieren, E. (2008) “An Adjusted Boxplot for Skewed Distributions”, Computational Statistics & Data Analysis, 52, pp. 5186-5201

Status: validato

Autore: Istat

Licenza: GPL-2 | GPL-3

Codifica GSBPM: GSBPM: 5.4 Edit and impute

Linguaggio di programmazione: R

Parole chiave: stima robusta; boxplot; metodo di Hidiroglou-Berthelot

Contatto: nome: Marcello D’Orazio – email: madorazi@istat.it

REQUISITI TECNICI

Il package univOutl funziona su versioni di R a partire 3.6.0 su qualsiasi sistema operativo (Windows, Mac o Linux) . Richiede che vengano installati e quindi caricati i seguenti package aggiuntivi R: robustbase e Hmisc.

 

COPYRIGHT

Copyright 2026 Marcello D’Orazio

Concesso in licenza a norma della GNU General Public License (GPL) versione 2 o successive. Non è possibile utilizzare l’opera salvo nel rispetto della Licenza. È possibile ottenere una copia della Licenza al seguente indirizzo: http://www.gnu.org/licenses/. Salvo diversamente indicato dalla legge applicabile o concordato per iscritto, il software distribuito secondo i termini della Licenza è distribuito “TAL QUALE”, SENZA GARANZIE O CONDIZIONI DI ALCUN TIPO, esplicite o implicite.

 

DISCLAIMER

L’Istat non si assume la responsabilità per risultati derivanti da un uso dello strumento non coerente con le indicazioni metodologiche contenute nella documentazione disponibile.

 

DOWNLOAD

Data di rilascio: 21/02/2026

univOutl Versione 0.5.0 – Package precompilato: Sistemi Windows

univOutl Versione 0.5.0 – Sorgenti del package: Sistemi Windows e Unix-like

 

INSTALLAZIONE

Il package scaricato può essere installato da R come segue:

> install.packages(path_to_file, repos = NULL)

dove il character path_to_file identifica il percorso verso il file .zip o .tar.gz scaricato.

 

DOCUMENTAZIONE TECNICA E METODOLOGICA

Reference manual – univOutl v. 0.5.0

https://cran.r-project.org/web/packages/univOutl/univOutl.pdf

Hidiroglou, M.A. and Berthelot, J.-M. (1986) “Statistical editing and Imputation for Periodic Business Surveys”. Survey Methodology, Vol 12, pp. 73-83.

McGill, R., Tukey, J. W. and Larsen, W. A. (1978) “Variations of box plots”. The American Statistician, 32, pp. 12-16.

Rousseeuw, P.J. and Croux, C. (1993) “Alternatives to the Median Absolute Deviation”, Journal of the American Statistical Association, 88, pp. 1273-1283.

Hubert, M., and Vandervieren, E. (2008) “An Adjusted Boxplot for Skewed Distributions”, Computational Statistics & Data Analysis, 52, pp. 5186-5201

 

ALTRA DOCUMENTAZIONE

https://github.com/marcellodo/univOutl

 

Ti è stata utile questa pagina?

    Gli aggiornamenti di Istat ogni settimana