Strumenti

Estimation of Variance by Efficient Replication

Download del software

A. Requisiti software

Il package EVER richiede l'installazione di R versione 2.5.1 o superiore.

B. Download

Per poter effettuare il download occorre compilare un brevissimo questionario identificativo. L'unico scopo della notifica è tenere traccia delle persone interessate ad EVER in modo da poterle informare dei nuovi sviluppi del progetto.


Installazione e caricamento del package

  • Istruzioni per sistemi Windows
  1. Salvare il file EVER_(versione).zip in una directory arbitraria
  2. Lanciare una sessione interattiva R e selezionare, dal menu "Pacchetti", l'opzione "Installa pacchetti da file zip locali…"
  3. R richiederà di indicare la directory in cui risiede il file EVER_(versione).zip e di selezionare il file
  4. Caricare il package EVER digitando l'istruzione library(EVER) oppure require(EVER).
    In alternativa è possibile selezionare, dal menu "Pacchetti", l'opzione "Carica pacchetto…" e scegliere EVER dal menu a tendina
    • Istruzioni per sistemi Unix-like
      1. Salvare il file EVER_(versione).tar.gz in una directory arbitraria
      2. Posizionarsi nella directory che contiene il file EVER_(versione).tar.gz
        e digitare dal prompt di shell l'istruzione:
        R CMD INSTALL EVER_(versione).tar.gz
      3. Lanciare una sessione R e caricare il package EVER digitando l'istruzione library(EVER) oppure require(EVER)

    Per ulteriori informazioni è possibile consultare il capitolo 6 "Add-on packges" del manuale "R Installation and Administration".

    Informazioni generali sul software

    Che cos'è EVER

    EVER è un package R sviluppato e manutenuto, nell'ambito della struttura che in Istat si occupa dei software generalizzati, da Diego Zardetto (zardetto@istat.it) il quale considera benvenuta qualsiasi comunicazione (segnalazioni di errori o malfunzionamenti, consigli, critiche) relativa al software ed agli aspetti metodologici che esso sottende e cercherà di tenerne conto nelle future release del software.

    Nell'attuale versione 1.2 il package EVER è disponibile corredato di manuale utente ed help on-line in lingua inglese. La versione corrente e le versioni precedenti del package possono essere scaricate anche dall'archivio CRAN (http://cran.r-project.org/web/packages/EVER/index.html).
    Il package EVER è interamente sviluppato in codice R interpretato: non contiene, cioè, codice compilato C o Fortran.
    EVER può essere utilizzato sia in ambiente Windows che in ambienti UNIX-like.

    Che cosa fa EVER

    EVER è un software dedicato al calcolo delle stime e degli errori di campionamento in indagini complesse.
    Nella versione attuale EVER rende disponibili le seguenti funzionalità principali:

    • Replicazione del campione
    • Calibrazione dei dati replicati
    • Calcolo delle stime, degli errori standard e degli intervalli di confidenza di:
      • Totali
      • Medie
      • Distribuzione di frequenza assoluta e relativa
      • Tabelle di contingenza
      • Rapporti tra totali
      • Quantili
      • Coefficienti di regressione
    • Calcolo delle stime, degli errori standard e degli intervalli di confidenza di stimatori definiti dall'utente (arbitrari, anche
      privi di una rappresentazione analitica).
    • Stime ed errori in sottopopolazioni

    Stima della varianza campionaria in EVER

    La tecnica di stima della varianza campionaria implementata nel
    package EVER si basa sul metodo DAGJK (Delete-A-Group Jackknife) esteso proposto da Kott.
    Il metodo DAGJK può essere visto come una variante computazionalmente efficiente del tradizionale metodo jackknife stratificato. La necessità di costruire una replica dei pesi originali per ogni PSU inclusa nel campione rende, di fatto, irrealistico il ricorso al metodo jackknife tradizionale per indagini "complesse e grandi" (decine di migliaia di PSU in strati numerosi e di dimensione molto variabile). L'utilizzabilità pratica del metodo DAGJK poggia, al contrario, sulla capacità del metodo di costruire - per una vasta gamma di stimatori e di disegni di campionamento - stime degli errori standard (quasi) non distorte anche con un piccolo numero (qualche decina) di repliche.
    In aggiunta alla sua peculiare efficienza computazionale, il metodo DAGJK gode dei principali vantaggi comuni ai più diffusi metodi di replicazione del campione.
    L'idea base di tutti i metodi di replicazione del campione consiste nello stimare la varianza campionaria di uno stimatore arbitrario mediante una adeguata misura della variabilità delle sue stime su repliche opportunamente costruite di un campione originario. Si tratta, dunque, di metodi intrinsecamente versatili, in grado, cioè, di fornire stime della varianza campionaria senza fare ricorso ad ipotesi restrittive sulla distribuzione dei dati della popolazione e/o sulla forma funzionale degli stimatori. Poiché tutto quello di cui necessitano è (i) la definizione della tecnica di replicazione e (ii) la definizione del metodo di calcolo dello stimatore su un campione, i metodi di replicazione si prestano, fra l'altro, a stimare la varianza di stimatori privi di una rappresentazione analitica (non esprimibili, cioè, come funzioni di valori direttamente osservabili sulle unità statistiche).
    EVER è concepito per sfruttare appieno la versatilità del metodo di replicazione DAGJK: oltre a coprire gli stimatori di uso più comune nelle indagini campionarie su vasta scala, il package fornisce, infatti, all'utente uno strumento amichevole per calcolare stime, errori standard ed intervalli di confidenza di stimatori arbitrari, definiti dall'utente medesimo. Questa funzionalità rende il package EVER particolarmente attraente in tutti i casi in cui il metodo di linearizzazione di Taylor per la stima della varianza campionaria sia applicabile solo al prezzo di forti approssimazioni (il problema della stima della povertà relativa è un possibile esempio).

    Documentazione

    1. Generalità sul calcolo delle stime e degli errori di campionamento
      • Wilkinson, G.N., Rogers, C.E. - (1973)
        "Symbolic Description of Factorial Models for Analysis of Variance"
        Journal of the Royal Statistical Society, series C (Applied Statistics),
        Vol. 22, pp. 181-191.
      • Särndal, C.E., Swensson, B., Wretman, J. - (1992)
        "Model Assisted Survey Sampling"
        Springer Verlag.
      • Deville, J.C., Särndal, C.E. - (1992)
        "Calibration Estimators in Survey Sampling"
        Journal of the American Statistical Association,
        Vol. 87, No. 418, pp. 376-382.
      • Estevao, V., Hidiroglou, M. A., Särndal, C. E - (1995)
        "Methodological principles for a generalized estimation system at Statistics Canada"
        Journal of Official Statistics, 11, n.2, pp. 181-204.
      • Singh, A.C., Mohl, C.A. - (1996)
        "Understanding calibration estimators in survey sampling"
        Survey Methodology, 22, pp. 107-115.
      • Vanderhoeft, C. - (2001)
        "Generalized Calibration at Statistic Belgium"
        Statistics Belgium Working Paper n. 3
        http://www.statbel.fgov.be/studies/
        paper03_en.asp.
      • Fuller, W.A. - (2002)
        "Regression estimation for survey samples"
        Survey Methodology, 28, pp. 5-23.
      • Lumley, T. - (2006)
        "survey: analysis of complex survey samples"
        R package version 3.6-5.
        http://cran.at.r-project.org/web/packages/survey/index.html
      • Scannapieco, M., Zardetto, D., Barcaroli, G. - (2007)
        "La Calibrazione dei Dati con R: una Sperimentazione sull'Indagine Forze di Lavoro ed un Confronto con GENESEES/SAS"
        Contributi Istat n. 4
    2. Stima della varianza campionaria
      • Woodruff, R. S. - (1971)
        "A Simple Method for Approximating the Variance of a Complicated Estimate"
        Journal of the American Statistical Association,
        Vol. 66, n. 334, pp. 411-414.
      • Kalton, G. - (1979)
        "Ultimate cluster sampling"
        Journal of the Royal Statistical Society,
        series A (General), Vol. 142, Part 2, pp. 210-222.
      • Krewski, D., Rao, J. N. K. - (1981)
        "Inference From Stratified Samples: Properties of the Linearization, Jackknife and Balanced Repeated Replication Methods"
        The Annals of Statistics, Vol. 9, No. 5, pp. 1010-1019.
      • Binder, D. A. - (1983)
        "On the variances of asymptotically normal estimators from complex surveys"
        International Statistical Review, 51, pp. 279-292.
      • Rust, K. - (1985)
        "Variance Estimation for Complex Estimators in Sample Surveys"
        Journal of Official Statistics, 1, pp. 381-397.
      • Bellhouse, DR. - (1985)
        "Computing Methods for Variance Estimation in Complex Surveys"
        Journal of Official Statistics, Vol.1, No.3, pp. 323-329.
      • Dorfman, A., Valliant, R. - (1993)
        "Quantile variance estimators in complex surveys"
        Proceedings of the ASA Survey Research Methods Section, pp. 866-871.
      • Rao, J. N. K., Lohr, S. L. - (1999)
        "Some Current Trends in Sample Survey Theory and Methods"
        Sankhya: The Indian Journal of Statistics, Special issue on Sample Surverys,
        Volume 61, Series B, Pt. 1, pp. 1-57.
      • Duchesne, P. - (2000)
        "A Note on Jackknife Variance Estimation for the General Regression Estimator"
        Journal of Official Statistics, Vol.16, No.2, pp. 133-138.
      • Valliant, R. - (2000)
        "Variance estimation for the general regression estimator"
        Survey Methodology, 28, pp. 103-114.
      • Rao, J. N. K., Lohr, S. L. - (2004)
        "Sample Survey Methods: Recent Developments and Applications"
        two-day workshop slides, Joint Statistical Meetings, Toronto.
    • Metodo Delete-A-Group jackknife
    • Kott, Phillip S. - (1998)
      "Using the Delete-A-Group Jackknife Variance Estimator in NASS Surveys"
      RD Research Report No. RD-98-01, USDA, NASS: Washington, DC.
    • Kott, Phillip S. - (1999)
      "The Extended Delete-A-Group Jackknife"
      Bulletin of the International Statistical Instititute. 52nd Session.
      Contributed Papers. Book 2, pp. 167-168.
    • Kott, Phillip S. - (2001)
      "The Delete-A-Group Jackknife"
      Journal of Official Statistics, Vol.17, No.4, pp. 521-526.
    • Kott, Phillip S. - (2008)
      "Building a Better Delete-a-Group Jackknife for a Calibration Estimator" NASS Research Report, NASS: Washington, DC.

      per informazioni:

      Software generalizzato
      per la produzione statistica

      Diego Zardetto
      email zardetto@istat.it