English
regenesees

ReGenesees (R evolved Generalised software for sampling estimates and errors in surveys)

Descrizione

ReGenesees è un sistema software basato su R per l'analisi design-based e model-assisted di indagini campionarie complesse.

Il nome del sistema intende enfatizzare la continuità dell'offerta di strumenti Istat per la calibrazione ed il calcolo delle stime e degli errori (di qui il richiamo al suo predecessore SAS GENESEES), sottolineando – al contempo – l'evoluzione e l'arricchimento di tale offerta attraverso R.

Occorre, tuttavia, precisare come ReGenesees non sia il risultato di una semplice migrazione di GENESEES da SAS a R, bensì il frutto di un progetto nuovo e completamente indipendente. ReGenesees risponde, infatti, ad un radicale cambiamento di logica applicativa che, oltre a consentire un più agevole e sicuro utilizzo del software, garantisce un notevole ampliamento della scelta di stimatori rispetto ai quali calcolare le stime e gli errori campionari.

 

Principali Funzionalità Statistiche del Sistema

  • Disegni di campionamento complessi
    • Disegni a più stadi, stratificati, a cluster
    • Probabilità di inclusione variabili, con o senza reintroduzione
    • Disegni di campionamento “misti” (strati AR e NAR)
  • Calibrazione
    • Globale e/o per partizioni (per modelli fattorizzabili)
    • A livello di unità e/o di cluster
    • Modelli omo-schedastici e/o etero-schedastici
    • Funzioni distanza: lineare, raking e logit
    • Vincoli di range sui correttori
    • Calibrazione in più passi
    • Trimming coerente dei pesi calibrati
  • Stimatori di Base
    • Horvitz-Thompson
    • Calibration Estimators
  • Stima della varianza campionaria
    • Formulazione multistadio (algoritmo ricorsivo di Bellhouse)
    • Ultimate-Cluster approximation
    • GENESEES-like per disegni “misti”
    • Linearizzazione di Taylor per stimatori non lineari “smooth”
    • Tecnica di collassamento degli strati per la gestione delle lonely PSU
    • Metodo GVF (Generalized Variance Functions)
  • Stime ed errori campionari (errore standard, varianza, coefficiente di variazione, intervallo di confidenza, design effect) per:
    • Totali
    • Medie
    • Distribuzioni di frequenza assoluta o relativa (marginali, condizionate e congiunte)
    • Rapporti fra totali
    • Shares e rapporti fra shares
    • Coefficienti di regressione multipla
    • Quantili (stima della varianza con il metodo di Woodruff)
  • Stime ed errori campionari per Stimatori Complessi
  • Funzioni differenziabili arbitrarie di stimatori di Horvitz-Thompson o di Calibrazione
  • Definibili liberamente dall'utente
  • Linearizzazione di Taylor automatica
  • Covarianza e correlazione fra stimatori complessi
  • Stime ed errori campionari per sottopopolazioni (domini)

Architettura del Sistema

L'architettura del sistema si articola su due package R integrati:

  • package ReGenesees: implementa lo strato applicativo del sistema, cioè tutte le funzionalità statistiche che il sistema rende disponibili all'utente
  • package ReGenesees.GUI: implementa lo strato di presentazione del sistema, cioè un'interfaccia utente di tipo grafico basata su Tcl/Tk

Deve essere sottolineato che il package ReGenesees può essere utilizzato anche da solo, interagendo con R nel modo tradizionale, cioè da linea di comando. Questa opzione potrebbe rivelarsi necessaria in specifici contesti applicativi (le simulazioni sono un tipico esempio) o apparire comunque preferibile ad utenti esperti del sistema R.

Al contrario, il package ReGenesees.GUI richiede il package ReGenesees, e lo importa automaticamente all'atto del caricamento. La GUI è stata progettata e realizzata con l'intento di rendere quanto più possibile amichevole e semplice l'interazione con il sistema ReGenesees anche ad utenti che non siano esperti di R, né di teoria del campionamento da popolazioni finite.

Informazioni

Status: validato
Autore: Istat
Licenza: EUPL-1.1
Codifica GSBPM: 5.6 Calculate weights
5.7 Calculate aggregates
Linguaggio di programmazione: R
Versione linguistica della GUI: EN
Parole chiave: calibrazione, calcolo delle stime, stima della varianza, indagini complesse, stimatori complessi, linearizzazione automatica
Contatto: nome: Diego Zardetto
email: zardetto@istat.it

Reperimento software e documentazione

REQUISITI TECNICI

Il package ReGenesees richiede l’installazione di R versione 2.14.0 (o superiore).

Il package ReGenesees.GUI richiede l’installazione di R versione 2.14.0 (o superiore) e dei package ReGenesees, tcltk2, RODBC e svMisc.

COPYRIGHT

Copyright 2015 Istat

Concesso in licenza a norma dell’European Union Public Licence (EUPL), versione 1.1 o successive. Non è possibile utilizzare l’opera salvo nel rispetto della Licenza. È possibile ottenere una copia della Licenza al seguente indirizzo: http://ec.europa.eu/idabc/eupl.html. Salvo diversamente indicato dalla legge applicabile o concordato per iscritto, il software distribuito secondo i termini della Licenza è distribuito “TAL QUALE”, SENZA GARANZIE O CONDIZIONI DI ALCUN TIPO, esplicite o implicite. Si veda la Licenza per la lingua specifica che disciplina le autorizzazioni e le limitazioni secondo i termini della Licenza.

DISCLAIMER

L’Istat non si assume la responsabilità per risultati derivanti da un uso dello strumento non coerente con le indicazioni metodologiche contenute nella documentazione disponibile.

DOWNLOAD

Package ReGenesees (funzionalità statistiche del sistema)

Package ReGenesees.GUI (interfaccia grafica del sistema)

DOCUMENTAZIONE TECNICA E METODOLOGICA

Reference manual – ReGenesees v. 1.9

Reference manual – ReGeneseesGUI v. 1.9

ALTRA DOCUMENTAZIONE

Fallows A., Pope M., Digby-North J., Brown G., Lewis D. 2015. A Comparative Study of Complex Survey Estimation Software in ONS. Romanian Statistical Review, 3:46-64.

Zardetto D. 2015. ReGenesees: an Advanced R System for Calibration, Estimation and Sampling Error Assessment in Complex Sample Surveys, (extended version). Journal of Official Statistics, 31(2):177-203.

Zardetto D. 2013. ReGenesees: an Advanced R System for Calibration, Estimation and Sampling Errors Assessment in Complex Sample Surveys. In Proceedings of the 7th International Conferences on New Techniques and Technologies for Statistics (NTTS), Eurostat, Brussels, 5-7 marzo 2013.

Barcaroli G., D. Zardetto. 2012. Use of R in Business Surveys at the Italian National Institute of Statistics: Experiences and Perspectives. In Proceedings of the 4th International Conference of Establishment Surveys (ICES IV), American Statistical Association, Montréal, 11-14 giugno 2012.