Il package ReGenesees richiede l'installazione di R versione 2.14.0 (o superiore).
Il package ReGenesees.GUI richiede l'installazione di R versione 2.14.0 (o superiore) e dei package ReGenesees, tcltk, tcltk2, RODBC e svMisc.
Per poter effettuare il download occorre compilare un brevissimo questionario identificativo. L'unico scopo della notifica è tenere traccia delle persone interessate al sistema ReGenesees in modo da poterle informare dei nuovi sviluppi del progetto.
Package ReGenesees (funzionalità statistiche del sistema)
Package ReGenesees.GUI (interfaccia grafica del sistema)
Installazione e caricamento di un package R
Istruzioni per sistemi Windows
Istruzioni per sistemi Unix-like
Per ulteriori informazioni è possibile consultare il capitolo 6 "Add-on packges" del manuale "R Installation and Administration".
Che cos'è ReGenesees
ReGenesees (R evolved Generalised software for sampling estimates and errors in surveys) è un sistema software basato su R per l'analisi design-based e model-assisted di indagini campionarie complesse.
Il nome del sistema intende enfatizzare la continuità dell'offerta di strumenti Istat per la calibrazione ed il calcolo delle stime e degli errori (di qui il richiamo a GENESEES), sottolineando - al contempo - l'evoluzione e l'arricchimento di tale offerta attraverso R.
Occorre, tuttavia, precisare come ReGenesees non sia il risultato di una semplice migrazione di GENESEES da SAS a R, bensì il frutto di un progetto nuovo e completamente indipendente. ReGenesees risponde, infatti, ad un radicale cambiamento di logica applicativa che, oltre a consentire un più agevole e sicuro utilizzo del software, garantisce un notevole ampliamento della scelta di stimatori rispetto ai quali calcolare le stime e gli errori campionari.
Principali Funzionalità Statistiche del Sistema
- Disegni a più stadi, stratificati, a cluster
- Probabilità di inclusione variabili, con o senza reintroduzione
- Disegni di campionamento "misti" (strati AR e NAR)
- Globale e/o per partizioni (per modelli fattorizzabili)
- A livello di unità e/o di cluster
- Horvitz-Thompson
- Calibration Estimators
- Formulazione multistadio (algoritmo ricorsivo di Bellhouse)
- Ultimate-Cluster approximation
- GENESEES-like per disegni "misti"
- Linearizzazione di Taylor per stimatori nonlineari "smooth"
- Totali
- Medie
- Distribuzioni di frequenza assoluta o relativa (marginali o congiunte)
- Rapporti fra totali
- Quantili (stima della varianza con il metodo di Woodruff)
- Funzioni differenziabili arbitrarie di stimatori di Horvitz-Thompson o di Calibrazione
- Definibili liberamente dall'utente
- Linearizzazione di Taylor automatica
Architettura del Sistema
Il sistema ReGenesees è interamente sviluppato in codice R e può essere utilizzato sia in ambiente Windows che nella maggior parte degli ambienti Unix-like.
L'architettura del sistema si articola su due package R integrati:
Deve essere sottolineato che il package ReGenesees può essere utilizzato anche da solo, interagendo con R nel modo tradizionale, cioè da linea di comando. Questa opzione potrebbe rivelarsi necessaria in specifici contesti applicativi (le simulazioni sono un tipico esempio) o apparire comunque preferibile ad utenti esperti del sistema R.
Al contrario, il package ReGenesees.GUI richiede il package ReGenesees (si veda la sezione Download), e lo importa automaticamente all'atto del caricamento. La GUI è stata progettata e realizzata con l'intento di rendere quanto più possibile amichevole e semplice l'interazione con il sistema ReGenesees anche ad utenti che non siano esperti di R, né di teoria del campionamento da popolazioni finite.
Input/Output
ReGenesees consente di importare ed esportare dati in diversi modi. E', ad esempio, possibile importare dati da file di testo (con estensioni quali .txt, .csv, .dat), da fogli di MS Excel e da tabelle di database MS Access. Il sistema può, inoltre, importare dati precedentemente memorizzati in workspace R (con estensioni .RData o .rda). Ad oggi, ReGenesees consente di esportare i risultati delle elaborazioni in file di testo o di salvarli in workspace R. Estensioni sulle funzionalità di I/O, ad esempio l'esportazione di dataset multipli come fogli separati di un singolo file .xls, saranno rese disponibili nelle future versioni del software.
Stato di Avanzamento del Progetto
La corrente versione di ReGenesees è la 1.1
Documentazione del Software
Entrambi i package che compongono il sistema (ReGenesees e ReGenesees.GUI) sono dotati di manuali di riferimento che rispettano integralmente gli standard R. Il manuale del package ReGenesees, in particolare, documenta tutte le funzionalità statistiche del software, fornendo anche una vasta gamma di esempi e casi d'uso direttamente eseguibili sui dati di prova di cui il package è corredato.
Una guida utente all'uso del sistema ReGenesees, di natura meno tecnica, è in corso di preparazione e sarà resa disponibile appena possibile.
Distribuzione del Software e Licenza
Il sistema ReGenesees è distribuito come Open Source Software, sotto licenza EUPL.
Autori
Responsabile del progetto: Diego Zardetto
Funzionalità statistiche (package ReGenesees): Diego Zardetto
Interfaccia grafica (package ReGenesees.GUI): Raffaella Cianchetta, Diego Zardetto
Referenti presso l'Istat:
Unità Operativa DIQR/MSS/G
"Strumenti generalizzati per la produzione statistica"
Diego Zardetto - zardetto@istat.it