Home / Strumenti / Metodi e software / Software / QUIS
QUick Imputation System
Download del software
A. Requisiti hardware e software
Dimensione minima hardware
- 2 Mb su disco C:\ (ulteriore memoria dipende dai data set
da elaborare)
Software necessari
- WINZIP
- Microsoft Windows 95/98/NT4.0 o superiori
- SAS SYSTEM v8/9.x per Microsoft Windows con i moduli:
1 - SAS/BASE
2 - SAS/STAT
3 - SAS/IML
B. Download
È possibile il download della versione del software sviluppata con SAS v8 ( Quisv8 ) e SAS v9 ( Quisv9 ). La procedura da seguire è la seguente:
- Creare una cartella QUIS (per esempio sul disco G:\QUIS)
- Copiarci il catalogo SAS Quis e il programma autoexec.sas disponibili nell'area download
- Aprire il programma autoexec.sas e verificare che la libreria Quis sia assegnata al path corrispondente alla cartella QUIS
- Copiare il collegamento su desktop al SAS (l'eseguibile) e rinominarlo come meglio si crede (p.es. QUIS)
- Cliccare con il tasto destro sul collegamento appena creato e selezionare "proprietà"
- Negli spazi "Destinazione" e "Da" copiare le rispettive istruzioni che sono riportate nel file opzionisas.txt disponibile nell'area download verificando che i path indicati corrispondano effettivamente a quelli dentro cui è stato installato l'eseguibile SAS (in "Destinazioni") e creata la cartella QUIS (in "Da"). Se si desidera disporre di tutte le voci di menù ordinarie del SAS cancellare l'opzione '-noawsmenu' dalla riga "Destinazione".
Informazioni generali sul software
QUIS è un software per l'imputazione delle mancate risposte parziali per variabili quantitative.
Il software è stato sviluppato in ambiente SAS.
Esso si compone di quattro moduli relativi ad altrettanti metodi di trattamento di dati quantitativi incompleti.
- Regressione basata su algoritmo EM
Il metodo utilizza l'algoritmo EM per effettuare le stime di massima verosimiglianza dei parametri di un modello normale multivariato che si ipotizza sottostante ai dati.
I parametri stimati vengono quindi utilizzati per l'imputazione per regressione delle MRP con o senza l'aggiunta di un residuo.
- Donatore di minima distanza (NND)
Classico metodo di imputazione consistente nell'attribuire agli item non osservati di ogni record incompleto (ricevente) i valori prelevati da un record completo (donatore) selezionato in modo da minimizzare una funzione di distanza opportunamente definita.
In QUIS sono previste tre tipi di distanza: Euclidea, Manhattan, Min-Max.
- Predictive mean matching (PMM)
Come il metodo di regressione il PMM utilizza l'algoritmo EM per effettuare le stime di massima verosimiglianza di un modello normale multivariato e calcolare le medie predittive dei valori mancanti condizionatamente a quelli osservati.
Queste ultime tuttavia non sono imputate direttamente, ma utilizzate per costruire una funzione di distanza mediante la quale effettuare l'imputazione con NND.
- Imputazione multipla (IM)
Basato sulla teoria di Rubin, anche questo metodo ipotizza la normalità dei dati. La peculiarità dell'IM consiste nel fatto che, al posto di un singolo data-set imputato, vengono prodotti più data-set completi che possono essere utilizzati per stimare la varianza delle stime associata alla mancata risposta.
Il software, ancora in versione prototipale consente di integrare i diversi metodi di imputazione in un ambiente unificato attraverso l'utilizzo di un'interfaccia amichevole a finestre.
Documentazione
- Chen J., Shao J. - (2000), "Nearest Neighbour Imputation for Survey Data", Journal of Official Statistics, 16, 113-131
- David M., Little R.J.A., Samuel M.E., Triest R.K. - (1986), "Alternative Methods of CPS Income Imputation", Journal of the American Statistical Association, 81, 29-41
- Dempster A.P., Laird N.M., Rubin D.B. - (1977), "Maximum Likelihood from Incomplete Data via the EM Algorithm", Journal of the Royal Statistical Society, Ser. B, 39, 1-38
- Kalton G., Kasprzyk D. - (1986), "The treatment of Missing Survey Data", Survey Methodology, Vol. 12, 1, 1-16
- Little R.J.A. - (1988), "Missing Data Adjustments in Large Survey", Journal of Business & Economic Statistics, 6, 287-295
- Little R.J.A., Rubin D.B. - (2002), "Statistical Analysis with Missing Data", Wiley & Sons, New York
- Mardia K.V., Kent J.T., Bibby J.M. - (1979), "Multivariate Analysis", Academic Press, London
- Pannekoek, J. - (2002), "Multivariate Regression and Hot Deck Imputation Method", EUREDIT Deliverable 5.1.1
- Rubin, D.B. - (1987), "Multiple Imputation for Nonresponse in Surveys", Wiley & Sons, New York
- Schafer J.L. - (1997), "Analysis of Incomplete Multivariate Data", ChAapman & Hall, London
per informazioni:
Metodi per il trattamento degli errori non campionari
Ugo Guarnera
email guarnera@istat.it