Strumenti

QUick Imputation System

Download del software

A. Requisiti hardware e software

Dimensione minima hardware
- 2 Mb su disco C:\ (ulteriore memoria dipende dai data set
da elaborare)

Software necessari
- WINZIP
- Microsoft Windows 95/98/NT4.0 o superiori
- SAS SYSTEM v8/9.x per Microsoft Windows con i moduli:
1 - SAS/BASE
2 - SAS/STAT
3 - SAS/IML

B. Download

È possibile il download della versione del software sviluppata con SAS v8 ( Quisv8 ) e SAS v9 ( Quisv9 ). La procedura da seguire è la seguente:

  • Creare una cartella QUIS (per esempio sul disco G:\QUIS)
  • Copiarci il catalogo SAS Quis e il programma autoexec.sas disponibili nell'area download
  • Aprire il programma autoexec.sas e verificare che la libreria Quis sia assegnata al path corrispondente alla cartella QUIS
  • Copiare il collegamento su desktop al SAS (l'eseguibile) e rinominarlo come meglio si crede (p.es. QUIS)
  • Cliccare con il tasto destro sul collegamento appena creato e selezionare "proprietà"
  • Negli spazi "Destinazione" e "Da" copiare le rispettive istruzioni che sono riportate nel file opzionisas.txt disponibile nell'area download verificando che i path indicati corrispondano effettivamente a quelli dentro cui è stato installato l'eseguibile SAS (in "Destinazioni") e creata la cartella QUIS (in "Da"). Se si desidera disporre di tutte le voci di menù ordinarie del SAS cancellare l'opzione '-noawsmenu' dalla riga "Destinazione".

Informazioni generali sul software

QUIS è un software per l'imputazione delle mancate risposte parziali per variabili quantitative.

Il software è stato sviluppato in ambiente SAS.

Esso si compone di quattro moduli relativi ad altrettanti metodi di trattamento di dati quantitativi incompleti.

  1. Regressione basata su algoritmo EM
    Il metodo utilizza l'algoritmo EM per effettuare le stime di massima verosimiglianza dei parametri di un modello normale multivariato che si ipotizza sottostante ai dati.
    I parametri stimati vengono quindi utilizzati per l'imputazione per regressione delle MRP con o senza l'aggiunta di un residuo.
  2. Donatore di minima distanza (NND)
    Classico metodo di imputazione consistente nell'attribuire agli item non osservati di ogni record incompleto (ricevente) i valori prelevati da un record completo (donatore) selezionato in modo da minimizzare una funzione di distanza opportunamente definita.
    In QUIS sono previste tre tipi di distanza: Euclidea, Manhattan, Min-Max.
  3. Predictive mean matching (PMM)
    Come il metodo di regressione il PMM utilizza l'algoritmo EM per effettuare le stime di massima verosimiglianza di un modello normale multivariato e calcolare le medie predittive dei valori mancanti condizionatamente a quelli osservati.
    Queste ultime tuttavia non sono imputate direttamente, ma utilizzate per costruire una funzione di distanza mediante la quale effettuare l'imputazione con NND.
  4. Imputazione multipla (IM)
    Basato sulla teoria di Rubin, anche questo metodo ipotizza la normalità dei dati. La peculiarità dell'IM consiste nel fatto che, al posto di un singolo data-set imputato, vengono prodotti più data-set completi che possono essere utilizzati per stimare la varianza delle stime associata alla mancata risposta.

Il software, ancora in versione prototipale consente di integrare i diversi metodi di imputazione in un ambiente unificato attraverso l'utilizzo di un'interfaccia amichevole a finestre.

Documentazione

  • Chen J., Shao J. - (2000), "Nearest Neighbour Imputation for Survey Data", Journal of Official Statistics, 16, 113-131
  • David M., Little R.J.A., Samuel M.E., Triest R.K. - (1986), "Alternative Methods of CPS Income Imputation", Journal of the American Statistical Association, 81, 29-41
  • Dempster A.P., Laird N.M., Rubin D.B. - (1977), "Maximum Likelihood from Incomplete Data via the EM Algorithm", Journal of the Royal Statistical Society, Ser. B, 39, 1-38
  • Kalton G., Kasprzyk D. - (1986), "The treatment of Missing Survey Data", Survey Methodology, Vol. 12, 1, 1-16
  • Little R.J.A. - (1988), "Missing Data Adjustments in Large Survey", Journal of Business & Economic Statistics, 6, 287-295
  • Little R.J.A., Rubin D.B. - (2002), "Statistical Analysis with Missing Data", Wiley & Sons, New York
  • Mardia K.V., Kent J.T., Bibby J.M. - (1979), "Multivariate Analysis", Academic Press, London
  • Pannekoek, J. - (2002), "Multivariate Regression and Hot Deck Imputation Method", EUREDIT Deliverable 5.1.1
  • Rubin, D.B. - (1987), "Multiple Imputation for Nonresponse in Surveys", Wiley & Sons, New York
  • Schafer J.L. - (1997), "Analysis of Incomplete Multivariate Data", ChAapman & Hall, London

per informazioni:
Metodi per il trattamento degli errori non campionari

Ugo Guarnera
email guarnera@istat.it

Quisv9
(zip 155 KB)
Quisv8
(zip 153 KB)