Concord

Controllo e correzione dati (ver. 1.0)


Concord è un sistema di controllo e correzioni dei dati con il quale si possono effettuare:

Correzioni probabilistiche con funzioni uguali a quelle del sistema SCIA, utilizzando la metodologia Fellegi-Holt.
Correzioni deterministiche con funzioni uguali a quelle di GRANADA.
Correzioni da donatore con funzioni uguali a quelle di RIDA
 
Nel menu bar di Concord si hanno le seguenti funzioni principali :

 Progetto:

con "Nuovo" si definisce un nuovo progetto scegliendo una cartella, che può essere creata utilizzando l'apposito simbolo dopo aver selezionato il percorso. Dopo aver scelto il tipo di correzione e, a conferma avvenuta, viene assegnato il progetto come libreria al SAS, scritto un record di progetto nel dataset "metadati", e registrati nella cartella tutti i dataset e file necessari all'esecuzione dei vari programmi del sistema.
con "Apri" si sceglie un progetto, corrispondente a una cartella (directory), tra quelli precedentemente definiti e il tipo di correzione. E' possibile rimuovere un progetto cliccando sul tasto con il simbolo di cancellazione e dopo conferma viene eliminato il progetto dal dataset "metadati".
Con "Chiudi" si chiude il progetto e si aggiorna il record corrispondente nel dataset "metadati".

La cartella contiene i file di sistema e i dataset generati automaticamente e utilizzati nei vari passi, e tutti i file generati dalle varie fasi di elaborazione.

In una stessa cartella e quindi in un progetto possono coesistere i vari tipi di correzione probabilistica, deterministica o tramite donatore, e si può passare da un tipo all'altro di correzione chiudendo e riaprendo il progetto.

Definizioni:

 

con "Variabili" identificate da un nome univoco, si definiscono generalmente i campi del tracciato record del file input del progetto sia per il probabilistico che per il deterministico e donatore.
con "Liste" si definiscono generalmente valori per il deterministico o insiemi di variabili per semplificare la scrittura delle regole per il probabilistico.
Con "Regole" si descrivono le condizioni di incompatibilità sia per il probabilistico che per il deterministico.
Con "Correzioni" si descrivono per il deterministico le regole con le quali sostituire valori.
Funzioni:

con "Controllo Regole" si esegue la verifica delle regole probabilistiche.
con "Derivazione insieme completo" si esegue il passo di generazione delle regole implicite.
con "Check dei dati" si esegue il passo di controllo dei dati per il probabilistico e controllo e correzione dei dati per il deterministico e donatore.
con "Correzione dei dati" si esegue l'imputazione solo per il probabilistico.
Analisi:
 

 
con "Tavole di verifica" si ottengono, nel solo probabilistico, i possibili incroci dei domini per analizzare la distribuzione delle variabili prima e dopo l'imputazione
con "Grafici" è possibile ottenere graficamente la distribuzione di ogni singola variabile prima e dopo la correzione.
Utilità:
 

 
con "Gestione dei dati" si effettua data-entry , anche controllato, sulla base della definizione delle variabili e delle regole d'incompatibilità.
con "Ordinamento dati" si esegue il sort di un file esterno, dopo aver definito le chiavi ascendenti o discendenti,
con "Numerazione dati", utile per le tavole di verifica, si inserisce un numeratore progressivo in un file esterno.
con "Unione dati" si uniscono più file esterni accodandoli.
con "Browser" si visualizza, con varie opzioni, un file esterno.
con "Genera data set" si genera, nella cartella di progetto, il data set SAS "puliti" dai file esterni "esatti" e "corretti" secondo la definizione delle variabili.
con "Copia dati" si copia un file esterno in un altro selezionando eventualmente i record tramite parametri .
 
 
 Help:
Attiva la funzione di aiuto visualizzabile come ipertesto tramite browser con possibilità di navigazione all'interno del documento.
Log:
Attiva la relativa funzione del SAS.
History:

con "Progetto" viene mostrata una tabella cronologica relativa al progetto attualmente in corso che evidenzia i passi di apertura, chiusura e di scelta dei files di input esterni.
con "All" viene mostrata una tabella cronologica di tutti i progetti.
con "Clear" cancella tutti i dati da History.
 
 
.