CONCORDJava (CONtrollo e CORrezione dei Dati versione con interfaccia Java)
I contenuti relativi a CONCORDJava sono riportati nelle seguenti sezioni:
CONCORDJava è un software open source per il controllo e correzione dei dati. L’applicazione integra software precedentemente sviluppati ed utilizzati in Istat: SCIA, RIDA e GRANADA.
L’applicazione, attualmente rilasciata in versione beta per la parte riguardante le correzioni deterministiche, è disponibile per il download nella versione in lingua italiana ed in inglese.
I diversi metodi residenti nel software sono implementati in moduli distinti:
- SCIA (Sistema di Controllo e Imputazione Automatici):
Esegue il controllo e la correzione di variabili qualitative applicando integralmente la metodologia di Fellegi-Holt. Per ciascun record errato il sistema prima individua il minimo numero di variabili da imputare e poi effettua l’imputazione garantendo azioni di imputazione coerenti con un predefinito insieme di regole di controllo.
- RIDA (Ricostruzione dell’Informazione con Donazione Automatica):
Esegue l’imputazione di variabile qualitative e quantitative mediante donatore di minima distanza. Operazioni propedeutiche sono:- la classificazione delle unità in esatte ed errate;
- la loro registrazione in due file distinti;
- la identificazione dei valori da imputare mediante un predefinito carattere (di errore).
- GRANADA (Gestione delle Regole per l’ANAlisi dei DAti):
Esegue l’imputazione di variabili qualitative e quantitative secondo l’approccio deterministico, ossia mediante l’applicazione di regole del tipo SE [condizione di errore] ALLORA [azione di correzione]. Mediante questo modulo è possibile eseguire anche il solo controllo dei dati (separazione in esatti ed errati) secondo regole di incompatibilità che ammettono operatori logici e aritmetici (e quindi valide per variabili qualitative e quantitative).
Propedeutica ai vari passi è la fase di definizione delle variabili, cioè dei campi del record da sottoporre a controllo, e degli edit o regole di controllo sia formali che sostanziali individuabili a partire dal questionario e dalla conoscenza relativa ai fenomeni indagati.
Status: validato
Autore: Istat
Licenza: EUPL-1.1
Codifica GSBPM:
5.3 Review and validate
5.4 Edit and impute
Linguaggio di programmazione: Fortran, Java
Versione linguistica della GUI: EN, IT
Parole chiave: localizzazione, imputazione, donatore di minima distanza, Fellegi-Holt
Contatto:
nome: Maria Teresa Buglielli
email: bugliell@istat.it
REQUISITI TECNICI
dimensione minima hardware
256 Mb memoria RAM
30 Mb su disco C:/
software necessari
Java 2 Runtime Environment 6.0 o superiore
COPYRIGHT
Copyright 2014 Istat
Concesso in licenza a norma dell’European Union Public Licence (EUPL), versione 1.1 o successive. Non è possibile utilizzare l’opera salvo nel rispetto della Licenza. È possibile ottenere una copia della Licenza al seguente indirizzo: http://ec.europa.eu/idabc/eupl.html. Salvo diversamente indicato dalla legge applicabile o concordato per iscritto, il software distribuito secondo i termini della Licenza è distribuito “TAL QUALE”, SENZA GARANZIE O CONDIZIONI DI ALCUN TIPO, esplicite o implicite. Si veda la Licenza per la lingua specifica che disciplina le autorizzazioni e le limitazioni secondo i termini della Licenza.
DISCLAIMER
L’Istat non si assume la responsabilità per risultati derivanti da un uso dello strumento non coerente con le indicazioni metodologiche contenute nella documentazione disponibile.
DOWNLOAD
Data di rilascio: 10/06/2014
CONCORDJAVA versione 2.2
DOCUMENTAZIONE TECNICA E METODOLOGICA