Fase di raccolta

Creazione della lista e selezione del campione

Le attività relative alla creazione della lista e alla selezione del campione corrispondono al sottoprocesso 4.1 “Create frame and select sample” del GSBPM.

La creazione della lista consiste nella costruzione dell’archivio delle unità appartenenti alla popolazione di interesse. La selezione del campione consiste nella individuazione delle unità campionarie sulla base di uno schema di campionamento predefinito.

Per una data occasione di indagine, la creazione della lista e la selezione del campione sono effettuate in base alle specifiche definite nel sottoprocesso 2.4 “Design frame and sample“.

Acquisizione dati

La fase di acquisizione dati, intesa nel senso stretto del termine, ossia di raccolta del dato presso le unità rispondenti, è preceduta da un insieme complesso ed articolato di attività necessarie alla definizione di un questionario d’indagine che permetta di raccogliere, per poi di misurare, i diversi aspetti del fenomeno indagato.

Nella schematizzazione del GSBPM, quanto appena detto si traduce in un insieme di sottoprocessi che percorrono il modello dalla fase 1 alla fase 4.

Fase 1 “Specify needs“. In questa fase dovranno essere realizzati i sottoprocessi dall’1.1 all’1.5 necessari ad individuare gli obiettivi di indagine ed a tradurli in concetti che, da un lato dovranno essere comprensibili e accessibili ai rispondenti, e dall’altro, dovranno essere misurabili e quindi trasformabili in variabili statistiche, che saranno disegnate nella fase 2. In questa prima fase è importante verificare l’esistenza dei dati presso altre fonti (ad esempio dati amministrativi) in modo da ridurre l’insieme delle variabili da rilevare con effetti positivi sia sui costi di rilevazione che sul fastidio statistico.

Fase 2: “Design“. Al termine della Fase 1, si procederà con la fase di disegno che, per l’acquisizione, riguarda le attività descritte nei sottoprocessi 2.1, 2.2 e 2.3. Le variabili individuate nella Fase 1 permetteranno la progettazione del piano di tabulazione (passaggio utile anche per la fase di disseminazione dei risultati) dal quale saranno desumibili anche le variabili derivate (che non saranno rilevate ossia raccolte in fase di acquisizione) e le classificazioni ufficiali che saranno utilizzate. A questo punto sarà possibile “tradurre” le variabili in domande del questionario, mentre le loro caratteristiche (valori ammissibili) e relazioni tra di esse rappresenteranno, rispettivamente, i controlli di validità ed i flussi di intervista. Il disegno delle variabili dovrebbe essere fatto tenendo in considerazione i metadati esistenti in Istituto al fine di utilizzare definizioni esistenti o di inserirne delle nuove qualora mancanti nel sistema. Questo favorirebbe il processo di standardizzazione, anche in un’ottica internazionale, nonché il riuso di elementi definiti in altri processi di acquisizione.

Il disegno delle variabili dovrà essere fatto in parallelo con il sottoprocesso 2.3 “Design Collection“, finalizzato ad individuare il/i metodo/i di raccolta dati “più appropriato/i”. Questo perché il disegno delle variabili e, quindi, la struttura e la formulazione dei quesiti da inserire nel questionario, è strettamente dipendente dalla tecnica di rilevazione utilizzata. In questo contesto rientra anche la progettazione dei controlli che si vogliono inserire durante la fase di raccolta, quando la tecnica usata è basata sull’uso del computer (es: CATI, CAPI, CAWI, descritte nella Fase 3). E’ buona regola, infatti, progettare i controlli tenendo presente l’equilibrio tra qualità del dato e il fastidio statistico del rispondente, che, se elevato, potrebbe influire negativamente sulle mancate risposte totali e/o parziali.

Fase 3 “Build“: in base alle indicazioni provenienti dalla fase di disegno verranno costruiti gli strumenti per la raccolta dati, sottoprocesso 3.1 “Build collection instruments” del GSBPM. La fase di acquisizione avviene attraverso l’utilizzo di uno o più tecniche (strumenti), assistite o non dal computer, con o senza il supporto del rilevatore, nonché attraverso strumenti, quali EDI (Electronic Data Interchange), XBRL (eXtensible Business Reporting Language), adatti allo scambio di informazioni tra l’ente statistico e le unità di rilevazione (aziende e/o organi istituzionali produttori di dati sotto forma di fonti amministrative o registri). E’ in questo sottoprocesso che si effettua anche il test di funzionalità del questionario elettronico. E’ raccomandabile stabilire una connessione diretta tra gli strumenti di raccolta ed il sistema di metadati al fine di agevolare la fase di costruzione degli strumenti nonché le fasi successive del processo, come ad esempio la Diffusione.

Tra le tecniche di acquisizione dati, giocano un ruolo sempre più importante quelle assiste dal computer, ossia CADI (Computer Assisted Data Inputing), CAPI (Computer Assisted Personal Interviewing), CATI (Computer Assisted Telephone Interviewing), CAWI (Computer Assisted Web Interviewing). Come già in parte anticipato, la caratteristica più significativa di queste tecniche consiste nel fatto di permettere l’inserimento già in fase di raccolta dati di tutti quei controlli tipici delle successive fasi di controllo e correzione, inibendo di fatto l’acquisizione del dato errato. Si differenzia la tecnica CADI che, usata nell’ambito di rilevazione tramite modelli cartacei, consiste di fatto in un’acquisizione controllata, dove i controlli sono inseriti solo al fine di ridurre quelli di registrazione o anche come supporto alla fase di revisione.

Un’altra peculiarità di queste tecniche, sempre ad eccezione delle CADI, è quella di consentire la personalizzazione della formulazione dei quesiti in funzione delle caratteristiche del rispondente (nome, sesso) o di risposte fornite a precedenti quesiti del questionario stesso o di informazioni già disponibili, perché rilevate in precedenti indagini, rendendo così l’intervista più colloquiale e facilitando la disponibilità del rispondente a collaborare. La tipologia e complessità dei controlli inseriti in fase di acquisizione è notevolmente differente tra CATI e CAPI da un lato e CAWI dall’altro:

  • per le prime due, la presenza di un rilevatore formato sia sui contenuti di indagine che sulla tecnica di somministrazione del questionario permette sia di inserire una quantità di controlli decisamente più elevata di quanto sia possibile effettuare con il CAWI che di fare un uso maggiore di controlli di tipo bloccanti ossia che richiedono la risoluzione delle incompatibilità per poter proseguire con l’intervista;
  • nel CAWI, invece, dove il questionario è auto-compilato dal rispondente, è necessario non solo contenere il numero di controlli inseriti, ma anche di gestirli con degli avvertimenti che segnalano l’incongruenza senza l’obbligo di sanarla per procedere con l’intervista.

E’ buona regola in tutti i casi progettare i controlli tenendo presente l’equilibrio tra qualità del dato e fastidio statistico del rispondente, che, se elevato, potrebbe influire negativamente sulle mancate risposte totali e/o parziali.

E’ bene ricordare di nuovo, che l’adozione di queste tecniche di rilevazione ha già un impatto in fase di progettazione di disegno del questionario di indagine, che dovrà successivamente essere tradotto in questionario elettronico. Il questionario elettronico deve poi essere approfonditamente testato, non soltanto per verificare le performance dell’applicazione informatica in termini di conformità alle specifiche e dei tempi di risposta, ma anche in termini di gradevolezza e fluidità dell’intervista.

Fase 4 “Collect“: Dopo la costruzione e test degli strumenti, può iniziare la fase di raccolta dei dati che, espressa in termini dei sottoprocessi 4.2 “Set-up collection” 4.3 “Run collection” e 4.4 “Finalise collection“, include tutte le attività che vanno dalla formazione dei rilevatori fino alla predisposizione di appositi ambienti informatizzati dove saranno caricati i dati raccolti per poi essere sottoposti al successivo passaggio di elaborazione (Fase 5 “Process“).

Ultima modifica: 20 marzo 2018