Strumenti

Disegno del campione

Metodologie e tecniche per il disegno del campione

Per ciascuna indagine statistica condotta dall'Istat si rende necessario definire il disegno di indagine ottimale, cioè il disegno che, rispettando i vincoli operativi e di costo imposti, porti a stime il più possibile precise in termini di errore totale.
In particolare, al fine di definire il disegno di indagine ottimale è utile suddividere tale attività secondo le seguenti fasi:

A. definizione degli obiettivi conoscitivi (che comprende in particolare la scelta della popolazione obiettivo e dei parametri di interesse) e dei vincoli operativi e di costo;
B. progettazione e realizzazione del disegno campionario.

A. Definizione degli obiettivi conoscitivi

A1 - Definizione della popolazione obiettivo

Per una definizione dettagliata della popolazione obiettivo, ossia dell'insieme di unità statistiche intorno alle quali si intende investigare, si devono considerare i punti di seguito illustrati.

  • È necessario individuare le unità che appartengono alla popolazione obiettivo definendo in modo univoco le caratteristiche comuni che devono presentare le unità per essere incluse nella popolazione obiettivo. Se l'individuazione della popolazione si basa su una o più variabili quantitative, si deve definire, per ciascuna variabile, un valore numerico o soglia che divide le unità tra appartenenti e non appartenenti alla popolazione obiettivo.
    Nel caso in cui l'individuazione delle unità appartenenti alla popolazione si basa su variabili qualitative, occorre definire, per ciascuna variabile, la modalità o le modalità che le unità devono possedere per appartenere alla popolazione.
  • Si deve definire l'istante di tempo oppure il periodo temporale alla quale si riferisce la popolazione obiettivo.
  • In tutti i casi in cui è necessario escludere dalla popolazione obiettivo una o più sotto popolazioni particolari, per motivi legati agli alti costi di rilevazione o alla mancanza di liste aggiornate, occorre: esplicitare chiaramente tali esclusioni nella definizione della popolazione obiettivo; effettuare una valutazione preventiva della numerosità di tali sotto popolazioni al fine di ben comprendere l'effetto che tali esclusioni possono avere sulla consistenza finale della popolazione obiettivo.
  • Nel caso in cui l'indagine abbia la finalità di investigare su unità statistiche gerarchicamente collegate, ad esempio, famiglie ed individui oppure imprese ed unità locali, si devono definire le popolazioni obiettivo con riferimento a ciascuna tipologia di unità statistica di interesse.

A2 - Definizione dei parametri di interesse

I più importanti aspetti da tenere presenti per la definizione dei parametri oggetto di stima e dei domini di studio sono di seguito descritti.

  • È necessario definire ciascun parametro oggetto di investigazione in base a:
a. la sua natura statistica, ovvero se si tratta: di un totale o di una media di una variabile quantitativa, di una frequenza assoluta o relativa riferita ad una modalità o classi di modalità di una variabile qualitativa (oppure riferita ad una classe di valori di una variabile quantitativa), di un rapporto ecc.;
b. l'istante di tempo oppure il periodo temporale a cui si riferisce il parametro;
c. la sua espressione formale i cui termini sono riferiti alle unità della popolazione obiettivo.
  • Si devono definire i domini di studio, ossia le sotto popolazioni con riferimento alle quali si vuole calcolare ciascun parametro oggetto di stima; tali sotto popolazioni possono essere definite in base a caratteristiche di appartenenza territoriale (domini territoriali di studio) oppure attraverso altre caratteristiche delle unità della popolazione obiettivo.
  • Nel caso di rilevazioni a obiettivi plurimi, è necessario definire una gerarchia di rilevanza degli scopi dell'indagine. Si tratta di un problema complesso in quanto le indagini multi-obiettivo hanno la finalità di soddisfare diverse tipologie di obiettivi, ciascuna delle quali varia a seconda della natura statistica del parametro da stimare, del riferimento temporale e del dominio di stima. È necessario, pertanto, suddividere gli obiettivi in tre tipologie:
a. obiettivi primari strategici, relativi a quei parametri e a quei domini di studio, le cui stime devono rispettare obbligatoriamente prefissate soglie massime sugli errori di campionamento attesi e prefissati livelli di accuratezza; tali obiettivi rappresentano uno dei principali elementi che guidano la scelta del disegno di indagine e in particolare della strategia campionaria;
b. obiettivi primari non strategici, relativi a quei parametri e a quei domini di studio, le cui stime devono rispettare requisiti minimali sugli errori di campionamento attesi e sui livelli di accuratezza, tali da garantirne la diffusione in base ai dati prodotti dall'indagine. Qualora si presentino differenti disegni di indagine e strategie campionarie che rispettano gli obiettivi primari la scelta di una di esse deve ricadere su quella che garantisce anche il raggiungimento degli obiettivi secondari;
c. obiettivi secondari, relativi a quei parametri riferiti a particolari domini di studio (piccoli domini o piccole aree) per i quali non è garantito l'ottenimento di stime attendibili in base alla strategia di campionamento progettata per rispettare gli obiettivi primari strategici e non strategici. Per il raggiungimento, almeno parziale, di tali obiettivi si possono adottare accorgimenti particolari nella fase di definizione del disegno (stratificazione e allocazione) e particolari metodi di stima indiretta.

A3 - Esplicitazione dei vincoli operativi e di costo

Al fine di esplicitare i vincoli di costo, di precisione delle stime e di tutti quei vincoli operativi connessi alla rilevazione che possono determinare scelte differenti nella fase di progettazione della strategia campionaria è necessario considerare i punti di seguito illustrati:

  • devono essere chiari i vincoli di costo dell'indagine, e/o i vincoli di precisione delle stime controllando la coerenza dei due tipi di vincoli;
  • nel caso si possano adottare differenti tecniche di indagine occorre individuare per ciascuna tecnica alternativa tutti i vincoli operativi connessi alla rilevazione sul campo.

B. Progettazione e realizzazione del disegno campionario

La progettazione della strategia campionaria prevede l'effettuazione delle seguenti fasi:

  • l'indicazione dell'errore di campionamento ammesso per le principali stime in relazione ai domini geografici di riferimento ed alle sottoclassi di popolazione;
  • l'individuazione di tutte le informazioni disponibili aggiornate, legate alle variabili oggetto di indagine;
  • la definizione dello schema di campionamento (campione a più stadi, campione stratificato, ecc.);
  • la scelta dei criteri di stratificazione (scelta delle variabili, scelta del numero degli strati, definizione del criterio di formazione degli strati);
  • la scelta del metodo probabilistico di selezione delle unità di campionamento (selezione con probabilità uguali, selezione con probabilità variabili);
  • la determinazione delle numerosità campionarie per i diversi stadi di selezione.

Per quanto riguarda quest'ultima fase è importante tenere presente che si tratta di una fase di rilevante importanza statistica in quanto l'Istat effettua indagini multiscopo su larga scala. Per le suddette indagini è, infatti, poco realistico pensare di potere determinare una dimensione campionaria che assicuri prefissati livelli di precisione a tutte le stime di interesse; inoltre, un ulteriore elemento di complessità - presente nella quasi totalità delle indagini Istat - è dovuto all'esigenza di produrre stime di parametri riferiti ad un numero elevato di domini territoriali di studio.

Nel ricercare - autonomamente per ciascun dominio territoriale di studio - la soluzione ottima a tale problema, ci si trova in pratica a dover conciliare finalità diverse che richiedono ciascuna una risposta in genere diversa, le cui soluzioni potrebbero confliggere. Tuttavia, è possibile utilizzare una metodologia che affronta in un ottica globale il problema della determinazione ottima della dimensione campionaria in presenza di una molteplicità di obiettivi e di vincoli.
Più precisamente, la metodologia adottata dall'Istat consente di determinare la dimensione campionaria minima che assicura, con il livello di precisione desiderato, l'ottenimento delle stime dei parametri di interesse riferiti ai diversi domini territoriali di studio.
Giova rilevare che la soluzione a cui si perviene, pur essendo ottima in senso globale, fornisce soluzioni a livello di ciascun dominio territoriale di studio generalmente meno efficienti rispetto a quelle ottenibili affrontando la determinazione della dimensione campionaria autonomamente per ciascun dominio territoriale di studio. Infine la fase di realizzazione della strategia campionaria consiste nell'estrazione effettiva del campione sulla base del disegno campionario progettato.