Ricerca
strumenti

Metodi e software del processo statistico

Fase di progettazione

Progettazione della lista e del campione

Le attività relative alla progettazione della lista e della metodologia di campionamento fanno riferimento al sottoprocesso 2.4 Design frame and sample del Generic Statistical Business Process Model (GSBPM).

Più precisamente:

  • Costruzione dell’archivio di selezione relativo alla popolazione obiettivo e contenente, per ciascuna unità della popolazione, le informazioni identificative e necessarie per il contatto, eventuali variabili ausiliarie utili per la definizione del disegno (variabili di stratificazione, variabili identificative degli eventuali stadi di selezione);
  • Progettazione del disegno di campionamento che, sulla base degli obiettivi conoscitivi specificati nella Fase 1 Specify Needs e dei vincoli operativi e di costo, consenta di ottenere stime il più possibile precise.

Le caratteristiche della lista di campionamento sono rilevanti per la corretta definizione del disegno di campionamento.

La lista deve rispondere a criteri di qualità in termini di aggiornamento, copertura e accuratezza delle informazioni in essa riportate. Da un punto di vista strettamente teorico la lista di selezione ideale dovrebbe possedere i seguenti requisiti:

  • essere costituita dalle sole unità appartenenti alla popolazione di interesse al momento di riferimento dell’indagine;
  • includere ogni unità della popolazione una sola volta;
  • contenere dati aggiornati e corretti relativamente alle informazioni identificative (nome e indirizzo) e alle eventuali informazioni descrittive (altri dati strutturali importanti) delle unità.

Le possibili situazioni di allontanamento dalla lista ideale sono:

  • sottocopertura, nel caso in cui alcuni elementi della popolazione non sono contenuti nella lista e non possono, pertanto, essere inclusi nel campione;
  • sovracopertura, quando alcuni elementi della lista sono inesistenti e/o non appartengono alla popolazione di interesse;
  • duplicazione di alcune unità, se alcuni elementi della popolazione sono presenti più volte nella lista;
  • grappoli di unità, quando alcuni elementi della lista contengono grappoli di elementi della popolazione.

La progettazione del disegno campionario prevede innanzitutto la definizione dello schema di campionamento sulla base dei costi legati alla tecnica di rilevazione prescelta e delle informazioni contenute nella lista di selezione (campionamento a più stadi di selezione, campionamento stratificato). La scelta di un disegno a più stadi di selezione deriva generalmente dalla necessità di concentrare il campione sul territorio al fine di contenere i costi di rilevazione in caso di indagini che prevedono una modalità diretta di somministrazione del questionario (intervista faccia a faccia). La scelta di un disegno campionario stratificato ha come finalità il miglioramento della precisione delle stime. La suddivisione delle unità della popolazione in strati è effettuata sulla base di variabili ausiliarie presenti sulla lista e legate alle variabili oggetto di indagine.

Sulla base dello schema di campionamento adottato, possono essere previste le seguenti fasi:

  • scelta dei criteri di stratificazione (scelta delle variabili, scelta del numero degli strati, definizione del criterio di formazione degli strati);
  • scelta del metodo probabilistico di selezione delle unità campionarie (selezione con probabilità uguali, selezione con probabilità variabili). In caso di disegni a due o più stadi la selezione delle unità di primo stadio è effettuata generalmente con probabilità proporzionale ad una misura di ampiezza supposta correlata con le variabili oggetto di indagine.
  • determinazione delle numerosità campionarie per i diversi stadi di selezione e allocazione del campione tra gli strati sulla base dell’errore di campionamento ammesso per le principali stime in relazione ai domini di riferimento e alle sottoclassi di popolazione. Poiché solitamente le indagini sono progettate per la produzione di molteplici stime per diversi domini di interesse, è necessario utilizzare metodologie che affrontino in un’ottica globale il problema della determinazione della dimensione campionaria ottima in presenza di un numero elevato di obiettivi e di vincoli.
Ti è stata utile questa pagina?

    Gli aggiornamenti di Istat ogni settimana