[ English ]

Statistiche Smart da Big Data

  • Ascolta questa pagina usando ReadSpeaker
  • Condividi
  • Lascia un feedback

L’intensa e continua generazione di Big Data su tutti gli aspetti della vita, attraverso l’uso costante di dispositivi intelligenti (Smart), strumenti digitali e reti elettroniche/social network, sta caratterizzando la realtà sociale, ambientale ed economica e l’interazione tra persone, organizzazioni e oggetti.

Artefice e protagonista della quarta rivoluzione industriale, Internet delle Cose (Internet of Things – IoT) applicato alla vita quotidiana o ai processi delle imprese sta trasformando le operazioni di produzione di dati e sta facendo crescere l’integrazione tra i sistemi intelligenti.

E’ quindi prevedibile che nel prossimo futuro, la maggior parte dei dati scaturirà direttamente dalle persone, con lo svolgimento quotidiano di attività, l’uso di sistemi e di oggetti personali, tra cui gli innumerevoli dispositivi intelligenti in grado di connettersi a Internet.

In tale contesto, l’Istat è chiamato a svolgere un ruolo chiave nella trasformazione in statistiche ufficiali di questa mole di dati, producendo le cosiddette statistiche smart affidabili (Trusted Smart Statistics). Per questa ragione L’Istat è impegnato nell’innovazione attraverso gli sviluppi metodologici e l’uso di nuove fonti di dati per una più efficiente e tempestiva produzione di statistiche ufficiali, per rispondere meglio alle esigenze degli utenti e ridurre l’onere statistico su famiglie, individui e imprese. Tali statistiche sono prodotte in conformità agli standard adottati a livello nazionale e internazionale, con particolare riguardo agli aspetti relativi alla protezione della privacy delle persone a cui i dati si riferiscono e agli aspetti di qualità.

Cosa sono e a che servono

Sono prodotti statistici derivanti da sistemi intelligenti, elaborati con strumenti e metodologie per la Statistica ufficiale e, pertanto, verificabili e trasparenti. L’Istat ne garantisce la validità e l’accuratezza, nel pieno rispetto della privacy delle persone e degli altri soggetti interessati.
Le statistiche smart da Big Data arricchiscono le statistiche ufficiali perché sono in grado di fornire risposte immediate e veloci sulle evoluzioni sociali, ambientali ed economiche, con un’ampia granularità, anche dal punto di vista territoriale.

Tali statistiche contribuiscono a far comprendere ai cittadini e alle imprese il valore dei loro dati, avvicinandoli alla statistica ufficiale, sostenendone il ruolo attivo, consapevole e partecipativo, alleggerendo loro il carico statistico.

Le statistiche smart rinsaldando, quindi, una reciproca e consolidata interazione tra l’Istat  i cittadini e le imprese che generano dati.

Come cambiano il processo di produzione

I cittadini conferiscono dati relativi alle loro attività quotidiane a molti tipi di operatori e intermediari, i quali, a loro volta, possono condividerle con l’Istat per scopi di natura statistica, fornendone dovuta informativa agli interessati.

Inoltre, tutti i dati detenuti dai privati se utilizzati per compilare Statistiche ufficiali sono soggetti a garanzia di riservatezza: l’Istat non può divulgare alcuna informazione che comporti la diffusione di dati personali o aziendali e tutte le informazioni sono pubblicate in forma aggregata.

Molte sono le tipologie di fonti da cui è possibile ottenere dati riguardo, ad esempio, la mobilità della popolazione e i trasporti pubblici, i cambiamenti degli stili di vita e i consumi, la salute.
Nel sistema di produzione delle statistiche smart, fonti e procedure di elaborazione possono essere gestite all’esterno dell’Istat, attraverso metodologie e algoritmi concordati e software affidabili.
Inoltre, i processi tradizionali per produrre le statistiche, basati su questionari e interazioni tra intervistatori e rispondenti, stanno cedendo il passo a nuovi modelli integrati di acquisizione ed elaborazione dei dati.

Nelle rilevazioni smart, ancora in fase sperimentale, gli intervistati utilizzano dispositivi intelligenti (smartphone, tablet, dispositivi di tracciamento delle attività) per fornire i dati. In questo modo, l’onere statistico a carico dei rispondenti può essere molto ridotto.

L’Istat trasforma in informazione statistica i Big Data e li diffonde in modo integrato con le altre Statisticche ufficiali. Il sistema di produzione delle statistiche smart deve perciò integrarsi con l’infrastruttura di acquisizione e produzione di dati dell’Istat, ovvero Sistema Integrato dei Registri e indagini correnti.

Per poter garantire la qualità e l’affidabilità delle statistiche smart, secondo i Principi di responsabilità e trasparenza propri delle Statistiche ufficiali, è però necessaria una revisione del processo statistico e dei paradigmi tradizionali di valutazione e documentazione della qualità dei dati.

Aspetti relativi alla privacy

La tutela della privacy dei cittadini e delle imprese e la riservatezza delle informazioni sono principi fondamentali di ciascun Istituto nazionale di statistica, del Sistema statistico europero (SSE) e di Eurostat. La garanzia di riservatezza è contenuta nella legislazione statistica nazionale e dell’UE e viene messa in pratica pubblicando tutte le informazioni in forma aggregata. Gli istituti nazionali di statistica non possono divulgare informazioni che porterebbero alla divulgazione di informazioni su una persona o un’impresa.

Normativa di riferimento

  • Codice delle Statistiche Europee. Per le Autorità Statistiche Nazionali (European Statistics Code of Practice), uno strumento di autoregolamentazione basato su sedici principi riguardanti il contesto istituzionale, i processi statistici e i prodotti statistici che rappresenta il quadro comune di riferimento per la qualità del SSE.
    Gli Istituti nazionali di statistica che producono Statistiche ufficiali sotto la solida lente del Codice delle statistiche europee ricoprono una posizione unica per fornire ai cittadini dell’UE e ai responsabili delle politiche pubbliche approfondimenti di alta qualità, indipendenti, oggettivi, trasparenti e imparziali, non politicamente influenzati.
  • Regolamento Generale sulla Protezione dei Dati – RGPD (Regolamento (UE) 2016/679 del Parlamento europeo e del Consiglio del 27 aprile 2016) che introduce i concetti di Privacy integrata nella progettazione tecnologica (Privacy by design) e di Privacy by default, riferita alle misure tecniche e organizzative da mettere in atto per fornire tutte le garanzie.
  • La Proposta di Regolamento del Parlamento Europeo e del Consiglio riguardante norme armonizzate sull’accesso equo ai dati e sul loro utilizzo (normativa sui dati) del 23 febbraio 2022, che affronta il tema dell’uso dei dati detenuti dai privati nelle statistiche ufficiali. Da questo regolamento si sono originate tutta una serie di tecniche volte a garantire la privacy già in fase di raccolta/pre-trattamento (Input) dei dati da utilizzare.

Un investimento condiviso a livello internazionale

Le statistiche smart rappresentano un’estensione delle statistiche ufficiali messe a disposizione dei cittadini e dei policy makers prodotte mediante l’uso di fonti non tradizionali e di metodologie innovative, in grado di dare risposte più tempestive a esigenze informative emergenti e differenziate, cogliendone in tempo reale gli aspetti evolutivi.
Queste statistiche consolidano i risultati della ricerca scientifica e ne permettono il loro immediato uso nei processi di produzione. Perciò, da diversi anni, l’Istat, in collaborazione con gli Istituti Nazionali di Statistica degli altri Paesi europei e con le Organizzazioni internazionali (Eurostat, ONU, UNECE), è impegnato attivamente nello studio, nelle sperimentazioni e nella produzione di statistiche smart da Big Data, nel rispetto di linee guida e principi comuni.
Il Memorandum di Scheveningen, nel 2013, ha dato avvio alle sperimentazioni sulle nuove fonti Big Data in ambito del Sistema statistico europeo, incentivando lo studio dei metodi per produrre statistiche ufficiali tempestive e affidabili.
Successivamente, il Memorandum di Bucarest, adottato dal Comitato del Sistema statistico europeo nel 2018, ha introdotto il concetto di statistiche smart realizzate con Big Data (Trusted Smart Statistics) e delle cosiddette rilevazioni intelligenti e affidabili (Trusted Smart Surveys).

Attualmente, la condivisione dei dati tra i detentori di dati privati e gli istituti nazionali di statistica è consentita attraverso accordi privati su base individuale. Riconoscendo la ricchezza dei dati e il loro potenziale valore per le statistiche ufficiali, il SSE sta concentrando i propri sforzi sullo sviluppo di un quadro giuridico che consenta agli istituti nazionali di statistica di accedere a questi dati e di utilizzarli in modo affidabile.

La strategia europea per i dati mira a costruire un vero e proprio mercato unico dei dati e a fare dell’Europa un leader mondiale nel settore dei dati. A questo proposito, la prossima legge sui dati dovrebbe costituire un pilastro fondamentale e la seconda grande iniziativa annunciata nella strategia sui dati. L’obiettivo è contribuire alla creazione di un quadro di governance intersettoriale per l’accesso e l’utilizzo dei dati legiferando su questioni che riguardano le relazioni tra gli attori dell’economia dei dati, per incentivare la condivisione orizzontale dei dati tra i vari settori.

Governance

Il sistema di produzione per le statistiche smart da Big Data prevede nuove forme di collaborazione tra attori interni ed esterni all’Istat (e.g. Università, altre istituzioni, partner privati) e di condivisione di conoscenze metodologiche e soluzioni informatiche.

In Istat a governare questo modello di produzione è uno Steering Committee, composto da Direttori interni, che è responsabile del processo di Analisi Strategica e dell’individuazione della domanda di statistiche smart. Per sfruttare al meglio l’interdisciplinarietà delle competenze, l’Istat si è dotato del Centro interdipartimentale per le TSS, che effettua il coordinamento delle attività tecniche, metodologiche e di messa in produzione delle statistiche smart realizzate nelle strutture organizzative dell’Istat.

Prodotti disponibili

Le statistiche smart da big data trovano applicazione in Istat nella produzione sia di statistiche ufficiali sia di statistiche sperimentali.

Indici mensili dei prezzi al consumo 

L’introduzione degli scanner data (ovvero i dati che si ricavano dai lettori dei codici a barre sui prodotti dei supermercati) nella rilevazione dei prezzi al consumo ha aperto dal 2018 la strada all’uso di nuove fonti in Istat e ha comportato una revisione della strategia campionaria dell’indagine.

Statistiche sperimentali con Big Data

Sperimentazioni in corso

Molteplici sono le fonti, le metodologie e le procedure di trattamento dati su cui sono in corso sperimentazioni. Dall’uso dei dati di telefonia mobile per studiare gli spostamenti delle persone nel territorio, volti a classificare i movimenti della popolazione in pendolari, occasionali o turistici, allo studio delle informazioni ottenute dai siti o portali che diffondono in rete le ricerche di lavoro, utilizzati per migliorare gli indicatori del mercato del lavoro.
Dall’utilizzo delle immagini satellitari per comprendere l’uso dei suoli in agricoltura, all’uso delle informazioni sulla localizzazione delle navi dai sensori di rilevazione per l’arricchimento delle statistiche sui trasporti marittimi. Dallo studio delle transazioni elettroniche di pagamento per il miglioramento delle previsioni e stime rapide di grandezze macroeconomiche, all’uso delle informazioni dei social network per l’analisi della violenza di genere e del linguaggio d’odio.

FAQ

Cos’è la datificazione?
Con la crescente digitalizzazione, si assiste al processo della cosiddetta datificazione: ogni evento o stato, nel mondo fisico o virtuale, in tempo reale è trasformato in dato.
I dati, a loro volta, sono raccolti, scambiati, registrati, analizzati, trasformati, venduti.
La disponibilità delle fonti di tipo Big Data da cui derivano tali dati fa parte di quei cambiamenti globali che hanno impatti significativi anche sulla produzione di statistiche ufficiali.

Cosa sono gli oggetti intelligenti nell’ambito dell’Internet delle Cose (IoT)?
Intenet delle Cose rappresenta l’evoluzione dell’uso della rete Internet: gli oggetti (le cose) si rendono riconoscibili e acquisiscono intelligenza grazie al fatto di poter comunicare dati su se stessi, e accedere a informazioni aggregate da parte di altri. Per “cose” o “oggetti” si intendono categorie quali: dispositivi, apparecchiature, impianti e sistemi, materiali e prodotti tangibili, opere e beni, macchine e attrezzature.

Quali sono le criticità per la Statistica ufficiale nell’uso di dati detenuti da privati?
Le aziende private non sono obbligate a fornire all’Istat i dati in loro possesso e possono, quindi, decidere di venderli ad altre organizzazioni che forniscono approfondimenti a pagamento. Quindi, la fornitura di dati non può essere garantita a lungo termine e ciò influisce sulla capacità di produrre dati confrontabili nel tempo. La confrontabilità, infatti, è un aspetto importante delle statistiche ufficiali, in quanto consente ai decisori di trarre conclusioni significative.
Inoltre, va menzionato che spesso i costi di accesso alle informazioni e alla preparazione dei dati possono essere elevati.

Ultima modifica: 18 maggio 2023