[ English ]
Statistica sperimentale

Stime delle modalità di utilizzo dei siti web da parte delle imprese

  • Ascolta questa pagina usando ReadSpeaker
  • Condividi
  • Lascia un feedback

L’Istat rende disponibili le stime all’anno di riferimento 2018 delle funzionalità e servizi offerti dai siti web delle imprese. Tali stime sono supportate dalle informazioni raccolte attraverso l’indagine sull’utilizzo dell’ICT nelle imprese con almeno 10 addetti e di quelle raccolte direttamente dalle pagine web delle imprese secondo il seguente flusso di processo:

1 – Acquisizione dell’indirizzo web URL disponibili da fonti amministrative
URL ottenibili da portali tematici
URL ottenuti mediante utilizzo in batch di motori di ricerca (tecniche di URL retrieval)
2 – Identificazione impresa Controllo della validità dell’URL (errori ricorrenti e verifica dell’authority)
Estrazione di informazioni anagrafiche dal sito web e confronto con le stesse informazioni disponibili nel registro delle imprese
3 – Data analytics Tecniche di web scraping per l’acquisizione dei dati web
Tecniche di text mining per estrarre l’informazione richiesta
Tecniche di machine learning per l’impiego di algoritmi che simulano un processo di apprendimento per la costruzione di modelli predittivi
4 – Inferenza Riporto alla popolazione target delle distribuzioni di interesse calcolate sui valori predetti nelle imprese con siti web in cui si è operato il web-scraping

(Le fasi principali di processo per stimare le distribuzioni obiettivo che usano informazioni dai siti web)

I file Excel in allegato forniscono le stime relative al tasso di imprese (sul totale della popolazione di riferimento) che:

  1. offrono funzioni di web-ordering;
  2. presentano proposte di lavoro o informazioni sui posti di lavoro vacanti nell’impresa;
  3. hanno collegamenti ai social media (Facebook, Twitter, Instagram ecc.);
  4. mostrano una combinazione di alcune funzioni e / o servizi presenti sul sito web (si presentano delle statistiche sull’accostamento delle stime correnti e le stime supportate con le informazioni da siti web).

Rispetto all’edizione riferita al 2017, le stime del 2018 presentano tre principali novità: un aggiornamento del processo di data mining, uno stimatore modificato per ridurre il bias delle stime generato dalla selectivity della fonte Big Data; l’aggiunta delle stime dei parametri definiti al punto (4).

APPROFONDIMENTI

  1. Technical Report (in inglese)
  2. Producing contingency table estimates integrating survey data and Big Data (G. Bianchi, G. Barcaroli, P. Righi, M.Rinaldi, in inglese)

Periodo di riferimento: Anno 2018

Data di pubblicazione: 08 maggio 2020

Statistiche sperimentali

Statistiche sperimentali Cosa sono le statistiche sperimentali?

FEEDBACK
Vi invitiamo a lasciare osservazioni, commenti e suggerimenti sulle nostre statistiche sperimentali.
Potete inviare una email a:
statistiche-sperimentali@istat.it