- Home
- /
- Statistica sperimentale
- /
- Modalità di utilizzo dei...
Modalità di utilizzo dei siti web da parte delle imprese
L’Istat rende disponibili le stime all’anno di riferimento 2018 delle funzionalità e servizi offerti dai siti web delle imprese. Tali stime sono supportate dalle informazioni raccolte attraverso l’indagine sull’utilizzo dell’ICT nelle imprese con almeno 10 addetti e di quelle raccolte direttamente dalle pagine web delle imprese secondo il seguente flusso di processo:
1 – Acquisizione dell’indirizzo web | URL disponibili da fonti amministrative URL ottenibili da portali tematici URL ottenuti mediante utilizzo in batch di motori di ricerca (tecniche di URL retrieval) |
---|---|
2 – Identificazione impresa | Controllo della validità dell’URL (errori ricorrenti e verifica dell’authority) Estrazione di informazioni anagrafiche dal sito web e confronto con le stesse informazioni disponibili nel registro delle imprese |
3 – Data analytics | Tecniche di web scraping per l’acquisizione dei dati web Tecniche di text mining per estrarre l’informazione richiesta Tecniche di machine learning per l’impiego di algoritmi che simulano un processo di apprendimento per la costruzione di modelli predittivi |
4 – Inferenza | Riporto alla popolazione target delle distribuzioni di interesse calcolate sui valori predetti nelle imprese con siti web in cui si è operato il web-scraping |
(Le fasi principali di processo per stimare le distribuzioni obiettivo che usano informazioni dai siti web)
I file Excel in allegato forniscono le stime relative al tasso di imprese (sul totale della popolazione di riferimento) che:
- offrono funzioni di web-ordering;
- presentano proposte di lavoro o informazioni sui posti di lavoro vacanti nell’impresa;
- hanno collegamenti ai social media (Facebook, Twitter, Instagram ecc.);
- mostrano una combinazione di alcune funzioni e / o servizi presenti sul sito web (si presentano delle statistiche sull’accostamento delle stime correnti e le stime supportate con le informazioni da siti web).
Rispetto all’edizione riferita al 2017, le stime del 2018 presentano tre principali novità: un aggiornamento del processo di data mining, uno stimatore modificato per ridurre il bias delle stime generato dalla selectivity della fonte Big Data; l’aggiunta delle stime dei parametri definiti al punto (4).
APPROFONDIMENTI
- Technical Report (in inglese)
- Producing contingency table estimates integrating survey data and Big Data (G. Bianchi, G. Barcaroli, P. Righi, M.Rinaldi, in inglese)