Laboratorio per l’Innovazione

  • Ascolta questa pagina usando ReadSpeaker
  • Condividi
  • Lascia un feedback

Il Laboratorio per l’Innovazione è una delle infrastrutture di cui l’Istat si è dotato per rispondere all’evoluzione della domanda statistica, per migliorare la qualità dei processi produttivi e per rafforzare il ruolo della ricerca e dell’innovazione in Istituto.

Il Laboratorio offre l’opportunità di dedicare del tempo alla ricerca e mette a disposizione infrastrutture informatiche molto potenti e performanti utili a testare le proprie idee in uno spazio dedicato.

Ogni anno viene lanciata una call per raccogliere le idee innovative che poi vengono sottoposte ad un processo di valutazione che vede coinvolti esperti tematici, informatici e metodologi. Le idee che superano il processo di valutazione vengono ammesse al laboratorio e sviluppate in un periodo di circa quattro mesi. All’interno del Laboratorio si favorisce un’esperienza collaborativa in cui si integrano competenze e professionalità distinte.

Allo scopo di finalizzare lo sviluppo delle idee alla produzione statistica, è stato elaborato un programma d’innovazione che definisce quali sono le aree di priorità considerate innovative e di maggiore interesse per le attività d’Istituto:

  • nuove fonti di dati, Big-Data e nuove modalità di acquisizione;
  • miglioramento dei processi statistici, adozione di standard e linee guida fornite da iniziative internazionali;
  • nuove tecniche di navigazione, scoperta e visualizzazione dell’informazione, integrazione dati, open data, linked open data;
  • nuove tecnologie e metodologie ICT.

Infrastruttura Informatica

La realizzazione di progetti innovativi ha implicato un forte investimento informatico per  l’adeguamento e l’innovazione degli strumenti IT che devono fornire l’hardware e il software necessari all’implementazione delle idee. Una delle caratteristiche del Laboratorio Innovazione è il supporto agli utenti grazie ad un’architettura informatica che permette la realizzazione di progetti altrimenti non realizzabili nel normale ambiente di produzione. L’architettura informatica prevede una zona d’accesso al LabInn denominata zona “BlueSky”, dove sono presenti le sole postazioni d’accesso utente riservate esclusivamente ai membri dei team ammessi al Laboratorio, dette client endpoint, da cui accedere ad Internet e alla zona “operativa” del LabInn.

L’Infrastruttura “isolata” detta anche zona “operativa” è definita su una soluzione IperConvergente (Nutanix), che sfruttando pienamente i meccanismi di “TIERING” tra dischi a stato solido e dischi meccanici, assicura delle eccellenti performance, agevolando significativamente la gestione funzionale IT.
Inoltre utilizzando algoritmi di “DATA DEDUPLICATION”, che permettono di eliminare le ridondanze e ridurre di conseguenza l’occupazione globale di dati, è possibile aumentare la capacità di memorizzazione con risultati considerevoli in termini di risparmio di occupazione spazi “storage”.

La soluzione NUTANIX è integrata con schede GPU dedicate (nVidia TESLA P40).

La zona “operativa”, completamente virtualizzata su Hypervisor VMware ESXi, consta di due ambienti con regolamentazioni di flusso differenti:

  • l’ambiente “Workstation”, interamente predisposto con tecnologie di “Virtual Apps & Virtual Desktop” basato su tecnologie CITRIX, garantendo un elevato livello di sicurezza, una elevata “User Experience” (UX) ed una “governance” centralizzata di ottimo livello. In questo ambiente sono eseguite tutte le attività EndUser Oriented (WorkSpace Utente, applicazioni di tipo desktop e applicazioni funzionali all’acceso/gestione dell’ambiente “server” del LabInn) e che prevede l’accesso esclusivo all’ambiente “Server” del LabInn;
  • l’ambiente Server dove sono eseguite tutte le attività core BackEnd Oriented (esecuzione applicazioni, elaborazioni dati, machine learning, deep learning e calcolo), è composto da un discreto numero di Server Virtuali (VM), equipaggiati con sistemi operativi di tipo “MS Windows Server” e “RHEL Linux”, funzionali a consentire gli accessi necessari ai workload di riferimento ed eventualmente verso la rete Internet tramite l’exit point LabInn.

I due ambienti “Workstation” (SO: Windows 7) e “Server” (SO: Windows e Linux) costituiscono il vero e proprio LabInn, sono dotati di diversi equipaggiamenti software: software web oriented, DB Oracle dedicati, software development oriented e software di analisys and processing data.

Collaborazioni esterne

Uno degli obiettivi del LabInn è valorizzare il ruolo della ricerca anche attraverso le collaborazioni con il mondo della ricerca esterno all’Istat. Le collaborazioni esterne favoriscono ed agevolano il proficuo processo di interazione – già avviato in Istituto – con Enti di ricerca nazionali ed internazionali attraverso la costituzione di una rete di conoscenza, ricerca e innovazione che rafforzi il circuito virtuoso in cui l’Istituto è inserito grazie ad accordi partnership, convenzioni con altri enti e organismi di ricerca a livello nazionale ed internazionale.

Nello specifico, nell’ambito del LabInn lo sviluppo del progetto “Integrazione di dati provenienti da più fonti per il calcolo di indicatori socio-economici a livello comunale” è realizzato anche grazie alla collaborazione delle Università di Perugia  e di Pisa.

Progetti

  • Parallelizzazione dell’algoritmo di Metropolis-Hastings per la stima di intervalli di confidenza della dimensione di popolazione | Slide e  Poster Inaugurazione
  • MinHash: un nuovo strumento per l’integrazione di basi dati di grandi dimensioni | Slide
  • Utilizzo delle reti neurali per l’imputazione di dati mancanti relativi a lavoro e istruzione nel registro base degli individui | Slide
  • Recupero di dati contabili da testi non strutturati di bilanci d’impresa disponibili sul sito Telemaco attraverso tecniche di text-mining e webscraping avanzato| Slide
  • Sviluppo del sistema di restituzione di informazioni statistiche personalizzate alle imprese coinvolte nelle rilevazioni economiche | Slide
  • Sperimentazione di tecnologie LOD | Slide
  • Utilizzo delle tecniche di web scraping nella rilevazione ei prezzi al consumo per i pacchetti vacanza internazionali e nazionali | Slide
  • Integrazione di dati provenienti da più fonti per il calcolo di indicatori socio-economici a livello comunale | Slide Inaugurazione | Slide XIII Conferenza di Statistica

Progetti conclusi

  • Web scraping e la domanda di lavoro | Slide | Relazione tecnica
  • Classificazione avanzata del verde urbano da dati Open e Telerilevati | Slide e Poster Inaugurazione | Relazione tecnica
  • La georeferenziazione degli indirizzi: le coordinate geografiche | Slide | Relazione tecnica
  • Supporto alla raccolta dati per il Censimento dell’Agricoltura 2020: applicativo cartografico per l’integrazione delle mappe delle aziende agricole| Slide Inaugurazione | Poster 1,  Poster 2 XIII Conferenza di Statistica | Paper Convegno ESRI | Report
  • Web mining per integrare e validare informazioni del registro statistico delle imprese attive ASIA | Slide Inaugurazione | Slide XIII Conferenza di Statistica | Report

Contatti

LabInn – Laboratorio per l’Innovazione
Via De Pretis, 74
00184 Roma
laboratorioinnovazione@istat.it

Enrico Orsini
Tel. 06 4673.6550
eorsini@istat.it

Gerarda Grippo
Tel. 06 4673.3262
grippo@istat.it

Mario Magarò
Tel. 06 4673.2060
magaro@istat.it