Un mare di dati per una montagna di neve
Fino a qualche anno fa, erano ben poche le occasioni in cui grandi aziende e piccoli imprenditori decidevano di unire le forze e lavorare insieme. Ma questi tempi sono finiti: oggi, per nostra fortuna, big corporate e piccole start-up collaborano sempre più spesso con l’obiettivo di creare solide partnership che da un lato possano portare benefici di natura finanziaria alle seconde e dall’altro possano aiutare le prime ad innovarsi e rimanere competitive sul mercato. Open Innovation significa proprio questo, ed è anche grazie all’importante ruolo giocato da incubatori come i Business Innovation Centre (BIC) di Trentino Sviluppo che queste collaborazioni diventano realtà!
L’esperienza ed il progetto che vorrei raccontare in questo articolo è partito proprio della nostra vittoria alla seconda edizione della BIC Open Challenge, un contest nazionale che premia e supporta le start-up che rispondono con una soluzione innovativa ad una sfida lanciata da un’azienda insediata nei BIC di Trentino Sviluppo. La sfida quest’anno era stata lanciata dall’azienda altoatesina TechnoAlpin, leader nella produzione di impianti di innevamento, la quale ha una sede anche al BIC di Trento.
L’obiettivo: guidare e supportare TechnoAlpin in un radicale cambiamento nella gestione dei dati. In particolare, nella migrazione dall’utilizzo di un Data Warehouse ad un Data Lake.
Alt! Ma di cosa stiamo parlando esattamente? Data Warehouse e Data Lake sono due approcci alla gestione e al salvataggio dei dati totalmente diversi.
Il primo è un database costruito per un’analisi dati strutturata. In altre parole, la modalità di archiviazione dei dati è definita in anticipo ed è funzionale all’esecuzione di specifiche ricerche (query) e analisi. I dati necessitano quindi di essere puliti, arricchiti e trasformati in anticipo rispetto all’utilizzo che, a priori, si decide di farne.
Il Data Lake, invece, nasce da una prospettiva completamente ribaltata: i dati vengono raccolti e archiviati nel loro formato nativo (dati “grezzi”), a prescindere dall’utilizzo finale. Non è quindi necessaria la definizione a priori di schemi e modelli per la loro archiviazione, né tantomeno la loro elaborazione ex ante. Quest’ultima avverrà solamente nel momento in cui il dato è necessario per eseguire una specifica analisi, grazie a degli strumenti appositamente configurati.
Il motivo alla base dell’utilizzo di un Data Lake è la flessibilità: un dato “grezzo” può essere impiegato per più analisi (comprese quelle che, nel momento della raccolta dati, non erano ancora state ponderate) e che richiedono elaborazioni diverse dello stesso dato.
Nel contesto del progetto, la migrazione verso un approccio di tipo Data Lake ci ha quindi permesso di separare completamente il processo di raccolta dati da quello di organizzazione ed elaborazione. Per farlo, ci siamo affidati alla piattaforma Azure ed abbiamo utilizzato sia servizi dedicati Microsoft (Data Factory, Ingestion Pipeline, Vault e Data Bricks – giusto per fare qualche nome) che a strumenti specifici per l’analisi di data stream e per la gestione dei deployment (Terraform e Spark).
Il risultato è una piattaforma di raccolta dati più moderna e molto flessibile, in grado di raccogliere dati di natura diverse: da quelli provenienti dalle centinaia di centraline installate nei generatori di neve (i cosiddetti “cannoni”), a quelli che descrivono le condizioni meteorologiche. Solo in un secondo momento il sistema applica logiche di elaborazione ed analisi dati con l’obiettivo di preparare report accessibili tramite dashboard e applicazioni mobile da parte non solo di TechnoAlpin ma anche dei suoi clienti.
Inoltre, la flessibilità dell’approccio Data Lake permetterà a TechnoAlpin di aggiungere in autonomia nuove logiche di analisi future e di trattamento dati. In particolare, sarà possibile utilizzare questi dati per monitorare gli impianti di innevamento e sviluppare analisi predittive che permettano l’ottimizzazione e il risparmio delle risorse idriche ed energetiche impiegate. Un esempio? Incrociando i dati raccolti dai generatori con le analisi dei dati meteorologici, sarà possibile programmare la produzione di neve nelle fasce temporali più opportune.
In definitiva, questo progetto si è rilevato un’eccellente opportunità che ci ha permesso di mettere in campo le nostre competenze scientifiche e tecnologiche e dimostrare ancora una volta l’importanza che giocano oggi i dati: tutte le aziende ne dispongono, ed è importante sapere come gestirli e utilizzarli per trarne valore e creare un vantaggio competitivo.
Guarda la video-intervista a Daniele sul progetto!
Ti è piaciuto questo articolo?
Inserisci il tuo indirizzo e-mail per ricevere la nostra newsletter!
PS: odiamo lo spam proprio come te, quindi ti promettiamo solo un paio di newsletter all’anno con una raccolta degli articoli più interessanti!