in collaborazione con Parco Tecnologico Padano – PTP (http://www.tecnoparco.org/)
Descrizione
Nell’ambito dei diversi progetti di ricerca attivi, vi è la necessità di sviluppare un sistema di data warehousing, che possa gestire ed immagazzinare i dati prodotti dalle nuove tecnologie di sequenziamento del genoma. Questo sistema dovrà rispondere a diverse caratteristiche, tra cui flessibilità e scalabilità per adattarsi alle grandi quantità di dati (centinaia di gigabyte) generati dai nuovi sequenziatori. Il sistema di data warehouse dovrà prevedere anche una parte di filtraggio e preprocessing dei dati in ingresso, oltre alla capacità di collegarsi a diversi database esistenti, per poter interrogare, correlare ed aggregare tra loro le informazioni provenienti da diverse fonti e relative ai dati biologici in esame.
Durante il periodo di stage, lo studente dovrà sviluppare un’applicazione in Ruby on Rails che consenta di generare automaticamente uno scaffold funzionante per sistemi di data warehouse di questo tipo, inclusa la parte di visualizzazione via web. L’applicazione genererà lo scaffold sulla base di una serie di dati di configurazione iniziali e sarà distribuita tramite la piattaforma RubyGems, in modo che possa essere facilmente riutilizzabile ed applicabile a diversi progetti di ricerca.
Requisiti: Conoscenza DBMS e Linux. Familiarità con Ruby e il framework Ruby On Rails (o interesse ad apprenderlo).
Competenze acquisibili: Esperienza con la meta-programmazione, lo sviluppo di database e applicazioni web che supportano grandi quantità di dati. Acquisizione di competenze con il framework Ruby on Rails.
Risultati attesi: Sviluppo di un’applicazione in Rails per la creazione automatica di sistemi di data warehouse.
Tempo di realizzazione: 3 mesi
Contatti:
Gianluca Della Vedova (referente interno) – gianluca.dellavedova@unimib.it
Francesco Strozzi (referente esterno) – francesco.strozzi@tecnoparco.org