Stage: Creazione di un’applicazione in Rails per creare automaticamente sistemi di data warehouse per dati biologici.

Nell’ambito dei diversi progetti di ricerca attivi, vi è la necessità di sviluppare un sistema di data warehousing, che possa gestire ed immagazzinare i dati prodotti dalle nuove tecnologie di sequenziamento del genoma. Questo sistema dovrà rispondere a diverse caratteristiche, tra cui flessibilità e scalabilità per adattarsi alle grandi quantità di dati (centinaia di gigabyte) generati dai nuovi sequenziatori. Il sistema di data warehouse dovrà prevedere anche una parte di filtraggio e preprocessing dei dati in ingresso, oltre alla capacità di collegarsi a diversi database esistenti, per poter interrogare, correlare ed aggregare tra loro le informazioni provenienti da diverse fonti e relative ai dati biologici in esame. Durante il periodo di stage, lo studente dovrà sviluppare un’applicazione in Ruby on Rails che consenta di generare automaticamente uno scaffold funzionante per sistemi di data warehouse di questo tipo, inclusa la parte di visualizzazione via web. L’applicazione genererà lo scaffold sulla base di una serie di dati di configurazione iniziali e sarà distribuita tramite la piattaforma RubyGems, in modo che possa essere facilmente riutilizzabile ed applicabile a diversi progetti di ricerca.

Luogo

Parco Tecnologico Padano — Lodi — http://www.tecnoparco.org

Requisiti

Conoscenza DBMS e Linux. Familiarità con Ruby e framework Ruby on Rails.

Competenze acquisibili

Esperienza con la meta-programmazione, lo sviluppo di database e applicazioni web che supportino grandi quantità di dati. Acquisizione di competenze con il framework Ruby on Rails.

Risultati attesi

Sviluppo di un’applicazione in Rails per la creazione automatica di sistemi di data warehouse.

Per informazioni contattare

Gianluca Della Vedova <gianluca.dellavedova@unimib.it> oppure Francesco Strozzi <Francesco.strozzi@tecnoparco.org>

Tempo di realizzazione: 3 mesi

Analisi sperimentale di algoritmi di clustering

Il problema del clustering è uno dei più comuni in Informatica e consiste nel raggruppare elementi “simili” di un insieme, data una opportuna nozione di similarità. Abbiamo disegnato alcuni algoritmi ed effettuato un’analisi di natura teorica per tali algoritmi. Siamo interessati ad implementarli e a analizzare sperimentalmente la bontà di tali algoritmi.

Realizzazione di un database per la gestione di informazioni genomiche

Lo splicing alternativo è il meccanismo biologico che espande la complessità del proteoma negli organismi multicellulari. PIntron è un progetto di ricerca, sviluppato all’interno del laboratorio, che si occupa di sviluppare strumenti software per la predizione di eventi di splicing alternativo. L’obiettivo della tesi consiste nel disegnare una base di dati per la memorizzazione di dati biologici relativi a splicing alternativo e nello sviluppo di opportune interfacce di interrogazione ed esplorazione della base di dati.

Contatti: Prof. Paola Bonizzoni, Raffaella Rizzi

Requisiti: conoscenza di base di Linux, interesse nello sviluppo di applicazioni web in ambienti virtuali

Note: Questa proposta è principalmente orientata a studenti della laurea di primo livello (stage). Studenti della laurea magistrale interessati alla proposta sono pregati di discutere con i referenti per valutare possibili estensioni della stessa ai fini di tesi.

Colloquium on Unconventional models of Computation

On September 28, 2009 we have organized a 1-day workshop within the Italian Conference on Theoretical Computer Science. The colloquium is devoted to various aspects of unconventional computation, with contributions ranging from theory to experiments and applications. Some of the topics that will be covered include molecular and membrane computing, nature-inspired computational paradigms, algorithmic bioprocesses.

ASWorkshop

On October 3, 2008 we have organized a 1-day workshop with title Alternative Splicing in Animals and Plants. The aim of this workshop is to bring together the knowledge of researchers from different areas, ranging from theory of algorithms, molecular biology, computational biology and plant and human genomics, that are involved in the thorough investigation of this key mechanism by both computational and experimental approaches. More information can be found at the conference website.