Stage Interno: Rifattorizzazione programma per il calcolo di splicing alternativo

Descrizione

PIntron è un programma sviluppato dal nostro gruppo di ricerca per il calcolo della struttura esoni-introni di un gene. Questo software viene attualmente utilizzato per alimentare uno dei principali database biologici  dedicati agli effetti del fenomeno biologico chiamato splicing alternativo.

Per adattare questo software ai dati derivanti dalle nuove tecnologie di sequenziamento, diventa necessario pensare una rifattorizzazione del codice ed alla preparazione di un insieme di test (di regressione e unit test) per evitare di compromettere la qualità delle predizioni.

Luogo

DISCo – Unimib

Requisiti

Conoscenze basilari del linguaggio di programmazione C e di test dei programmi.

Competenze acquisibili

Capacità di lavorare su programmi scritti in C. Capacità di usare un sistema di controllo di versione (git). Capacità di relazionarsi con persone aventi competenze eterogenee, lavoro di team, tempistiche di consegna e valutazione di fattibilità.

Risultati attesi

Aggiornamento del programma PIntron. Realizzazione di una sperimentazione per valutare le modifiche apprortate.

Per informazioni contattare

Gianluca Della Vedova <gianluca.dellavedova@unimib.it> o Raffaella Rizzi <raffaella.rizzi@unimib.it>

Tempo di realizzazione

3 mesi

Stage Interno: Confronto di approcci per lo spliced alignment

Descrizione

Il problema dello spliced alignment consiste nel allineare una porzione di trascritto con un genoma di riferimento. II programma che affronta questo problema viene detto spliced aligner e realizza uno dei passi principali di un sistema di predizione di splicing alternativo: PIntron. 

L’obiettivo dello stage consiste nel sostituire in PIntron lo spliced aligner attualmente utilizzato con GSnap e verificare sperimentalmente gli effetti di tale sostituzione nei tempi di esecuzione e nella qualità delle predizioni.

Luogo

DISCo – Unimib

Requisiti

Conoscenze basilari del linguaggio di programmazione C.

Competenze acquisibili

Capacità di lavorare su programmi scritti in C. Capacità di eseguire e comprendere una valutazione statistica dei risultati di una sperimentazione. Capacità di usare un sistema di controllo di versione (git). Capacità di relazionarsi con persone aventi competenze eterogenee, lavoro di team, tempistiche di consegna e valutazione di fattibilità.

Risultati attesi

Aggiornamento del programma PIntron. Realizzazione di una sperimentazione per valutare le modifiche apprortate.

Per informazioni contattare

Gianluca Della Vedova <gianluca.dellavedova@unimib.it> o Raffaella Rizzi <raffaella.rizzi@unimib.it>

Tempo di realizzazione

3 mesi

Stage Interno: Sviluppo applicazione web per indentificazione di splicing alternativi

Descrizione

Vogliamo realizzare un’applicazione web che si interfacci ad un software esistente (PIntron) che predice la struttura esoni-introni di un gene. Questo software viene attualmente utilizzato per alimentare uno dei principali database biologici  dedicati agli effetti del fenomeno biologico chiamato splicing alternativo.

L’obiettivo dello stage consiste nella creazione di una interfaccia web per utilizzare il software. Nello stage è previsto l’utilizzo del framework di sviluppo web Ruby on Rails.

Luogo

DISCo – Unimib

Requisiti

Conoscenze basilari di programmazione web.

Competenze acquisibili

Capacità di sviluppare applicazioni web con Ruby on Rails. Capacità di usare un sistema di controllo di versione (git). Capacità di relazionarsi con persone aventi competenze eterogenee, lavoro di team, tempistiche di consegna e valutazione di fattibilità.

Risultati attesi

Progettazione e implementazione di un’applicazione web per la bioinformatica.

Per informazioni contattare

Gianluca Della Vedova <gianluca.dellavedova@unimib.it>

Tempo di realizzazione

3 mesi

Incontro di Presentazione di Stage e Tesi

Il gruppo di ricerca AlgoLab (http://www.algolab.eu/), principalmente associato con il laboratorio di Bioinformatica e Calcolo Naturale, propone Stage e Tesi riguardanti la gestione e analisi di grandi quantità di dati (big data analysis).
Le proposte permettono agli studenti di acquisire competenze e conoscenze spendibili in ogni ambito professionale, quali Ruby, Ruby on Rails, Hadoop, Puppet, e VirtualBox.
La presentazione delle proposte da parte dei supervisori interni e esterni (Istituto Nazionale di Genetica Molecolare e Parco Tecnologico Padano) sarà:

Martedì 29 Maggio 2012 alle ore 11.30
aula Seminari – Ed. U14

Tutti gli studenti interessati (o semplicemente curiosi) sono invitati a partecipare.
Per informazioni: Gianluca Della Vedova <gianluca.dellavedova@unimib.it>

Alcune proposte sono:

  • Sviluppo ed estensione API per il database Ensembl

  • Puppet per il provisioning in ambiente virtualizzato – cloud

  • Creazione di un’applicazione in Rails per creare automaticamente sistemi di data warehouse per dati biologici

  • Creazione di un’applicazione Rails per l’annotazione e condivisione di dati e informazioni Immunologiche

  • Realizzazione di un ambiente di virtualizzazione per la Bioinformatica

Incontro di Presentazione di Stage e Tesi

Il gruppo di ricerca AlgoLab (http://www.algolab.eu/), principalmente associato con il laboratorio di Bioinformatica e Calcolo Naturale, propone Stage e Tesi riguardanti la gestione e analisi di grandi quantità di dati (big data analysis).
Le proposte permettono agli studenti di acquisire competenze e conoscenze spendibili in ogni ambito professionale, quali Ruby, Ruby on Rails, Hadoop, Puppet, e VirtualBox.
La presentazione delle proposte da parte dei supervisori interni e esterni sarà:

Giovedì 2 Febbraio 2012 alle ore 14.30
aula T023 – Ed. U14

Tutti gli studenti interessati (o semplicemente curiosi) sono invitati a partecipare.
Per informazioni: Gianluca Della Vedova <gianluca.dellavedova@unimib.it>

Il materiale presentato durante l’incontro è scaricabile:

Tesi: Creazione di un’applicazione Rails per l’annotazione e condivisione di dati e informazioni Immunologiche

Descrizione

Il nostro centro di ricerca ha come risorsa strategica la conoscenza immunologica derivante dall’esperienza dei ricercatori e dalle informazioni che ogni giorno altri laboratori producono sotto forma di articoli scientifici. Diversi database pubblici descrivono gran parte della conoscenza oggi disponibile ma non possono descrivere in dettaglio i singoli esperimenti che vengono condotti e soprattutto non possono rappresentare le informazioni frammentate e dettagliate che i singoli ricercatori hanno in uno specifico campo non ancora ampiamente esplorato oppure pubblicato. L’idea del progetto è quella di costruire uno strumento nella forma di applicazione web, utilizzando il framework Ruby on Rails,  che permetta di catalogare, organizzare e stabilire relazioni per esperimenti, letteratura oppure conoscenza interna. Dovrà essere possibile interrogare lo strumento anche in modo automatico con delle API web-resting, in modo da poter integrare i dati di analisi con quelli pubblici e annotati internamente.

In questo progetto il datastore potrebbe essere anche un sistema NoSQL.

Opzionale: esportazione della base di dati in formato RDF. https://github.com/helios/bioruby-rdf http://it.wikipedia.org/wiki/Resource_Description_Framework

Luogo

Istituto Nazionale di Genetica Molecolare  — Milano — http://www.ingm.org

Requisiti

Conoscenza di base di Ruby, database.

Competenze acquisibili

Capacità di relazionarsi con persone aventi competenze eterogenee, lavoro di team, tempistiche di consegna e valutazione di fattibilità, framework Ruby on Rails per la creazione di applicazioni web e tecniche di meta-programmazione in Ruby, concetti di database documentali (NoSQL)

Risultati attesi

Un applicazione web interna che permetta la catalogazione della conoscenza

Per informazioni contattare

Gianluca Della Vedova <gianluca.dellavedova@unimib.it> oppure Raoul Bonnal <bonnal@ingm.org>

Tempo di realizzazione

6 mesi

Stage: Puppet per il provisioning in ambiente virtualizzato – cloud

Descrizione

Un laboratorio di Bioinformatica è un ambiente dinamico dove nuovi software, librerie e strumenti in genere devono essere aggiornati e disponibili in breve tempo. Inoltre, la possibilità di costruire in casa un sistema Cloud consente di avere un numero variabile di istanze di macchine che devono essere amministrate in modo dinamico. La gestione di queste richieste se non affrontata nel modo opportuno può, a lungo andare, introdurre delle criticità nel comparto IT e conseguentemente nei servizi di calcolo e strategici che questo eroga. Utilizzando tecniche di provisionig: deployment di configurazioni, applicativi e servizi, è possibile rispondere in modo efficiente e elastico a queste esigenze.  Uno strumento di successo in questo ambito, OpenSource e scritto in Ruby, è Puppet che tramite un DSL (Domain Specific Language) permette con estrema semplicità di descrivere e gestire anche situazioni particolarmente complesse. In questo progetto lo studente verrà affiancato al reparto IT e seguirà le fasi di realizzazione di una configurazione base per poi svilupparne una ad hoc.

Luogo

Istituto Nazionale di Genetica Molecolare  — Milano — http://www.ingm.org

Requisiti

Conoscenza di sistemi Linux

Competenze acquisibili

Configurazione e creazione di un sistema di provisioning master slave con Puppet.
Installazione e configurazione automatica di macchine virtuali (Linux)

Risultati attesi

Un sistema Puppet funzionante con una serie di “ricette” per la gestione di differenti situazioni: database, web server e sviluppo.

Per informazioni contattare

Gianluca Della Vedova <gianluca.dellavedova@unimib.it> oppure Raoul Bonnal <bonnal@ingm.org>

Tempo di realizzazione

3 mesi