Costruzione di grafi di variazione

Proposta di tesi magistrale

La costruzione di un grafo di variazione (variation graph) che permetta di rappresentare un insieme di genomi viene fatta a partire da un allineamento multiplo dei genomi coinvolti. Al momento lo strumento più avanzato è seqwish, però quest’ultimo analizza principalmente gli allineamenti a coppie, perdendo quindi la visione d’insieme dell’allineamento e non riuscendo a gestire al meglio la presenza di variazioni strutturali, quali traslocazioni e inversioni, nell’allineamento multiplo.

Questa proposta prevede di studiare nuovi approcci per l’individuazione di variazioni strutturali a partire da un allineamento multiplo e di rappresentarli in un grafo di variazioni usando il modello HandleGraph che è pensato per minimizzare l’occupazione di memoria.

Inoltre è prevista l’implementazione in Rust o C++ di questi approcci per poi validare sperimentalmente le prestazioni in termini di tempo, memoria e qualità dei grafi ottenuti.