Algoritmo per assemblare long reads in grafi di splicing

Proposta di tesi magistrale

Assemblare grafi da sequenze è un classico problema in bioinformatica. Si vuole sviluppare un algoritmo per costruire un grafo di splicing (grafo di annotazione di un gene) a partire da sequenze long reads, che sono frammenti particolarmente lunghi. Per fare questo, si intende utilizzare un approccio basato su FM-index per confrontare tra loro long-reads nella costruzione del grafo.

Il lavoro di tesi prevede sia una parte teorica che implementativa e sperimentale.