© The author; licensee Universidad Nacional de Colombia.
Revista DYNA, 85(204), pp. 108-116, March, 2018, ISSN 0012-7353
DOI: http://dx.doi.org/10.15446/dyna.v85n204.60078
DNA fragment assembling using a novel GPU firefly algorithm
•
Pablo Javier Vidal & Ana Carolina Olivera
Consejo Nacional de Investigaciones Científicas y Técnicas, Centro de Investigaciones y Transferencia Golfo San Jorge & Universidad Nacional de la
Patagonia Austral, Caleta Olivia, Argentina. pjvidal@conicet.gov.ar, acolivera@conicet.gov.ar
Received: September 15
th,
de 2016. Received in revised form: August 15
th,
2017. Accepted: October 5
th
, 2017
Abstract
The Deoxyribonucleic Acid Fragment Assembly Problem (DNA-FAP) consists in reconstruct a DNA chain from a set of fragments taken
randomly. Several authors solved the DNA-FAP using different approaches. In general, although it was obtaining good results; the
computational time associated is high. The Firefly Algorithm (FA) is a bioinspired model based on the behaviour of fireflies. Considering
that FA is a population bioinspired algorithm is possible design a parallel model of itself on Graphics Processing. In this work, a FA
especially development for its execution on GPU is presented in order to accelerate the computational process to solve the DNA-FAP.
Through several experiments the efficiency of the algorithm and the quality of the results were demonstrated.
Keywords: fragment assembly problem; firefly algorithm; graphics processing units; optimization; parallelism.
Ensamblado de fragmentos de ADN utilizando un novedoso
algoritmo de luciérnaga en GPU
Resumen
El problema de ensamblado de fragmentos de cadenas de ácido desoxirribonucleico (Deoxyribonucleic Acid Fragment Assembly Problem,
DNA-FAP) consiste en la reconstrucción de cadenas de ADN desde un conjunto de fragmentos tomados aleatoriamente. El DNA-FAP ha
sido resuelto por diferentes autores utilizando distintos enfoques. Aunque se obtienen buenos resultados, el tiempo computacional asociado
es alto. El algoritmo de luciérnaga (Firefly Algorithm, FA) es un modelo bioinspirado basado en el comportamiento de las luciérnagas. Al
ser un algoritmo bioinspirado poblacional es posible generar un modelo paralelo del mismo sobre Unidades de Procesamiento Gráfico
(Graphics Processing Units, GPU). En este trabajo un algoritmo de luciérnaga es diseñado especialmente para ser ejecutado sobre una
arquitectura GPU de manera tal de acelerar el proceso computacional buscando resolver el DNA-FAP. A través de diferentes experimentos
se demuestra la eficiencia computacional y la calidad de los resultados obtenidos.
Palabras clave: ensamblado de fragmentos de ADN; algoritmo de luciérnaga; unidades de procesamiento gráfico; optimización;
paralelismo.
1. Introducción
La necesidad de conocer y predecir mutaciones somáticas
y realizar distintos estudios relacionados con el desarrollo de
los seres vivos es un tópico de relevancia por su impacto en
la medicina para detección y tratamiento de patologías, la
investigación forense y el desarrollo de medicamentos. Entre
los problemas relacionados con el genoma podemos
encontrar el estudio del ensamblado de cadenas de ADN
(Deoxyribonucleic Acid Fragment Assembly Problem,
DNA-FAP), donde dado un conjunto de cientos o miles de
How to cite: Vidal, P.J. and Olivera, A.C., Ensamblado de fragmentos de ADN utilizando un novedoso algoritmo de luciérnaga en GPU. DYNA, 85(204), pp. 108-116, March,
2018.
fragmentos de ADN, que pueden contener errores, debemos
encontrar la secuencia de ADN original a partir de las
permutaciones de los fragmentos que mejor representen a
dicha secuencia [17].
Existen herramientas que automatizan el secuenciamiento
de ADN, entre ellas podemos nombrar PHRAP [13], TIGR
assembler [38] y EULER [32] entre muchas otras. Todas
estas herramientas están enfocadas a diferentes problemas
encontrados durante el ensamblado de fragmentos.
En los últimos años, varios autores han abordado el DNA-
FAP con metaheurísticas y algoritmos bioinspirados [26,33].