Docking Inter/Intra-Molecular Mediante Metaheur´ ısticas Multi-objetivo Esteban L´ opez-Camacho, Mar´ ıa Jes´ us Garc´ ıa Godoy, Jos´ e Garc´ ıa-Nieto, Antonio J. Nebro y Jos´ e F. Aldana-Montes Resumen— El Acoplamiento Molecular (Molecular Docking) es un problema de optimizaci´ on de gran complejidad que consiste en predecir la orientaci´ on del dos mol´ eculas: el ligando y el receptor, de manera que formen un complejo molecular energ´ eticamente estable. El docking molecular es un problema tradi- cionalmente tratado con ´ exito mediante metaheur´ ısti- cas para la optimizaci´ on de un objetivo: la m´ ınima energ´ ıa libre de uni´ on. Sin embargo, en la literatura actual no se encuentran muchos trabajos que traten este problema desde el punto de vista multiobjetivo. En este sentido, todav´ ıa no existen estudios compara- tivos con el fin de dilucidar qu´ e t´ ecnica (o qu´ e tipo de ellas) ofrece un mejor rendimiento en general. En este estudio realizamos una comparativa experimental de una serie de algoritmos multiobjetivo representativos del estado del arte actual, para la resoluci´ on de ins- tancias complejas de docking molecular. En concreto, los algoritmos evaluados son: NSGA-II, ssNSGA-II, SMPSO, GDE3, MOEA/D y SMS-EMOA. Para ello, hemos seguido un enfoque de optimizaci´ on basado en las energ´ ıas inter- e intra-molecular, siendo ´ estos los dos objetivos a minimizar. En la evaluaci´ on de los al- goritmos hemos aplicado m´ etricas de rendimiento pa- ra medir la convergencia y la diversidad de los frentes de Pareto resultantes, respecto a frentes de referencia calculados. Adem´ as, en comparaci´ on con soluciones mono-objetivo obtenidas por t´ ecnicas de referencia en el problema (LGA), comprobamos c´ omo los algo- ritmos multi-objetivo evaluados son capaces de ob- tener conformaciones moleculares de m´ ınima energ´ ıa de acoplamiento. Palabras clave — Docking Molecular, Optimizaci´ on Multi-Objetivo, Comparativa Experimental I. Introducci´ on En el campo de la bioinform´ atica, el docking mo- lecular es un problema de optimizaci´on duro que consiste en predecir la orientaci´on del dos mol´ ecu- las: una peque˜ na (el ligando) y una macromol´ ecula (receptor), de manera que formen un complejo mole- cular energ´ eticamente estable. El objetivo principal es encontrar la conformaci´on ´ optima entre el recep- tor y el ligando, que resulte con m´ ınima energ´ ıa de acoplamiento. Este problema viene siendo tradicio- nalmente abordado mediante t´ ecnicas metaheur´ ısti- cas y otros m´ etodos computacionales inspirados en la naturaleza, obteniendo resultados satisfactorios en la optimizaci´on de un ´ unico objetivo: la energ´ ıa m´ ıni- ma de uni´on de mol´ eculas con cierto grado de fle- xibilidad [1]. Sin embargo, no se pueden encontrar muchos trabajos en la literatura donde se trate es- te problema con un enfoque multi-objetivo. En este sentido, un primer intento fue propuesto en 2006 por Khaos, Dpto. de Lenguajes y Ciencias de la Computaci´ on, Universidad de M´ alaga E-mail: {esteban,mjgarciag,jnieto,antonio,jfam}@lcc.uma.es Oduguwa et al. [2], en el que se eval´ uan los algorit- mos NSGA-II, PAES y SPEA en el docking de tres complejos moleculares. Grosdidier et al. [3] propuso en 2007 una adaptaci´on de un algoritmo evolutivo llamado EADock en el entorno CHARMM de Har- vard Macromolecular Mechanics. En 2008, Janson et al. [4] dise˜ naron un algoritmo multi-objetivo pa- ralelo llamado ClustMPSO, que utiliza un m´ etodo k-means para guiar la estrategia de migraci´on en- tre islas. ClustMPSO utiliza el modelo de evaluaci´on de AutoDock y fue probado para la conformaci´on ´ optima de seis complejos moleculares. Este mismo a˜ no, Boisson et al. [5] implementaron un modelo bi- objetivo evolutivo mediante la librer´ ıa ParadisEO y GOLD para la evaluaci´on de seis instancias molecu- lares. Recientemente, Sandoval-Perez et al. [6] utili- zaronla implementaci´on de NSGA-II de laplatafor- ma jMetal [16] para optimizar las energ´ ıas de enlace como dos objetivos para el docking de cuatro instan- cias. La mayor´ ıa de estos trabajos presentan la apli- caci´onde una t´ ecnica aislada a un conjunto limitado de instancias moleculares de complejidad moderada en t´ erminos de flexibilidad. Adem´as, a´ un no se ha realizado una comparativa algor´ ıtmica mono/multi- objetivo sobre un conjunto de compuestos molecula- res lo suficientemente amplio y aplicando flexibilidad tanto a los ligandos como a los receptores, dado pie a instancias complejas. En este trabajo, nuestra principal motivaci´ on es la realizaci´ on de una comparativay an´alisis exhaus- tivo sobre el rendimiento de seis metaheur´ ısticas multi-objetivo en el docking molecular, centr´ ando- nos adem´ as en compuestos moleculares de alta fle- xibilidad de conformaci´on. Los algoritmos evalua- dos son: Nondominated Sorting Genetic Algorithm II (NSGA-II) [7] y su versi´on de estado estacionario (ssNSGA-II) [8], Speed Modulation Multi-Objective Particle Swarm Optimization (SMPSO) [9], Third Evolution Step of Generalized Differential Evolu- tion (GDE3) [10], Multi-Objective Evolutionary Al- gorithm Based on Decomposition (MOEA/D) [11] y S Metric Evolutionary Multiobjective Optimiza- tion (SMS-EMOA) [12]. Estos algoritmos constitu- yen un conjunto variado de t´ ecnicas modernas multi- objetivo (NSGA-II es utilizado como t´ ecnica bien conocida de control) del estado del arte, que desa- rrollan modelos diferentes de aprendizaje e inducen comportamientos heterog´ eneos en t´ erminos de con- vergencia, diversidad y escalabilidad. En este senti- do, todos estos algoritmos vienen mostrando resulta-