Détection de régions génomiques homologues par un algorithme de flot avec coûts Eric Audemard, Thomas Faraut, Thomas Schiex INRA toulouse; Chemin de Borde Rouge BP 52627, 31326 Castanet Tolosan cedex , France {eric.audemard,thomas.faraut,thomas.schiex}@toulouse.inra.fr Résumé : L’identification de régions génomiques homologues, c’est à dire possédant une origine ancestrale commune, est centrale à l’étude des génomes. La difficulté résulte de l’érosion des traces de cette relation d’homologie. Le principe est alors de rechercher des signatures d’homologie parmi un ensemble de courtes régions similaires. Nous présentons un formalisme modélisant toutes les solutions dans un graphe. Dans ce graphe, un chemin est une représentation de deux régions potentiellement homologues et notre but est de retrouver un ensemble cohérent de chemins, c’est à dire de régions homologues. Cet ensemble est reconstruit à l’aide d’une méthode d’optimisation globale basée sur la théorie des flots. Mots-Clés : bioinformatique, évolution des génomes, génomique comparative, flots, réseaux de transport. 1 Introduction La recherche d’une relation de parenté, c’est à dire d’une origine ancestrale commune, appelée également relation d’homologie, entre gènes d’espèces différentes, ou au sein d’une même espèce, est une étape importante de l’étude des génomes. La mise en évidence d’une origine ancestrale commune de deux gènes, ou plus généralement de deux régions porteuses d’une fonction biologique, fournit des arguments en faveur d’une fonction biologique commune. Cette recherche d’origine ancestrale commune est surtout centrale à l’étude de l’évolution des gènes, des génomes et des espèces. Avec l’arrivée des génomes entièrement séquencés, cette recherche de relations de parenté se transpose naturellement aux segments des chromosomes. L’origine commune des espèces implique que deux espèces quelconques partageaient la même organisation chromosomique chez leur plus proche parent. Pour ces deux espèces, les organisations chromosomiques actuelles sont le résultat d’une histoire évolutive propre, puisque indépendante depuis leur séparation (spéciation), faite de mutations chro- mosomiques de différentes natures (de la substitution de nucléotides à des réarrangements chromo- somiques pouvant impliquer l’échange de grands fragments entre chromosomes). Une forte similitude entre deux régions chromosomiques suggère une conservation depuis leur plus proche parent. On parle alors de segments chromosomiques conservés, ou de segments homologues, et l’identification de cette conservation correspond à la mise en évidence d’une origine ancestrale commune pour ces segments chromosomiques et permet d’appliquer, à cette échelle, la démarche d’inférence de fonction et l’étude de l’évolution des génomes. La recherche de segments homologues au sein de génomes entièrement séquencés fait l’objet du présent travail. Peu après la séparation de deux espèces, la conservation des génomes est telle qu’il est facile de les comparer (aligner) et d’identifier les longs segments chromosomiques conservés. Lorsque la spéciation