4 décembre 2003
Les protéines sont formées à partir de 20 acides-aminés codés par des triplets de nucléotides, appelles “codons”. Les quatre nucléotides (A,T,C,G) génèrent 64 codons, mais ces codons ne sont pas uniformément utilisés par la cellule. Au contraire, certains d’entre eux sont préférés et on parle alors de “biais des codons”. Il existe plusieurs types de biais de codons et certains sont reliés à des fonctions biologiques spécifiques. A partir de quelques idées mathématiques très simples appliquées à l’analyse des séquences nous avons développé une méthode pour détecter le biais des codons dominant chez les Procaryotes et Eucaryotes, et défini un cadre formel pour interpréter les relations entre organismes à partir de génomes entiers plutôt que de familles de protéines spécifiques. Cet espace permet de classer des ensembles d’organismes reliés par une “signature” commune. Notre analyse, basée sur 96 génomes Eubacteriens et Archaeens, suggère aussi l’hypothèse que cet espace reflète la géométrie d’un “espace physiologique” des Procaryotes. Dans ce sens, la combinaison entre génomes complets et signatures de biais des codons pourrait devenir un outil important pour déduire de l’information sur la physiologie d’un organisme et possiblement sur les conditions écologiques dans lesquelles les organismes bactériens et archéens ont évolué. Pour certains de ces organismes, il ne semble pas possible de détecter autrement cette information.
[Vidéo indisponible]