Envie de connaître et comprendre

27 février 2009

La motivation première est l’envie de connaître et de comprendre. On ne peut vivre la vie de chercheur pleinement que si c’est une passion. C’est tellement enrichissant et tellement prenant qu’on peut se réveiller la nuit pour réfléchir à une ‘manip’, à un papier qu’on vient de lire, à une discussion qu’on a eue. Quand on est jeune et qu’on sent qu’on a intensément cette préoccupation dans la peau, il faut décider d’être chercheur, c’est tout simplement merveilleux. Cela ne veut pas dire qu’il n’y a pas des difficultés, des moments de déprime ou de doute. On a toujours peur au début quand on prend des responsabilités nouvelles : serai-je à la hauteur au niveau intellectuel ? Saurai-je organiser mon travail ? Parviendrai-je à nouer les bonnes relations de travail ? Peu importe, outrepassons ces doutes car il faut se lancer, batailler, travailler. Si on aime la recherche et si on aime la science, ça vaut le coup. Le métier de chercheur, intellectuellement, c’est LE bonheur.

Guy Riba

en ces temps troublés de réformes dans l’enseignement supérieur et la recherche, ça fait plaisir de lire de tels propos, notamment de la part de quelqu’un qui est maintenant dans les hautes sphères… (voir sa biographie sur le site de l’INRA)


Genome dark matter

23 février 2009

On a cru pendant longtemps que la complexité d’un organisme allait de pair avec la taille de son génome (voir ce billet). Puis l’on s’est rendu compte que c’était faux en mesurant la taille du génome de beaucoup d’organismes différents, mais ce n’est pas pour autant qu’on a compris pourquoi certains organismes avaient un génome beaucoup plus grand que d’autres… En parallèle de ça, une chercheuse travaillant sur des chromosomes de maïs a découvert dans les années 1950 des éléments génétiques un peu particuliers. On est tous plus ou moins familier avec l’ADN qui code pour une protéine, ce que l’on appelle le dogme de la biologie moléculaire (si vous ne savez pas ce que c’est, lisez d’abord l’article de Wikipédia) mais il existe des morceaux d’ADN capables de se multiplier dans les génomes: on appelle ça des éléments transposables (ETs).

nrg703-i1

Imaginons un morceau d’ADN qui code pour une protéine capable de reconnaître un motif d’ADN bien précis, par exemple le motif « CCAATG », et que lorsque la protéine s’attache à ce motif, elle soit capable de couper l’ADN à cet endroit et de le réinsérer ailleurs. Maintenant imaginons que, par hasard, à un moment donné, dans un organisme quelconque, le morceau d’ADN qui code pour cette protéine se retrouve avec, de part et d’autre, c’est-à-dire sur sa gauche et sur sa droite, le motif en question. Par un mécanisme proche du « couper-coller », ce morceau d’ADN, par l’intermédiaire de la protéine pour laquelle il code, peut se déplacer d’un endroit à un autre du génome (d’un locus à un autre).  Et si jamais ce bout d’ADN est répliqué lorsque la cellule se prépare à entrer en division, et qu’après avoir été répliqué il se déplace et s’insère à un autre locus qui n’a pas encore été répliqué, alors, lorsque ce deuxième locus sera lui aussi répliqué, le morceau d’ADN sera en deux exemplaires dans le génome. Et c’est peut-être ainsi que le premier élément transposables est né, il y a de ça plusieurs milliards d’années !

En continuant à imaginer un peu, on comprend bien que, tant que l’ET se déplace et/ou se multiplie sans gêner le reste du génome, il peut augmenter en nombre de copies jusqu’à représenter une très grande proportion du génome entier. De nombreux travaux en génétique des populations ont d’ailleurs cherché les conditions pour lesquelles un ET pouvait se maintenir dans une population (voir le graphique ci-dessous de l’évolution du nombre moyen d’ETs par individu dans une population). Et depuis la fin du XXe siècle, comme il devient de plus en plus « facile » de séquencer un génome entier, on peut rechercher les ETs et tenter de comprendre non seulement leur dynamique évolutive mais également leur impact sur la structure et la fonction du reste du génome (mmm, un beau sujet de thèse…).

dynamique d'une famille d'ETs

Pour en revenir au titre de ce billet, on a longtemps parlé de junk DNA concernant les ETs parce qu’en fin de compte, s’ils ne font que se multiplier, ils ne sont pas d’un grand intérêt pour l’organisme qui les porte dans son génome. De plus, la communauté scientifique a commencé à s’y intéresser en même temps que la théorie du gène égoïste, théorie selon laquelle chaque gène ne se préoccupe que de son succès évolutif propre, et non de celui de l’organisme qui le transmet. Et dans ce cadre, les ETs sont les parasites ultimes… Si l’on prend comme exemple le génome humain, on estime à 45% la portion du génome faite d’ETs. Si l’on sait également que moins de 1.5% du génome humain code pour des protéines, on estime alors que le reste corresponds en fait à d’anciens ETs très divergents mais plus reconnaissables en tant que tel. Et le plus étonnant, c’est que la majorité de cet ADN est transcrit: on appelle ça la dark matter des génomes…


Génomes et complexité

21 février 2009

On pense généralement que les humains sont tout en haut de la pyramide de l’évolution, qu’ils représentent le sommet ultime de la complexité. Bon, on sait maintenant depuis 150 ans qu’il est possible d’avoir des formes de vies très complexes sans recourir à un créateur, et d’ailleurs, depuis ce temps-là, les chercheurs établissent des théories et les valident régulièrement (voir cet article de Nature, en libre accès). Mais malgré cela, lorsque l’on observe l’éventail du vivant, on a quand même l’impression que certaines formes de vie sont plus complexes que d’autres. Et comme l’on sait que tout organisme vivant possède un génome, on a naturellement pensé que cette complexité se cachait au sein du génome, par exemple un organisme complexe possède un plus grand génome qu’un organisme peu complexe.

Considérons par exemple une liste d’organismes vivants: la levure Saccharomices cerevisae (utilisée pour la fermentation), la mouche Drosophila melanogaster (chouchou des généticiens) et le mammifère Homo sapiens (nous…). La levure a un génome de 13 Mb (13 millions de paires de bases), la mouche de 165 Mb et l’homme de 3 Gb. Jusque là, ça marche, mais si l’on considère le blé Triticum aestivum, son génome fait… 17 Gb ! Surprise: le blé que l’on a tendance à considérer comme « moins complexe » que nous a un génome plus de 5 fois plus grand ! De cette observation est né le « paradoxe de la valeur C« , la lettre C désignant la taille du génome haploïde d’un organisme, c’est-à-dire la taille du génome contenu dans un gamète. La figure 1 montre la distribution de la valeur C chez plusieurs ensembles d’organismes (sur ce graphique, la valeur C est en picogramme et non pas en paire de bases, mais le résultat est identique).

cvalues1

On a ensuite pensé au nombre de gènes de chaque organisme, mais ça n’a pas donné grand chose non plus à part un autre paradoxe, de la valeur « G » cette fois. Ceux qui veulent en savoir plus et jouer avec les données sous R peuvent suivre le tutoriel proposé par les chercheurs de l’Université de Lyon.

Cette question de la complexité continue à alimenter de grands débats mais maintenant les chercheurs essaient d’abord de comprendre ce que signifie « être plus complexe qu’un autre ». Les recherches ont considérablement étendu leur portée et impliquent maintenant les notions d’auto-organisation, émergence, entropie, etc… empruntées à l’informatique théorique, la physique, et les mathématiques (voir par exemple le nouvel Institut des Systèmes Complexes à Paris).

Cependant, en parallèle, d’autres recherches ont beaucoup avancé, notamment sur notre connaissance du génome, et ont permis de résoudre enfin ce fameux paradoxe de la valeur C. Suite au prochain numéro… !


Science et politique

12 février 2009

La science a le premier mot en tout mais le dernier en rien.

Victor Hugo

Cité par Eli Kintisch dans son article de Science en parlant de l’influence du conseiller scientifique du président des Etats-Unis.


Alignement de séquences

11 février 2009

Maintenant que l’on a vu ce qu’est une séquence d’ADN ainsi que le lien entre darwinisme et mendélisme, et après avoir introduit la génétique des populations par l’équilibre de Hardy-Weinberg, il est temps de parler de bioinformatique. Depuis que l’on sait que l’ADN est le support de l’hérédité, on s’est dépêché de trouver le moyen de séquencer des fragments d’ADN. On s’est donc retrouvé avec, d’un côté des séquences d’ADN, et de l’autre des questions du type: quelle est la fonction de cette séquence ? ces deux séquences ont-elles un ancêtre commun ?  à quoi ressemble l’action de la sélection naturelle sur une séquence d’ADN ? quels types de séquences sont trouvés dans un génome ? …

Ces questions ont ouvert de vastes champs de recherche tels que l’évolution moléculaire, la génomique fonctionnelle et comparative, la bioinformatique… Notamment, on s’est vite rendu compte que l’alignement de séquences était un point d’entrée quasi obligé. Par exemple, on se retrouve avec le problème suivant: étant donné une séquence X de longueur m et une séquence Y de longueur n, quel est le meilleur alignement de X avec Y ? Et par « meilleur alignement », on entend « celui qui reflète le mieux l’évolution des deux séquences à partir de leur ancêtre commun ».

Le cas le plus simple correspond à l’alignement deux-à-deux (pairwise en anglais). Mais on peut aussi chercher à comparer plus que deux séquences, faisant ainsi un alignement multiple. Par ailleurs, la notion de « meilleur alignement » requiert de connaître le processus évolutif auquel les séquences ont été soumises, on a donc besoin de modéliser les mutations au cours du temps. Cela permet ensuite de tracer la phylogénie d’un ensemble de séquences, cad leur généalogie. En fin de compte, les prédictions de la génétique des populations, et donc de la théorie de l’évolution, vont pouvoir être testées, et elles sont maintenant amplement prouvées.


Le problème de Darwin

11 février 2009

Darwin est connu, entre autre, pour la théorie de la sélection naturelle. Mais il lui a manqué toute sa vie une théorie convaincante de l’hérédité. Comme beaucoup à son époque, il croyait que les caractères des parents se mélangeaient dans leur descendance. Le problème, c’est qu’une telle théorie aboutit à une uniformisation de la population après quelques générations, mais sans variation la sélection naturelle ne peut pas agir…

De plus, il existait une controverse quant à la nature des changements évolutifs sous l’action de la sélection. Darwin était un « gradualiste », il pensait que les modifications étaient graduelles, incrémentales. D’autres comme Galton étaient plutôt des « saltationnistes », l’évolution progressant par sauts. A la suite de ses réflexions, Galton a introduit les concepts statistiques de corrélation et de régression: la génétique des populations (ainsi que l’association entre biologie et statistique) commençait à pointer le bout de son nez.

Les deux écoles de pensée se sont combattues pendant tout le début du XXe siècle, surtout avec la redécouverte des lois de Mendel en 1900. Mais petit à petit, il apparu clairement que le darwinisme (la théorie de la sélection naturelle) et le mendélisme (la génétique comme théorie de l’hérédité) étaient intimement liés. Pour s’en rendre compte, il suffit de voir l’équilibre de Hardy-Weinberg. En effet, s’il n’y a aucun force évolutive agissant au sein de la population, la variation ne va pas disparaître: la critique concernant la théorie du mélange ne s’applique pas à l’hérédité mendélienne. La loi de Hardy-Weinberg montre que darwinisme et mendélisme, loin d’être incompatibles, sont quasiment inséparables ! Et comme le dit Ewens dans son fameux livre « Mathematical Population Genetics« :

Il serait difficile d’imaginer un processus héréditaire autre que le schéma quantal mendélien [le gène est l’unité discrète d’hérédité] dans lequel la sélection naturelle pourrait agir avec suffisamment d’efficacité alors que d’un autre côté les différences de valeur sélectives entre génotypes conduiront normalement à des changements des fréquences alléliques et ainsi à l’évolution.


%d blogueurs aiment cette page :