Accès direct :    Recherche rapide :   OK
L'institut les_partenariats Les recherches les hommes et les femmes La science et vous
Dossiers scientifiques  | Le point sur...  | Apprendre, expérimenter  | Partager nos ressources  | Rencontrer l'Inra
 
 

Imprimer

Envoyer par courriel

Accueil > La science et vous > Dossiers scientifiques > Génomique > À lire et à voir > Dossier : La génomique végétale à l'Inra > Qu'est-ce que la génomique ?

Qu'est-ce que la génomique ?


Dossier : La génomique végétale à l'Inra - 2001

 

1. QU’EST-CE QUE LA GÉNOMIQUE ?

La génomique s’inscrit dans la continuité de la génétique, qu’elle dote d’outils d’analyse fine et directe du génome et d’une capacité de traitement très rapide d’un très grand nombre de données grâce à des équipements de type industriel. Elle intègre l’étude de la structure des génomes (génomique structurale) et l’analyse de la fonction des gènes (génomique fonctionnelle).

1.1. De la génétique à la génomique


La génétique, littéralement étude des gènes, consiste à étudier la transmission des caractères héréditaires d’une génération à l’autre. Les gènes sont définis comme des "facteurs héritables" gouvernant les caractéristiques d’un individu. Dans certains cas, un seul gène contrôle un caractère. Ce caractère est appelé monogénique. On peut citer l’exemple des caractères de peau lisse et de noyau adhérent qui distinguent les nectarines, les brugnons et les pêches. La nectarine (pêche à peau lisse et à noyau libre) et le brugnon (pêche à peau lisse et à noyau adhérent) sont en fait des mutants de pêches, connus depuis l’Antiquité, et déjà utilisés en croisement dans des programmes d’amélioration du pêcher au XIXe siècle.

C’est en observant des caractères monogéniques du pois que Gregor Mendel (1822-1884) a établi les premières lois fondamentales de la génétique.

Ces lois, très simples et universellement partagées par les plantes et les animaux, stipulent que :

  • un gène donné peut exister sous deux formes différentes (allèles) ;
  • un individu possède deux exemplaires de chaque gène, provenant chacun d’un de ses parents et portés par deux chromosomes dits homologues ;
  • l’individu ne transmet qu’un seul de ces allèles (au hasard) à chacun de ses descendants.

Certains allèles, dits dominants, imposent leur version du caractère à l’individu qui les porte. Chez un hétérozygote (les deux allèles du gène en question, provenant respectivement des deux parents, sont différents) c’est donc la forme du caractère imposée par l’allèle dominant qui sera exprimée. D’autres allèles, dits récessifs, sont masqués lorsqu’ils sont associés à un allèle dominant et sont traduits dans l’expression du caractère seulement lorsqu’ils sont présents à l’état homozygote (les deux allèles du gène en question, provenant respectivement des deux parents, sont identiques).

L’ensemble des allèles d’un individu constitue son génotype. L’ensemble de ses caractères (gouvernés par les gènes, exprimés dans un environnement donné) constitue son phénotype.

Les allèles provenant de chacun des parents de l’individu sont "réassortis" au cours d’une division cellulaire particulière appelée méiose, qui conduit à la formation des cellules sexuelles. Les cellules sexuelles (ou gamètes) ne contiennent qu’un seul allèle de chaque gène.

La recombinaison génétique à la méïose



Document © Inra
Si deux gènes A et B sont portés par le même chromosome, et si un individu transmet à un descendant l’allèle A1 du gène A, la probabilité qu’il transmette au même descendant l’allèle B1 du gène B reçu du même parent sera d’autant plus grande que ces deux gènes seront “proches” l’un de l’autre. S’ils sont très “proches” et donc la plupart du temps transmis ensemble, on dit que les gènes A et B sont liés. Si deux gènes A et C ne sont pas sur le même chromosome, alors ils sont transmis aux descendants de façon totalement indépendante de leur origine parentale. Plus les gènes A et B sont liés, plus la distance génétique qui les sépare est faible.


Thomas Morgan (1866-1945) a établi, en travaillant sur la mouche du vinaigre (Drosophila melanogaster), que la transmission des allèles parentaux à la descendance n’est pas totalement indépendante d’un gène à l’autre : il existe des “groupes de liaison” c’est-à-dire des grouped’allèles transmis plus souvent ensemble que “réassortis”. Il a montré que ces groupes de liaison correspondent en fait aux différents chromosomes de l’espèce. Tous les gènes portés par un chromosome devraient donc être transmis ensemble. Toutefois, le phénomène de recombinaison méiotique permet aux chromosomes hérités de chacun des deux parents (chromosomes homologues) d’échanger des fragments, et donc de dissocier des allèles portés par le même chromosome. On peut mesurer la distance génétique qui sépare deux gènes portés par le même chromosome en calculant leur fréquence de dissociation à la méiose.

La carte génétique d’un individu est la représentation des distances génétiques qui séparent les gènes. Elle est d’autant plus dense que l’on aura étudié plus de gènes et d’autant plus précise que l’on aura observé plus de descendants (mesure plus précise des fréquences de dissociation).

Cellule, noyau, ADN, ARN et protéines.

inraok3r.jpg

Une plante est constituée de différents organes (tige, racines, feuilles...) qui sont eux mêmes l’assemblage de tissus différenciés (épiderme, vaisseaux, mésophylle...) Chaque tissu est caractérisé par un type cellulaire. Les quelques milliards de cellules d’une plante sont donc de types différents, mais portent toutes le même patrimoine génétique.
Une cellule représente une entité fonctionnelle vivante, autonome pour un grand nombre de fonctions métaboliques. Ces fonctions, qu’elles soient communes à tous les types cellulaires ou spécifiques d’un type particulier, sont contrôlées par l’information génétique portée par les chromosomes situés dans le noyau. Le nombre de chromosomes est une caractéristique de l’espèce, ainsi que la façon dont les gènes sont organisés sur ceux-ci. Chaque chromosome est constitué d’une molécule d’ADN (acide désoxyribonucléique) portant l’information génétique, très compactée et enroulée autour de protéines.
L’information génétique est constituée de la suite des nucléotides (adénine, cytosine, guanine, thymine : A, C, G, T) portés par la double chaîne de l’ADN. L’ADN est constitué de séquences codantes assurant la fabrication de protéines par les cellules et de séquences non-codantes qui peuvent représenter une fraction importante de l’ADN. Un gène comprend une séquence d’ADN codant une protéine donnée et des séquences adjacentes permettant son expression, précédée, suivie, et parfois interrompue par des séquences d’ADN dit non-codant. Une partie du gène particulièrement importante pour son activité est le promoteur, qui est une séquence située en amont de la séquence codante et qui détermine dans quel type cellulaire, à quel moment du développement et sous l’effet de quel(s) stimulus le gène est actif.
L’expression d’un gène se déroule en deux étapes principales. Tout d’abord le gène est transcrit (copié) en une molécule d’ARN (acide ribonucléique) dit ARN messager (ARNm) qui sort ensuite du noyau. Dans le cytosol de la cellule, l’ARN messager (ARNm) est alors traduit (décodé) en protéine : la succession des nucléotides est “lue” trois par trois (en triplets) et chaque triplet détermine un élément possible de la chaîne protéique (acide aminé). La correspondance entre les triplets de nucléotides et les acides aminés constituant les protéines est appelée code génétique. Le code génétique est identique pour tous les êtres vivants. Selon sa fonction, la protéine synthétisée va alors être impliquée dans une voie métabolique, associée à d’autres protéines, intégrée dans une structure cellulaire, etc.


Un certain nombre de caractères particulièrement pertinents pour l’amélioration des plantes, tels que le rendement, l’adaptation aux pratiques culturales, la résistance à des contraintes de l’environnement ou à des maladies… sont des caractères complexes. Ces caractères peuvent souvent se décomposer en caractéristiques plus faciles à étudier : le rendement en grains à l’hectare est par exemple fonction du nombre de plantes à l’hectare, du nombre de ramifications par plante, du nombre d’épis ou de gousses par ramification et du poids d’un grain. Ils varient souvent de manière continue entre des valeurs extrêmes, et sont appelés pour cela des caractères quantitatifs. Ils sont gouvernés par plusieurs, voire de nombreux gènes qui peuvent agir chacun en proportion variable.

L’étude de l’association des allèles influant sur un caractère complexe a nécessité la mise en oeuvre d’outils mathématiques et statistiques qui ont permis le développement de la génétique quantitative.

Parallèlement, la découverte de la structure moléculaire des gènes a ouvert un domaine de recherche où la relation précise entre la séquence nucléotidique qui code l’information génétique et la fonction du gène (le produit protéique de ce gène et son implication dans la structure ou le métabolisme de la cellule et de l’organisme) constitue le sujet de l’étude. La génétique moléculaire a donc pour objet la molécule d’ADN et l’élucidation des informations qu’elle code grâce aux outils du génie génétique.



1.2. Les outils du génie génétique


Le génie génétique englobe un ensemble de concepts et de techniques qui permettent d’étudier et de modifier les gènes et leurs fonctions, au cœur même du fonctionnement des cellules et des organismes vivants. Ces outils, qui se sont développés au cours des trente dernières années grâce aux découvertes de la biologie moléculaire, ont permis des avancées remarquables dans notre compréhension du monde vivant. Ils sont également à la base des programmes de génomique, grâce à l’amélioration et l’automatisation des techniques existantes, mais aussi au développement de techniques nouvelles.

  • Isoler l’ADN

L’ADN est une molécule complexe mais on peut l’isoler relativement facilement des tissus vivants, grâce à ses propriétés chimiques particulières. Chez les plantes (et les autres eucaryotes, organismes constitués de cellules à noyau), l’ADN chromosomique se trouve dans le noyau des cellules. Pour l’extraire, il faut, à partir d’un broyat de tissus, rompre les membranes de la cellule et du noyau pour libérer les chromosomes, par exemple en utilisant un détergent. L’ADN peut alors être isolé en utilisant le fait que les sels d’ADN sont insolubles dans l’alcool (ils forment un précipité).

  • Couper-coller l’ADN

Les molécules d’ADN constituant les chromosomes sont beaucoup trop longues, complexes et fragiles pour être analysées facilement. Au laboratoire, on préfère travailler sur de petits fragments contenant un ou quelques gènes. On peut facilement mesurer la taille de ces fragments d’ADN par migration sur des gels d’électrophorèse.

Des protéines bactériennes découvertes voilà trente ans, les enzymes de restriction, ont la particularité de couper l’ADN en des points spécifiques. Ces molécules du monde vivant reconnaissent une succession précise de quelques nucléotides de l’ADN (par exemple GAATTC) et le coupent au niveau de ce site. Cette étape de coupure est souvent appelée digestion de l’ADN. Grâce à d’autres enzymes, on peut également "recoller" des morceaux d’origines variées et réaliser de nouveaux assemblages génétiques, dans le but d’éprouver des hypothèses scientifiques ou de conférer une nouvelle propriété à l’organisme étudié (par exemple, faire synthétiser de l’insuline par une bactérie).

  • Recopier l’ADN

D’autres enzymes bactériennes, les polymérases, ont la propriété de recopier les molécules d’ADN à l’identique. Si on leur ajoute deux petits morceaux d’ADN (les “amorces”) encadrant une région d’ADN, on peut multiplier très rapidement, au laboratoire, cette région d’ADN : c’est la technique d’amplification, ou PCR (“Polymerase Chain Reaction”), facile à automatiser à grande échelle, et largement utilisée par la génomique.

  • Séquencer l’ADN

La molécule d’ADN est constituée d’un enchaînement de quatre nucléotides : A, C, G, T, qui constituent l’alphabet à quatre lettres du code génétique (voir "Cellule, noyau…").

Déterminer l’ordre des nucléotides, la "séquence" d’une région d’ADN, donne accès à l’information génétique de base et permet d’étudier les gènes présents dans cette régionet donc les protéines pour lesquesl ils codent. Pour séquencer une molécule d’ADN, les biologistes utilisent une technique enzymatique qui consiste à recopier un brin d’ADN (la matrice) in vitro, en ajoutant dans la réaction des nucléotides modifiés qui, quand ils sont incorporés, bloquent l’élongation de la copie. En lisant la longueur de ces chaînes bloquées après une électrophorèse, on peut reconstituer l’enchaînement des nucléotides sur le brin d’ADN matrice. Toutefois, la longueur des fragments que l’on peut analyser ne dépasse pas quelques centaines de nucléotides, et pour séquencer de plus grandes molécules d’ADN, il est nécessaire de les fragmenter avant de les lire. L’ordinateur se charge par la suite de reconstituer la séquence complète en assemblant les fragments qui se chevauchent. De nos jours, une grande partie de ces opérations est réalisée de façon automatique par des robots de séquençage, secondés par des programmes informatiques qui nécessitent de grandes capacités de calcul.

  • Reconnaître son semblable

Une autre technique abondamment utilisée dans les expériences de génétique moléculaire repose sur la complémentarité des deux brins de la molécule d’ADN ou sur la complémentarité entre une molécule d’ADN et une molécule d’ARN complémentaire. Lors de l’hybridation moléculaire, des fragments d’ADN ou d’ARN (ou “sondes”), marqués par un traceur radioactif ou fluorescent, sont employés pour détecter la présence d’une séquence proche (ou “homologue”) dans un mélange complexe, par exemple un génome entier.

  • Stocker l’ADN : clonage et banques

Chez les plantes, la quantité d’ADN composant le génome varie beaucoup selon les espèces. Chez certaines (comme Arabidopsis ou le riz), cette quantité se chiffre en centaines de millions de nucléotides ; chez d’autres comme le maïs, on s’adresse à des tailles plutôt de l’ordre du milliard, voire de la centaine de milliards pour certaines. Les génomes sont donc en général des objets trop complexes pour être manipulés facilement par le généticien. Il est nécessaire de les découper en morceaux facilement stockables et manipulables : on constitue alors une banque de fragments, chaque fragment étant introduit et multiplié indépendamment dans un hôte, bactérie ou levure. Il faut bien sûr disposer d’un grand nombre de fragments pour avoir une bonne chance que chaque région du génome soit représentée dans une banque. Bien entendu, plus le génome est de grande taille, plus cette banque doit comporter de fragments ; c’est en partie pour cela que les génomiciens préfèrent travailler sur des génomes les plus simples possibles, comme ceux de l’arabette ou du riz.


  • La transgénèse

Les techniques du génie génétique permettent l’isolement, l’étude et la modification des gènes dans des tubes à essai (“in vitro”). Bien sûr, il est souvent nécessaire de réintroduire ces gènes modifiés (constructions génétiques) ou non dans un organisme vivant afin de vérifier leur fonction ; on utilise alors une technique dite de transformation, ou transgénèse, pour introduire ces constructions dans le génome de l’espèce étudiée.

Deux méthodes sont utilisées pour introduire une construction dans un génome de plante. La première utilise les fonctions de la bactérie Agrobacterium. Les propriétés de transfert d’ADN de cette bactérie dans les cellules végétales ne sont connues que depuis 1977, mais sont utilisées depuis des millions d’années par Agrobacterium pour coloniser les cellules végétales. Agrobacterium tumefaciens est capable d’introduire dans certaines plantes des gènes bactériens susceptibles d’induire la multiplication anarchique des cellules transformées au point d’infection : c’est la maladie de la galle du collet.

Afin d'utiliser cette bactérie pour des expériences de transformation et pouvoir régénérer des plantes entières à partir des cellules transformées, les bactéries sont débarrassées des gènes responsables de la formation de galle, mais elles conservent la faculté de transférer vers le génome de la plante réceptrice une séquence d’ADN, l’ADN-T (ou ADN transféré) dans lequel on aura inséré le gène d’intérêt. Les bactéries porteuses de la construction génétique sont alors mises en contact direct avec les tissus de la plante pour transformer certaines des cellules de ces tissus. Chez un grand nombre d’espèces, il est maintenant possible de régénérer une plante entière à partir d’une cellule. C’est ainsi que l’on obtient une plante transgénique, en régénérant un individu entier à partir d’une cellule transformée.

La seconde méthode, dite de transfert direct, est utilisée pour les plantes récalcitrantes à l’infection par Agrobacterium, ou pour lesquelles il est difficile de régénérer un individu à partir d’une cellule. Elle requiert un “canon à particules”, qui permet de bombarder un tissu végétal (feuille, tige, apex, embryon...) avec des micro-billes couvertes de l’ADN de la construction génétique, à une vitesse si importante qu’elle permet à ces billes de pénétrer dans la cellule en traversant sa paroi. L’ADN solubilisé dans le cytoplasme peut alors, dans certains cas, aller s’insérer dans le génome de la plante. Les cellules transformées des tissus pourront également donner naissance à une plante entière, comme nous l’avons vu précédemment. Lorsqu’un apex ou un embryon ont été ainsi traités et que l’on cultive cet organe pour obtenir une plante entière, si certaines cellules à la base de la formation des organes reproducteurs de la plante ont été transformées, il est possible d’obtenir dans la descendance de cette plante des individus dont toutes les cellules sont transformées.



1.3. La génomique

L’avènement de la génomique en tant que nouvelle discipline biologique repose essentiellement sur des progrès techniques importants réalisés au cours des années 1990. Ces techniques comblent, en effet, en grande partie un fossé qui séparait ce qu’on pouvait identifier au niveau génétique, de ce qu’on pouvait analyser au niveau moléculaire. Classiquement, on savait d’un côté identifier et localiser des caractères génétiques sur les cartes chromosomiques, et de l’autre étudier et modifier des gènes in vitro. Au cours des dix ou quinze dernières années, sont apparues des méthodologies qui permettent de relier ces deux niveaux d’analyse : on peut par exemple plus facilement isoler les gènes à la base des caractères localisés sur les cartes génétiques.

Un aspect important des approches de génomique est l’objectif d’exhaustivité qu’elles affichent. Si l’ambition de la génomique structurale est de décrire l’organisation des chromosomes et dresser l’inventaire des gènes qu’ils contiennent, celle de la génomique fonctionnelle est d’attribuer un rôle biologique à ces gènes, de déterminer la façon dont ils sont régulés et leurs interactions. La génomique n’est donc qu’une façon différente d’aborder la génétique, avec des ambitions nouvelles quant aux questions que l’on pose et aux outils qu’on met en place pour y répondre.


1.3.1. Génomique structurale



  • La cartographie génétique

L’apparition d’un nouveau type de marqueurs génétiques au milieu des années 1980, les marqueurs moléculaires, a permis de dresser des cartes génétiques avec une précision et une rapidité jusqu’alors inégalées. Ces marqueurs, dont on étudie la ségrégation au passage d’une génération à l’autre au même titre que celle de n’importe quel caractère génétique simple, permettent d’identifier et de suivre dans les populations des différences – ou polymorphismes – au niveau de la molécule d’ADN elle-même, d’où leur nom de marqueur "moléculaire". Faciles à obtenir en grand nombre, simples d’emploi, ils sont à la base de cartes génétiques extrêmement détaillées qui permettent ensuite aux généticiens de localiser les régions chromosomiques importantes entrant en jeu dans un caractère, et ce même pour des caractères très complexes.

  • La cartographie physique

Les génomes entiers sont trop complexes pour pouvoir être étudiés facilement au laboratoire. Il est donc nécessaire de les fragmenter et de les multiplier sous forme de banque de fragments. D’importants progrès techniques ont permis d’augmenter notablement la taille des fragments qu’on peut analyser et de les propager chez les bactéries ou les levures sous forme de chromosomes artificiels portant plusieurs centaines de milliers de nucléotides.

Malheureusement, dans ces banques, ces fragments ne sont plus ordonnés, et il faut donc rétablir leur origine chromosomique de façon à obtenir un ensemble de fragments indépendants et identifiés individuellement, qui recouvre la totalité du génome : c’est ce qu’on appelle la carte physique du génome.

On recherche pour ce faire les zones de chevauchement entre les différents fragments de la banque, ce qui permet de les ordonner les uns par rapport aux autres.

Les marqueurs moléculaires utilisés pour la carte génétique peuvent être localisés sur la carte physique et permettent d’identifier les fragments chevauchants correspondant aux différents chromosomes. On peut en procédant de cette manière établir une correspondance entre la carte physique et la carte génétique, ce qui permet de passer d’une localisation sur la carte génétique à une région d’ADN et vice-versa.

Il faut noter que les deux cartes – génétique et physique – sont loin de donner la même représentation du génome : si la carte génétique s’appuie sur le mécanisme biologique de la recombinaison, la carte physique correspond à la molécule d’ADN. Deux gènes très proches sur la molécule d’ADN (carte physique) peuvent apparaître éloignés sur la carte génétique s’il y a beaucoup d’événements de recombinaison entre eux. L’intégration des deux types de cartes permet d’isoler les gènes responsables des caractères étudiés, étape nécessaire pour avancer dans la compréhension de leur fonction.

  • Le séquençage

Les techniques de séquençage enzymatique sont apparues dès les années 1970. Elles sont de nos jours réalisées de façon automatique par des robots de séquençage. Ces machines permettent d’atteindre un débit compatible avec le séquençage de génomes entiers. Ces programmes, établis sur la base de collaborations et de financements internationaux, sont actuellement conduits dans des centres de séquençage de grande taille, qui possèdent plusieurs dizaines de ces robots comme le Génoscope à Évry.

Le séquençage complet du génome de l’arabette, premier génome de plante totalement séquencé, a été annoncé en décembre 2000. Cette séquence constitue la carte ultime du génome. Elle permet d’identifier tous les gènes (il y en a environ 26 000 chez Arabidopsis), de comprendre la structure et le fonctionnement du génome et des chromosomes, de fournir une source de marqueurs génétiques illimitée...



1.3.2. Bioinformatique


Un des problèmes soulevés par les programmes de génomique est l’augmentation sans précédent des volumes de données biologiques à traiter. Il s’agit de stocker ces données dans de larges bases de données informatiques, de permettre à tous les biologistes d’y accéder de façon simple et rapide, de les analyser et les comparer entre elles, souvent en développant des outils mathématiques et informatiques appropriés. C’est le domaine de la bioinformatique, nécessaire aux programmes de génomique qu'elle soit structurale ou fonctionnelle.

À partir des données de séquençage, il est généralement difficile de reconnaître les gènes, souvent morcelés dans le génome. L’informatique peut apporter une aide précieuse pour identifier et reconstituer les gènes codant pour des protéines. Des programmes informatiques élaborés à partir des connaissances obtenues sur des milliers de gènes permettent de prédire la localisation des parties codantes des gènes et donc d’apporter une aide précieuse pour l’identification des gènes codant pour telle ou telle protéine. La comparaison automatique de séquence, permet également de rechercher dans l’énorme masse de données existante les gènes qui présentent des ressemblances avec une séquence étudiée, que ce soit dans le même organisme ou dans toute autre espèce. De 50 à 60 % des gènes d’Arabidopsis impliqués dans la synthèse des protéines sont retrouvés dans d’autres organismes comme la levure de boulanger, la mouche du vinaigre ou l’homme, reflétant des fonctions très conservées dans tous les être vivants. Si on connaît déjà la fonction biologique de ces gènes similaires, on peut souvent proposer un rôle pour les gènes étudiés, rôle que l’on pourra essayer de confirmer de façon expérimentale. Le traitement informatique peut également faire connaître dans la séquence des modules de structure ou de fonction connue, qui peuvent renseigner le biologiste par exemple sur la régulation de l’expression du gène ou sur la localisation de la protéine dans la cellule.



1.3.3. Génomique fonctionnelle


La génomique structurale et le séquençage permettent de dresser un inventaire de la totalité des gènes de l’organisme. L’analyse bioinformatique permet d’établir des classifications et souvent de proposer des hypothèses sur la fonction que pourraient remplir ces gènes. L’objectif de la génomique fonctionnelle est de fournir des outils d’analyse efficaces permettant d’attribuer des fonctions aux nombreux gènes inconnus. Cette discipline s’articule autour de deux axes majeurs : l’expression du génome et la modification de l’expression des gènes.

  • L’expression du génome

Savoir où, quand, et comment un gène et la protéine correspondante sont actifs pendant la vie de la plante renseigne sur leur rôle biologique et leurs interactions éventuelles. Deux gènes qui ont les mêmes caractéristiques d’expression auront, en effet, plus de chance d’intervenir dans le même phénomène.

On peut étudier l’expression du génome à deux niveaux majeurs de régulation : celui de la transcription de l’ADN en ARN messager, et celui de la traduction des ARNm en protéines. Alors que traditionnellement ces analyses étaient conduites sur un ou quelques gènes, il devient possible d’étudier simultanément la régulation de la totalité des gènes de l’organisme au cours de son développement ou en réponse à des stress et des variations de l’environnement.

Ces techniques sont maintenant au point pour l’étude de la transcription. Grâce à l’emploi de véritables puces à ADN, sur lesquelles sont déposées plusieurs dizaines de milliers de séquences différentes, on peut analyser l’expression des gènes dans un tissu ou un organe donné en utilisant des sondes ARN provenant de cet échantillon biologique. Pour chaque point de la puce, le signal obtenu après hybridation entre l’ADN du gène auquel correspond ce point et la sonde ARN utilisée renseigne sur le niveau d’expression de ce gène dans l’échantillon.

Des techniques très puissantes sont également en cours de développement pour la quantification des protéines, leur localisation et l’étude de leurs modifications. Ces techniques sont aussi basées sur l’emploi de biopuces et d’appareils sophistiqués empruntés aux chimistes et aux physiciens. On peut de plus réaliser des protéines hybrides en fusionnant à la séquence protéique étudiée un marqueur facile à visualiser, qui va renseigner sur la localisation et la régulation de cette protéine.

Les organismes et les cellules vivantes intègrent un grand nombre de réseaux de régulations et d’interactions complexes. Nombre de ces réseaux opèrent au niveau moléculaire par le biais d’interactions entre gènes et protéines. Au delà de l’analyse des gènes individuels et de leurs produits protéiques, un objectif majeur pour le futur consiste en l’élucidation de ces interactions. Certains outils prometteurs ont déjà vu le jour, basés là encore sur l’emploi de biopuces miniaturisées, ou sur la détection d’interactions moléculaires.

  • La modification de l’expression des gènes

Un vieux principe propose que pour connaître un processus, rien ne vaut d’y introduire un grain de sable et d’observer ce qui se passe. Ce principe a largement été utilisé en biologie depuis Claude Bernard, notamment par les approches génétiques d’analyse de mutants. Les mutants résultent de modifications de la séquence des gènes, et sont donc affectés dans un ou plusieurs caractères. Ils peuvent être d’origine spontanée, induits par des traitements physiques ou chimiques, ou obtenus après introduction de séquences d’insertion telles que l’ADN-T d’A. tumefaciens ou des éléments transposables.

Pour appliquer le principe du grain de sable à grande échelle au génome d’une espèce, par exemple Arabidopsis thaliana (voir encadré) choisie pour la petite taille de son génome, l’Inra participe à la production d’une collection de plantes mutées pour chacun des 26 000 gènes de cette espèce.

Ces plantes mutantes sont obtenues par trangénèse et résultent de l’intégration au hasard dans leur génome d’un fragment d’ADN appelé ADN-T (pour ADN transféré). Cet ADN-T peut s’insérer dans la séquence d’un gène et par là même l’empêcher d’assurer sa fonction : il provoque une mutation. L’effet de cette mutation sur les caractéristiques de la plante renseigne sur la fonction qui a été affectée.

Dans la mesure où les insertions de l’ADN-T sont aléatoires, il faut trier, parmi toutes les plantes obtenues, celles qui portent la ou les mutations que l’on recherche. Si on étudie un aspect particulier du développement de la plante, par exemple la mise en place d’un organe, on recherchera dans la collection les plantes qui sont affectées dans la mise en place de cet organe, puis on isolera le gène muté grâce à l’étiquette que constitue l’ADN-T.

À l’inverse, on peut poser la question de sa fonction pour chaque gène identifié lors du séquençage du génome. On peut alors rechercher dans l’ADN des plantes de la collection laquelle porte un ADN-T inséré dans ce gène. On pourra alors observer qu’elles sont les conséquences de cette mutation sur le phénotype de la plante et donc obtenir des indications sur la fonction de ce gène.

On peut également introduire un gène donné dans la plante en changeant ses signaux de régulation, ce qui va conduire à l’expression intempestive du gène, et en observer les conséquences sur la biologie de la plante.

Arabidopsis thaliana : plante modèle et conservation de la synténie
Arabidopsis.jpg
Photo D. Bouchez © Inra
Plante adulte d’Arabidopsis (20 cm)

Connaître l’ensemble des mécanismes qui régissent la vie d’une plante, comme son développement, sa floraison ou sa fructification, est essentiel non seulement au niveau fondamental mais également pour améliorer les plantes cultivées. La communauté internationale scientifique a choisi une crucifère, l’arabette ou Arabidopsis thaliana, de la famille du chou et du colza, pour être la plante modèle de leurs études. Cette petite plante se cultive facilement en laboratoire et en serre, et quelques semaines suffisent pour obtenir une plante au stade adulte, capable de fournir un grand nombre de graines qui peuvent être stockées plusieurs années. Arabidopsis thaliana présente aussi l’avantage considérable de posséder le plus petit génome végétal connu. À titre de comparaison, le riz et le maïs ont une taille de génome respectivement 4 et 20 fois plus grande que celle du génome de l’arabette. Le séquençage du génome de cette plante, entrepris par un consortium international de laboratoires (dont le Génoscope en France) a été achevé en 2000.


Au centre Inra de Versailles, une banque de mutants d’Arabidopsis thaliana a été constituée. Ces mutants d’insertion sont obtenus par l’introduction aléatoire d’un fragment d’ADN dans le génome. Les 50 000 lignées à la disposition des chercheurs présentent parfois des caractéristiques inhabituelles dues à la perturbation de la fonction du gène muté.


En quoi la connaissance du génome des plantes modèles comme l’arabette, sans aucun intérêt économique, peut-elle présenter un intérêt ? Au delà des connaissances de base apportées par ces études, on peut utiliser la ressemblance entre le génome de ces espèces modèles et celui d’espèces cultivées apparentées. Les gènes sont souvent organisés de la même manière sur les chromosomes, et placés dans le même ordre : c’est le phénomène de conservation de la synténie. Il est donc possible, moyennant des vérifications, de s’appuyer sur les informations acquises sur un génome modèle pour analyser les chromosomes d’une plante apparentée. Cette ressemblance sert de base pour explorer des génomes plus complexes et plus grands, comme ceux de la plupart des espèces cultivées.



La banque de mutants d’Arabidopsis de Versailles

banque.jpg

Photo C. Maitre © Inra
Serre dans laquelle sont recherchées des plantes d’Arabidopsis mutantes parmi les 50 000 lignées d’insertion produites par l’Inra.


Au centre Inra de Versailles, une banque de mutants d’Arabidopsis thaliana a été constituée. Ces mutants d’insertion sont obtenus par l’introduction aléatoire d’un fragment d’ADN dans le génome de la plante. Les 50 000 lignées à la disposition des chercheurs présentent des caractéristiques inhabituelles dues à la perturbation de la fonction du gène muté et sont très utiles pour étudier cette fonction.
Par exemple les mutants "tonneau" d’Arabidopsis présentent des altérations de forme et de taille spectaculaires. On a pu relier ces modifications à des défauts dans la mise en place d’une structure cellulaire particulière, le cytosquelette. Ce dernier est au centre de la plupart des étapes de la vie de la cellule : division et croissance cellulaires notamment. Ces mutants donnent des renseignements précieux sur certains mécanismes fondamentaux de l’organogenèse végétale et les liens entre l’organisation cellulaire et la morphologie des plantes.



Génoplante

En France en 1999, le programme Génoplante est initié pour le développement de la génomique végétale. L’Inra contribue activement à l’élaboration de ce projet et à sa réalisation, qui donne naissance à un Groupement d’intérêt scientifique. Il offre la particularité de réunir des partenaires de la recherche publique (Cirad, CNRS, Inra et IRD) et des partenaires de la recherche privée (Biogemma, Bioplante, Aventis Crop Science). La recherche s’organise selon deux axes : “Génoplante générique”, dont les travaux sont coordonnés sur les espèces modèles (arabette et riz) et visent aussi à créer d’indispensables outils technologiques, notamment en bio-informatique et robotisation et nécessitent de mettre des travaux en commun ; “Génoplante espèces” qui regroupe les programmes spécifiques sur des espèces d’intérêt agronomique (blé, maïs, colza pour l’essentiel, mais aussi pois, luzerne, piment, melon, vigne…) afin de mieux connaître leurs génomes en vue de développements ultérieurs.

Les travaux menés dans le cadre de Génoplante participent à l’accroissement des connaissances générales sur le vivant.




Retour Sommaire


 

Rédaction :  Mission communication (Dossier : La génomique végétale à l'Inra - 2001)
Date de création : 16 Août 2005
Date de dernière mise à jour : 17 Août 2005

Dossiers scientifiques

 

 

Le point sur...

Apprendre, expérimenter

Partager nos ressources

Rencontrer l'Inra

Siège : 147 rue de l'Université 75338 Paris Cedex 07 - tél : +33(0)1 42 75 90 00 | copyright © INRA 2009 | Crédits | Mentions légales