Si deux gènes A et B sont portés par le
même chromosome, et si un individu transmet à un descendant l’allèle
A1 du gène A, la probabilité qu’il transmette au même descendant l’allèle
B1 du gène B reçu du même parent sera d’autant plus grande que ces deux
gènes seront “proches” l’un de l’autre. S’ils sont très “proches” et
donc la plupart du temps transmis ensemble, on dit que les gènes A et
B sont liés. Si deux gènes A et C ne sont pas sur le même chromosome,
alors ils sont transmis aux descendants de façon totalement indépendante
de leur origine parentale. Plus les gènes A et B sont liés, plus la
distance génétique qui les sépare est faible.
Thomas Morgan (1866-1945)
a établi, en travaillant sur la mouche du vinaigre (Drosophila melano-gaster),
que la transmission des allèles parentaux à la descendance n’est pas
totalement indépendante d’un gène à l’autre : il existe des “groupes
de liaison” c’est-à-dire des grouped’allèles transmis plus souvent ensemble
que “réassortis”. Il a montré que ces groupes de liaison correspondent
en fait aux différents chromosomes de l’espèce. Tous les gènes portés
par un chromosome devraient donc être transmis ensemble. Toutefois,
le phénomène de recombinaison méiotique permet aux chromosomes hérités
de chacun des deux parents (chromosomes homologues) d’échanger des fragments,
et donc de dissocier des allèles portés par le même chromosome. On peut
mesurer la distance génétique qui sépare deux gènes portés par le même
chromosome en calculant leur fréquence de dissociation à la méiose.
La carte génétique d’un individu est la représentation des distances
génétiques qui séparent les gènes. Elle est d’autant plus dense que
l’on aura étudié plus de gènes et d’autant plus précise que l’on aura
observé plus de descendants (mesure plus précise des fréquences de dissociation).
Cellule,
noyau, ADN, ARN et protéines

Une plante est constituée de différents
organes (tige, racines, feuilles...) qui sont eux mêmes l’assemblage
de tissus différenciés (épiderme, vaisseaux, mésophylle...). Chaque
tissu est caractérisé par un type cellulaire. Les quelques milliards
de cellules d’une plante sont donc de types différents, mais portent
toutes le même patrimoine génétique.
Une cellule représente une entité fonctionnelle vivante, autonome pour
un grand nombre de fonctions métaboliques. Ces fonctions, qu’elles soient
communes à tous les types cellulaires ou spécifiques d’un type particulier,
sont contrôlées par l’information génétique portée par les chromosomes
situés dans le noyau. Le nombre de chromosomes est une caractéristique
de l’espèce, ainsi que la façon dont les gènes sont organisés sur ceux-ci.
Chaque chromosome est constitué d’une molécule d’ADN (acide désoxyribonucléique)
portant l’information génétique, très compactée et enroulée autour de
protéines.
L’information génétique est constituée de la suite des nucléotides (adénine,
cytosine, guanine, thymine : A, C, G, T) portés par la double chaîne
de l’ADN. L’ADN est constitué de séquences codantes assurant la fabrication
de protéines par les cellules et de séquences non-codantes qui peuvent
représenter une fraction importante de l’ADN. Un gène comprend une séquence
d’ADN codant une protéine donnée et des séquences adjacentes permettant
son expression, précédée, suivie, et parfois interrompue par des séquences
d’ADN dit non-codant. Une partie du gène particulièrement importante
pour son activité est le promoteur, qui est une séquence située en amont
de la séquence codante et qui détermine dans quel type cellulaire, à
quel moment du développement et sous l’effet de quel(s) stimulus le
gène est actif.
L’expression d’un gène se déroule en deux étapes principales. Tout d’abord
le gène est transcrit (copié) en une molécule d’ARN (acide ribonucléique)
dit ARN messager (ARNm) qui sort ensuite du noyau. Dans le cytosol de
la cellule, l’ARN messager (ARNm) est alors traduit (décodé) en protéine
: la succession des nucléotides est “lue” trois par trois (en triplets)
et chaque triplet détermine un élément possible de la chaîne protéique
(acide aminé). La correspondance entre les triplets de nucléotides et
les acides aminés constituant les protéines est appelée code génétique.
Le code génétique est identique pour tous les êtres vivants. Selon sa
fonction, la protéine synthétisée va alors être impliquée dans une voie
métabolique, associée à d’autres protéines, intégrée dans une structure
cellulaire, etc.
Un certain nombre de caractères particulièrement
pertinents pour l’amélioration des plantes, tels que le rendement, l’adaptation
aux pratiques culturales, la résistance à des contraintes de l’environnement
ou à des maladies… sont des caractères complexes. Ces caractères peuvent
souvent se décomposer en caractéristiques plus faciles à étudier : le
rendement en grains à l’hectare est par exemple fonction du nombre de
plantes à l’hectare, du nombre de ramifications par plante, du nombre
d’épis ou de gousses par ramification et du poids d’un grain. Ils varient
souvent de manière continue entre des valeurs extrêmes, et sont appelés
pour cela des caractères quantitatifs. Ils sont gouvernés par plusieurs,
voire de nombreux gènes qui peuvent agir chacun en proportion variable.
L’étude de l’association des allèles influant sur un caractère complexe
a nécessité la mise en oeuvre d’outils mathématiques et statistiques
qui ont permis le développement de la génétique quantitative.
Parallèlement, la découverte de la structure moléculaire des gènes a
ouvert un domaine de recherche où la relation précise entre la séquence
nucléotidique qui code l’information génétique et la fonction du gène
(le produit protéique de ce gène et son implication dans la structure
ou le métabolisme de la cellule et de l’organisme) constitue le sujet
de l’étude. La génétique moléculaire a donc pour objet la molécule d’ADN
et l’élucidation des informations qu’elle code grâce aux outils du génie
génétique.
1.2. Les outils du génie génétique
Le génie génétique englobe un ensemble de concepts et de techniques
qui permettent d’étudier et de modifier les gènes et leurs fonctions,
au cœur même du fonctionnement des cellules et des organismes vivants.
Ces outils, qui se sont développés au cours des trente dernières années
grâce aux découvertes de la biologie moléculaire, ont permis des avancées
remarquables dans notre compréhension du monde vivant. Ils sont également
à la base des programmes de génomique, grâce à l’amélioration et l’automatisation
des techniques existantes, mais aussi au développement de techniques
nouvelles.
• Isoler l’ADN
L’ADN est une molécule complexe mais on peut l’isoler relativement facilement
des tissus vivants, grâce à ses propriétés chimiques particulières.
Chez les plantes (et les autres eucaryotes, organismes constitués de
cellules à noyau), l’ADN chromosomique se trouve dans le noyau des cellules.
Pour l’extraire, il faut, à partir d’un broyat de tissus, rompre les
membranes de la cellule et du noyau pour libérer les chromosomes, par
exemple en utilisant un détergent. L’ADN peut alors être isolé en utilisant
le fait que les sels d’ADN sont insolubles dans l’alcool (ils forment
un précipité).
• Couper-coller l’ADN
Les molécules d’ADN constituant les chromosomes sont beaucoup trop longues,
complexes et fragiles pour être analysées facilement. Au laboratoire,
on préfère travailler sur de petits fragments contenant un ou quelques
gènes. On peut facilement mesurer la taille de ces fragments d’ADN par
migration sur des gels d’électrophorèse.
Des protéines bactériennes découvertes voilà trente ans, les enzymes
de restriction, ont la particularité de couper l’ADN en des points spécifiques.
Ces molécules du monde vivant reconnaissent une succession précise de
quelques nucléotides de l’ADN (par exemple GAATTC) et le coupent au
niveau de ce site. Cette étape de coupure est souvent appelée digestion
de l’ADN. Grâce à d’autres enzymes, on peut également « recoller » des
morceaux d’origines variées et réaliser de nouveaux assemblages génétiques,
dans le but d’éprouver des hypothèses scientifiques ou de conférer une
nouvelle propriété à l’organisme étudié (par exemple, faire synthétiser
de l’insuline par une bactérie).
• Recopier l’ADN
D’autres enzymes bactériennes, les polymérases, ont la propriété de
recopier les molécules d’ADN à
l’identique. Si on leur ajoute deux petits morceaux d’ADN (les “amorces”)
encadrant une région d’ADN, on peut multiplier très rapidement, au laboratoire,
cette région d’ADN : c’est la technique d’amplification, ou PCR (“Polymerase
Chain Reaction”), facile à automatiser à grande échelle, et largement
utilisée par la génomique.
• Séquencer l’ADN
La molécule d’ADN est constituée d’un enchaînement de quatre nucléotides
: A, C, G, T, qui constituent l’alphabet à quatre lettres du code génétique
(voir « Cellule, noyau… »).
Déterminer l’ordre des nucléotides, la « séquence » d’une région d’ADN,
donne accès à l’information génétique de base et permet d’étudier les
gènes présents dans cette régionet donc les protéines pour lesquesl
ils codent. Pour séquencer une molécule d’ADN, les biologistes utilisent
une technique enzymatique qui consiste à recopier un brin d’ADN (la
matrice) in vitro, en ajoutant dans la réaction des nucléotides modifiés
qui, quand ils sont incorporés, bloquent l’élongation de la copie. En
lisant la longueur de ces chaînes bloquées après une électrophorèse,
on peut reconstituer l’enchaînement des nucléotides sur le brin d’ADN
matrice. Toutefois, la longueur des fragments que l’on peut analyser
ne dépasse pas quelques centaines de nucléotides, et pour séquencer
de plus grandes molécules d’ADN, il est nécessaire de les fragmenter
avant de les lire. L’ordinateur se charge par la suite de reconstituer
la séquence complète en assemblant les fragments qui se chevauchent.
De nos jours, une grande partie de ces opérations est réalisée de façon
automatique par des robots de séquençage, secondés par des programmes
informatiques qui nécessitent de grandes capacités de calcul.
• Reconnaître son semblable
Une autre technique abondamment utilisée dans les expériences de génétique
moléculaire repose sur la complémentarité des deux brins de la molécule
d’ADN ou sur la complémentarité entre une molécule d’ADN et une molécule
d’ARN complémentaire. Lors de l’hybridation moléculaire, des fragments
d’ADN ou d’ARN (ou “sondes”), marqués par un traceur radioactif ou fluorescent,
sont employés pour détecter la présence d’une séquence proche (ou “homologue”)
dans un mélange complexe, par exemple un génome entier.
• Stocker l’ADN : clonage et banques
Chez les plantes, la quantité d’ADN composant le génome varie beaucoup
selon les espèces. Chez certaines (comme Arabidopsis ou le riz), cette
quantité se chiffre en centaines de millions de nucléotides ; chez d’autres
comme le maïs, on s’adresse à des tailles plutôt de l’ordre du milliard,
voire de la centaine de milliards pour certaines. Les génomes sont donc
en général des objets trop complexes pour être manipulés facilement
par le généticien. Il est nécessaire de les découper en morceaux facilement
stockables et manipulables : on constitue alors une banque de fragments,
chaque fragment étant introduit et multiplié indépendamment dans un
hôte, bactérie ou levure. Il faut bien sûr disposer d’un grand nombre
de fragments pour avoir une bonne chance que chaque région du génome
soit représentée dans une banque. Bien entendu, plus le génome est de
grande taille, plus cette banque doit comporter de fragments ; c’est
en partie pour cela que les génomiciens préfèrent travailler sur des
génomes les plus simples possibles, comme ceux de l’arabette ou du riz.
• La transgénèse
Les techniques du génie génétique permettent l’isolement, l’étude et
la modification des gènes dans des tubes à essai (“in vitro”). Bien
sûr, il est souvent nécessaire de réintroduire ces gènes modifiés (constructions
génétiques) ou non dans un organisme vivant afin de vérifier leur fonction;
on utilise alors une technique dite de transformation, ou transgénèse,
pour introduire ces constructions dans le génome de l’espèce étudiée.
Deux méthodes sont utilisées pour introduire une construction dans un
génome de plante. La première utilise les fonctions de la bactérie Agrobacterium.
Les propriétés de transfert d’ADN de cette bactérie dans les cellules
végétales ne sont connues que depuis 1977, mais sont utilisées depuis
des millions d’années par Agrobacterium pour coloniser les cellules
végétales. Agrobacterium tumefaciens est capable d’introduire dans certaines
plantes des gènes bactériens susceptibles d’induire la multiplication
anarchique des cellules transformées au point d’infection : c’est la
maladie de la galle du collet.
Afin d'utiliser cette bactérie pour des expériences de transformation
et pouvoir régénérer des plantes entières à partir des cellules transformées,
les bactéries sont débarrassées des gènes responsables de la formation
de galle, mais elles conservent la faculté de transférer vers le génome
de la plante réceptrice une séquence d’ADN, l’ADN-T (ou ADN transféré)
dans lequel on aura inséré le gène d’intérêt. Les bactéries porteuses
de la construction génétique sont alors mises en contact direct avec
les tissus de la plante pour transformer certaines des cellules de ces
tissus. Chez un grand nombre d’espèces, il est maintenant possible de
régénérer une plante entière à partir d’une cellule. C’est ainsi que
l’on obtient une plante transgénique, en régénérant un individu entier
à partir d’une cellule transformée.
La seconde méthode, dite de transfert direct, est utilisée pour les
plantes récalcitrantes à l’infection par Agrobacterium, ou pour lesquelles
il est difficile de régénérer un individu à partir d’une cellule. Elle
requiert un “canon à particules”, qui permet de bombarder un tissu végétal
(feuille, tige, apex, embryon...) avec des micro-billes couvertes de
l’ADN de la construction génétique, à une vitesse si importante qu’elle
permet à ces billes de pénétrer dans la cellule en traversant sa paroi.
L’ADN solubilisé dans le cytoplasme peut alors, dans certains cas, aller
s’insérer dans le génome de la plante. Les cellules transformées des
tissus pourront également donner naissance à une plante entière, comme
nous l’avons vu précédemment. Lorsqu’un apex ou un embryon ont été ainsi
traités et que l’on cultive cet organe pour obtenir une plante entière,
si certaines cellules à la base de la formation des organes reproducteurs
de la plante ont été transformées, il est possible d’obtenir dans la
descendance de cette plante des individus dont toutes les cellules sont
transformées.
1.3. La génomique
L’avènement de la génomique en tant que nouvelle discipline biologique
repose essentiellement sur des progrès techniques importants réalisés
au cours des années 90. Ces techniques comblent, en effet, en grande
partie un fossé qui séparait ce qu’on pouvait identifier au niveau génétique,
de ce qu’on pouvait analyser au niveau moléculaire. Classiquement, on
savait d’un côté identifier et localiser des caractères génétiques sur
les cartes chromosomiques, et de l’autre étudier et modifier des gènes
in vitro. Au cours des dix ou quinze dernières années, sont apparues
des méthodologies qui permettent de relier ces deux niveaux d’analyse
: on peut par exemple plus facilement isoler les gènes à la base des
caractères localisés sur les cartes génétiques.
Un aspect important des approches de génomique est l’objectif d’exhaustivité
qu’elles affichent. Si l’ambition de la génomique structurale est de
décrire l’organisation des chromosomes et dresser l’inventaire des gènes
qu’ils contiennent, celle de la génomique fonctionnelle est d’attribuer
un rôle biologique à ces gènes, de déterminer la façon dont ils sont
régulés et leurs interactions. La génomique n’est donc qu’une façon
différente d’aborder la génétique, avec des ambitions nouvelles quant
aux questions que l’on pose et aux outils qu’on met en place pour y
répondre.
1.3.1. Génomique structurale
• La cartographie génétique
L’apparition d’un nouveau type de marqueurs génétiques au milieu des
années 1980, les marqueurs moléculaires, a permis de dresser des cartes
génétiques avec une précision et une rapidité jusqu’alors inégalées.
Ces marqueurs, dont on étudie la ségrégation au passage d’une génération
à l’autre au même titre que celle de n’importe quel caractère génétique
simple, permettent d’identifier et de suivre dans les populations des
différences – ou polymorphismes – au niveau de la molécule d’ADN elle-même,
d’où leur nom de marqueur "moléculaire". Faciles à
obtenir en grand nombre, simples d’emploi, ils sont à la base de cartes
génétiques extrêmement détaillées qui permettent ensuite aux généticiens
de localiser les régions chromosomiques importantes entrant en jeu dans
un caractère, et ce même pour des caractères très complexes.
• La cartographie physique
Les génomes entiers sont trop complexes pour pouvoir être étudiés facilement
au laboratoire. Il est donc nécessaire de les fragmenter et de les multiplier
sous forme de banque de fragments. D’importants progrès techniques ont
permis d’augmenter notablement la taille des fragments qu’on peut analyser
et de les propager chez les bactéries ou les levures sous forme de chromosomes
artificiels portant plusieurs centaines de milliers de nucléotides.
Malheureusement, dans ces banques, ces fragments ne sont plus ordonnés,
et il faut donc rétablir leur origine chromosomique de façon à obtenir
un ensemble de fragments indépendants et identifiés individuellement,
qui recouvre la totalité du génome : c’est ce qu’on appelle la carte
physique du génome.
On recherche pour ce faire les zones de chevauchement entre les différents
fragments de la banque, ce qui permet de les ordonner les uns par rapport
aux autres.
Les marqueurs moléculaires utilisés pour la carte génétique peuvent
être localisés sur la carte physique et permettent d’identifier les
fragments chevauchants correspondant aux différents chromosomes. On
peut en procédant de cette manière établir une correspondance entre
la carte physique et la carte génétique, ce qui permet de passer d’une
localisation sur la carte génétique à une région d’ADN et vice versa.
Il faut noter que les deux cartes – génétique et physique – sont loin
de donner la même représentation du génome : si la carte génétique s’appuie
sur le mécanisme biologique de la recombinaison, la carte physique correspond
à la molécule d’ADN. Deux gènes très proches sur la molécule d’ADN (carte
physique) peuvent apparaître éloignés sur la carte génétique s’il y
a beaucoup d’événements de recombinaison entre eux. L’intégration des
deux types de cartes permet d’isoler les gènes responsables des caractères
étudiés, étape nécessaire pour avancer dans la compréhension de leur
fonction.
• Le séquençage
Les techniques de séquençage enzymatique sont apparues dès les années
1970. Elles sont de nos jours réalisées de façon automatique par des
robots de séquençage. Ces machines permettent d’atteindre un débit compatible
avec le séquençage de génomes entiers. Ces programmes, établis sur la
base de collaborations et de financements internationaux, sont actuellement
conduits dans des centres de séquençage de grande taille, qui possèdent
plusieurs dizaines de ces robots comme le Génoscope à Evry.
Le séquençage complet du génome de l’arabette, premier génome de plante
totalement séquencé, a été annoncé en décembre 2000. Cette séquence
constitue la carte ultime du génome. Elle permet d’identifier tous les
gènes (il y en a environ 26 000 chez Arabidopsis), de comprendre la
structure et le fonctionnement du génome et des chromosomes, de fournir
une source de marqueurs génétiques illimitée...
1.3.2. Bioinformatique
Un des problèmes soulevés par les programmes de génomique est l’augmentation
sans précédent des volumes de données biologiques à traiter. Il s’agit
de stocker ces données dans de larges bases de données informatiques,
de permettre à tous les biologistes d’y accéder de façon simple et rapide,
de les analyser et les comparer entre elles, souvent en développant
des outils mathématiques et informatiques appropriés. C’est le domaine
de la bioinformatique, nécessaire aux programmes de génomique qu'elle
soit structurale ou fonctionnelle.
A partir des données de séquençage, il est généralement difficile de
reconnaître les gènes, souvent morcelés dans le génome. L’informatique
peut apporter une aide précieuse pour identifier et reconstituer les
gènes codant pour des protéines. Des programmes informatiques élaborés
à partir des connaissances obtenues sur des milliers de gènes permettent
de prédire la localisation des parties codantes des gènes et donc d’apporter
une aide précieuse pour l’identification des gènes codant pour telle
ou telle protéine. La comparaison automatique de séquence, permet également
de rechercher dans l’énorme masse de données existante les gènes qui
présentent des ressemblances avec une séquence étudiée, que ce soit
dans le même organisme ou dans toute autre espèce. De 50 à 60% des gènes
d’Arabidopsis impliqués dans la synthèse des protéines sont retrouvés
dans d’autres organismes comme la levure de boulanger, la mouche du
vinaigre ou l’homme, reflétant des fonctions très conservées dans tous
les être vivants. Si on connaît déjà la fonction biologique de ces gènes
similaires, on peut souvent proposer un rôle pour les gènes étudiés,
rôle que l’on pourra essayer de confirmer de façon expérimentale. Le
traitement informatique peut également faire connaître dans la séquence
des modules de structure ou de fonction connue, qui peuvent renseigner
le biologiste par exemple sur la régulation de l’expression du gène
ou sur la localisation de la protéine dans la cellule.
1.3.3. Génomique fonctionnelle
La génomique structurale et le séquençage permettent de dresser un inventaire
de la totalité des gènes de l’organisme. L’analyse bioinformatique permet
d’établir des classifications et souvent de proposer des hypothèses
sur la fonction que pourraient remplir ces gènes. L’objectif de la génomique
fonctionnelle est de fournir des outils d’analyse efficaces permettant
d’attribuer des fonctions aux nombreux gènes inconnus. Cette discipline
s’articule autour de deux axes majeurs : l’expression du génome et la
modification de l’expression des gènes.
• L’expression du génome
Savoir où, quand, et comment un gène et la protéine correspondante sont
actifs pendant la vie de la plante renseigne sur leur rôle biologique
et leurs interactions éventuelles. Deux gènes qui ont les mêmes caractéristiques
d’expression auront, en effet, plus de chance d’intervenir dans le même
phénomène.
On peut étudier l’expression du génome à deux niveaux majeurs de régulation
: celui de la transcription de l’ADN en ARN messager, et celui de la
traduction des ARNm en protéines. Alors que traditionnellement ces analyses
étaient conduites sur un ou quelques gènes, il devient possible d’étudier
simultanément la régulation de la totalité des gènes de l’organisme
au cours de son développement ou en réponse à des stress et des variations
de l’environnement.
Ces techniques sont maintenant au point pour l’étude de la transcription.
Grâce à l’emploi de véritables puces à ADN, sur lesquelles sont déposées
plusieurs dizaines de milliers de séquences différentes, on peut analyser
l’expression des gènes dans un tissu ou un organe donné en utilisant
des sondes ARN provenant de cet échantillon biologique. Pour chaque
point de la puce, le signal obtenu après hybridation entre l’ADN du
gène auquel correspond ce point et la sonde ARN utilisée renseigne sur
le niveau d’expression de ce gène dans l’échantillon.
Des techniques très puissantes sont également en cours de développement
pour la quantification des protéines, leur localisation et l’étude de
leurs modifications. Ces techniques sont aussi basées sur l’emploi de
biopuces et d’appareils sophistiqués empruntés aux chimistes et aux
physiciens. On peut de plus réaliser des protéines hybrides en fusionnant
à la séquence protéique étudiée un marqueur facile à visualiser, qui
va renseigner sur la localisation et la régulation de cette protéine.
Les organismes et les cellules vivantes intègrent un grand nombre de
réseaux de régulations et d’interactions complexes. Nombre de ces réseaux
opèrent au niveau moléculaire par le biais d’interactions entre gènes
et protéines. Au delà de l’analyse des gènes individuels et de leurs
produits protéiques, un objectif majeur pour le futur consiste en l’élucidation
de ces interactions. Certains outils prometteurs ont déjà vu le jour,
basés là encore sur l’emploi de biopuces miniaturisées, ou sur la détection
d’interactions moléculaires.
• La modification de l’expression des gènes
Un vieux principe propose que pour connaître un processus, rien ne vaut
d’y introduire un grain de sable et d’observer ce qui se passe. Ce principe
a largement été utilisé en biologie depuis Claude Bernard, notamment
par les approches génétiques d’analyse de mutants. Les mutants résultent
de modifications de la séquence des gènes, et sont donc affectés dans
un ou plusieurs caractères. Ils peuvent être d’origine spontanée, induits
par des traitements physiques ou chimiques, ou obtenus après introduction
de séquences d’insertion telles que l’ADN-T d’A. tumefaciens ou des
éléments transposables.
Pour appliquer le principe du grain de sable à grande échelle au génome
d’une espèce, par exemple Arabidopsis thaliana (voir p9) choisie pour
la petite taille de son génome, l’INRA participe à la production d’une
collection de plantes mutées pour chacun des 26 000 gènes de cette espèce.
Ces plantes mutantes sont obtenues par trangénèse et résultent de l’intégration
au hasard dans leur génome d’un fragment d’ADN appelé ADN-T (pour ADN
transféré). Cet ADN-T peut s’insérer dans la séquence d’un gène et par
là même l’empêcher d’assurer sa fonction : il provoque une mutation.
L’effet de cette mutation sur les caractéristiques de la plante renseigne
sur la fonction qui a été affectée.
Dans la mesure où les insertions de l’ADN-T sont aléatoires, il faut
trier, parmi toutes les plantes obtenues, celles qui portent la ou les
mutations que l’on recherche. Si on étudie un aspect particulier du
développement de la plante, par exemple la mise en place d’un organe,
on recherchera dans la collection les plantes qui sont affectées dans
la mise en place de cet organe, puis on isolera le gène muté grâce à
l’étiquette que constitue l’ADN-T.
A l’inverse, on peut poser la question de sa fonction pour chaque gène
identifié lors du séquençage du génome. On peut alors rechercher dans
l’ADN des plantes de la collection laquelle porte un ADN-T inséré dans
ce gène. On pourra alors observer qu’elles sont les conséquences de
cette mutation sur le phénotype de la plante et donc obtenir des indications
sur la fonction de ce gène.
On peut également introduire un gène donné dans la plante en changeant
ses signaux de régulation, ce qui va conduire à l’expression intempestive
du gène, et en observer les conséquences sur la biologie de la plante.
Arabidopsis thaliana :
plante modèle et conservation de la synténie

Photo D. Bouchez © INRA
Plante adulte d’Arabidopsis (20 cm)
Connaître l’ensemble des mécanismes
qui régissent la vie d’une plante, comme son développement, sa floraison
ou sa fructification, est essentiel non seulement au niveau fondamental
mais également pour améliorer les plantes cultivées.
La communauté internationale scientifique a choisi une crucifère, l’arabette
ou Arabidopsis thaliana, de la famille du chou et du colza, pour être
la plante modèle de leurs études. Cette petite plante se cultive facilement
en laboratoire et en serre, et quelques semaines suffisent pour obtenir
une plante au stade adulte, capable de fournir un grand nombre de graines
qui peuvent être stockées plusieurs années. Arabidopsis thaliana présente
aussi l’avantage considérable de posséder le plus petit génome végétal
connu.
A titre de comparaison, le riz et le maïs
ont une taille de génome respectivement 4 et 20 fois plus grande que
celle du génome de l’arabette. Le séquençage du génome de cette plante,
entrepris par un consortium international de laboratoires (dont le Génoscope
en France) a été achevé en 2000.
Au centre INRA de Versailles, une banque de mutants d’Arabidopsis thaliana
a été constituée. Ces mutants d’insertion sont obtenus par l’introduction
aléatoire d’un fragment d’ADN dans le génome. Les 50 000 lignées à la
disposition des chercheurs présentent parfois des caractéristiques inhabituelles
dues à la perturbation de la fonction du gène muté.
En quoi la connaissance du génome des plantes modèles comme l’arabette,
sans aucun intérêt économique, peut-elle présenter un intérêt ? Au delà
des connaissances de base apportées par ces études, on peut utiliser
la ressemblance entre le génome de ces espèces modèles et celui d’espèces
cultivées apparentées. Les gènes sont souvent organisés de la même manière
sur les chromosomes, et placés dans le même ordre : c’est le phénomène
de conservation de la synténie. Il est donc possible, moyennant des
vérifications, de s’appuyer sur les informations acquises sur un génome
modèle pour analyser les chromosomes d’une plante apparentée. Cette
ressemblance sert de base pour explorer des génomes plus complexes et
plus grands, comme ceux de la plupart des espèces cultivées.
La banque
de mutants d’Arabidopsis de Versailles

Photo C. Maitre © INRA
Serre
dans laquelle sont recherchées des plantes d’Arabidopsis mutantes parmi
les 50 000 lignées d’insertion produites par l’INRA.
Au centre INRA de Versailles, une banque de mutants d’Arabidopsis thaliana
a été constituée. Ces mutants d’insertion sont obtenus par l’introduction
aléatoire d’un fragment d’ADN dans le génome de la plante. Les 50 000
lignées à la disposition des chercheurs présentent des caractéristiques
inhabituelles dues à la perturbation de la fonction du gène muté et
sont très utiles pour étudier cette fonction.
Par exemple les mutants « tonneau » d’Arabidopsis présentent des altérations
de forme et de taille spectaculaires. On a pu relier ces modifications
à des défauts dans la mise en place d’une structure cellulaire particulière,
le cytosquelette. Ce dernier est au centre de la plupart des étapes
de la vie de la cellule : division et croissance cellulaires notamment.
Ces mutants donnent des renseignements précieux sur certains mécanismes
fondamentaux de l’organogenèse végétale et les liens entre l’organisation
cellulaire et la morphologie des plantes.
Génoplante
En France en 1999, le programme Génoplante est initié pour le développement
de la génomique végétale. L’INRA contribue activement à l’élaboration
de ce projet et à sa réalisation, qui donne naissance à un Groupement
d’Intérêt Scientifique. Il offre la particularité de réunir des partenaires
de la recherche publique (CIRAD, CNRS, INRA et IRD) et des partenaires
de la recherche privée (Biogemma, Bioplante, Aventis Crop Science).
La recherche s’organise selon deux axes : “Génoplante générique”, dont
les travaux sont coordonnés sur les espèces modèles (arabette et riz)
et visent aussi à créer d’indispensables outils technologiques, notamment
en bio-informatique et robotisation et nécessitent de mettre des travaux
en commun ; “Génoplante espèces” qui regroupe les programmes spécifiques
sur des espèces d’intérêt agronomique (blé, maïs, colza pour l’essentiel,
mais aussi pois, luzerne, piment, melon, vigne…) afin de mieux connaître
leurs génomes en vue de développements ultérieurs.
Les travaux menés dans le cadre de Génoplante participent à l’accroissement
des connaissances générales sur le vivant.
Retour
sommaire

Institut National de la
Recherche Agronomique
Copyright © 2001 - Tous droits réservés
Mise en ligne : Avril 2001