Le Monde Complexe Et Mouvant Des ARN.

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 22

Immuno-analyse et biologie spécialisée (2010) 25, 4—25

REVUES GÉNÉRALES ET ANALYSES PROSPECTIVES

Le monde complexe et mouvant des ARN.


Première partie
The RNA world, a complex and moving world. First part

J. Lamoril a,∗, N. Ameziane a, J.-C. Deybach a, P. Bouizegarène a, M. Bogard b

a
Laboratoire de biochimie et génétique moléculaire, hôpital Louis-Mourier, 178, rue des Renouillers, 92700 Colombes, France
b
Laboratoire de biochimie et biologie moléculaire, centre hospitalier Victor-Dupouy, 69, rue du Lieutenant-Colonel-Prud’hon,
95107 Argenteuil cedex, France

Reçu le 1er septembre 2009 ; accepté le 10 janvier 2010


Disponible sur Internet le 21 février 2010

KEYWORDS Summary Since the elucidation of the genetic code approximately 40 years ago, the role of
RNA; RNA in biology has gained increasing attention. Now, study of RNA is one of the fastest developing
Transcriptome; area in molecular and cellular biology. For a long time, biologists have been focused on DNA
Ribonome and proteins with little interest for RNA. The growing interest in genome-wide transcriptional
profiling has allowed new developments in RNA research and brought important attention to
the RNA world, its incredible complexity and its huge functional role within the cell and its
environment. The RNA world with its remarkable range of biological processes have important
implications in human health that begins only to be sketched out. In this article in two parts,
we will describe the diversity of the RNA world and potential consequences in medicine.
© 2010 Published by Elsevier Masson SAS.

Résumé Depuis la découverte du code génétique il y a environ 40 ans, le rôle des ARN en
MOTS CLÉS biologie n’a fait que croître. Cela fait environ une dizaine d’années que l’étude des ARN est
ARN ; devenue un des domaines les plus fertiles de la recherche en biologie moléculaire et cellulaire.
Transcriptome ; Jusqu’à ces dernières années en effet, la partie du génome constituée de l’ADN codant les
Ribonome protéines constituait le moteur principal de la recherche en génétique moléculaire. Les ARN
étaient peu étudiés. Les recherches récentes et plus particulièrement l’étude des transcrits
ARN (grâce en particulier aux transcriptomes) ont cependant démontré le rôle crucial des ARN

∗ Auteur correspondant. Laboratoire de bochimie B et génétique, hôpital Bichat—Claude Bernard, 46, rue Henri-Huchard,

75018 Paris, France.


Adresse e-mail : [email protected] (J. Lamoril).

0923-2532/$ – see front matter © 2010 Publié par Elsevier Masson SAS.
doi:10.1016/j.immbio.2010.01.002
Le monde complexe et mouvant des ARN. Première partie 5

et la richesse de ce nouveau monde dans les relations complexes au sein de la cellule et de


son environnement. Ces études ont révélé de nouveaux et multiples mécanismes fonctionnels.
Cette explosion de découvertes et la révolution qui en découle ne sont pas terminées. Les ARN
dévoilent leurs mystères et les implications majeures en médecine commencent seulement à
s’ébaucher. Nous allons décrire dans cet article constitué de deux parties la diversité incroyable
de ce monde et les implications importantes pour la santé humaine.
© 2010 Publié par Elsevier Masson SAS.

Introduction Structure d’un ARN

Depuis le décryptage du code génétique, il y a environ Structure de base


40 ans, le rôle de l’acide ribonucléique (ARN) en biolo- L’ARN se distingue de l’ADN par son sucre, le D-ribose, et
gie n’a fait que croître et constitue actuellement un des diffère d’une base pyrimidique, l’uracile (U) étant intégrée
domaines de découvertes les plus fertiles de la biologie. À au lieu de la thymine (T). Il s’agit d’une macromolécule for-
la fin des années 1990, la relation entre l’acide désoxyri- mée de la polymérisation d’unités de base, les nucléotides
bonucléique (ADN), l’ARN et la protéine semblait simple. (composés de l’union d’une base avec un sucre, le D-ribose
L’ADN génomique était transcrit en ARN messager (ARNm) [cette dernière association s’appelant le nucléoside] et d’un
et ce dernier traduit en protéine. Depuis 2000, de nom- acide phosphorique), reliés par des liaisons phosphodies-
breuses études ont décrit l’existence d’une panoplie d’ARN ters. Les bases composant un ARN normal sont au nombre
aux rôles insoupçonnés jusqu’alors. Leur découverte conco- de quatre, les bases puriques (adénine [A] et guanine [G])
mitante à celle de l’épigénétique, a révolutionné notre et les bases pyrimidiques (cytosine [C] et uracile [U]). Un
compréhension du monde du vivant et notre vision de la phy- ARN peut s’apparier à lui-même, à un autre ARN ou à un
siopathologie humaine. Les dernières analyses du génome ADN par des liaisons faibles, les liaisons hydrogène selon la
ont révélé qu’environ 60—70 % de notre génome au minimum règle de base suivante (règle de Watson-Crick) :
était transcrit [1]. Outre les gènes codant pour des protéines
(2 % du génome humain et environ 25 000 gènes), de nom- • la base « A » est associée avec la base « U » par deux liai-
breux transcrits ne sont pas codants et sont constitués pour sons hydrogènes (A = U) ;
une grande majorité par des ARNs fonctionnels provenant de • la base « G » est associée avec la base « C » par trois liai-
régions intergéniques, d’introns, d’exons ou de séquences sons hydrogènes (G≡T).
répétitives (pour certains, plus de 90 % du génome est trans-
crit [2]). Il reste cependant encore beaucoup d’inconnues. Par opposition à l’ADN sous sa forme (majeure) hélicoï-
Ainsi, progressivement, le monde des ARNs se dévoile [3]. dale B, l’ARN forme une hélice A plus compacte. Ainsi, sa
Dans cet article, nous allons le survoler, montrer sa diversité, structure spécifique permet d’autres formes d’appariement
sa richesse et son importance croissante en médecine. (dites non Watson-Crick), la plus commune étant la paire
G : U (appelée aussi wobble pair). Des interactions mul-
tiples sont donc possibles au niveau des nucléotides ARN et
ARN : définition jouent un rôle fondamental dans sa structure. On peut par
exemple observer des interactions triples (ainsi, un nucléo-
Il existe de nombreux ARN aux fonctions différentes. L’étude tide simple brin peut interagir avec une pair de bases), ce
du transcriptome (catalogue des ARN codés par le génome) type d’interaction impliquant non seulement la base mais
a montré son incroyable complexité. La majorité du génome le sucre associé. C’est le cas du motif « A », l’adénosine
est en effet transcrite par un ensemble de réseaux se che- étant souvent en contact avec une paire de bases type
vauchant parfois en sens et antisens, souvent soumis à de Watson-Crick. L’ARN est donc constitué d’hélices double
nombreux épissages alternatifs. Les études sur le trans- brins (comme pour l’ADN) définies par la règle de Watson-
criptome non codant pour des protéines sont par ailleurs Crick et de motifs ARN essentiellement maintenus par
de plus en plus nombreuses. La moisson des découvertes des appariements dit « non Watson-Crick » (exemple : appa-
est importante aboutissant à la description de nombreuses riements de type « reverse Watson-Crick », « Hoogsteen »,
classes de petits ARN (20—200 nucléotides) tels que les « reverse Hoogsteen » etc.). Ces interactions sont moins
micro-ARN, les ARN PIWI, les petits ARN interférents et dépendantes de la structure primaire comme on le voit
de grands ARN (> 200 nucléotides) non codant. Ces derniers dans l’ADN par exemple et expliquent que l’identification
constituent probablement la majeure partie du transcrip- informatique d’ARNnc dans le génome soit plus compliquée
tome non codant. Aussi, distingue-t-on dorénavant les ARN [4].
qui jouent le rôle de molécules intermédiaires transmettant
l’information génétique codée dans l’ADN avec pour finalité Autres éléments structuraux
la synthèse de protéines, des ARN non codants (ARNnc) ayant La structure de l’ARN est complexe : son étude réalisée
également un rôle fonctionnel majeur. Bien que différents notamment par cristallographie et par études fonctionnelles
dans leur rôle, ces ARN présentent une structure de base a démontré l’importance de ces structures secondaires et
similaire. tertiares dans leur fonctionnalité. Nous citons ici, à titre
6 J. Lamoril et al.

d’exemple, quelques éléments structuraux importants pré- la ligation d’ARN, les modifications site-spécifique d’ARN, la
sents dans certains ARNs : méthylation de l’ADN, la synthèse de télomère, la modula-
tion des fonctions protéiques. Les ARNs jouent ainsi un rôle
• le pseudo-nœud (pseudoknot) : il s’agit d’une structure primordial dans l’expression des gènes et dans la stabilité
tertiaire entortillée contenant deux éléments en épingle à du génome.
cheveux (stem-loop), le premier élément étant une struc- Quelle que soit la classe d’ARN, le principe d’action est
ture interne de la construction en épingle à cheveux du le même. Les ARNs sont des molécules intermédiaires (adap-
second. Elle peut se trouver en 5 , en 3 ou dans la région tateurs) se fixant sur une séquence nucléique spécifique
codante de l’ARN. Selon sa position dans l’ARN, elle joue (molécule cible) et provoquent ainsi l’activité catalytique
une influence sur la traduction des ARNm (en 5 ), la phase d’une ou plusieurs molécule(s) partenaire(s). Dans le cas
de lecture, la reconnaissance du codon stop, l’élongation des ARNnc, de nombreuses protéines partenaires sont impli-
(dans la partie codante) ainsi que dans le passage de la quées et constituent une unité fonctionnelle, le complexe
traduction à la réplication de l’ARN viral (en 3 ) [5]. Cette des ribonucléoprotéines.
structure est fréquemment retrouvée dans le génome des Il est impossible de décrire tous les ARN : un ouvrage
virus ARN ; entier serait nécessaire. Nous décrirons uniquement et sim-
• le ribose zipper (fermeture à ribose) : le groupe 2-OH de plement ceux qui nous paraissent à ce jour important pour
l’ARN peut servir de donneur ou d’accepteur d’hydrogène. comprendre les évolutions de la médecine actuelle.
Une fermeture à ribose peut se former à l’interface de
deux duplex ARN dans lesquels les groupes 2 -OH sont
Les ARN codants
associés par des liaisons hydrogène ;
Seuls les ARNm sont des ARN codants.
• le récepteur de tétraboucle (tetraloop) : il s’agit d’une
Après synthèse du pré-ARNm par transcription de l’ADN
interaction à grande distance dans laquelle un arrange-
génomique, les introns sont éliminés par épissage (splicing)
ment particulier est observé, constitué de formations de
et l’ARNm mature transporté dans le cytoplasme pour tra-
boucles complexes avec interaction de type liaison hydro-
duction en protéine. Ils ne représentent que 2,3 % du génome
gène et fermeture de la boucle par appariement entre
[10].
guanine (en 5 de la boucle) et adénine (en 3 de la
boucle) ;
• l’IRES (internal ribosome entry site, site d’entrée interne Les ARN non codants
des ribosomes) [5] : il s’agit d’une structure présente dans Les ARNnc sont constitués d’un grand nombre d’ARN
la partie interne de la région 5 non-codante essentiel- différents (Tableaux 1 et 2). De manière générale, les
lement chez les virus ARN qui déclenche une traduction ARNnc servent à guider des complexes protéiques vers des
alternative à la traduction classique et permet donc la séquences d’acides nucléiques. Il résulte de cet assemblage
synthèse protéique [6]. ARNnc—complexe protéique, une multitude de fonctions
cellulaires, par exemple, la régulation d’un gène en cis ou en
Gènes d’ARN trans [11]. Par ailleurs, leur localisation dans le génome est
Normalement, les gènes d’ARN non traduits possèdent, variable. Sans rentrer dans les détails et selon l’ARNnc en
comme les autres gènes, un promoteur et sont transcrits de cause, on peut trouver ces ARNnc dans le génome sur le brin
la même façon que les gènes codant pour des protéines par sens ou le brin antisens, dans ces deux cas chevauchant ou
une ARN polymérase (le plus souvent, l’ARN polymérase II, non un ou plusieurs exons d’un gène transcrit (avec possible
pol II) [7]. Ces gènes peuvent être transcrits à partir du brin interférence transcriptionnelle, voir infra). L’expression de
sens ou antisens et peuvent même dans certains cas partager l’ARNnc peut aussi être bidirectionnelle. Enfin, l’ARNnc peut
le même promoteur qu’un autre gène. Après le début de la être situé dans un intron ou dans une région intergénique
transcription, un chapeau est ajouté en 5 de nombreux ARN (entre deux gènes codants). Toutes ces localisations pos-
(incluant les ARNnc) par la pol II (structure m7 Gppp reconnue sibles rendent difficile la mise en évidence d’un ARNnc [12].
par le facteur d’initiation de la traduction eIF4F), structure Parmi ces ARNnc, on peut citer :
indispensable à sa stabilité ainsi que pour la traduction en
protéine dans le cas des ARNm. En 3 , la transcription des
• les ARN ribosomaux (ARNr), composants du ribosome,
ARN est plus complexe [8].
organelle cytoplasmique permettant la traduction des
ARNm en protéines. Ils représentent la majorité des ARN
Classification des ARN de la cellule ;
• les ARN de transferts (ARNt) : ce sont des transporteurs
Selon l’ARN, la molécule possède une activité catalytique d’acides aminés qu’ils amènent au site ribosomique pour
et/ou constitue un composant structural d’un ensemble la synthèse protéique ;
complexe. Actuellement, on distingue les ARN codants (en • les ribozymes : ARN possédant une activité catalytique
pratique, les ARNm, ARN messagers) et les ARNnc. Pour (par exemple, la RNase P, ribozyme clivant les précurseurs
certains, 98 % des transcrits du génome humain représente- d’ARNt). On peut citer les ribozymes « hairpin » (en boucle
raient des ARNnc [9]. Parmi ces ARNnc, on distingue les longs à cheveux), hammerhead (en tête de marteau), le ribo-
ARN dont la taille est supérieure à 200 nucléotides qui fonc- zyme du virus de l’hépatite Delta, les introns des groupes
tionnent sans prétraitement particulier et les petits ARNnc I, II et III, capables d’auto-épissage, présents chez les
issus d’un prétraitement de longs précurseurs. Les fonctions plantes, les champignons et les bactéries mais rarement
de ces ARNs sont multiples. On peut citer le clivage d’ARN, chez les animaux ;
Le monde complexe et mouvant des ARN. Première partie 7

Tableau 1 Bases de données d’ARN non codant.

Base de données ARN cible Site Internet

MiRBase miARN http://microrna.sanger.ac.uk


Argonaute MiARN http://www.ma.uni-heidelberg.de/apps/zmf/argonaute
SnoRNABase SnoARN http://www-snorna.biotoul.fr
Plant snoRNA Database SnoARN http://bioinf.scri.sari.ac.uk/cgi-bin/plant snorna/home
SnoRNabase SnoARN http://gene.fudan.sh.cn/snoRNAbase.nsf
The genomic tRNA database ARNt http://lowelab.ucsc.edu/GtRNAdb
Compilation of tRNA sequences and ARNt http://www.tRNA.uni-bayreuth.de
sequences of tRNA genes
Arabidopsis small RNA project Petits ARN http://asrp.cgrb.oregonstate.edu
Rfam (RNA family database) ARN non codants http://www.sanger.ac.uk/software/Rfam
RNAdb ARN non codants http://research.imb.uq.edu.au/RNAdb
Non coding RNA database ARN non codants http://biobases.ibch.poznan.pl/ncRNA/
NONCODE ARN non codants http://www.noncode.org/

• les petits ARN : un certain nombre de petits ARN contri- une séquence codante appelée aussi open reading frame
buent à divers processus biologiques en association avec (ORF) et constituée de nucléotides dont l’association par
des complexes de ribonucléoprotéines (RNP), par exemple triplet est dénommée codon (chaque codon correspondant
les petits ARN nucléaires (snRNA, small nuclear RNA). Ces à un acide aminé selon le code génétique), une région 3 non
petits ARN jouent alors le rôle de guide de reconnaissance codante (3 NC ou 3 UTR) contenant un signal de polyadény-
d’une séquence nucléique cible grâce à la complémenta- lation (séquence consensus 5 -AAUAAA), une queue poly-A
rité de séquence [11] ; (longue suite d’adénosines) et de nombreuses séquences
• les snoRNA (small nucleolar RNA, petits ARN nucléo- régulatrices [14,15]. Un ORF débute par le codon initiateur
laires) : ces petits ARN contribuent aux modifications de AUG (la séquence consensus du site d’initiation de la tra-
séquences ARN des ARN ribosomaux. Parmi ces petits ARN duction chez l’humain est : 5 -GCCRCCAUGG) dénommé site
encore mal connus, certains joueraient aussi un rôle dans d’initiation de la traduction et se termine par le codon stop
la régulation de l’épissage alternatif [1] ; X (il en existe trois : UAA, UGA, UAG) (Fig. 1). La transcrip-
• les microARN (miARN) : ce sont de courts ARN de 21—23 pb tion de la région de l’ADNg cible catalysée essentiellement
dont le rôle de régulateur de l’expression est fonda- par l’ARN polymérase II, donne un pré-ARNm, copie de l’ADN
mental. Ils provoquent la dégradation de l’ARNm ou la génomique. Après épissage (élimination des introns dégra-
répression de la traduction ; dés dans le noyau par des complexes enzymatiques, les
• les siARN (small interfering RNA, petits ARN interfé- exosomes, présents aussi dans le cytoplasme), phénomène
rents) : leur rôle est similaire à celui des microARN, mais complexe que nous ne décrirons pas, l’ARNm mature est
ils dégradent systématiquement l’ARN cible ; obtenu. Il est important néanmoins de savoir que, selon
• les piARN (Piwi-interacting RNA, piRNA, ARN interagissant les pré-ARNm, des épissages alternatifs sont possibles. Cet
avec les protéines Piwi) : ces ARN jouent aussi un rôle ARNm sera ensuite traduit en protéine à l’aide des ARN de
dans la régulation de l’expression des gènes. Ces ARN sont transfert (ARNt) et des ribosomes (situés essentiellement
encore mal connus. dans le cytoplasme et le réticulum endoplasmique mais
retrouvés aussi associés aux mitochondries, aux synapses,
Il est probable que d’autres ARN restent à découvrir aux structures d’adhésion cellulaire) [16]. L’étude du trans-
(Tableau 2). criptome a permis de constater l’extraordinaire complexité
de cette transcription dont la vision jusqu’au début des
années 2000 était simple [17]. Il a été notamment constaté
Les ARN messagers (ARNm) que le début de la transcription (site d’initiation de la trans-
cription) présentait souvent de nombreuses alternatives (on
Bien que des progrès considérables aient été réalisés en parle de diversité transcriptionnelle).
biologie moléculaire, un des principes fondamentaux de la
biologie moléculaire découvert dans les années 1950 reste
vrai : l’information génétique est transmise de l’ADN vers L’épissage des pré-ARNm
l’ARN puis vers la protéine. Un ARN messager (ARNm) est
un ARN, copie de la partie codante du gène (ADNg) à partir Le mécanisme d’élimination des introns a lieu dans le
duquel il a été formé (on parle de transcrit) et qui servira de noyau. Complexe, nous en rappellerons seulement certains
support pour la synthèse peptidique d’une protéine (cette aspects [18]. L’ADN génomique est transformé en pré-ARNm
transformation en protéine étant appelée la traduction). Sur par transcription. Ce pré-ARNm est une copie de l’ADN
le plan structural, un ARNm est schématiquement constitué génomique contenant l’information pour la synthèse de la
d’un chapeau en 5 (ajout en 5 du pré-ARNm d’un nucléotide protéine codée par le gène. Le pré-ARNm possède donc les
G méthylé non codé par l’ADNg), une partie non traduite, la exons et introns du gène correspondant [19]. Les introns
partie 5 non codante (5 NC ou 5 UTR, untranslated region), sont alors éliminés pour réunir entre eux les exons cor-
8 J. Lamoril et al.

Tableau 2 Les ARN non codants [13].

ARN non codants Fonction

Traitement de l’ARN et modifications


ARNsn du complexe d’épissage Épissage des introns du pré-ARNm
ARNsn U7 Formation de l’histone en 3 du pré-mARN
ARNs C/D Méthylation 2 -O des ARNr, ARNsn, et des ARNt
Traitement des ARNr
ARNs H/ACA Pseudo-uridylation des ARNr et des ARNsn
Traitement des ARNr
ARN RNase P Maturation du pré-ARNt (clivage de l’extrêmité 5 ) - Ribozyme
ARNs guide (ARNg) du trypanosome Editing de l’ARNm
Production d’ARNm alternatifs
snoARN Modifications spécifiques des ARNr, ARNsn voire ARNt (chez les
archea seulement)
Transcription
ARN 7SK Contrôle de l’élongation/transcription médiées par le P-TEFb
ARN 6S Régulation transcriptionnelle chez la bactérie par interaction
directe avec l’ARN polymérase
Traduction
ARNt Traduction de l’ARNm
ARNtm Contrôle de qualité chez la bactérie
Déclenche le relargage des ribosomes bloqués pendant la
traduction
ARNr Participe au sein du ribosome à la formation de la liaison
peptidique d’un acide aminé au peptide en formation
Transport des protéines
ARN SRP Translocation des protéines vers le réticulum endoplasmique
Régulation de l’expression des gènes
siARN Inhibition de gènes
Dégradation d’ARN de virus, de rétro-éléments et de
séquences répétées
miARN Inhibition de gènes
Inhibition de la traduction
Dégradation d’ARNm cibles
piARN Inhibition de gènes
Inhibition de transcrits répétés dans la lignée germinale de
mammifère (modification de chromatine ?)
rasiARNs Inhibition de gènes
Inhibition de transcrits répétés dans la lignée germinale de la
drosophile (modification de chromatine ?)
ARN antisens d’Eubactéries Inhibition de gènes
Inhibition de la traduction
Dégradation d’ARN messagers cibles
Parfois, activation de gènes
ARN Xist Participe à l’inactivation de l’X
Stabilité génomique
ARN télomérase Synthèse du télomère
miARN : microARN ; piARN : PIWI-interacting ARN ; P-TEFb : positive transcription elongation factor b ; rasiARN : repeat-associated siARN ;
RNase : ribonucléase ; rARN : ARN ribosomique ; siARN : small interfering ARN (ARN intérférants) ; snARN : small nuclear ARN (petits ARN
du noyau) ; SRP : signal recognition particle ; tmRNA : transfer messenger ARN ; tARN : ARN de transfert.

respondant à la partie codante du gène. Cette élimination [20]. Les introns à éliminer varient en taille d’une cen-
des introns, l’épissage (en anglais, splicing), est effectuée à taine de nucléotides à plusieurs milliers. Par ailleurs, selon
l’aide d’un complexe, le spliceosome. Ce complexe contient les gènes, l’épissage peut varier : on parle alors d’épissage
cinq ribonucléoprotéines (U1, U2, U4, U5 et U6 appelées alternatif (c’est-à-dire l’inclusion ou l’exclusion d’un ou plu-
aussi snRNP) et de nombreuses autres protéines non-snRNP sieurs exons), mécanisme pouvant être tissu spécifique ou
Le monde complexe et mouvant des ARN. Première partie 9

Figure 1 Schéma d’un ARNm. L’ARNm est constitué de 5 vers 3 d’un chapeau (m7 G), d’une région 5 non codante (5-NC), d’un
cadre ouvert de lecture (open reading frame [ORF]) correspondant à la région codante traduite en protéine, d’une région 3 non
codante (3 -NC) et d’une queue poly(A). Deux codons spécifiques limitent l’ORF, le codon initiateur AUG et le codon stop appelé
aussi codon X (correspondant à un des codons suivants : UGA, UAA et UAG).

variable au cours du développement. Après épissage, les fer, les iron responsive element (IRE). Par ailleurs, cer-
ARNm sont exportés dans le cytoplasme à l’aide de protéines taines structures secondaires peuvent aussi modifier cette
d’export. régulation. En effet, l’ARNm peut présenter des séquences
autocomplémentaires provoquant la formation de structures
en boucle (stem-loop) où se fixent certaines protéines, les
La polyadénylation des ARNm mRNP (mRNA binding proteins), les iron regulatory pro-
tein (IRP) se fixant sur les IRE en étant un exemple. Ces
L’épissage et la polyadénylation des ARNm (ajout d’une éléments jouent un rôle important dans la stabilité de
queue poly(A) en 3 de l’ARNm) sont des processus couplés, l’ARNm, son accessibilité par les ribosomes, ses interac-
les facteurs d’épissage proches des sites poly(A) influençant tions avec la machinerie complexe traductionnelle et sa
le traitement de l’extrêmité 3 de l’ARNm et les facteurs de localisation cellulaire. Dans certains cas (par exemple, dans
polyadénylation influençant réciproquement l’épissage des certains neurones), la régulation de l’expression des gènes
introns proches des sites poly(A). Cette régulation complexe est également fonction de sa localisation dans la cellule,
joue un rôle majeur dans la régulation des sites alternatifs restreignant ainsi la traduction à certains sites cellulaires,
de polyadénylation [19]. Par ailleurs, pour certains auteurs, ce qui permet de réguler cette expression indépendam-
l’existence possible de sites alternatifs de polyadénylation ment de facteurs agissant directement sur le gène. Ce
serait un moyen d’échapper à la dégradation de l’ARNm par mécanisme permet d’augmenter localement la traduction
des miARN [21]. en protéines tout en économisant de l’énergie (la protéine
n’est pas transporté au site actif mais y est directement
La régulation de la transcription produite). L’adressage cellulaire des ARNm est complexe
et implique de nombreux partenaires protéiques [25]. Les
Sans rentrer dans les détails, nous allons rappeler quelques différentes étapes de transcription bien que décrites sépa-
éléments importants de cette régulation [22]. La régulation rément sont en fait liées. Une grande partie se déroule
de la transcription de l’ARNm est en partie liée à la diver- dans le noyau pour se poursuivre dans le cytoplasme
sité des parties 5 et 3 des gènes mais aussi à certaines [26].
caractéristiques variables de l’ARNm telles que sa rapi-
dité de synthèse (turnover), sa traduction et sa localisation L’editing des ARNm
intracellulaire. D’autres structures peuvent être présentes
dans les ARNm. Ainsi, il est possible d’avoir plusieurs ORF Les ARNm présentent une grande diversité résultant de deux
(on parle alors d’upstream ORF [uORF]) dont l’importance mécanismes, l’épissage alternatif et l’editing (terme diffi-
fonctionnelle dans la régulation de la transcription et la cile à traduire en français). L’editing des ARN (sur les ARNm
traduction de l’ARNm a été récemment confirmée [23] : et les ARNnc) est une modification post-transcriptionnelle
plusieurs sites d’initiation de la traduction (AUG, codon de l’ARN qui provoque des changements subtils (inser-
initiateur), des sites d’entrée de ribosome (plus exacte- tion, délétion, conversion enzymatique d’un ou quelques
ment de la sous-unité 40S du ribosome) [24]. On peut ribonucléotides). Il peut agir ou non de concert avec les
aussi avoir des sites alternatifs de fixation des ribosomes, mécanismes d’épissage alternatif. Ces réactions expliquent
les internal ribosome entry site (IRES), plusieurs signaux la grande diversité transcriptionnelle. La forme la plus
de polyadénylation ainsi que des sites de régulation de commune d’editing est la transformation de l’adénosine
la traduction (par exemple, des éléments de réponse au en inosine. À ce jour, en excluant les zones répéti-
10 J. Lamoril et al.

tives, quelques centaines de gènes édités ont été recensés


[27].
Quelques exemples.

Transformation de l’adénosine en inosine


Réaction prédominante d’editing chez les mammifères, il
s’agit d’une réaction de désamination de l’adénosine en
inosine catalysée par les enzymes adenosine deaminases
acting on RNA (ADARS). L’inosine est ensuite reconnue par
le ribosome (et les reverses transcriptases) comme une gua-
nosine (A → I → G).

Modification de la cytosine en uracile


L’editing peut aussi être réalisé à l’aide d’une famille
de cytidine déaminase, les apolipoprotein B editing com- Figure 2 L’editing des ARN.
plex (APOBEC), groupe d’enzymes agissant sur l’ADN et/ou
l’ARN (dix sont actuellement recensées). Elles catalysent
la désamination de la cytosine en uridine [28]. Ce méca- Petits ARN nucléaires, ARNsn (small nuclear
nisme a été retrouvé chez de nombreux procaryotes (par RNA, snRNA)
exemple, le virus de la rougeole) et chez les eucaryotes
dont l’exemple le plus connu est celui de l’apolipoprotéine
Les ARNsn constituent un petit groupe de transcrits présents
B (ApoB, Omim 107730) pour lequel existent deux formes
en grande quantité dans le noyau. Ces derniers sont consti-
(ApoB48 et ApoB100) de métabolisme totalement différent
tués de deux classes en fonction de leur séquence et des
et codées par le même gène ApoB. L’une est synthétisée
cofacteurs protéiques associés (snRNP, small nuclear ribo-
dans le foie (ApoB100) et l’autre dans l’intestin (ApoB48).
nucleoproteins) (Fig. 3) :
Dans ce cas particulier, l’editing du gène au niveau d’une
séquence CAA est effectué par désamination de la cyto-
sine (ce qui la transforme en uridine : C → U) et produit • les ARN de la classe Sm, caractérisés par un chapeau 5 -
un codon stop (UAA) et la formation d’une protéine tron- triméthylguanosine, une anse en 3 (stem-loop) et un site
quée, ApoB48. Pour mémoire, certaines APOBEC agissent au de fixation (dénommé Sm) pour un groupe de protéines
niveau de l’ADN par un mécanisme d’editing et sont impli- dites Sm (protéines U1, U2, U4, U4atac, U5, U7, U11,
qués notamment dans la résistance aux virus (notamment U12) ;
VIH) [28].

Autres rôles de l’editing


L’editing joue aussi un rôle dans la régulation des petits ARN
interférents (siARN), les miARN et d’autres ARNnc en inhi-
bant leur action par editing de l’ARN double brin cible par
exemple ou par action directe de fixation des ADARS sur ce
même ARN. Un phénomène similaire existe pour les miARN
[29].
Par ailleurs, il a été aussi démontré que l’editing était
un moyen de réguler les séquences Alu (courtes séquences
répétées d’environ 280 pb de la famille des SINEs [short
interspersed nuclear elements] qui constituent environ 10 %
du génome humain). Les séquences Alu transcrites pour-
raient modifier l’expression des gènes dans lesquels ils se
trouvent [29]. Il existerait donc un editing important des
séquences Alu tissu-spécifique (notamment dans le cer-
veau et le rein) dont les conséquences ne sont pas claires
actuellement, même s’il semble qu’il s’agisse d’un méca- Figure 3 Les petits ARN nucléaires, ARNsn [13]. Les ARNsn
nisme anti-Alu. Dans certains cas, l’editing permet aussi sont constitués de deux classes : (i) les ARNsn Sm, carac-
une diversité transcriptionnelle déjà évoquée en participant térisés par un chapeau 5 -triméthylguanosine (TMG), un site
aux mécanismes d’épissage alternatif ou de modification de de fixation des protéines Sm (site Sm) et une structure en
codon stop (Fig. 2) [29]. L’editing joue un rôle majeur dans anse (3 stem-loop) encadrée. Ils sont transcrits par l’ARN poly-
de nombreux tissus et plus particulièrement dans le cerveau mérase II ; (ii) les ARNsn Lsm, caractérisés par un chapeau
tant dans son développement que dans la régulation de nom- 5 -monométhylphosphate (MPG), une structure en anse (3 stem-
breuses fonctions cellulaires et même semble-t-il cognitives loop) et une queue poly-(U), le site Lsm. Ils sont transcrits par
[30]. l’ARN polymérase III.
Le monde complexe et mouvant des ARN. Première partie 11

• les ARN de la classe Lsm, caractérisés par un chapeau des introns des pré-ARNm. Cette réaction est guidée par
monométhylphosphate, une anse 3 (stem-loop) se termi- l’appariement base-base entre les ARNsn constitutifs du
nant par une queue uridine constituant un site de fixation complexe protéique d’épissage appelé spliceosome et les
pour des protéines dénommées Lsm (U6 et U6atac). jonctions exon/intron du pré-ARNm. Il s’agit d’une réaction
complexe dans laquelle plus de 150 protéines interagissent
Dans le génome humain, les gènes codant pour ces ARNsn [32].
sont répétés de nombreuses fois. Transcrits par l’ARN poly-
mérase II, les gènes de ARNsns Sm les mieux caractérisés
sont ceux codant pour les ARNsn U1 et U2 du complexe Petits ARN nucléolaires, ARNsno (small
d’épissage. Nous les prendrons comme exemple pour décrire nucleolar RNA, snoRNA)
ce petit ARN. Le promoteur du gène possède deux séquences
particulières et importantes dans le contrôle de la transcrip- Schématiquement, les ARNsno sont impliqués dans les modi-
tion du gène, le site distal sequence element (DSE) agissant fications des ARNr, des ARNsn et des ARNt [33]. Les petits
comme un enhancer et le site proximal sequence element ARN nucléolaires (ARNsno) sont constitués de deux familles,
(PSE). Le transcrit de ces gènes n’est pas épissé et contrai- les ARNs C/D et les ARNs H/ACA. Le terme « nucléolaire »
rement à la majorité des transcrits ne possède pas de queue est historique et se rapporte aux descriptions initiales obser-
poly-A en 3 . Une séquence spécifique en 3 , dénommée 3 - vant leur localisation aux nucléoles dans le noyau cellulaire
box, est localisée 9—19 pb en aval de la région codant pour par opposition aux ARNsn. En fait, cette dénomination est
l’ARN. Cette boîte est nécessaire pour la formation cor- trompeuse, cette classe d’ADN possédant de nombreuses
recte en 3 de l’ARNsn. D’autres ARNsn, les ARNs Lsm (Like fonctions tant dans le noyau que dans le cytoplasme. Chez
Sm : famille de protéines à laquelle se lie l’ARN) sont trans- l’être humain, au moins 200 ARNs différents C/D et H/ACA
crits par une ARN polymérase III [31]. Alors que les ARNsn sont répertoriés. L’étude de ces ARN à travers les espèces
Sm sont exportés dans le cytoplasme pour leur maturation montre que leur existence remonte à plus de deux à trois
puis repassent dans le noyau par un processus complexe, les millions d’années. Ces ARN jouent un rôle majeur dans de
ARNsn Lsm restent intranucléaires [13]. nombreux processus biologiques tels que la traduction des
L’ensemble constitué par ces ARNsn et les snRNP par- protéines, l’épissage des ARNm et la stabilité du génome. Ils
ticipe à la réaction d’épissage, c’est-à-dire l’élimination participent aussi aux modifications nucléotidiques d’autres

Figure 4 Les ARNsno C/D et H/ACA [13]. a : structure secondaire d’un ARNsno C/D, guide de méthylation 2 O. Deux boîtes
conservées C (RUGAUGA) et D (CUGA) sont présentes aux extrémités en anse en formant des tours en boucles (kink turns, k-turns).
La pair C/D est associée à une séquence antisens (trait épais) en amont de la boîte D et s’apparie avec l’ARN cible (en rouge). L’ARN
cible se méthyle sur le ribose du nucléotide (nt) apparié à l’ARN guide (l’ARNsno) se trouvant cinq paires de bases en amont de la
boîte D ; b : structure secondaire d’un ARNsno H/ACA, ARN guide de pseudo-uridylation (pseudoU). Une boucle (hairpin) imparfaite
est formée entre la tige inférieure, la poche de pseudoU, la tige supérieure et l’anse apicale. L’ARN cible est apparié dans la poche
de pseudoU. Une boîte ACA ou H se trouve en aval de la boucle. À 15 nucléotides (nt) de cette boîte se trouve l’uridine de l’ARN
cible qui est modifié (N␺ représente le nucléotide conservé adjacent à l’uridine cible ␺). La boîte H/ACA est en fait constituée de
deux unités en boucle séparées par une séquence simple brin contenant la boîte H (ANANNA). Chez les eucaryotes, l’anse apicale
possède une boîte CAB (Cajal box de séquence UGAG) permettant la rétention de certains ARN ACA/H pour guider la modification
d’ARNsn (plutôt que des ARNr). Chez les Archeae, ces ARN possèdent aussi une formation en tours de boucle (k-turns). A : adénine ;
U : uracile ; N : n’importe quelle base ARN ; R : base pyrimidique (cytosine ou uracile) ; G : guanine.
12 J. Lamoril et al.

ARNnc au sein de complexes protéines, les ribonucléopro- Chez les eucaryotes, les ARNsno sont assemblés avec les pré-
téines (RNPs). Les ARN C/D participent aux méthylations des RNPs inactifs. L’ensemble est transporté vers les corps de
2 -O-ribose et les ARN H/ACA guident les pseudo-uridylation Cajal, structures intranucléaires nécessaires à l’assemblage
(conversion de l’uridine en pseudo-uridine). Ces actions sont et la maturation des RNPs. Les RNPs sont ensuite dirigés
effectuées par ces ARN conjointement et simultanément vers leurs sites actifs suivant leur fonction c’est-à-dire dans
sur les ARN ribosomaux (ARNr). Ces RNPs agissent sur des les nucléoles, les télomères, les corps de Cajal (organelles
sites clés des ARNr et jouent un rôle majeur pour assurer nucléaires) selon les séquences signatures (boîtes C/D, H et
la fonction du ribosome. D’autres fonctions complexes sont ACA) qu’elles contiennent. Les ARN qui retournent vers les
assurées par les ARNsno telles qu’une action sur le spli- corps de Cajal s’appellent encore ARNsca (small Cajal body
ceosome (en agissant sur les ARNsn), sur la synthèse du RNAs) et participent aux modifications des ARNsn [13].
télomère (assurée par un ARN H/ACA). Il semble que de
nombreuses autres fonctions restent à découvrir pour ces
ARNsno. Certaines caractéristiques structurales définissent ARN de transfert (ARNt)
ces ARN. Les ARN C/D possèdent deux séquences dites boîtes
C (5 -RUGAUGA) et D (5 -CUGA) réunies par des anses (loop) Les ARN de transfert (ARNt) participent à la synthèse
et formant des tours en boucles (kink turns). Une paire C/D des protéines en permettant le transfert de l’acide
est associée à une séquence antisens (l’ARN cible) en amont aminé spécifique qui leur est attaché au peptide en
de la boîte D. L’ARN cible est alors méthylé sur le ribose cours de synthèse au sein du complexe ARNm/ribosomes/
correspondant au nucléotide situé en complément de la ribonucléoprotéines/ARNr lors d’une réaction complexe
base localisée 5 nucléotides en amont de la boîte D (Fig. 4). appelée traduction. Celle-ci est constituée schématique-
Comme les autres ARNnc, le rôle de ces ARN guidant des ment de trois étapes : initation, élongation et terminaison.
modifications (on parle d’ARN guide) est en fait celui d’un Cette traduction réalise une synthèse linéaire d’une chaîne
adaptateur assurant le lien entre un ou plusieurs composants de résidus aminoacides dans un ordre spécifique. Bien
catalytiques (des ribonucléoprotéines, RNPs) et la cible. que différant dans certains détails, la traduction chez
Nous ne décrirons pas les montages et régulations complexes les eucaryotes et les procaryotes présente beaucoup de
associant ces ARNsno et les RNPs et renvoyons le lecteur similitudes. Nous allons présenter cette traduction dans
à la référence [13] pour des descriptions précises. Sur le ses grandes lignes sans entrer dans les particularités
plan génétique, plusieurs constructions existent. Les gènes différenciant les aspects traductionnels des eucaryotes et
codant pour les ARNsno sont essentiellement localisés dans des procaryotes [34]. Au cours de la traduction, au niveau
les introns de gènes codant pour des protéines impliquées du ribosome, l’hybridation ARNm/ARNt par association du
dans la biogenèse des ribosomes. On peut aussi les retrouver codon situé sur l’ARNm avec l’anticodon complémentaire
dans les introns de gènes codants. En fait, leur synthèse à situé sur l’ARNt (en fait, l’amino-acyl ARNt, un acide aminé
partir des introns est réalisée après épissage des pré-ARNm. spécifique de l’anticodon étant fixé sur l’ARNt par une
Dans certains cas, les pré-ARNm ne sont pas traduits en pro- enzyme, l’aminoacyl-tRNA synthétase) (Fig. 6). Le ribosome
téines et seuls les introns sont transformés. Dans d’autres en permettant l’ajout des acides aminés un par un au cours
cas, les ARNsno sont dérivés de transcrits polycystroniques de la traduction permet la synthèse progressive du poly-
qui peuvent contenir jusqu’à dix ARN différents, chaque peptide qui aboutira dans un deuxième temps au cours des
ARN étant ensuite libéré par endoclivage. Plus rarement, modifications post-traductionnelles à la protéine mature.
quelques ARNsno sont transcrits indépendamment (Fig. 5). Pour mémoire, le code génétique est constitué de 61 codons
codant pour 20 acides aminés (aas) et trois codons stop. Le
code génétique est dit dégénéré dans le sens où plus d’un
codon code pour un même acide aminé (codons synonymes).
Les codons synonymes ne sont pas utilisés avec la même
fréquence (on parle de biais de codons). Leur utilisation
dépend de l’abondance de l’ARNt correspondant dans la
cellule [35]. Par exemple, dans Escherichia coli, parmi les
six codons codant pour l’arginine (CGU, CGC, CGA, CGG,
AGA et AGG), CGU et CGC sont les plus utilisés. L’interaction
codon/anticodon est complexe et ne répond pas unique-
ment aux règles d’appariements de Watson et Crick [36].
L’incorporation des acides aminés est rapidement réalisée
(environ 10—20 aas par seconde) en plusieurs étapes.
L’étape d’initation est complexe et fait intervenir de nom-
Figure 5 Organisation génomique des ARNsno C/D et H/ACA breuses protéines (par exemple, initiation factor 2 [eIF2]),
[13]. Chez les eucaryotes, plusieurs organisations génomiques l’ARNt de la méthionine (AUG, appelé aussi codon initia-
des ARNsno (grosses flèches) sont possibles. 1 : beaucoup teur). Elle démarre dans la partie 5 non codante de l’ARNm
d’ARNsno ont leurs gènes dans des introns de gènes codant pour et forme dans un premier temps, un complexe de pré-
des protéines qui participent à la biogenèse des ribosomes ; 2 : initiation (complexe 43S puis 48S [par association d’autres
certains ARNsno sont organisés en polycistrons. Un transcript (le protéines au cours du processus] en présence de la sous-
polycistron) contient jusqu’à dix transcrits d’ARN. Chaque ARN unité ribosomale 40S chez les eucaryotes). Ce complexe
est ensuite libéré du précurseur par endoclivage ; 3 : quelques va alors démarrer dans la direction 5 → 3 la vérification
ARNsno sont transcrits isolément. de l’ARNm jusqu’à rencontrer le codon initateur AUG
Le monde complexe et mouvant des ARN. Première partie 13

Figure 6 Schéma d’un ARNt [36]. Il s’agit de la séquence pri-


maire et secondaire de l’ARNtVal d’Escherichia coli. Encadré
en jaune se trouve l’anticodon UAC sur l’ARNt. Ce dernier va
s’hybrider au codon GUA de l’ARNm (un des codons pour l’acide
aminé valine). Dans sa structure primaire, outre les nucléo-
sides contenant les A, C, G et U, on trouve des nucléosides
modifiés tels que cmo5 U (uridine-5-oxydoacétique), D (dihy-
drouridine), s4 U (4-thio-urine), m6 A (N6-méthyladénosine),
m7 G (7-méthylguanosine), T (ribothymidine), ␺ (pseudouri-
dine). Figure 7 Schéma de la traduction. La traduction a lieu au
sein des deux sous-unités ribosomales 30S (40S chez les euca-
ryotes) et 50S (60S chez les eucaryotes), l’ensemble donnant
provoquant alors le positionnement de l’ARNt-méthionine un ribosome 70S (80S chez les eucaryotes). L’ARNm est lu (tra-
sur le site P du ribosome. L’assemblage avec la sous-unité duit) par le ribosome en présence de complexes protéiques,
60S (eucaryotes) permet de démarrer l’élongation. On aura l’ARNt servant d’intermédiaire pour traduire cet ARNm en pro-
alors schématiquement la sélection de l’anticodon par le téine. a : au niveau du ribosome (dans la sous-unité 30S/40S
ribosome, la reconnaissance de l’anticodon, l’assemblage à à l’interface avec la sous-unité 50S/60S), l’élongation de la
l’ARNm, la modification conformationnelle de la sous-unité protéine et la traduction se situent sur trois sites : le site A
30S du ribosome et de l’ARNt permettant l’entrée de (amino-acyl), le site P (peptidyl) et le site E (exit). L’ARNt
l’ARNt sur le site A de la sous-unité 50S du ribosome arrive au niveau du site A (ARNt-aminoacyl) où il reconnaît
puis des étapes d’élongation proprement dite du peptide sur l’ARNm le codon complémentaire de son anticodon (tra-
naissant, la translocation et l’expulsion de l’ARNt utilisé, duction). À l’aide de réactions complexes incluant notamment
une nouvelle arrivée de l’aminoacyl-ARNt spécifique du des protéines appelées facteurs d’élongation (par exemple, EF-
codon et renouvellement des étapes précités, la traduction Tu), l’acide aminé est ensuite transféré sur le peptide naissant
se terminant au codon stop (terminaison) spécifiquement fixé sur l’ARNt (ARNt-peptidyl ; on parle d’élongation) au site P.
reconnu par un groupe de protéines appelées eRF1 chez les Cette réaction est réalisée à l’aide d’une peptidyl transférase ;
eucaryotes (RF1 ou RF2 chez les procaryotes ; release factor b : les ARNt du site A (aminoacyl) et P (peptidyl) sont ensuite
[RF]) qui permet l’hydrolyse du peptide synthétisé et sa transférés respectivement sur le site P et E à l’aide d’autres pro-
libération de l’ARNt-peptidyl (en association avec d’autres téines (par exemple, facteur d’élongation EF-G) tandis qu’un
protéines telles que RF3 et eRF3) [37]. Schématiquement, nouveau ARNt-aminoacyl vient se fixer sur le site A (translo-
ces facteurs reconnaissent le codon stop par un motif pro- cation). L’élongation se termine quand un codon stop au site
téique spécifique au site A (par exemple, pour RF1, le motif A est reconnu par certains facteurs protéiques (par exemple,
« Proline-acide aminé quelconque-thréonine » [PNT] et pour class I release factors, eRF1 chez les eucaryotes) provoquant
RF2, le motif « sérine-proline-phénylalanine » [SPF]). Ce alors l’hydrolyse de l’ARNt-peptidyl et la libération du peptide
peptide sera ensuite remanié par des modifications post- synthétisé de l’ARNt. Ce dernier subira alors d’autres modifi-
traductionnelles pour aboutir à la protéine mature (Fig. 7) cations, les modifications post-traductionnelles (par exemple,
[38]. Contrairement à la réplication de l’ADN effectuée phosphorylation).
14 J. Lamoril et al.

avec une grande fidélité (taux d’erreur de 1/108 —1010 ), 30 kb. Les clusters d’ARNr sont localisés sur les bras courts
la traduction présente un taux d’erreur plus important de certains chromosomes et sont appelés régions nucléo-
(1/103 —104 , taux identique à la transcription : 1/104 ). Il est laires organisatrices (nucleolar organizer regions [NORs])
important que ce taux d’erreur soit le plus minime possible. [44]. Chez les eucaryotes, ils sont transcrits par différentes
En effet, une erreur de traduction aboutit à une protéine ARN polymérases dans les nucléoles (par exemple, l’ARN 5S
déstructurée activant alors les mécanismes de contrôle de est transcrit par une polymérase III et le pré-ARN 35S par
qualité de la cellule et peut aboutir à l’apoptose de celle-ci. une polymérase I). Le nombre de gènes ARNr actifs varie
Pour certains auteurs, dans certains cas, ces erreurs partici- selon les cellules et les demandes de ces dernières pour la
peraient à la diversité protéique (et donc phénotypique) et synthèse protéique. Nous ne décrirons pas la transcription
à l’évolution et pourraient ainsi être considérées comme des complexe des ARNr et leur association au sein des ribosomes
phénomènes physiologiques dans certaines circonstances avec des protéines ribosomales [43]. L’enzyme participant
[38]. Par exemple, ces erreurs participent à la synthèse de à l’ajout d’un acide aminé au cours de l’élongation, la
protéines clés chez certains rétrovirus [39]. Après la traduc- peptidyl transférase est constitué de plusieurs ARNr. Par
tion, le ribosome est recyclé en présence de protéines de ailleurs, pour maintenir les sites A et P en configuration
recyclage (ribosome recycling factor [RRF] chez les proca- active au cours de la traduction au sein du ribosome, la
ryotes par exemple), ce mécanisme étant différent chez les présence d’un ARNr 23S est nécessaire. La présence d’un
eucaryotes et les procaryotes. Dans tous les cas, les deux ribosome est fondamentale dans la traduction et la mise en
sous-unités, l’ARNt et l’ARNm se séparent. Le recyclage est conformation spatiale correcte de la protéine (même si des
cependant encore un mécanisme mal connu [34]. protéines spécifiques, les chaperones participent aussi au
remodelage spatial correct de la protéine) car elle minimise
l’énergie thermodynamique afin d’optimiser cette réaction
Ribosomes et les ARN ribosomaux [45]. À titre d’exemple, si cette synthèse se faisait sans
ce dernier et les complexes protéiques associés, au moins
Les ARN ribosomaux (ARNr) sont des structures complexes un milliard d’année serait nécessaire pour obtenir une pro-
et compactes dont on distingue chez les procaryotes deux téine de 100 acides aminés de structure tridimensionnelle
formes principales, l’ARN 16S (participant à la structure de adéquate ! [46].
la sous-unité ribosomale 30S) et l’ARN 23S (participant à
la structure de la sous-unité ribosomale 50S), l’association
des sous-unités 30S et 50S constitue le ribosome 70S. Rap-
Ribozymes
pelons ici que le terme « S » est extrapolé de Svedberg,
unité de mesure de sédimentation des molécules (ici ribo- Les ribozymes constituent un groupe d’ARN possédant une
somes) soumises à ultracentrifugation. Chez les procaryotes, activité catalytique. Il s’agit donc d’ARN-enzyme [47,48].
on retrouve les ARN 5S, 18S et 25S. Les ARNr sont associées En dehors du ribozyme le plus complexe à savoir le
aux ribonucléoprotéines (RNPs) pour constituer les sous- ribosome qui permet la formation de liaisons peptidique
unités ribosomales dont l’assemblage constitue le ribosome ARN-dépendantes, les ribozymes sont constitués de trois
[40]. Chez les eucaryotes, on distingue deux sous-unités, la groupes, les introns auto-épissants (divisés en deux classes
petite (40S) et la grande (60S), l’ensemble constituant le principales, I et II), la RNase P (impliquée dans la synthèse
ribosome 80S [34]. La grande sous-unité est constituée de des ARNt) et les petits ARN catalytiques (groupe incluant
47 protéines et de trois ARNr [41]. La petite de 32 protéines quatre motifs catalytiques partageant un même mécanisme
et un ARNr (ARNr 5S). La synthèse du ribosome est complexe chimique) (Tableau 3). Parmi ces ARN, on distingue principa-
et démarre avec celle des ARNr dans le noyau [42]. L’ARNr lement les introns du groupe II s’auto-épissant (self-splicing
synthétisé subit ensuite des modifications multiples (méthy- group II introns) retrouvé à la fois parmi les ARN codants et
lation, pseudo-uridylation, action d’endo- et exonucléases) les ARNnc.
et s’associe à des protéines, les protéines ribosomales (plus
de 180 d’entre elles appelées facteurs et 100 petites ribonu- Introns du groupe I et II s’auto-épissant
cléoprotéines nucléolaires, snoRNP constituées elles-mêmes
en partie de snoARN) pour constituer le préribosome. Le Ces ribozymes participent à l’épissage des ARN. À l’instar
préribosome constitué dans le noyau est ensuite exporté de la composante ribozyme de la RNase P, ils catalysent le
dans le cytoplasme par un processus actif pour y subir des clivage des liaisons phosphodiesters et la ligation produisant
étapes complexes de maturation [41]. Le principal rôle du des extrémités 5 -phosphate et 3 -hydroxyl [47].
ribosome est d’interagir avec l’ARNm et l’ARNt en présence
d’un complexe protéique et de petits ARN, les ARN ribo-
somaux pour effectuer la synthèse des protéines au cours Formation de la liaison peptidique au ribosome
de la traduction, c’est-à-dire l’ajout des acides aminés,
un par un. Les ARNr constitutifs des ribosomes participent Le ribosome est le plus gros des ribozymes. Il catalyse
à la reconnaissance des ARNt au site A du ribosome [43]. la formation des liaisons peptidiques au cours de la syn-
Sur le plan génétique, les gènes des ARNr (ADNr) sont thèse protéique pendant la traduction. L’activité de la
présents en opérons (clusters), structures locales des chro- peptidyl-transférase implique deux ARNt substrats, l’ARNt-
mosomes assemblant des gènes transcrits en groupe. Chez amino-acyl au site A du ribosome et l’ARNt-peptidyl au site
les humains, une sous-unité de transcription d’ARNr mesure P du ribosome (constitué d’ARNr). Elle permet l’ajout d’un
environ 43 kb et est constitué de séquences codant pour des aminoacide sur l’ARNt-peptidyl par une réaction complexe
pré-ARNr séparés par des séquences intergéniques d’environ schématiquement décrite plus haut [47].
Le monde complexe et mouvant des ARN. Première partie 15

Tableau 3 Exemples de ribozymes [49].

Ribozyme Activité catalytique Rôle naturel

En tête de marteau (hammerhead) Ribonucléase spécifique de séquence ARN autocatalytique


En boucle (hairpin) Ribonucléase spécifique de séquence ARN autocatalytique
RNase P Ribonucléase spécifique de structure Synthèse d’ARNt
Intron du groupe I Clivage d’ARN suivi de ligation Épissage
Intron du groupe II Clivage d’ARN et d’ADN suivi de ligation Épissage et transposition
Spliceosome Clivage d’ARN et ligation Épissage

Le ribozyme GlmS d’action fait intervenir un mécanisme d’autoclivage grâce


à un domaine en tête de marteau. Il s’agit d’un motif
Il s’agit du riboswitch glmS localisé dans la région 5 -non d’environ 35 nucléotides contenant des régions simple brin
codante du gène codant pour la glucosamine-6-phosphate très conservées et qui contiennent les nucléotides néces-
synthetase. En présence de glucosamine-6-phosphate saires à une activité catalytique optimum. Le complexe
(GlcN6P), il clive son propre ARNm réprimant ainsi la pro- ribozyme/substrat est constitué d’une hélice intramolécu-
duction de l’enzyme. Le métabolite GlcN6P, en se fixant sur laire (hélice II) et de deux hélices intermoléculaires (hélices
l’ARNm, provoquerait une modification conformationnelle I et III) (Fig. 8). Bien que de structure différente, les ribo-
et stabiliserait l’ARNm et induirait ainsi le clivage d’autres zymes en tête de marteau et ceux en épingle à cheveux
ARNm codant pour la même enzyme [50]. Ce modèle de peuvent se retrouver sur les brins opposés d’un même virus
réaction est discuté par d’autres auteurs [48]. ARN satellite et catalysent des réactions identiques [47].

La RNase P Le ribozyme en épingle à cheveu (hairpin ribozyme)


Ces ARN ont été initialement isolés de virus satellites de
C’est une enzyme clé ubiquitaire de la synthèse des ARN plantes. Le motif catalytique en épingle à cheveu est impli-
de transfert (ARNt) retrouvée chez les procaryotes et les qué dans la réplication de ces virus par un processus de
archeae. Cette endonucléase clive spécifiquement les ARNt cercle roulant identique à ce qui a été observé dans les
précurseurs (pré-ARNt) permettant la formation d’un ARNt hammerhead ribozyme. Le motif en épingle à cheveu cata-
mature [51]. Il s’agit d’une ribonucléoprotéine (RNP) conte- lyse aussi la ligation des extrêmités et permet de générer
nant une sous-unité ARN essentielle pour la catalyse. La des ARN à forme circulaire (activité ARN ligase). Ces ribo-
composante protéique est essentielle pour l’activité de zymes mesurent environ 50 nucléotides et sont constitués
l’enzyme in vivo. Il a été démontré néanmoins que le de deux domaines A (contenant l’activité ribozyme et asso-
composant ARN est la sous-unité catalytique (au moins pour cié à l’ARN substrat) et B séparés par une boucle interne.
certaines eubactéries). Cette dernière peut suffire seule Les boucles A et B subissent des modifications conforma-
pour catalyser la réaction de clivage in vitro chez certaines tionnelles et interagissent entre elles (procédé de docking),
bactéries (par exemple, E. coli). Cela n’a pas été observé modification essentielle pour l’activité catalytique.
chez l’être humain où la composante protéique est indis-
pensable [51]. Le ribozyme du virus de l’hépatite delta (HDV)
L’HDV est un virus circulaire à ARN satellite du virus de
l’hépatite B. Son ARN est simple brin et mesure 1700 pb.
Les petits ARNs catalytiques
Il se réplique par un double mécanisme de cercle roulant
nécessitant une activité autocatalytique contenue à la fois
Ce sont de petits ARN impliqués dans le processus de répli-
cation des génomes à ARN qui les contiennent. On distingue
quatre groupes selon leur structure secondaire caractéris-
tique.

Le ribozyme en tête de marteau (hammerhead


ribozyme)
Cette structure a été initialement découverte chez des ARN
pathogènes pour les plantes (par exemple, les viroïdes) puis
mise en évidence chez certains eucaryotes (par exemple,
certaines espèces de crickets). Ils sont impliqués dans
la transformation de longs transcrits multimériques en
plusieurs transcrits monomériques. Dans les plantes, ils
interviennent dans la réplication des génomes à ARN dans
lesquels ils sont contenus (par un mécanisme de cercle rou- Figure 8 Principe d’action d’un ribozyme [49]. 1 : les ribo-
lant, rolling circle dont le principe est similaire à celui zymes spécifiques s’hybrident à l’ARNm cible ; 2 : l’ARNm est
de la technique d’amplification par rolling circle amplifi- lysé en présence du ribozyme à activité catalytique. L’ARNm ne
cation [RCA]). Démontré pour certains de ces ARN, le mode peut plus être traduit.
16 J. Lamoril et al.

dans l’ARN sens et l’ARN antisens. L’activité ribozyme est L’inactivation de l’X
donc nécessaire à sa réplication.
Chez les mammifères (dont l’être humain), le mâle possède
un X et la femelle deux X. Afin de pallier à la différence
Le ribozyme VS du nombre de chromosome X et pour qu’il n’y ait pas de
Cet ARN a été isolé de mitochondries d’une souche de déséquilibre quantitatif dans l’expression des gènes issus de
Neurospora sp. (souche Varkud-1c). Le motif catalytique ces chromosomes, deux mécanismes peuvent être observés,
est responsable de l’autoclivage et la ligation de l’ARNnc soit l’un des deux X est inactivé aléatoirement (c’est le cas
VS transcrit à partir de l’ADN VS. L’activité du domaine chez la femme), soit l’expression des gènes de l’unique X
catalytique correspond à un fragment de 154 nucléotides. du mâle est augmentée (c’est le cas de la drosophile). Dans
La structure secondaire complexe est constituée de six tous les cas, la stratégie de régulation de l’expression de
domaines (I à VI) dont deux (I et V) possèdent des inter- l’X fait intervenir des ARNnc. Sans entrer dans les détails
actions importantes. de ce mécanisme, chez la femme, une région particulière
du chromosome X joue un rôle fondamental dans l’initiation
et la diffusion de l’inactivation de l’X, la région X inactiva-
Les longs ARN non codant (long noncoding tion center (Xic). Un ARNnc transcrit à partir de cette région
RNA, lncRNA) du chromosome X qui deviendra inactif, X inactivation spe-
cific transcript (Xist) participe au recrutement d’enzymes
permettant la condensation progressive de la chromatine
Ces ARN se définissent par une taille supérieure à 200 pb
(notamment en méthylant des histones) et par conséquent,
et peuvent aller jusqu’à 100 kb. Les gènes codant pour ces
l’inactivation de l’X [52].
ARN sont transcrits essentiellement par l’ARN polymérase II
et dans de rares cas par l’ARN polymérase III, et ne subissent
pas de traitement identique à celui subit par l’ARNm du Les loci HOX
fait de leur propriété principale de régulation. Nous don-
nerons quelques exemples de leur action, ces longs ARNnc Au nombre de quatre (A, B, C et D et contenant 39 gènes
sont nombreux et mal connus à l’heure actuelle (Fig. 9) [2]. homeobox [HOX]), ces loci jouent un rôle fondamental dans
Actuellement, le nombre d’ARNnc contenus dans le génome l’expression coordonnée de gènes pour le modelage et la
humain n’est pas connu. différentiation cellulaire. Plus de la moitié des transcrits de

Figure 9 Exemples d’action des longs ARNnc. Schéma d’une région avec les deux brins sens (5 → 3 ) et antisens (3 → 5 ). Les
gènes sont représentés par les régions avec les rectangles pleins. Les flèches sur les rectangles indiquent le sens de la transcription
sur chaque brin. 1 : une région d’un promoteur non codant (orange) peut modifier (par stimulation ou inhibition) l’expression d’un
gène situé en aval (gène violet) par exemple en inhibant l’ARN polymérase II et/ou en remodelant localement la chromatine.
C’est le principe de l’interférence transcriptionnelle ; 2 : un transcrit antisens (marron) hybride un transcrit sens chevauchant et
inhibe la reconnaissance des sites d’épissage par le complexe protéique d’épissage, le spliceosome. Il en résulte un ARNm avec
épissage alternatif. Une alternative possible à cette hybridation de l’ARNnc est l’activation de Dicer puis la formation de siARN ; 3 :
un transcrit ARN antisens se fixe sur des protéines cibles et peut alors avoir plusieurs conséquences selon les ARNnc ; a : moduler
l’activité d’une protéine ; b : guider la localisation cellulaire d’une protéine ; c : constituer une partie d’une structure protéique
complexe ; 4 : un long ARNnc peut être fragmenté en plusieurs petits ARNnc (exemples, miARN, piwiARN).
Le monde complexe et mouvant des ARN. Première partie 17

ces loci sont des ARNnc issus des régions intergéniques sou-
vent co-exprimés avec les gènes issus des parties codantes
adjacentes. Bien que mal connue et complexe, cette
co-expression en cis (sur le même chromosome et locus)
permet localement une régulation fine, par exemple en
se fixant sur une méthyltransférase dont l’action sera
alors d’inactiver le gène adjacent. Par ailleurs, ces ARNnc
peuvent aussi avoir une activité en trans [53]. On retrouve
des mécanismes similaires dans d’autres cas tels que
l’empreinte parentale (où seul, un des chromosomes issus
soit du père soit de la mère est exprimé) dans laquelle
un long ARNnc inactive un des deux chromosomes (par Figure 10 Régulation schématique en cis d’un gène par un
exemple, l’ARN H19 est impliqué dans l’empreinte d’insulin ARNnc chevauchant — Exemple. La séquence codante d’un
like growth factor 2 (IFG2). ARNnc est exprimé en antisens (flèche mauve indiquant le sens
L’exemple des loci HOX démontre le rôle fondamental 5 → 3 de la transcription) alors que le gène codant est exprimé
de certains ARN dans le développement d’un organisme et en sens (flèche bleue indiquant le sens 5 → 3 de la transcrip-
une de leur propriété, la capacité à recruter des complexes tion). Les deux gènes se chevauchent (séquences communes aux
protéiques modifiant les histones afin de transformer la deux gènes). Après transcription, l’ARNnc va se fixer sur une
structure chromatinienne dans un état transcriptionnel actif méthyltransférase d’histone et l’activer. En méthylant les his-
ou passif. tones se fixant localement sur le génome, une condensation de
la chromatine provoque l’inhibition de la transcription du gène
codant pour une protéine.
Répression transcriptionnelle par les ARN non
codant Alu
dans des plasmides et présentent souvent des structures
Les ARNnc peuvent aussi interagir avec l’ARN polymérase II secondaires complexes. Ils ont une structure et des carac-
afin de réprimer la transcription chez les eucaryotes. Par téristiques proches de celles des microARN (miARN) des
exemple, schématiquement, dans certaines conditions de eucaryotes. Ces ARNs agissent en trans (plus rarement en
choc thermique sur des cellules humaines, l’ARN polymé- cis) et sont impliqués dans la régulation traductionnelle.
rase III permet la transcription d’un ARNnc Alu à partir De manière générale, les ARNs en cis sont exprimés de
d’éléments short intersped element (SINE). L’ARNnc se fixe manière constitutive alors que ceux codés en trans agissent
alors sur l’ARN polymérase II et inhibe son interaction avec en général en présence de conditions spécifiques (faible
les promoteurs de gènes de ménage (housekeeping genes). teneur en fer du milieu, stress oxydatif par exemple). Ainsi,
Le mécanisme précis demeure encore mal connu [53]. certains ARNs hybrident les ARNm et par un mécanisme
complexe, inhibent la traduction de l’ARNm d’une manière
similaire aux miARN des eucaryotes. D’autres ARNs viennent
Expression tissu spécifique des ARN non codant se fixer sur la séquence de Shine-Dalgarno (nécessaire à la
traduction chez les procaryotes) ou au codon d’initiation
Dans le cerveau plus particulièrement, on retrouve des AUG pour réprimer la traduction en empêchant la fixa-
ARNnc spécifiques issus de diverses régions génomiques tion du ribosome 30S. D’autres mécanismes de régulation
(intergéniques, introniques et sites soumis à empreinte par les ARNs semblent aussi exister [53]. Selon les cas,
parentale). Ces régions codent des transcrits ARNnc pou- la complémentarité au cours de l’hybridation peut être
vant chevaucher en sens ou antisens des gènes codants dont partielle ou complète [54]. Les protéines et les ribonu-
le rôle est essentiel pour le fonctionnement du neurone. cléases agissant de concert avec ces ARNs sont encore mal
On observe une inter-relation de l’expression des ARNnc et connues.
des gènes codants (chevauchant ou non) aboutissant à une
régulation fine effectuée par les ARNnc (Fig. 10).
Les riboswitches
Dans la partie 5 de l’ARNm se trouvent des éléments de
Les petits ARN non codant régulateurs régulation de l’ARN pouvant adopter différentes confor-
mations en réponse aux événements extérieurs (ribosomes
Les ARNnc des procaryotes bloqués, fixation de ligands/métabolites, modification de
température. . .) modifiant ainsi l’expression du gène corres-
Les petits ARN de régulation ou ARNs pondant. Parmi ces éléments, certains sont des capteurs de
Certains petits ARNnc des procaryotes appelés ARNs (ou métabolites (par exemple, S-adenosylmethionine, lysine. . .)
sRNA, small regulatory RNA) jouent un rôle majeur de régu- appelés aussi riboswitches [55]. La fixation du métabo-
lation chez les procaryotes notamment en condition de lite sur cette structure complexe de l’ARN provoque une
stress. Le séquençage de plusieurs génomes de procaryotes a modification conformationnelle et participe soit à la régula-
permis de mettre en évidence de nombreux ARNs conservés tion transcriptionnelle, soit au contrôle de la traduction,
entre les différentes souches bactériennes [54]. Ces ARNs en induisant essentiellement une action de répression
bactériens non codant mesurent entre 50 et 250 pb, sont [54]. Bien que le plus souvent décrits chez les bactéries,
transcrits depuis des régions intergéniques (IGR) des chro- les riboswitches sont aussi présents chez les eucaryotes
mosomes, à partir d’éléments mobiles (cf transposons) ou [56].
18 J. Lamoril et al.

Les ARNs modulant l’activité protéique


Certains ARNs possèdent une activité intrinsèque (cf. la
RNase P), participent aux fonctions essentielles de ribo-
nucléoprotéines (cf. ARN 4.5S et tm) ou exercent une
activité régulatrice en mimant la structure de certains
acides nucléiques et déroutent ainsi les protéines vers leurs
acides nucléiques cibles (cf. ARNs CsrB, 6S et GlmY) [54].

Les groupes de courtes séquences palindromiques


CRISPR (clusters of regularly interspaced short
palindromic repeats)
Les CRISPR constituent un système de défense contre les
virus, les plasmides et les transposons similaire à ce qu’on
observe chez les eucaryotes (similitude avec les petits ARN
interférents, siARN). Elles empêchent par ailleurs la conju-
gaison bactérienne. On les retrouve chez 40 % des bactéries
démontrant ainsi leur rôle majeur [57]. Les loci CRISPR sont Figure 11 Principe d’action des ARNs CRISPR (clusters of
constitués d’une séquence leader de 550 pb suivie de courtes regularly interspaced short palindromic repeats) [53]. Le locus
séquences répétées très conservées de 24—48 pb séparées CRISPR est composé de séquences répétées séparées par des
par de petites séquences (spacer) de 26—72 pb mais de séquences hypervariables uniques (spacers). Les gènes CAS
séquence variable (zones hypervariables). Ces spacers incor- codent pour des protéines CAS dont les fonctions consistent à
porent (« capturent ») spécifiquement de l’ADN viral (par manipuler les ARN CRISPR pour les rendre fonctionnels et/ou à
exemple, ADN de phage) à l’aide de protéines CAS dont réprimer l’expression des séquences du locus. Le locus CRISPR
le rôle est encore mal connu (codées par des gènes adja- est transcrit en un long ARN traité ensuite à l’aide d’un
cents aux loci CRISPR, les gènes CAS (CRISPR-associated) complexe protéique appelé complexe Cascade et qui le trans-
et les petits ARN issus de ces loci). Des segments d’ADN forme en petits ARN constitués d’un ensemble spacer/séquence
du locus sont transcrits en ARNs pour assurer une réponse répétée appelés aussi ARNcr (ARN CRISPR). Ces ARNcr, par
immunologique adaptée de la bactérie (adaptive immunity), un mécanisme inconnu, ciblent l’ADN étranger en présence
c’est-à-dire la destruction du phage ADN en présence des d’autres protéines CAS, semble-t-il pour le dégrader.
protéines CAS. Les séquences CRISPR agissent donc sur de
l’ADN et non de l’ARN. Par un mécanisme inconnu, des
séquences d’ADN du phage sont incorporées, deviennent leront les expressions de gènes. Par ailleurs, les protéines
héritables et permettent à la bactérie d’acquérir une résis- régulatrices peuvent aussi agir en complément des ARNs.
tance aux phages (Fig. 11). Par un mécanisme similaire, la Différentes combinaisons sont alors possibles [60].
conjugaison des plasmides peut être inhibée [53]. La pré-
sence de ces séquences chez la plupart des bactéries permet Les ARNg (guide RNA)
de les utiliser comme outils épidémiologiques (cf. évolution Les ARNguides (ARNg) sont de petits ARN simple brin
bactérienne, génotypage de souches, transfert horizontal). d’environ 60 pb présents chez certains procaryotes. On les
retrouve dans le kinétoplaste mitochondrial de certains
parasites comme les trypanosomes. Ces ARNg catalysent
Quels sont les avantages de ces ARNs par rapport à des l’insertion ou la déletion d’un résidu U de certains pré-
protéines au rôle similaire pour la régulation de ARNm dans les mitochondries en présence d’un complexe
l’expression de gènes ? protéique, l’éditosome. Il s’agit d’un mécanisme d’editing
Les ARNs sont rapides à synthétiser et nécessitent moins génerant un ORF permettant la traduction de cet ARNm
d’énergie pour la cellule. Ils sont plus petits que les ARNm édité en protéine fonctionnelle. Les ARNg modulent ainsi la
(100—200 pb pour les ARNs versus au-dessus de 1000 pb pour combinatoire de traduction possible à partir d’un pré-ARNm
les ARNm). Ils ne nécessitent pas d’étape de traduction. [11].
Leurs effets sont rapides et sensibles. Leur action on/off
est plus vive que celle des protéines [58]. Les cinétiques
d’action des ARNs et des protéines sont différentes. Leur Les ARNnc des eucaryotes impliqués dans la
action étant stœchiométrique, la quantité d’ARNs est impor- répression des ARN
tante pour son effet. Quand elle dépasse largement celle de
l’ARNm, son action off est immédiate. Dans le cas contraire, Il s’agit d’un domaine récent fondamental dont les appli-
l’ARNs a peu d’action sur l’ARNm. Il existe donc pour les cations tant dans la recherche que dans le domaine
ARNs un seuil d’efficacité. Ainsi, lorsque le signal de stimu- thérapeutique ou diagnostique sont potentiellement très
lation est faible, les ARNs sont peu efficace. En revanche, importantes. Nous allons les décrire schématiquement, la
autour du seuil d’efficacité des ARNs, il semblerait que seconde partie de cet article leur étant consacrée. De
l’ARNs soit très sensible aux stimuli et puisse provoquer une manière générale, ces petits ARN sont obtenus à partir
modulation précise de la réponse génétique [59]. Les ARNs de précurseurs ARNnc et ont la particularité de servir de
par ailleurs peuvent contrôler à des degrés variables tout un guide à des protéines particulières, les protéines argonautes
réseau métabolique et selon le degré d’appariement (et la (AGO) afin de réguler leur cible respective. On distingue
priorité dans l’appariement de l’ARNs sur ses cibles) modu- trois classes d’ARNnc, les microARN (miARN), les piwiARN
Le monde complexe et mouvant des ARN. Première partie 19

(piARN) et les petits ARN interférents (small interfering ARN DICER. Il semblerait que ces piARN soient restreints aux cel-
[siARN]). lules germinales ainsi qu’aux cellules somatiques en contact
avec les cellules germinales. Chez les mammifères, les
Les microARN (miARN) piARN sont présents uniquement chez le mâle. On y dis-
Ce sont de petits ARN de 20—24 pb dont la production tingue deux classes, la classe prépachytène et la classe
est assurée par les enzymes Dicer à partir de précurseurs pachytène. Les ARN prépachytène présentent des homo-
transcrits de zones intergéniques, introniques ou même de logies de séquence avec les transposons et les séquences
régions codantes. Les miARN vont guider les complexes RNA- répétées. Leur expression est exactement associée avec la
induced silencing complexes (RISC) aux ARNm auxquels ils fenêtre d’effacement/rétablissement de la méthylation de
s’apparient avec une spécificité absolue ou, le plus souvent, l’ADN des transposons au cours du développement de la
relative (par appariement à un site spécifique du miARN lignée germinale, probablement en provoquant des modi-
de 6—8 pb, la tête (seed)). Par ce complexe ainsi formé, fications histones. En revanche, les origines et les cibles
on observera une inhibition de la traduction ou une lyse des piARN pachytènes restent encore mystérieuses. Ils
de l’ARNm. Ces miARN jouent un rôle fondamental dans la pourraient jouer un rôle dans le maintien de l’intégrité géno-
régulation du transcriptome. Présents dans tout le génome, mique des cellules germinales.
ces miARN jouent des rôles multiples tant dans le déve-
loppement que l’adaptation au stress et à la signalisation Les introns, une riche source d’ARNnc
hormonale.
Les introns constituent au moins 30 % du génome humain
Les small interfering RNA (siARN) et semblent constituer une source majeure d’ARNnc. Parmi
Les siARN, petits ARN d’environ 22 pb, sont synthétisés à par- ces derniers nichés dans des gènes codants ou non, certains
tir de précurseurs ARN double brin traités par les enzymes jouent un rôle majeur dans la régulation de l’expression
DICER. Ces siARN peuvent avoir plusieurs origines différentes des gènes codant dans lesquels ils se trouvent [56,61]. Il
telles que les ARN viraux, des transgènes, des transposons, semble qu’environ 81 % des gènes codants subissant un épis-
des loci spécifiques. Ils peuvent être aussi synthétisés par sage possèdent des introns transcriptionnellement actifs
des ARN polymérases ARN dépendantes (RNA dependent RNA essentiellement dans le noyau [62]. Les introns sont épis-
polymerase [RdRp]) qui recopient des ARN simple brin (ce sés au cours de la transcription mais la formation des ARNnc
dernier mécanisme n’existe pas chez les mammifères). Une issus de ces derniers est encore largement inconnue. Il
fois traités par les enzymes DICER, les siARN vont s’associer semble que l’ARN polymérase II agisse sur leur transcrip-
aux protéines AGO qui vont guider l’interférence ARN soit tion (d’autres ARN polymérases ont été aussi impliquées) et
au niveau de l’ARN, soit au niveau de l’ADN. Ces siARN que celle-ci soit coordonnée et co-régulée avec la transcrip-
jouent un rôle majeur dans la défense contre les virus tion du gène codant correspondant. Parmi ceux-ci, certains
chez la drosophile et les plantes notamment. Certains virus ARNnc possèdent une queue poly(A) [62]. Un certain nombre
peuvent d’ailleurs contourner ces siARN à l’aide de pro- de ces ARNnc issus d’introns jouent un rôle de régulateur
téines ciblant le mécanisme de répression siARN-AGO. Par de l’expression de gènes codants soit au niveau transcrip-
ailleurs, les siARN jouent un rôle majeur dans la régulation tionnel (régulation de l’épissage alternatif), soit au niveau
de l’expression de nombreux gènes notamment la répres- post-transcriptionnel (par exemple, par interférence trans-
sion de transposons. De nombreux siARN notamment ont été criptionnelle) bien que cela soit encore mal connu. Ces
observés chez la souris et la drosophile, les siARN endogènes, ARNnc seraient eux-même régulés par des stimuli exté-
endo-siARN exprimés dans les oocytes et les cellules des rieurs (cf. hormones) mais cela nécessite confirmation [62].
lignées germinales et somatiques dont les transposons sont Parmi les ARNnc issus d’introns, on retrouve notamment
la principale cible en empêchant leur expression. Observés des microARN et des ARNsno. Les études montrent cepen-
principalement chez les plantes et plus rarement chez les dant qu’un certain nombre d’entre eux sont transformés en
mammifères (notamment la souris chez qui cet ARN a été d’autres petits ARN [63]. Comme d’autres ARNnc, ceux-ci
particulièrement étudié), les transcrits siARN issus de gènes peuvent aussi assurer un rôle de régulation épigénétique
antisens peuvent jouer en cis ou en trans un rôle direct de [62].
régulation de l’expression du gène dont ils sont adjacents
et/ou chevauchant [53]. Dans la lignée germinale chez les
plantes, les siARN jouent aussi un rôle pour empêcher la Les systèmes de contrôle de qualité des ARN
mobilité des transposons, rôle assuré par les piARN chez les
mammifères. La dégradation des ARN dans la cellule est un phéno-
mène général dont le contrôle est finement régulé. Malgré
Les piwi-interacting RNA (piARN) la grande complexité des mécanismes de dégradation des
La superfamille des protéines argonautes (AGO) est consti- ARN, il existe de nombreuses similitudes entre les bac-
tuée de deux grandes branches, la branche AGO retrouvée téries, les archaea et les eucaryotes. Schématiquement,
tant dans la levure, les plantes que les animaux et la trois classes d’enzyme dégradant les ARN appelées ribonu-
branche PIWI spécifique de l’espèce animale. Les piARN ont cléases (RNases) sont répertoriées selon le site de coupure
surtout été étudiés chez la souris et la drosophile. Dans en interne (les endonucléases), en 5 (les 5 -exonucléases)
les deux cas, on distingue trois membres différents. Les ou en 3 (les 3 -exonucléases). En pratique, il existe de très
piARNs se distinguent des miARN et des siARN par leur taille nombreuses RNases [42]. Certains mécanismes assurent un
(25—30 pb), et leur biogenèse, indépendante des enzymes contrôle de qualité des ARN. Nous en citerons quelques uns.
20 J. Lamoril et al.

La dégradation de l’ARN après un codon stop La dégradation par polyadénylation


anormal prématuré (ou NMD, nonsense-mediated
mRNA decay) Chez les procaryotes
Ce mécanisme a été démontré chez E. coli pour la dégrada-
La synthèse des protéines se réalise dans le cadre d’un tion des ARNt et des ARNr anormaux [67]. Une polymérase
ensemble parfaitement orchestré de transcription puis poly-(A) permet la polyadénylation d’ARNt anormaux qui
de traduction [19]. Pour que cet ensemble fonctionne subissent alors une dégradation par une 3 → 5 ribonu-
correctement, un certain nombre de contrôles de qua- cléase polynucléotide phosphorylase (PNPase). De manière
lité est assuré par la cellule. Parmi les dispositifs mis similaire, une PNPase, une 3 → 5 exoribonucléase et une
en jeu, la dégradation de l’ARNm après un codon stop RNase R dégradent les ARNr anormaux. Le mécanisme de
anormal (nonsense-mediated mRNA decay, NMD) constitue déclenchement de ces réactions est encore mal connu.
une réaction fondamentale dans la régulation génétique. Il semblerait que la modification spatiale de l’ARN anor-
Ce mécanisme permet l’élimination des ARNm anor- mal induise ces réactions en permettant l’accessibilité d’un
maux ayant acquis un codon stop prématuré anormal groupement 3 hydroxyl à ces molécules ce qui ne serait pas
(pour mémoire, les codons stop sont UAA, UAG, UGA) possible dans la configuration spatiale normale [67].
dont les conséquences si l’ARNm anormal était trans-
crit, serait la formation de protéines aux effets délétères Chez les eucaryotes
de type gain/perte de fonction. Environ 30 % des mala- Un système proche de celui exposé ci-dessus à savoir une
dies héréditaires sont liées à un codon stop prématuré 3 polyadénylation des ARNnc anormaux, a été démontré
et induisent donc cette réaction. Ce processus agit éga- chez Saccharomyces cerevisiae. Cela a été démontré pour
lement aussi dans certains cas sur des ARNm normaux les ARNt anormaux en présence d’un complexe protéique
[64]. dénommé TRAMP mais ce complexe agit aussi sur les autres
Ces codons stop prématurés peuvent être la conséquence ARNnc tels que les ARNr, les ARNsno et les ARNsn [67].
de mutations, d’erreurs de transcription ou d’expression de Ce complexe possède une activité de polyadénylation. La
pseudogènes, d’anomalies d’épissage, de réarrangements, structure spatiale de l’ARN joue un rôle majeur dans la
de l’utilisation de sites alternatifs AUG d’initiation. Dans reconnaissance d’un ARN anormal par le complexe TRAMP.
certains cas cependant, ce mécanisme n’est pas déclen- L’ARN est ensuite dégradé par un autre complexe, l’exosome
ché [65]. C’est le cas par exemple, en cas de codon constitué de protéines et de ribonucléases (par exemple, la
stop anormal proche du codon stop normal (à une dis- RNase PH) dans le noyau, TRAMP étant alors un cofacteur de
tance inférieure à 50/54 pb de ce dernier) [66] ou à ce complexe.
proximité du codon d’initiation de la transcription (AUG ini-
tiateur). La protéine Ro60
Par ailleurs, la NMD n’est en général pas activée dans La dégradation des ARN peut se faire dans le noyau comme
les gènes sans introns (tels que les gènes codant pour ci-dessus et/ou dans le cytoplasme. La protéine Ro60 (Trove
l’histone H4, pour la protéine de choc thermique 70 [hsp70] domain family member 2 [TROVE2]) a initialement été
et pour le récepteur à la mélanocortine 4 [MC4R]), la décrite comme un antigène chez les patients atteints de
machinerie cellulaire impliquée dans l’épissage jouant un pathologie inflammatoire auto-immune (telle que le lupus
rôle dans la reconnaissance des codons stop prématurés ou le syndrome de Goujerot-Sjögren). Il s’agit d’une pro-
du moins chez les mammifères. En revanche, chez la dro- téine de localisation nucléaire et cytoplasmique. Elle pré-
sophile ou chez Caenorhabditis elegans, des gènes sans sente la particularité de s’associer avec des ARNnc d’environ
intron peuvent subir la NMD. Cette dernière notion est 100 nucléotides, les ARN Y dont le rôle est mal connu. Chez
cependant remise en cause dans certaines études [65]. Bien les humains, quatre ARN Y ont été identifiés. Transcrits par
qu’encore mal connue, la reconnaissance d’un codon stop l’ARN polymérase III, ils joueraient un rôle dans la réplica-
anormal et le déclenchement de la NMD est complexe. tion de l’ADN (Omim 601821). Ro60 se fixe sur de nombreux
Elle fait appel à de nombreuses protéines parmi lesquelles ARNnc de conformation spatiale anormale tels que les pré-
des ribonucléoprotéines présentes en aval du ribosome de ARNr 5S, des snARN. Fixé aux ARNnc anormaux, Ro60 induit
terminaison et qui activeraient ce dernier, un complexe l’action de nucléases non identifiés pour dégrader l’ARN.
protéique du spliceosome appelé exon junction complexes L’ARN Y pourrait jouer un rôle dans la régulation de Ro60
(EJC) chez les mammifères uniquement [65]) et des pro- [67]. Les mécanismes sont encore largement inconnus.
téines regulator of nonsens transcripts (UPF) [64,65]. Ainsi,
le déclenchement de la NMD est complexe et un certain
nombre de protéines interviennent tant dans la régulation Les autres systèmes de dégradation de l’ARN
de la NMD que dans son déclenchement ou son inhibition
(par exemple, la protéine PABPC1, poly(A)-binding protein Les ARNm
1, impliquée dans la traduction) [64]. La NMD dont on
pensait initialement qu’elle jouait un rôle comme gardien Nous ne traiterons dans ce paragraphe ni des ARNs ni des
de l’intégrité de l’ARNm joue aussi une fonction impor- siARN ou miARN, objets de paragraphes spécifiques. En
tante dans la modulation de l’expression des gènes. Des dehors du contrôle de qualité décrit ci-dessus, la dégra-
travaux sont en cours à ce sujet, la NMD jouant un rôle dation de l’ARN peut survenir de différentes manières.
non seulement dans la dégradation des ARNm anormaux Schématiquement, elle peut survenir à plusieurs étapes,
mais aussi dans celle d’environ 5—10 % d’ARNm normaux ces mécanismes étant intriqués avec ceux des contrôles de
[65]. l’intégrité des ARN :
Le monde complexe et mouvant des ARN. Première partie 21

• l’ARNm synthétisé sous forme d’un large précurseur doit proteins [RBP]), les ARNm, des ARNnc de régulation et
être partiellement dégradé pour devenir actif. Chez les des protéines auxiliaires, les messenger ribonucleoprotein
eucaryotes, par exemple, un ARN polycistronique d’ARN (mRNPs) [68]. Les RBP sont retrouvées également chez les
ribosomaux synthétisé par l’ARN polymérase I nécessite eucaryotes et les archaea. Il s’agit encore une fois d’un phé-
d’être clivé à l’aide d’endo- et exonucléases pour libérer nomène complexe dans lequel un certain nombre d’ARNm
les ARNr actifs ; sont assemblés et co-régulés à l’aide de protéines asso-
• les introns éliminés par épissage sont dégradés par des ciées à des mRNPs. Des petits ARNnc sont alors ciblés sur
exonucléases ; ces ARNm co-régulés en agissant en trans sur des RNPs afin
• au cours de l’exportation de l’ARNm du noyau vers le de coordonner l’expression de l’ensemble de ces ARNm.
cytoplasme, l’ARNm peut être dégradé par des 5 - ou des Sur chaque ARNm, de multiples éléments sont présents en
3 -exonucléases ; cis et constituent un code modulaire appelé untranslated
• au cours de la traduction, l’ARNm subit plusieurs tours de sequence element for regulation (USER). Ce code modu-
traduction au cours desquels la queue poly(A) est progres- laire détermine les RBP qui se fixeront sur un ou plusieurs
sivement raccourcie par une deadenylase ; ARNm et définira ainsi le destin de chaque ARNm. Ces nom-
• lors du turnover des ARNm et des ARNnc, partie intégrante breux RBPs agissent en collaboration ou en compétition, leur
du métabolisme des ARN. Il s’agit alors d’une dégrada- combinaison donnant le schéma d’expression final. Les chan-
tion constitutive qui joue un rôle clé dans la régulation gements métaboliques de la cellule sont alors responsables
de l’expression des gènes [42]. de modulation de l’expression des gènes de façon coordon-
née permettant alors à la cellule de réagir rapidement à un
Les ARNnc (ARN non codant) changement environnemental interne ou externe. Le ribo-
nome n’est pas le transcriptome. Il représente l’organisation
dynamique des ARNm au sein de l’infrastructure consti-
En grande majorité, les ARN et notamment les ARNnc sont
tuée par les ribonucléoprotéines alors que le transcriptome
transcrits par l’ARN polymérase II. La plupart des ARN
évalue les ARNm dans leur ensemble. Nous allons illus-
transcrits sont dégradés dans le noyau formant une popula-
trer par un exemple cette différence [68]. Par exemple,
tion hétérogène nucléaire, l’ARNhn (heterogeneous nuclear
supposons que 100 molécules d’ARNm codent pour la pro-
RNA). Il semblerait que de l’ARNnc, véritable bruit de fond
téine X, 25 d’entre elles pourraient être activées dans un
transcriptionnel, serait aussi présent dans le noyau [42].
état associé avec les mRNP 1, 50 autres pourraient être
De petits transcrits antisens sont aussi générés à partir de
réprimés au cours de la traduction dans un état associé
promoteurs et sont rapidement détruits par les exosomes.
avec les mRNP 2 et 25 autres ARNm pourraient se trouver
Enfin, on retrouve aussi des ARNnc transcrits à partir de
dans un état/compartiment silencieux. Le transcriptome
régions antisens intergéniques ou de zones antisens de gènes
donnerait une activité de cet ARNm de 25 % sans autre pré-
codants et qui constituent aussi un bruit de fond transcrip-
cision. Le ribonome permet d’évaluer comment est régulé
tionnel de rôle mal défini. Ces ARNnc seraient hautement
plus finement cet ARNm ou plus précisément l’ensemble
instables et sont difficiles à mettre en évidence expérimen-
des régulations auxquelles est soumise un ARNm ou une
talement. Ils seraient dégradés par les complexes exosomes.
classe d’ARNm à l’étape post-transcriptionelle. Le ribonome
L’ARN polymérase III transcrit de petits ARN tels que
peut donc être défini comme l’état des ribonucléoprotéines
l’ARNt, l’ARNr 5S, l’ARNsn U6. La surveillance de ces ARN
(incluant les ARNm) présentes dans la cellule à un moment
peut amener à leur dégradation par des 5 -exonucléases,
donné. Elle permet une étude des régulations dynamiques
des exosomes [42]. La dégradation des ARNnc est en fait un
à l’étape post-transcriptionnelle (Fig. 12) [68]. Par ailleurs,
processus hautement efficace.
il a pu être démontré dans certains cas que le ribonome
Par ailleurs, outre les systèmes complexes de dégrada-
agissait au sein d’une cellule mais pouvait aussi parfois
tion des ARNnc brièvement évoqués, il existe aussi un grand
agir sur les cellules adjacentes par transfert d’ARN à l’aide
nombre de RNases non spécifiques telles que la RNase A
d’exosomes (transfert horizontal) [69]. Certains par analo-
pour les eucaryotes ou la RNase T1 pour les champignons.
gie avec ce qui est observé avec les virus ont même parlé de
Il s’agit dans ces derniers cas de RNases extracellulaires
« quasi-génome » pour le ribonome. Mais, cela reste encore
dégradant les ARN. On en retrouve notamment sur la peau
à confirmer par d’autres études [68]. Le ribonome est donc
et dans le sang. Il semblerait que le rôle de ces RNases
une couche de modules et de circuits fonctionnels ayant des
serait d’empêcher des ARN de s’intégrer aux métabolismes
tâches autonomes de contrôle et de coordination au sein des
intracellulaires.
réseaux d’expression des gènes.

Le ribonome
Le transcriptome
Certains auteurs ont proposé la théorie du ribonome [68]. Le
ribonome est constitué par l’ensemble des ARN cellulaires Le transcriptome représente l’ensemble des transcrits issus
et de leur facteurs de régulation au sein des ribonucléopro- d’un génome à un moment donné. En pratique, il s’agit de
téines à un temps et un lieu donnés. Il opère à de multiples l’expression des ARN de toute classe, identifiés et exprimés
niveaux de la régulation des gènes en contrôlant et coor- dans une cellule et/ou un tissu voire un organisme entier.
donnant la transcription, l’épissage, l’export, la stabilité et Il est bien entendu impossible dans cet article de décrire
la traduction de nombreux ARNm réalisant ainsi une expres- ce dernier tant sa complexité, ses spécificités cellulaires,
sion coordonnée de gènes. Dans les cellules de mammifères, tissulaires, métaboliques, d’espèce sont importantes.
il est constitué de protéines fixant des ARN (RNA-binding Nous donnerons quelques idées générales en se basant sur
22 J. Lamoril et al.

Figure 13 Schéma représentant un aspect de la comple-


xité du transcriptome. Les rectangles verts représentent des
séquences d’exons non codants et les rectangles bleus des
séquences d’exons codants. Les diamants verts représentent
Figure 12 Principe de régulation au sein d’un ribonome — des ARNsno et les triangles jaunes des séquences de microARNs.
Exemple [68]. Ce schéma illustre les régulations complexes A. Présence de transcrits à partir des brins sens et antisens se
qu’on peut observer au sein d’un ribonome. Dans ce schéma, les chevauchant. B. Transcrit sur le brin sens avec présence d’un
ribonucléoprotéines (RBP) constituent un réseau dans le cyto- autre transcrit niché dans un intron du grand transcrit. Il y a
plasme où ils régulent directement la stabilité ou la traduction donc deux transcrits sur le brin sens.
d’ARNm réciproquement, ce qui aboutit à une régulation fine et
coordonnée du système. Ce système agit aussi en coordination
avec d’autres et module ainsi d’autres ARNm cibles. Par ailleurs, de nombreuses études démontrent que le
taux d’ARNm du transcriptome et de protéines du protéome
(l’ensemble des protéines exprimés dans une cellule et/ou
certains aspects du transcriptome de mammifères. Dans le un tissu voire un organisme entier) ont une faible corrélation
génome cellulaire humain, on considère qu’il existe environ l’un avec l’autre (r = 0,2—0,6) [71], ce qui laisse penser que
20—25 000 gènes codant pour des protéines. Néanmoins, d’autres régulations complexes existent en plus de celles
l’étude du transcriptome a montré que la diversité de actuellement connues pour la transcription et la traduction
transcription amenait à un niveau de complexité supérieure [68].
du fait de la possibilité d’épissages alternatifs aboutissant
à des isoformes protéiques (environ 60 % des transcrits
codants mais les chiffres varient selon les études, allant ARN non codants et pathologie chez l’être
jusqu’à 95 % [70]), de l’utilisation de codons d’initiation humain
alternatifs (environ 60 % de gènes codant ont au minimum
deux sites de transcription), de la diversité des extrémités
Lorsqu’un gène codant présente une mutation, le phénotype
5 et 3 des gènes dont la structure est fondamentale pour la
est plus ou moins sévère, le plus souvent visible clinique-
régulation des ARNm, leur synthèse, leur traduction et leur
ment. Un gène codant muté provoque donc de manière
localisation subcellulaire. Par ailleurs, dans certains cas,
variable, fonction de la pénétrance, un phénotype visible
l’editing de l’ARN peut aussi modifier la diversité trans-
clinique et/ou biologique dans les maladies dites mono-
criptionnelle. Comme nous l’avons déjà écrit ci-dessus,
géniques. Dans le cadre des maladies polygéniques, le
l’étude du transcriptome a démontré que la majorité
phénotype est plus difficile à interpréter à partir des don-
des transcrits ne sont pas des ARNm mais des ARNnc. Par
nées génetiques et de nombreuses études d’association dans
ailleurs, une couche supplémentaire de complexité a été
le génome sont en cours pour compléter et comprendre les
mise en évidence par la démonstration d’une organisation
résultats déjà obtenus. L’importance croissante des ARNnc
de régions de gènes transcrits en sens et en antisens au
et leur rôle majeur dans la régulation génétique ajoutent
même locus et dont la coordination est finement régulée
un degré de complexité supplémentaire à l’interprétation
(Fig. 13) [17]. Par ailleurs, les études de transcriptomes
des phénotypes observés tant dans les maladies monogé-
de mammifères ont révélé qu’environ 0,5—1 % des gènes
niques que polygéniques. Les modifications (mutations) sur
codants humains possédaient des domaines de fixation de
les ARNnc provoquent le plus souvent des modifications plus
l’ARN (RNA-binding domains [RBD]), les protéines conte-
subtiles et plus difficiles à déterminer d’autant plus que leur
nant ces domaines sont encore mal connues et d’autres
connaissance est plus récente. L’association de mutations
domaines similaires existent probablement [70]. Beaucoup
sur des gènes codants et non codants aboutit à une combi-
d’interrogations demeurent par exemple :
natoire d’effets phénotypiques complexe à interpréter [61].
De nombreux exemples seront donnés dans la seconde par-
• quel(s) mécanisme(s) de coordination existe(nt) entre la tie de cet article. Certains mécanismes régulateurs peuvent
transcription et le traitement de l’ARN afin d’obtenir moduler les effets pathologiques des mutations sur les
un métabolisme physiologique équilibré cellule- ou gènes codants. Nous présentons ci-dessous deux mécanismes
tissu-dépendant, avec ou sans nécessité d’interactions potentiels (transvection et transinduction) puis d’autres
physiques directes ? exemples généraux de mécanismes moléculaires impliquant
• quelle est la part réellement fonctionnelle des transcrits des ARNnc. D’autres mécanismes existent. Nous ne les décri-
ARN mis en évidence [70] ? rons pas ici [72].
Le monde complexe et mouvant des ARN. Première partie 23

Transvection et ARNnc des sites de fixation de miARN et provoquent alors un


gain ou une perte de fixation de ces derniers. Un certain
Sur certains loci, un phénomène particulier a été observé. nombre de mutations situées sur la partie 3 -non codante
Il a été nommé transvection : une région jouant un rôle d’un ARNm ne semblent pas affecter l’ARNm directement en
de régulation située en amont d’un gène codant muté cis mais plutôt la régulation en trans assurée par un ARNnc
peut maintenir un phénotype relativement normal lorsqu’il [61].
est combiné avec une région mutée jouant un rôle de
régulation, celle-ci étant associée (linked) au gène codant
non muté sur le même chromosome (lesquels donnent un La régulation de mécanismes génétiques
phénotype mutant quand ils sont homozygotes). Ce phé- complexes
nomène a été décrit chez la drosophile [73]. Il semblerait
cependant qu’il s’agisse d’un phénomène universel [61] qui Les ARNnc jouent un rôle majeur dans les régulations comme
mettrait en œuvre un mécanisme lié physiquement entre cela a été souvent souligné dans cet article. Leur rôle
des promoteurs et/ou des enhancers agissant en cis sur un dans les mécanismes de régulation épigénétique est aussi
même chromosome permettant de stimuler la transcrip- fondamental (modification de la chromatine, des histones,
tion de gènes codants adjacents sur l’autre chromosome. méthylation de l’ADN). Ces mutations induisent des modifi-
Dans certains cas, ce mécanisme pourrait s’effectuer sur cations du phénotype soit subtiles, soit plus importantes (par
de grandes distances, voire entre différents chromosomes exemple, dans l’inactivation de l’X, l’exclusion allélique,
[61]. Beaucoup de promoteurs présentant une transvection l’empreinte parentale, la reprogrammation des cellules ger-
sont transcrits en ARNnc. Complexité supplémentaire, des minales, les paramutations, l’effet de position. . .) [61].
modifications épigénétiques peuvent survenir (elles-même Un exemple de mutation sur un ARNnc est celui décrit
pouvant être régulées par des ARNnc). En conclusion, les dans un modèle murin d’une ataxie cerebelleuse humaine,
études menées sur ce difficile sujet semblent montrer que l’ataxie spinocerebelleuse de type 8 (SCA8, Omim 608768).
la transvection est effectuée à l’aide d’ARNnc. Il s’agirait Les patients présentent une expansion (augmentation) du
alors d’une transcomplémentation, résultat d’un état hété- nombre de triplets CUG sur l’ARNnc présent sur le brin anti-
rozygote composite entre un locus contenant un ARNnc sens, ataxin 8 opposite strand (ATXN8OS), gène en antisens
régulateur et un locus contenant un gène codant à proximité du gène codant KLHL1 (Kelch-like 1, Omim 605332). La souris
et dont l’expression est contrôlée par cet ARNnc. Ce méca- transgénique présentant la même expansion développe les
nisme est cependant encore mal connu chez les eucaryotes signes cliniques observés chez l’humain. Les études ont mon-
[61]. tré que dans certains cas, SCA8 développait un mécanisme
de gain de fonction dans lequel étaient impliqués l’ARNnc
Transinduction ATXN8OS et une protéine polyglutamine ATXN8 (ataxin 8),
transcrite à partir du brin antisens [76]. Il semblerait que des
mécanismes similaires (expansion de triplets) se retrouvent
Ce phénomène a été observé pour le locus ␤-globine.
au niveau des ARNnc dans certaines formes de myotonies
Lorsqu’on transfecte transitoirement un gène ␤-globine,
[12].
celui-ci induit la transcription de la région de contrôle
du locus, locus control region (LCR) ainsi que des régions
intergéniques du locus ␤-globine dans des cellules non-
érythroïdes. Cet effet dépend de la transcription du gène Conclusion
␤-globine issu du plasmide transfecté et de son association
au locus ␤-globine endogène mais non pas de son expression Le monde des ARN dont une ébauche a été présentée dans
protéique démontrant ainsi qu’il ne s’agit pas d’un phé- ce premier article est complexe. L’élucidation progressive
nomène associé à l’expression d’une protéine mais bien à mais non terminée de la structure du génome humain et des
l’action d’ARNnc [74]. La séquence impliquée dans ce phé- autres génomes montre l’importance majeure des ARN et
nomène n’a pas encore été élucidée [61]. notamment des ARNnc longtemps négligés au profit des seuls
gènes codants et de leurs ARNm. Les implications thérapeu-
tiques, diagnostiques, pronostiques de ces découvertes sont
Mutation et gène d’ARNnc majeures et ne sont qu’à leur début. Dans la seconde partie,
nous évoquerons certains ARNnc dont les rôles sont multiples
À ce jour, peu de pathologies conséquences directes de bien que non encore complètement élucidés. Le monde des
mutation sur des gènes d’ARNnc ont été décrites. Peut-être ARN démontre la complexité de notre génome et la finesse
ces gènes ne sont-ils pas suffisamment explorés, la majo- de sa régulation. De nouveaux mécanismes et l’intrication
rité des études de pathologie moléculaire ciblant surtout complexe ADN/ARN se font jour. Encore une révolution bio-
les gènes codants. logique en marche.

Les mutations affectant les fonctions


trans-régulatrices des ARNm Internet

Des mutations sur des régions 3 -non codantes des ARNm Bases de données de maladies héréditaires, Omim (On
ont été identifiées, par exemple dans le syndrome de la line mendelian inheritance in man) : http://www.ncbi.nlm.
Tourette [75]. Ces mutations semblent être localisées sur nih.gov/sites/entrez?db=OMIM&itool=toolbar.
24 J. Lamoril et al.

Conflit d’intérêt are polymorphic among humans. Proc Natl Acad Sci U S A
2009;106:7507—12.
[24] Merrick WC. Cap-dependent and cap-independent translation
Aucun.
in eukaryotic systems. Gene 2004;12(332):1—11.
[25] Martin KC. Ephrussi A. mRNA localization: gene expression in
the spatial dimension. Cell 2009;136:719—30.
Références [26] Rougemaille M, Villa T, Gudipati RK. Libri D mRNA journey to
the cytoplasm: attire required. Biol Cell 2008;100:327—42.
[1] Kawaji H, Hayashizaki Y. Exploration of small RNAs. PLoS Genet [27] Li JB, Levanon EY, Yoon JK, Aach J, Xie B, Leproust E,
2008;4:e22. et al. Genome-wide identification of human RNA editing
[2] Wilusz JE, Sunwoo H, Spector DL. Long noncoding RNAs: sites by parallel DNA capturing and sequencing. Science
functional surprises from the RNA world. Genes Dev 2009;324:1210—3.
2009;23:1494—504. [28] Conticello SG. The AID/APOBEC family of nucleic acid muta-
[3] Amaral PP, Dinger ME, Mercer TR, Mattick JS. The eukaryotic tors. Genome Biol 2008;9:229.
genome as an RNA machine. Science 2008;319:1787—9. [29] Jepson JE, Reenan RA. RNA editing in regulating gene expres-
[4] Dinger ME, Pang KC, Mercer TR, Mattick JS. Differentiating sion in the brain. Biochim Biophys Acta 2008;1779:459—70.
protein-coding and noncoding RNA: challenges and ambigui- [30] Mattick JS, Mehler MF. RNA editing, DNA recoding and the evo-
ties. PLoS Comput Biol 2008;4:e1000176. lution of human cognition. Trends Neurosci 2008;31:227—333.
[5] Roberts L, Holcik M. RNA structure: new messages in trans- [31] Egloff S, O’Reilly D, Murphy S. Expression of human snRNA genes
lation, replication and disease. Workshop on the role of RNA from beginning to end. Biochem Soc Trans 2008;36:590—4.
structures in the translation of viral and cellular RNAs. EMBO [32] Nilsen TW. The spliceosome: the most complex macromolecu-
Rep 2009;10:449—53. lar machine in the cell? Bioessays 2003;25:1147—9.
[6] Martínez-Salas E, Pacheco A, Serrano P, Fernandez N. New [33] Dieci G, Preti M, Montanini B. Eukaryotic snoRNAs: a paradigm
insights into internal ribosome entry site elements relevant for for gene expression flexibility. Genomics 2009;94:83—8.
viral gene expression. J Gen Virol 2008;89:611—26. [34] Rodnina MV, Wintermeyer W. Recent mechanistic insights into
[7] Carninci P. The long and short of RNAs. Nature 2009:974—5. eukaryotic ribosomes. Curr Opin Cell Biol 2009;21:435—43.
[8] Gilmartin GM. Eukaryotic mRNA 3 processing: a common means [35] Gustillo EM, Vendeix FAP, Agris PF. tRNA’s modifications bring
to different ends. Genes Dev 2005;19:2517—21. order to gene expression. Curr Opin Microbiol 2008;11:134—40.
[9] Mattick JS. The functional genomics of noncoding RNA. Science [36] Agris PF, Vendeix FA, Graham WD. tRNA’s wobble deco-
2005;309:1527—8. ding of the genome: 40 years of modification. J Mol Biol
[10] Frith MC, Pheasant M, Mattick JS. The amazing complexity of 2007;366:1—13.
the human transcriptome. Eur J Hum Genet 2005;13:894—7. [37] Groppo R, Richter JD. Translational control from head to tail.
[11] Hüttenhofer A, Schattner P. The principles of guiding by RNA: Curr Opin Cell Biol 2009;21:444—51.
chimeric RNA-protein enzymes. Nat Rev Genet 2006;7:475—82. [38] Zaher HS, Green R. Fidelity at the molecular level: lessons from
[12] Ponting CP, Oliver PL, Reik W. Evolution and functions of long protein synthesis. Cell 2009;136:746—62.
noncoding RNAs. Cell 2009;136:629—41. [39] Jacks T, Varmus HE. Expression of the Rous sarcoma virus pol
[13] Matera AG, Terns RM, Terns MP. Non-coding RNAs: lessons from gene by ribosomal frameshifting. Science 1985;230:1237—42.
the small nuclear and small nucleolar RNAs. Nat Rev Mol Cell [40] Spirin AS. The ribosome as an RNA-based molecular machine.
Biol 2007;8:209—20. RNA Biol 2004;1:3—9.
[14] Chen JM, Férec C, Cooper DN. A systematic analysis of disease- [41] Staley JP, Woolford Jr JL. Assembly of ribosomes and spliceo-
associated variants in the 3 regulatory regions of human somes: complex ribonucleoprotein machines. Curr Opin Cell
protein-coding genes I: general principles and overview. Hum Biol 2009;21:109—18.
Genet 2006;120:1—21. [42] Houseley J, Tollervey D. The many pathways of RNA degrada-
[15] Chen JM, Férec C, Cooper DN. A systematic analysis of disease- tion. Cell 2009;136:763—76.
associated variants in the 3 regulatory regions of human [43] Dinman JD. The eukaryotic ribosome: current status and chal-
protein-coding genes II: the importance of mRNA secondary lenges. J Biol Chem 2009;284:11761—5.
structure in assessing the functionality of 3 UTR variants. Hum [44] McStay B, Grummt I. The epigenetics of rRNA genes: from
Genet 2006;120:301—33. molecular to chromosome biology. Annu Rev Cell Dev Biol
[16] Lécuyer E, Yoshida H, Krause HM. Global implications of mRNA 2008;24:131—57.
localization pathways in cellular organization. Curr Opin Cell [45] Samanta D, Das A, Bhattacharya A, Basu A, Das D, DasGupta
Biol 2009;21:409—15. C. Mechanism of ribosome assisted protein folding: a new
[17] Gustincich S, Sandelin A, Plessy C, Katayama S, Simone R, insight into rRNA functions. Biochem Biophys Res Commun
Lazarevic D, et al. The complexity of the mammalian trans- 2009;384:137—40.
criptome. J Physiol 2006;575:321—32. [46] Levinthal C. Are there pathways for protein folding? J Chim
[18] Wahl MC, Will CL, Lührmann R. The spliceosome: design prin- Phys 1968;65:44—5.
ciples of a dynamic RNP machine. Cell 2009;136:701—18. [47] Fedor MJ, Williamson JR. The catalytic diversity of RNAs. Nat
[19] Moore MJ, Proudfoot NJ. Pre-mRNA processing reaches back to Rev Mol Cell Biol 2005;6:399—412.
transcription and ahead to translation. Cell 2009;136:688—700. [48] Strobel SA, Cochrane JC. RNA catalysis: ribozymes, ribosomes,
[20] Schellenberg MJ, Ritchie DB, MacMillan AM. Pre-mRNA spli- and riboswitches. Curr Opin Chem Biol 2007;11:636—43.
cing: a complex picture in higher definition. Trends Biochem [49] Ameziane N, Bogard M, Lamoril J. Principes de biologie molé-
Sci 2008;33:243—6. culaire en biologie clinique. Collection Campus Référence:
[21] Sandberg R, Neilson JR, Sarma A, Sharp PA. Burge CB Prolifera- Elsevier éd; 2005.
ting cells express mRNAs with shortened 3 untranslated regions [50] Winkler WC, Nahvi A, Roth A, Collins JA, Breaker RR. Control of
and fewer microRNA target sites. Science 2008;320:1643—7. gene expression by a natural metabolite-responsive ribozyme.
[22] Chatterjee S, Pal JK. Role of 5 - and 3 -untranslated regions of Nature 2004;428:281—6.
mRNAs in human diseases. Biol Cell 2009;101:251—62. [51] Hartmann RK, Gössringer M, Späth B, Fischer S, Marchfelder A.
[23] Calvo SE, Pagliarini DJ, Mootha VK. Upstream open reading The making of tRNAs and more - RNase P and tRNase Z. Prog
frames cause widespread reduction of protein expression and Mol Biol Transl Sci 2009;85:319—68.
Le monde complexe et mouvant des ARN. Première partie 25

[52] Chow J, Heard E. X inactivation and the complexities of silen- [66] Nagy E, Maquat LE. A rule for termination-codon position within
cing a sex chromosome. Curr Opin Cell Biol 2009;21:359—66. intron-containing genes: when nonsense affects RNA abun-
[53] Brosnan CA, Voinnet O. The long and the short of noncoding dance. Trends Biochem Sci 1998;23:198—9.
RNAs. Curr Opin Cell Biol 2009;21:416—25. [67] Reinisch KM, Wolin SL. Emerging themes in non-coding
[54] Waters LS, Storz G. Regulatory RNAs in bacteria. Cell RNA quality control. Curr Opin Struct Biol 2007;17:
2009;136:615—28. 209—14.
[55] Coppins RL, Hall KB, Groisman EA. The intricate world of ribos- [68] Mansfield KD, Keene JD. The ribonome: a dominant
witches. Curr Opin Microbiol 2007;10:176—81. force in co-ordinating gene expression. Biol Cell 2009;101:
[56] Mattick JS, Makunin IV. Non-coding RNA. Hum Mol Genet 169—81.
2006;15:R17—29. [69] Baj-Krzyworzeka M, Szatanek R, Weglarczyk K, Baran J, Urba-
[57] Sorek R, Kunin V, Hugenholtz P. CRISPR: a widespread system nowicz B, Brański P, et al. Tumour-derived microvesicles carry
that provides acquired resistance against phages in bacteria several surface determinants and mRNA of tumour cells and
and archaea. Nat Rev Microbiol 2008;6:181—6. transfer some of these determinants to monocytes. Cancer
[58] Mehta P, Goyal S, Wingreen NS. A quantitative comparison of Immunol Immunother 2006;55:808—18.
sRNA-based and protein-based gene regulation. Mol Syst Biol [70] Blencowe BJ, Ahmad S, Lee LJ. Current-generation high-
2008;4:221. throughput sequencing: deepening insights into mammalian
[59] Lenz DH, Mok KC, Lilley BN, Kulkarni RV, Wingreen NS, Bass- transcriptomes. Genes Dev 2009;23:1379—86.
ler BL. The small RNA chaperone Hfq and multiple small RNAs [71] Lu P, Vogel C, Wang R, Yao X, Marcotte EM. Absolute pro-
control quorum sensing in Vibrio harveyi and Vibrio cholerae. tein expression profiling estimates the relative contributions
Cell 2004;118:69—82. of transcriptional and translational regulation. Nat Biotechnol
[60] Shimoni Y, Friedlander G, Hetzroni G, Niv G, Altuvia S, Biham 2007;25:117—24.
O, et al. Regulation of gene expression by small non-coding [72] O’Rourke JR, Swanson MS. Mechanisms of RNA-mediated
RNAs: a quantitative view. Mol Syst Biol 2007;3:138. disease. J Biol Chem 2009;284:7419—23.
[61] Mattick JS. The genetic signatures of noncoding RNAs. PLoS [73] Duncan IW. Transvection effects in Drosophila. Annu Rev Genet
Genet 2009;5:e1000459. 2002;36:521—56.
[62] Louro R, Smirnova AS, Verjovski-Almeida S. Long intronic [74] Ashe HL, Monks J, Wijgerde M, Fraser P, Proudfoot NJ. Interge-
noncoding RNA transcription: expression noise or expression nic transcription and transinduction of the human beta-globin
choice? Genomics 2009;93:291—8. locus. Genes Dev 1997;11:2494—509.
[63] Hill AE, Hong JS, Wen H, Teng L, McPherson DT, McPherson SA, [75] Abelson JF, Kwan KY, O’Roak BJ, Baek DY, Stillman
et al. Micro-RNA-like effects of complete intronic sequences. AA, Morgan TM, et al. Sequence variants in SLITRK1 are
Front Biosci 2006;11:1998—2006. associated with Tourette’s syndrome. Science 2005;310:
[64] Rebbapragada I, Lykke-Andersen J. Execution of nonsense- 317—20.
mediated mRNA decay: what defines a substrate? Curr Opin [76] Moseley ML, Zu T, Ikeda Y, Gao W, Mosemiller AK, Daugh-
Cell Biol 2009;21:394—402. ters RS, et al. Bidirectional expression of CUG and CAG
[65] Silva AL, Romão L. The mammalian nonsense-mediated mRNA expansion transcripts and intranuclear polyglutamine inclu-
decay pathway: to decay or not to decay ! Which players make sions in spinocerebellar ataxia type 8. Nat Genet 2006;38:
the decision? FEBS Lett 2009;583:499—505. 758—69.

Vous aimerez peut-être aussi