Angers2007 PDF
Angers2007 PDF
Angers2007 PDF
Un laboratoire veut étudier la ressemblance génétique de cinq lignées de sorgho (A, B, C, D, E). Pour
cela, il réalise une analyse par RFLP avec l'enzyme de restriction Eco RI et une sonde d'origine inconnue.
Les fragments d’ADN ainsi amplifiés sont ensuite séparés par electrophorèse. Les résultats de
l’electrophorèse donnent les profils suivants:
lignées A B C D E
NB : Deux lignées de sorgho présentent autant de fragments d’ADN identiques que de bandes révélées à
la même hauteur sur les profils de l’electrophorèse.
• Question 1 :
Construisez la matrice de similarité entre les cinq lignées de sorgho à partir du coefficient de
similarité de Dice (Sxy) défini ci-dessous.
Nxy
Sxy= 2 Nx = nombre de bandes de la lignée X
Nx+ Ny
Ny = nombre de bandes de la lignée Y
Nxy = nombre de bandes identiques entre les lignées X et Y
Similarité A B C D E
A
B
C
D
E
• Question 2 :
Déterminez la matrice de dissimilarité en utilisant la fonction de similitude linéaire :
Dxy = C – Sxy où C = max Sxy
• Question 3 :
Effectuez sur la matrice de dissimilarité la CAH en utilisant le critère du saut maximal. Votre réponse doit
comporter les différentes étapes et la représentation de l'arbre hiérarchique.
• Question 4 :
Que concluez vous sur les ressemblances entre les lignées de sorgho ?
III Analyse discriminante (8 points) : Dystrophie musculaire de Duchenne
Cette maladie est causée par la modification d'un gène responsable de la fabrication de la protéine
dystrophine, laquelle contribue à la force et la santé des muscles. Cette modification est ce qu'on appelle
une mutation. Lorsque ce gène subit une mutation, la protéine dystrophine ne s'acquitte plus de sa
fonction. Les cellules musculaires s'affaiblissent et se détruisent peu à peu. Rarissime chez les filles, cette
maladie affecte surtout les garçons.
Nous disposons de quatre variables pouvant être utilisés comme prédicteurs de cette maladie : la créatine
kinase, l'hemopexine, la lactate dehydrogénase et la pyruvate kinase (enzymes).
> tableau
CREATKIN HEMOPEX LACTDEHY PYRUKIN CARRIER
1 5.2 8.4 1.1 17.6 1
2 2.0 7.7 1.1 20.0 1
2. a) A l'aide du résultat e., déterminer la première fonction discriminante dans cet exemple.
b) Retrouver la coordonnée F1 de l'individu 1 dans le tableau f..
Dans la suite, on suppose que les deux classes suivent des lois multinormales.
4. Le test de Bartlett est présenté au résultat d.. Ils portent sur l'égalité des moyennes.
a) Quelle est l'hypothèse nulle pour le test portant sur F1.
b) Interpréter le résultat obtenu ici.
a. $varT
CREATKIN HEMOPEX LACTDEHY PYRUKIN
CREATKIN 10921.58 272.25 1162.69 3301.56
HEMOPEX 272.25 134.72 34.68 252.49
LACTDEHY 1162.69 34.68 183.86 486.81
PYRUKIN 3301.56 252.49 486.81 3355.68
$varW
CREATKIN HEMOPEX LACTDEHY PYRUKIN
CREATKIN 8620.38 -23.66 881.20 1614.46
HEMOPEX -23.66 96.44 -1.33 35.66
LACTDEHY 881.20 -1.33 149.77 280.44
PYRUKIN 1614.46 35.66 280.44 2118.33
$varB
CREATKIN HEMOPEX LACTDEHY PYRUKIN
CREATKIN 2301.20 295.91 281.49 1687.10
HEMOPEX 295.91 38.28 36.01 216.83
LACTDEHY 281.49 36.01 34.09 206.37
PYRUKIN 1687.10 216.83 206.37 1237.35
$varWi
$varWi[[1]]
CREATKIN HEMOPEX LACTDEHY PYRUKIN
CREATKIN 187.38 -17.66 2.20 -2.54
HEMOPEX -17.66 55.44 3.67 54.66
LACTDEHY 2.20 3.67 8.77 27.44
PYRUKIN -2.54 54.66 27.44 603.33
$varWi[[2]]
CREATKIN HEMOPEX LACTDEHY PYRUKIN
CREATKIN 8433 -6 879 1617
HEMOPEX -6 41 -5 -19
LACTDEHY 879 -5 141 253
PYRUKIN 1617 -19 253 1515
b. $correlation
CREATKIN HEMOPEX LACTDEHY PYRUKIN
CREATKIN 1.00 0.22 0.82 0.55
HEMOPEX 0.22 1.00 0.22 0.38
LACTDEHY 0.82 0.22 1.00 0.62
PYRUKIN 0.55 0.38 0.62 1.00
0.65 0.75 0.61 0.86
c. $statvar
m CREATKIN m HEMOPEX m LACTDEHY m PYRUKIN
1 4.31 7.97 1.26 16.50
2 15.56 9.42 2.64 24.75
moyenne 9.55 8.64 1.90 20.34
sd 12.32 1.37 1.60 6.83
F 18.96 28.00 16.35 41.46
P 0.00 0.00 0.00 0.00
d. $valpro
[,1]
vp 9.955148e-01
F* 7.068155e+01
Bartlett 4.767224e+01
ddl 4.000000e+00
P 1.104557e-09
e. $fonction discriminante
[,1]
[1,] 0.004352877
[2,] 0.059999982
[3,] -0.011854650
[4,] 0.013873564
h. $bilan
$bilan[[1]]
gp
fac 1 2
1 36 3
2 6 28
$bilan[[2]]
[1] "Le % de mal classés est : 12.3287671232877"