Exos Stats
Exos Stats
Exos Stats
Annales de Biostatistique
1998 - 2008
J.L. Golmard
A. Mallet
V. Morice
13 2: Concours 2007
21 4: Concours 2006
33 6: Concours 2005
47 8: Concours 2004
59 10 : Concours 2003
71 12 : Concours 2002
77 13 : Concours 2001
83 14 : Concours 2000
87 15 : Concours 1999
93 16 : Concours 1998
Rappels :
• La somme de variables aléatoires distribuées normalement est une variable aléatoire distri-
buée normalement
• Si une variable est distribuée selon une loi de χ2 à n degrés de liberté, son espérance est n et
sa variance 2n.
Exercice 1 (2 QCM)
1.1 On s’intéresse à la conformité des poches de sang utilisées dans un hôpital. On appelle p la
probabilité pour une poche d’être non-conforme. Cette probabilité est supposée faible. On
contrôle la conformité d’un nombre n de poches, assez grand (au moins 100).
1.2 On calculera les probabilités en utilisant la loi de Poisson et avec un arrondi à 2 décimales. On
dit que l’observation de zéro poche non-conforme parmi les n est incompatible avec la probabi-
lité p si la probabilité d’observer zéro poche non-conforme est inférieure à 5%.
A. Les valeurs n=300 et p=0,08 sont incompatibles avec l’observation de 0 poche non-
conforme
B. Avec n=300, il faut et il suffit que p<0,05 pour qu’il y ait compatibilité avec l’observation
de 0 poche non-conforme
C. Avec n=300, il faut et il suffit que p<0,01 pour qu’il y ait compatibilité avec l’observation
de 0 poche non-conforme
D. Il faut et il suffit que p>3/n pour qu’il y ait compatibilité avec l’observation de 0 poche non-
conforme
E. Il faut et il suffit que p<3/n pour qu’il y ait compatibilité avec l’observation de 0 poche non-
conforme
Exercice 2 (1 QCM)
2.1 La densité de probabilité d’une variable aléatoire X est donnée par f(x) = h x2, si 0<x<1, et f(x)
= 0 sinon. h est une constante à déterminer.
A. h=2
B. h=3
C. E(X) = 0,5
D. E(X) = 0,75
E. Pr(X < 0,5) < 0,5
Exercice 3 (1 QCM)
3.1 Pour détecter une certaine maladie, on dispose de deux examens notés A et B et dont les résul-
tats peuvent être positifs ou négatifs et sont indépendants, que la maladie soit ou non présente.
On connaît les sensibilités Se(A)=0,90 et Se(B)=0,60, ainsi que les spécificités Sp(A)=0,80 et
Sp(B)=0,80. La démarche choisie conclut qu’un sujet est malade dès qu’un des deux résultats est
positif et qu’il est non malade sinon.
A. Si le sujet est malade, la probabilité d’être négatif pour A et positif pour B est de 0,10
B. Si le sujet est malade, la probabilité d’être négatif pour A et positif pour B est de 0,20
C. La sensibilité obtenue par la démarche choisie est 0,96
D. La sensibilité obtenue par la démarche choisie est 0,54
E. La spécificité obtenue par la démarche choisie est 0,64
Exercice 4 (1 QCM)
4.1 Dans une certaine population la prévalence d’une maladie est 0,7. On dispose d’un test dia-
gnostique dont la sensibilité est 0,80 et la spécificité est 0,80
Exercice 5 (1 QCM)
5.1 La courbe ROC d’un examen est définie par la fonction y = x , avec (x compris entre 0 et 1)
Exercice 6 (1 QCM)
6.1 Une certaine intervention chirurgicale se décompose habituellement en 3 phases : la phase de
préparation, l’intervention proprement dite, et le réveil. Les durées de ces phases sont distribuées
selon des lois normales indépendantes, avec :
Exercice 7 (2 QCM)
7.1 Dans une certaine pathologie, la durée d’hospitalisation est distribuée selon un χ2 à 18 degrés
de liberté
7.2 En réalité, la distribution de la durée d’hospitalisation est mal connue. Quel est le nombre n de
sujets sur lesquels mesurer la durée d’hospitalisation pour pouvoir estimer la durée moyenne de
séjour avec une précision de ±1 jour au risque 5% (on prendra 6 comme valeur de l’écart-type)
A. 10 ≤ n ≤ 50
B. 51 ≤ n ≤ 120
C. 121 ≤ n ≤ 150
D. 151 ≤ n ≤ 170
E. 171 ≤ n ≤ 200
Exercice 8 (1 QCM)
8.1 En établissant une formule sanguine, on souhaite estimer la proportion de polynucléaires parmi
les leucocytes (globules blancs). Parmi 100 leucocytes, on compte 80 polynucléaires. Dans cette
question, on arrondit u0,05 à 2.
Exercice 9 (1 QCM)
9.1 Une balance A indique le poids sans biais, mais avec une erreur de mesure dont l’écart-type
est égal à 2. Une balance B a un biais systématique égal à une constante d, et un écart-type égal
à 3. On ne dispose que de la balance B pour se peser, mais on est prêt à se peser plusieurs fois (n
fois) et à estimer son poids par la moyenne arithmétique des pesées de manière à obtenir un ré-
sultat aussi bon que celui qu’on aurait obtenu avec la balance A en une seule pesée, en terme d’er-
reur quadratique moyenne.
Exercice 10 (1 QCM)
10.1 Pour estimer la tension artérielle diastolique moyenne dans une population on tire au sort 200
personnes qu’on répartit en deux échantillons de 100 personnes. On obtient les deux moyennes
suivantes : 79 et 81 mmHg, et pour écart-type observé : 10 mmHg dans chaque échantillon. On
construit un intervalle de confiance de niveau 0,9 sur chacun de ces échantillons et on construit
l’intersection de ces deux intervalles
A. La probabilité que les intervalles de confiance contiennent tous les deux la vraie valeur de
la tension artérielle diastolique moyenne est 0,9
B. La probabilité que les intervalles de confiance contiennent tous les deux la vraie valeur de
la tension artérielle diastolique moyenne est 0,81
C. La probabilité que les intervalles de confiance contiennent tous les deux la vraie valeur de
la tension artérielle diastolique moyenne est 0,09
D. La probabilité que l’intersection des deux intervalles contienne la vraie valeur de la tension
artérielle diastolique moyenne est 0,81
E. La probabilité que l’intersection des deux intervalles contienne la vraie valeur de la tension
artérielle diastolique moyenne est 0,9
Exercice 11 (1 QCM)
11.1 Deux sérodiagnostics A et B sont utilisés pour dépister une certaine maladie. Ces deux tests
ont été utilisés sur un ensemble d’individus. Dans 30 cas, les deux tests ont donné des conclu-
sions discordantes : dans 20 cas, A a été négatif et B positif ; dans 10 cas, A a été positif et B
négatif. Si les deux examens donnent la même proportion de résultats positifs, les probabilités de
chacun des deux types de discordance sont égales à 1/2.
On va donc comparer la proportion observée de discordances de type A négatif, B positif (20/30)
avec la valeur théorique 1/2.
A. L’hypothèse alternative est que l’un des deux sérodiagnostics donne plus souvent que
l’autre des résultats positifs
B. L’hypothèse nulle est que l’un des deux sérodiagnostics donne plus souvent que l’autre des
résultats négatifs
C. Le paramètre calculé est inférieur à 2
D. Le paramètre calculé est supérieur à 2,5
E. On n’a pas mis en évidence que l’un des sérodiagnostics donne plus souvent que l’autre des
résultats positifs
Exercice 12 (1 QCM)
12.1 On veut comparer les proportions moyennes de lymphocytes dans deux formes d’une mala-
die, qu’on notera formes A et B. On tire au sort deux groupes de 50 malades chacun, atteints res-
pectivement des formes A et B. On obtient les résultats suivants : les variances des proportions
sont de 0,05 et 0,1 dans les groupes A et B, et les proportions moyennes de lymphocytes sont
respectivement de 0,5 et de 0,6.
Exercice 13 (1 QCM)
13.1 On veut tester l’hypothèse d’égalité d’atteinte selon le sexe dans une maladie, c’est-à-dire
l’hypothèse selon laquelle les proportions d’hommes et de femmes sont égales parmi les per-
sonnes atteintes de cette maladie. On tire au sort 100 personnes atteintes de cette maladie, et on
observe m hommes. On rejettera l’égalité d’atteinte selon le sexe quand :
A. m ∈ [50 ; 53]
B. m ∈ [55 ; 57]
C. m ∈ [61 ; 65]
D. m ∈ [70 ; 75]
E. m ∈ [82 ; 83]
Exercice 14 (1 QCM)
14.1 En vue de comparer deux traitements T1 et T2 d’une affection bénigne, on répartit entre ces
deux traitements 250 malades par tirage au sort. Les résultats sont indiqués dans le tableau ci-
dessous
T1 15 70 35 120
T2 25 85 20 130
Exercice 15 (3 QCM)
15.1 On compare l’efficacité de 2 antalgiques A et B dans un essai randomisé sur 2 groupes de 50
sujets. L’efficacité est évaluée par la diminution de la douleur mesurée à l’aide d’une Echelle Vi-
suelle Analogique (EVA). Les résultats obtenus sont indiqués dans le tableau ci-dessous
A 50 23 70
B 50 20 90
A. L’hypothèse nulle est que la diminution de la douleur dans la population est la même avec
les deux traitements
B. Pour effectuer le test de comparaison, on doit supposer que la distribution de la diminution
15.2 Sachant qu’on s’intéresse à une variation de la diminution de la douleur de ±3 selon le trai-
tement, combien faudrait-il de sujets par groupe pour la mettre en évidence (si elle existe) en uti-
lisant un test de puissance 90%. On utilisera les variances de la QCM précédente pour les calculs
A. n = 40
B. 40 < n ≤ 100
C. 100 < n ≤ 200
D. 200 < n ≤ 600
E. 600 < n ≤ 1000
15.3 On dispose de 200 malades pour réaliser un essai thérapeutique sur deux groupes de 100 su-
jets. On s’intéresse toujours à la mise en évidence d’une variation de la diminution de la douleur
de ±3 selon le traitement. Quelle sera la puissance du test. On utilisera les variances de la QCM
15.1 pour les calculs
A. < 30%
B. 30-50%
C. 51-80%
D. 81-90%
E. > 90%
Exercice 16 (1 QCM)
16.1 On suit une population de malades bénéficiant d’une intervention chirurgicale prise comme
origine du temps (t=0)
Un an après l’intervention, il y a 90% de survivants
Deux ans après l’intervention, il y a 80% de survivants
Trois ans après l’intervention, il y a 60% de survivants
Quatre ans après l’intervention, il y a 40% de survivants
Cinq ans après l’intervention, il y a 20% de survivants
A. La probabilité qu’un malade a de mourir entre 2 ans et 4 ans après l’intervention est de 40%
B. La probabilité de survivre 4 ans après l’intervention quand on a déjà survécu 3 ans est 1/3
C. La probabilité de survivre 4 ans après l’intervention quand on a déjà survécu 2 ans est 1/2
D. La probabilité de vivre encore au moins 4 ans quand on a survécu 1 an après l’intervention
est de 20%
E. La probabilité de vivre encore au moins 4 ans quand on a survécu 1 an après l’intervention
est de 2/9
Concours 2007
Avertissement : le concours 2007 ne sera pas mis en ligne
Exercice 1 (1 QCM)
1.1 La colposcopie est un examen optique permettant de dépister les dysplasies du col de l’utérus
en détectant des zones suspectes. Lorsque (et seulement lorsque) une zone apparaît suspecte au
colposcopiste, une biopsie (prélèvement superficiel de quelques mm2) est réalisée et son histo-
logie précisée grâce à un examen effectué par un anatomopathologiste. L’histologie donne le dia-
gnostic.
On voudrait caractériser les propriétés métrologiques de la colposcopie. Avec les seules données
ainsi recueillies chez un certain nombre de femmes on pourra estimer :
A. La sensibilité de la colposcopie.
B. La spécificité de la colposcopie.
C. La valeur prédictive positive de la colposcopie.
D. La valeur prédictive négative de la colposcopie.
E. La proportion des faux positifs parmi les positifs.
Exercice 2 (1 QCM)
2.1 Dans une certaine maladie grave, la fonction de survie à compter du diagnostic est divisée par
deux entre deux dates quelconques différant d’un an. Indiquez les propositions exactes :
Exercice 3 (1 QCM)
3.1 Un(e) de vos collègues, peu familier(e) de la biostatistique s’intéresse à la fréquence d’une cer-
taine maladie chronique (sa prévalence). Il (elle) pense que cette fréquence est de 20 % dans sa
clientèle. Par ailleurs il (elle) a consulté les fiches de 900 de ses patients et trouvé 90 patients
atteints de cette maladie. Indiquez les propositions exactes.
A. Après calcul vous pouvez lui dire que la prévalence n’est pas 20 % dans sa clientèle
B. L’intervalle de confiance de la prévalence (au risque 5 %) est environ [0,08 0,12], à 0,01
près pour chaque borne.
C. L’intervalle de confiance de la prévalence (au risque 5 %) est environ [0,17 0,23], à 0,01
près pour chaque borne.
D. L’intervalle de pari de la prévalence (au risque 5 %) était environ [0,08 0,12] à 0,01 près
pour chaque borne.
E. L’intervalle de pari de la prévalence (au risque 5 %) était environ [0,17 0,23] à 0,01 près
pour chaque borne.
Exercice 4 (1 QCM)
4.1 On a constaté qu’au service d’urgences d’un certain hôpital se présentaient en moyenne 3 ma-
lades chaque jour. Le nombre de patients se présentant chaque jour est supposé suivre une dis-
tribution de Poisson. Lorsque 3 malades au plus se présentent, un médecin peut assurer seul leur
prise en charge. Lorsqu’il y a au moins quatre malades, un second médecin est mobilisé.
A. La probabilité pour qu’aucun malade ne se présente de la journée est 0,1 environ (à 0,01
près).
B. La probabilité pour qu’au plus un malade se présente dans la journée est 0,2 environ (à 0,01
près).
C. Le nombre moyen de médecins mobilisés pour cette consultation est 1,35 (à 0,02 près).
D. Le nombre moyen de médecins mobilisés pour cette consultation est 1,65 (à 0,02 près).
E. Le nombre moyen de médecins mobilisés pour cette consultation est 1,92 (à 0,02 près).
5.3 On donne maintenant les coûts (au sens large) des diverses actions
• coût de réalisation de l’examen e1 = 1
• coût d’administration du traitement = 5
• l’administration à tort du traitement a des effets néfastes assimilables à un coût supplémen-
taire = 5
• ne pas traiter un malade a des conséquences graves assimilables à un coût supplémentaire
= 100
On veut calculer le coût moyen associé à la stratégie choisie (traiter si et seulement si l’examen
donne un résultat positif). La variable aléatoire coût dont on cherche l’espérance peut prendre 4
valeurs, associées aux 4 possibilités : ne pas traiter avec raison, ne pas traiter à tort, traiter avec
raison, traiter à tort.
5.7 On dispose d’un autre examen e2 pour détecter la présence de la maladie. L’événement « le
résultat de e2 est positif » est noté E2 et est en faveur de la présence de la maladie. La sensibilité
de cet examen est de 90 % et sa spécificité de 80 %. La probabilité que les deux examens donnent
simultanément un résultat positif sur un même patient est de 0,25. La probabilité d’avoir la ma-
ladie et d’avoir les deux résultats positifs est de 0,085.
A. Ils sont indépendants, car ce n’est pas parce qu’on fait e1 qu’on est obligé de faire e2
B. S’ils n’étaient pas indépendants, le résultat de e2 n’aurait pas de lien avec celui de e1
C. S’ils étaient indépendants, le résultat d’un des examens n’apporterait aucune information
sur le résultat de l’autre
D. Si Pr(E2) était égal à 0,5 ils seraient indépendants
E. Ils ne sont pas indépendants et Pr(E2) = 0,27
5.8 La stratégie qu’on utilise maintenant est la suivante : on commence par faire l’examen e1 ; si
le résultat est négatif, on ne traite pas ; si le résultat est positif, on fait l’examen e2 puis on choisit
de traiter ou non selon que le résultat de e2 est positif ou négatif.
5.9 La stratégie précédente définit un examen composite e dont le résultat est positif si et seule-
ment si e1 fournit un résultat positif, puis e2 fournit un résultat positif
A. Sans calcul, on peut affirmer que la sensibilité de e est inférieure ou égale aux sensibilités
de e1 et e2
B. Sans calcul, on peut affirmer que la sensibilité de e est supérieure ou égale aux sensibilités
de e1 et e2
C. Sans calcul, on ne peut pas classer la sensibilité de e par rapport à celles de e1 et e2
D. La sensibilité de e est de 85 %
E. La sensibilité de e est de 95 %
5.10 On peut vérifier aisément que la spécificité de l’examen composite e est environ 82 %. On
suppose que le coût de l’examen e2 est égal à 2, les autres coûts étant ceux définis pour la ques-
tion 3
A. Il est raisonnable de préférer la nouvelle stratégie à celle ne faisant intervenir que l’examen
e1 si son coût moyen est inférieur à celui calculé question 5.
B. Il ne faut adopter cette nouvelle stratégie que si la sensibilité et la spécificité sont meilleures
que celles de e1 seul
C. Le coût moyen de la nouvelle stratégie est 3
D. Le coût moyen de la nouvelle stratégie est environ 5,6
E. Le coût moyen de la nouvelle stratégie est environ 8,2
Exercice 6 (6 QCM)
On réfléchit à une mesure de prévention innovante qui pourrait réduire le risque de complications
après une intervention chirurgicale. On sait que le taux de complications de cette intervention est
de 8 %. On espère grâce à cette mesure le ramener à 4 %.
Pour faire la preuve de l’intérêt de cette nouvelle mesure on s’apprête à réaliser un essai clinique
auquel participeront des patients dont une moitié bénéficiera de la mesure, l’autre moitié n’en bé-
néficiant pas. On veut assurer à cette étude une puissance de 0,8.
6.4 Il a été finalement décidé de réaliser une étude randomisée en incluant 412 patients. Les résul-
tats obtenus sont les suivants. Sur les 206 patients ayant bénéficié de la mesure, 14 ont présenté
une complication ; cela a été le cas chez 16 patients n’ayant pas bénéficié de la mesure. Indiquez
les propositions exactes :
6.5 En réalité, on a noté au cours de l’étude le degré de sévérité (grave ou peu grave) des compli-
cations présentées par les patients ; les résultats plus détaillés sont présentés dans le tableau de
contingence ci-dessous.
Ils permettent de répondre à une nouvelle question : la mesure de prévention a-t-elle une action
sur les complications ?
Pour répondre à cette question :
Concours 2006
Durée 1heure et 45 minutes. Tout document autorisé.
Exercice 1 (1 QCM)
1.1 On suppose que le nombre de sujets se présentant chaque jour à la consultation d’un médecin
entre 11h et 12h suit une loi de Poisson de moyenne 3.
A. La probabilité qu’au cours d’une consultation de 11h à 12h, aucun malade ne se présente
est comprise entre 4 % et 6 % ;
B. La probabilité qu’au cours d’une consultation de 11h à 12h, aucun malade ne se présente
est comprise entre 94 % et 96 % ;
C. La probabilité qu’au cours d’une consultation de 11h à 12h, un seul malade se présente est
comprise entre 10 et 20 % ;
D. La probabilité qu’au cours d’une consultation de 11h à 12h, un seul malade se présente est
supérieure à 20 % ;
E. La probabilité que 4 malades ou plus se présentent à la consultation est supérieure à 10 %
Exercice 2 (3 QCM)
2.1 Un enfant naît à terme s’il naît au bout de 38 semaines d’aménorrhée au moins (événement T) ;
il naît avant terme sinon. L’événement « naître avant terme » est noté AT.
Une grossesse est dite « unique » si la mère ne porte qu’un seul fœtus (événement noté U). Sinon,
la grossesse est dite « multiple » (événement M).
La probabilité de naissance avant terme est de 5 % pour une grossesse unique et de 45 % pour
une grossesse multiple.
Dans les QCM 1et 2 de l’exercice, on s’intéresse à une population dans laquelle le taux de gros-
sesses multiples est de 10 %.
A. Pr(M) ≥ 0,15
B. Pr(M) = 0,10
C. Pr(M) = 0,05
D. Pr(M) = 0,02
E. Pr(M) < 0,01
Exercice 3 (2 QCM)
3.1 On considère une variable X1 distribuée selon une loi normale d’espérance 0 et de variance 4,
et une variable X2 distribuée selon une loi normale centrée réduite.
Exercice 4 (5 QCM)
4.1 Dans une population comportant 10 % de personnes atteintes d’une certaine maladie, on
constitue 2 échantillons indépendants, l’un de 144 personnes atteintes (groupe M), l’autre de 256
non atteintes (groupe N).
Parmi les malades on observe 130 personnes possédant un signe S, mais seulement 51 ont ce
signe chez les non malades. On veut évaluer l’intérêt de ce signe dans le diagnostic de la maladie.
4.4 Les réponses sont indépendantes des réponses aux QCM précédentes.
On note ICSe1-α l’intervalle de confiance de niveau 1 - α pour la sensibilité et ICSp1-α l’inter-
valle de confiance de niveau 1 - α pour la spécificité
A. Pr(Se ∈ ICSe1-α) = α
B. Pr(Se ∈ ICSe1-α) = 1 - α
C. Pr[(Se ∈ ICSe1-α) ∩ (Sp ∈ ICSp1-α)] = α
D. Pr[(Se ∈ ICSe1-α) ∩ (Sp ∈ ICSp1-α)] = (1 - α)2
E. Pr[(Se ∈ ICSe1-α) ∩ (Sp ∈ ICSp1-α)] = 1 - α2
4.5 Les réponses ne sont pas indépendantes des réponses aux QCM précédentes.
On veut calculer un intervalle de confiance ICVPP pour la valeur prédictive positive à partir des
intervalles de confiance ICSe1-α et ICSp1-α. On admettra que la borne inférieure (resp. supé-
rieure) de ICVPP se calcule à partir des bornes inférieures (resp. supérieures) de ICSe1-α et
ICSp1-α.
On veut que la VPP ait une probabilité de 0,94 de se trouver dans l’intervalle ICVPP.
A. Compte tenu de la précision de la table, il faut utiliser les intervalles ICSe1-α et ICSp1-α cal-
culés avec α = 0,06
B. Compte tenu de la précision de la table, il faut utiliser les intervalles ICSe1-α et ICSp1-α cal-
culés avec α = 0,03
C. La borne inférieure de ICVPP est 0,272
D. La borne supérieure de ICVPP est 0,398
E. Il y a moins de 6 chances sur cent pour qu’un patient présentant le signe ait un risque d’être
atteint supérieur à 0,423
Exercice 5 (1 QCM)
5.1 Une étude clinique visant à comparer les proportions observées de patients qui sont encore
douloureux une heure après l’administration d’un antalgique selon la dose qu’ils ont reçue (faible
ou forte dose) a été dimensionnée (on a calculé un nombre de sujets nécessaires) de façon à as-
surer une puissance de 80 %.
A. Cela veut dire qu’il y a 8 chances sur 10 pour que la forte dose soit plus efficace que la faible
dose
B. Cela veut dire que si les proportions des patients encore douloureux ne dépendent pas de la
dose reçue, il y a 8 chances sur 10 pour qu’on le voie
C. Cela veut dire que l’on pourra déceler une différence de 80/2 = 40 % entre les deux propor-
tions
D. Pour faire le calcul il suffit de se donner la proportion supposée commune des patients qui
resteraient douloureux quelle que soit la dose
E. Pour faire le calcul on a dû se donner les deux proportions, différentes, de patients qui res-
teraient douloureux à chaque dose
Exercice 6 (1 QCM)
6.1 Un biologiste s’est engagé dans la comparaison du contenu en phytostérols de plaques d’athé-
rome entre deux populations de patients : les patients recevant un régime supplémenté en phy-
tostérols (patients S), dont il constitue un échantillon de 6 patients, les patients ne recevant pas
un tel régime (patients NS), dont il constitue un échantillon de 8 patients. On lui a recommandé
d’utiliser un test de Mann-Whitney-Wilcoxon. Il a obtenu une valeur calculée du paramètre du
test égale à 2,6.
A. Compte tenu de la valeur obtenue, il peut conclure que les proportions de plaques contenant
des phytostérols diffèrent dans les deux populations
B. Compte tenu de la valeur obtenue, il peut conclure qu’il y a plutôt plus de phytostérols dans
les plaques des patients supplémentés
C. Compte tenu de la valeur observée il ne peut pas conclure
D. Le degré de signification du test doit être donné par p<0,05
E. Le degré de signification du test doit être donné par p<0,01
Exercice 7 (2 QCM)
7.1 On cherche à étudier les relations entre vaccination contre la grippe et emploi. On a demandé
à 350 personnes choisies au hasard dans une population, d’une part si elles s’étaient faites vac-
ciner contre la grippe entre septembre et décembre 2005, et d’autre part leur statut socioprofes-
sionnel, en distinguant les trois catégories : sans activité professionnelle (SP), profession de
responsabilité élevée (PE), profession de responsabilité faible (PF). Les résultats sont indiqués
sur le tableau de contingence ci-dessous.
SP PE PF Totaux
Exercice 8 (3 QCM)
8.1 On s’intéresse à la durée T des symptômes rhumatologiques associés à l’infection par le
Chikungunya dans l’île de la Réunion. On appellera S la fonction de survie associée à cette va-
riable T, délai de survenue de l’événement « disparition des symptômes ». La durée est exprimée
en jours.
On suppose que S prend notamment les valeurs suivantes :
S(2) = 0,9 ; S(4) = 0,81 ; S(12) = 0,5 ; S(31) = 0,3.
A. Des trois phrases précédentes on déduit que la probabilité de voir les symptômes durer en-
core t jours alors qu’ils durent depuis x jours ne dépend pas de x
B. Si l’on présente encore des symptômes rhumatologiques à 5 jours, l’espérance de la durée
restante des symptômes est 13 jours
C. Si l’on présente encore des symptômes rhumatologiques à 5 jours, l’espérance de la durée
restante des symptômes est strictement comprise entre 13 et 18 jours
D. Si l’on présente encore des symptômes rhumatologiques à 5 jours, l’espérance de la durée
restante des symptômes est 18 jours
E. Si l’on présente encore des symptômes rhumatologiques à 5 jours, l’espérance de la durée
restante des symptômes est supérieure strictement à 18 jours
A. Dans cet échantillon il faut inclure des sujets non infectés par le Chikungunya
B. Individuellement, la date d’origine est la date de survenue des premiers symptômes rhuma-
tologiques
C. La date d’origine est la date de début de l’infection sur l’île
D. La date de point est le 1er octobre 2006
E. La date de point est postérieure au 1er octobre 2006
Exercice 9 (2 QCM)
9.1 Un nouveau médicament régulateur de la circulation rénale fait l’objet d’un essai.
Chez 49 patients on a dosé l’albuminurie (concentration d’albumine dans les urines) avant et
après l’administration du médicament. Pour savoir si on constate une variation de l’albuminurie
1.3 On sait que le temps moyen de disparition du produit chez les malades est supérieur au temps
moyen de disparition chez les non malades. Quelle contrainte cela impose-t-il à k ?
1.4 On veut choisir un seuil s tel que si pour une personne le délai de disparition du produit est
supérieur au seuil, elle est déclarée porteuse du signe pathologique S conduisant à conclure à la
présence de la maladie ; si ce délai est inférieur au seuil, elle est déclarée non porteuse.
– --s-
k –s
Montrer que la sensibilité vaut Se = e et que la spécificité vaut Sp = 1 - e
Les plaquettes de ces patients sont dosées chaque jour suivant la greffe pendant une période suffi-
sante pour que chez chaque sujet on obtienne la valeur la plus basse post-greffe. Dans la suite les
concentrations de plaquettes sont en 109/l.
L’étude a été réalisée chez 8 patients du groupe E et 7 patients du groupe NE. Les valeurs minimum
des plaquettes sont les suivantes :
2.1 (1 point)
On lit dans le rapport de l’étude :
« 7 patients du groupe NE et 8 patients du groupe E sont nécessaires pour assurer une puissance
de 0,9 »
Expliquez le sens de cette phrase
2.2 (1 point)
On lit dans le rapport de l’étude :
« l’analyse sera faite en intention de traiter »
Expliquez le sens de cette phrase.
2.3 (5 points)
On lit dans le rapport de l’étude :
« les niveaux de plaquettes seront comparées par un test d’hypothèses »
Réalisez le test approprié. On veillera à préciser les étapes de mise en œuvre, et le degré de si-
gnification le cas échéant. On ira aussi loin que possible dans l’interprétation.
3.1 La probabilité qu’une femme de cette population soit de stade 4 et survive au moins 5 ans est
0,03.
A. La probabilité de survivre au moins 5 ans pour une femme de stade 4 est 0,03
B. La probabilité de survivre au moins 5 ans pour une femme de stade 4 est 0,065
C. 70 % des femmes de stade 4 décèdent dans les 5 ans après la découverte de leur cancer
D. En cas de décès dans les 5 ans, la probabilité que la femme ait été de stade 4 est 0,20
E. En cas de décès dans les 5 ans, la probabilité que la femme ait été de stade 4 est 0,954
A. La probabilité qu’un cancer soit de stade 3 avec une survie d’au moins 5 ans est 0,5
B. La probabilité qu’un cancer soit de stade 3 avec une survie d’au moins 5 ans est 0,075
C. La probabilité qu’un cancer soit de stade 3 ou 4 avec une survie d’au moins 5 ans est 0,105
D. La probabilité de survivre au moins 5 ans pour une femme de stade 3 ou 4 est 0,105
E. La probabilité de survivre au moins 5 ans pour une femme de stade 3 ou 4 est 0,42
Concours 2005
Il faut ajouter aux auteurs A.J. Valleron et les enseignants de Saint-Antoine qui ont rédigé la moi-
tié des questions de cette épreuve.
tisticien effectue le test de comparaison entre les groupes H et T. Lui non plus ne connaît pas
l’erreur de la pharmacie. Le test est effectué, comme toujours, au risque de première espèce 5 %.
La puissance de l’étude a été établie à 90 %.
A. Il y a 5 chances sur 100 pour que le test statistique final conduise à déclarer que T et H ont
des effets différents
B. Il y a 95 chances sur 100 pour que le test statistique final conduise à déclarer que T et H ont
des effets différents
C. Il y a 10 chances sur 100 pour que le test statistique final conduise à déclarer que T et H ont
des effets différents
D. Il y a 90 chances sur 100 pour que le test statistique final conduise à déclarer que T et H ont
des effets différents
E. Il y a 0 chance sur 100 pour que le test statistique final conduise à déclarer que T et H ont
des effets différents
1.2 QCM 2
Chaque année, il y a une épidémie de syndromes grippaux. On suppose qu’elle touche en
moyenne 15 % de la population, et que le fait d’avoir eu un syndrome grippal une année ne mo-
difie pas le risque d’en avoir un l’année suivante (« pas d’immunité acquise »)
A. L’énoncé indique que les événements « avoir un syndrome grippal en 2004 » et « avoir un
syndrome grippal en 2003 » sont des événements indépendants
B. La probabilité pour un sujet d’avoir eu un syndrome grippal en 2003 et à nouveau un syn-
drome grippal en 2004 est 30 % (= 0,30)
C. La probabilité pour un sujet d’avoir eu un syndrome grippal en 2003 ou en 2004 est 30 %
D. La probabilité pour un sujet d’avoir eu un syndrome grippal en 2003 ou en 2004 est 15 %
E. Les sujets ayant eu un syndrome grippal en 2003 avaient 85 chances sur 100 de ne pas en
avoir en 2004
1.3 QCM 3
On se demande si un traitement T modifie la glycémie des malades qui le reçoivent. On mesure
la glycémie des sujets de deux groupes de 49 patients : les patients du premier groupe (groupe
T) sont traités par T ; ceux de l’autre groupe ne sont pas traités (groupe NT). Les groupes sont
constitués par tirage au sort, et on compare leur moyenne.
Les moyennes et variances observées dans les deux groupes sont : mT = 5,9 mmol/ml,
mNT = 5,5 mmol/ml, s2T = 0,4, s2NT = 0,6.
A. L’hypothèse nulle testée est que les moyennes observées mT et mNT sont identiques
B. Au risque 5 %, les moyennes observées mT et mNT diffèrent significativement
C. Le degré de signification est compris entre 1 % et 1 ‰
D. Le degré de signification est compris entre 5 % et 1 %
E. Le test est valide car les tailles des groupes sont suffisantes
1.4 QCM 4
Après avoir pratiqué un nombre très élevé de scanners dans la population des fumeurs de 50 à 55
ans, on considère que l’on dispose des probabilités suivantes :
— 30 % des fumeurs présentent une anomalie au scanner (avoir une anomalie au scanner est
noté A).
— 20 % des fumeurs indiquent tousser régulièrement (tousser régulièrement est noté T).
— 10 % des fumeurs présentent une anomalie (A) et indiquent tousser régulièrement (T).
1.5 QCM 5
On note G1, S, G2, et M les 4 phases du cycle cellulaire (G1, S, et G2, sont respectivement la
présynthèse, la synthèse et la post synthèse de l’ADN. M est la mitose).
On suppose que les durées de ces phases sont des variables aléatoires indépendantes entre elles.
Les moyennes et écarts types des durées de G1 sont respectivement de 10h et 5h ; de S : 7h et
3h ; de G2 : 2h et 1h ; de M 1h et 1h. Les distributions des durées de G1, S, G2, et M ne sont pas
gaussiennes.
1.6 QCM 6
On considère 2 événements A et B sur un même ensemble fondamental E, tels que la probabilité
de A ne change pas si on apprend que B ne s’est pas produit.
A. A et B sont indépendants
B. A et B sont incompatibles
C. Pr(A/B) = Pr(A/ B )
D. Pr( A ) = Pr( A /B)
E. Pr(A ou B) = Pr(A) + Pr(B)
1.7 QCM 7
On considère deux variables aléatoires X et Y et ρ(X,Y) leur coefficient de corrélation
1.8 QCM 8
Si le degré de signification d’un test ou d’une étude est inférieur à 0,01, alors c’est :
1.9 QCM 9
Mn désigne comme dans le cours la variable aléatoire moyenne arithmétique. On note X la va-
riable aléatoire d’intérêt, E(X) son espérance et var(X) sa variance.
1.10 QCM 10
On cherche à estimer la moyenne de la durée de sommeil dans la population des patients traités
par un somnifère. Pour cela on a observé chez 100 de ces patients leur durée de sommeil lors
d’un enregistrement nocturne. On a obtenu : Σxi=670 heures, et pour variance observée : s2=4.
1.11 QCM 11
On suppose que, habituellement, le nombre de sujets se présentant à la consultation d’un médecin
entre 11h et 12h suit une loi de Poisson de moyenne 3. Pour les calculs, on utilisera les valeurs
arrondies de la table suivante :
x 0 1 2 3 4 5
exp(-x) 1 0,37 0,14 0,05 0,02 0,007
A. La probabilité qu’aucun malade ne se présente au cours d’une consultation de 11h à 12h est
0,05
B. La probabilité qu’aucun malade ne se présente au cours d’une consultation de 11h à 12h est
0,95
C. La probabilité qu’un seul malade se présente au cours d’une consultation de 11h à 12h est
0,37
D. La probabilité qu’un seul malade se présente au cours d’une consultation de 11h à 12h est
0,15
E. La probabilité que 4 malades ou plus se présentent au cours d’une consultation de 11h à 12h
est 0,027
2.1 QCM 1
Un nouvel examen biologique permet de distinguer trois formes différentes, A, B et C, d’une ma-
ladie intestinale connue depuis longtemps et que l’on diagnostique facilement.
On se place dans la population des sujets présentant cette maladie ; on les appelle malades.
On voudrait montrer que cette classification en trois formes est liée à la douleur (présente-ab-
sente) que présentent certains de ces malades.
A. Cela revient à montrer que la proportion observée de malades présentant des douleurs dé-
pend de la forme de la maladie
B. Cela revient à montrer que forme de la maladie (variable à trois classes, ou modalités : A,
B, C) et douleur (variable à deux classes, ou modalités : présente, absente) ne sont pas in-
dépendantes
C. Pour le démontrer on peut constituer au hasard deux groupes de malades :
— dans le premier on recueillera la présence ou l’absence de douleur
— dans le second on recueillera la forme de la maladie
D. Pour le démontrer on doit disposer de deux informations sur chaque malade : la forme de la
maladie et le statut par rapport à la douleur
E. Cela revient à montrer que connaître la forme de la maladie n’apporte pas d’information sur
le risque de présence de douleur
2.2 QCM 2
Même énoncé que pour le QCM 1. Question indépendante des réponses au QCM 1.
On considère 219 malades. Après avoir recherché la forme de la maladie et interrogé ces malades
sur leurs douleurs, vous disposez du tableau d’effectifs suivant :
A B C
Présence de douleurs 38 50 56
Absence de douleurs 34 22 19
A. L’hypothèse nulle peut s’exprimer ainsi : forme de la maladie et douleur sont liées
B. L’hypothèse nulle peut s’exprimer ainsi : forme de la maladie et douleur sont indépendantes
C. L’égalité Pr (forme de la maladie=A et douleur=présente) = Pr (forme de la maladie =A) est
toujours juste sous H0
D. Le paramètre du test suit, sous H0, un χ2 à 2 degrés de liberté
E. On sait déjà que le test peut être réalisé car tous les effectifs du tableau sont supérieurs à 5.
2.3 QCM 3
Même énoncé que pour le QCM 1. Question indépendante des réponses aux QCM 1 et QCM 2
précédents.
2.4 QCM 4
On a suivi le devenir d’un grand groupe de malades atteints d’une maladie M, à partir de la date
de diagnostic. On considère alors que l’on dispose des probabilités suivantes :au bout d’un an,
20 % des malades sont morts ; au bout de 2 ans, 50 % des malades sont morts ; au bout de 3 ans,
70 % des malades sont morts ; au bout de 4 ans, 80 % des malades sont morts ; au bout de 5 ans,
80 % des malades sont morts.
A. La probabilité qu’un malade ayant déjà survécu 2 ans survive moins de 3 ans est 40 %
B. La probabilité qu’un malade ayant déjà survécu 2 ans survive moins de 3 ans est 60 %
C. La probabilité qu’un malade ayant déjà survécu 2 ans survive au moins 4 ans est 20 %
D. La probabilité qu’un malade ayant déjà survécu 2 ans survive au moins 4 ans est 40 %
E. La probabilité qu’un malade ayant déjà survécu 2 ans survive au moins 4 ans est 60 %
2.5 QCM 5
On sait d’avance que le taux sanguin T (en u/ml) d’une substance est plus élevé en moyenne chez
les malades atteints de la maladie (notés : M) que chez les non malades (notés : NM). On veut se
servir de la mesure de T pour aider au diagnostic de M. On suppose d’abord connaître parfaite-
ment la distribution de T chez les malades M et les non malades NM.
2.6 QCM 6
Même énoncé que pour le QCM 5. Question indépendante des réponses au QCM 5.
On décide de fixer le seuil diagnostique S, au dessus duquel on déclare le sujet malade, à 100 u/
ml.
2.7 QCM 7
Même énoncé que pour le QCM 5. Les réponses ne sont pas indépendantes de celles du QCM
précédent.
A. La valeur prédictive positive du test (avec le seuil 100) est comprise entre 30 et 50 %
B. La valeur prédictive positive du test (avec le seuil 100) est comprise entre 50 et 70 %
C. La valeur prédictive positive du test (avec le seuil 100) est comprise entre 70 et 90 %
D. La valeur prédictive positive du test (avec le seuil 100) est inférieure à 30 %
E. La valeur prédictive positive du test (avec le seuil 100) est supérieure à 70 %
2.8 QCM 8
Même énoncé que pour le QCM 5. Réponses indépendantes des réponses aux QCM précédents.
En réalité, on s’aperçoit qu’on ne connaît pas exactement la valeur de μM (qu’on avait supposée
égale à 110 u/ml), et on veut l’estimer à partir d’un échantillon de malades. On note Mn la va-
riable aléatoire moyenne arithmétique de T sur un échantillon de taille n.
On cherche la valeur de n telle que Mn ait 99 chances sur 100 d’être à moins de 2,5 u/ml de la
vraie valeur de μM. Pour les calculs, on considèrera que l’écart type σ de T vaut 10.
2.9 QCM 9
On s’intéresse ici à la durée de séjour des patients d’un service spécialisé donné, à l’hôpital. L’es-
timation de la moyenne et de la variance de la durée de séjour D s’obtient à partir des observa-
tions faites pendant une longue période (par exemple un an). Toutefois on pourrait penser qu’il
suffit de venir un jour donné à l’hôpital et d’utiliser les durées de séjour (qui seront connues à la
sortie du patient) des seuls patients présents ce jour là pour obtenir les estimations de la moyenne
et de la variance de D. Cette attitude conduit cependant à des résultats faux, la variable J (durée
de séjour à un jour donné) étant différente de la variable D (durée de séjour).
Cet exercice vise à préciser certains liens entre J et D.
On notera μJ et μD les espérances mathématiques de ces 2 variables ; σJ2 et σD2 leurs variances.
On considère 100 patients qui ont occupé successivement, sans interruption, et dans un ordre in-
déterminé, un lit donné du service spécialisé. Les durées de séjour de ces patients sont données
par la table suivante :
A. La durée totale d’occupation du lit par les 100 patients est de 270 jours.
B. La durée totale d’occupation du lit par les patients qui restent 2 jours est de 40 jours.
C. Durant la période d’occupation du lit, la probabilité que le patient présent dans le lit un jour
donné ait une durée de séjour de 2 jours est de 0,4
D. Durant la période d’occupation du lit, la probabilité que le patient présent dans le lit un jour
donné ait une durée de séjour de 2 jours est de 0,296
E. Durant la période d’occupation du lit, la probabilité que le patient présent dans le lit un jour
donné ait une durée de séjour de 3 jours est de 0,333.
2.10 QCM 10
Même énoncé que pour le QCM 9. Les réponses sont indépendantes de celles du QCM
précédent.
Dans la suite, on considère que les proportions données dans le tableau sont en réalité des pro-
babilités et donc que les probabilités calculées à la question précédente sont valides dans la po-
pulation générale.
A. μD = 3
B. μD = 2,7
C. σD2 = 1,21
D. σD2 = 1,87
E. σD2 = 8,50
2.11 QCM 11
Même énoncé que pour les QCM 9 et QCM 10 .Les réponses ne sont pas indépendantes de celles
du QCM 9.
On admettra que σJ2 = 1,31 = 1,142.
A. μJ = 3,15
B. μJ = 3
C. La probabilité que le patient présent dans le lit un jour donné ait une durée de séjour com-
prise entre 2 et 5 jours inclus est de 96,3 %
D. Pour 100 patients, l’intervalle [2,9 jours ; 3,4 jours] est un intervalle de pari (ou de fluctua-
tion) de niveau 95 % pour la durée moyenne de séjour calculée un jour donné (les bornes
sont arrondies à la première décimale)
E. Pour 100 patients, l’intervalle [2,9 jours ; 3,4 jours] est un intervalle de confiance de niveau
95 % pour la durée moyenne de séjour calculée un jour donné (les bornes sont arrondies à
la première décimale)
La correction proposée en ligne est trop détaillée par rapport à ce qui est demandé pour le
concours puisque les réponses aux QCM ne doivent pas être justifiées.
1.1 On veut définir un intervalle, symétrique autour de 10, contenant la valeur de la glycémie de
95 % des diabétiques
1.3 On veut définir un seuil g de la glycémie tel qu’on déclare diabétique un individu dont la gly-
cémie à jeun est supérieure ou égale au seuil, et non diabétique un individu dont la glycémie est
inférieure au seuil.
On choisit d’abord le seuil g = 7. On admet alors les résultats suivants :
sensibilité = Se = 0,935
spécificité = Sp = 0,975
A. Se = Pr(G = 7 / D)
B. Se = Pr(G = 7 / D )
C. Si on choisissait un seuil égal à 6, on peut affirmer sans calcul que la sensibilité augmente-
rait
D. Si on choisissait un seuil égal à 6, on peut affirmer sans calcul que la spécificité augmente-
rait
E. Si on choisissait un seuil égal à 6, on peut affirmer sans calcul que la spécificité diminuerait
1.4 On choisit maintenant le seuil g = 7,4. Les valeurs de sensibilité et spécificité deviennent :
A. Se = 0,895
B. Se = 0,905
C. Se = 0,999
D. Sp = 0,990
E. Sp = 0,995
1.5 On s’intéresse au risque de déclarer diabétique une personne qui ne l’est pas
A. Ce risque est 1 - Se
B. Ce risque est 1 - Sp
C. Ce risque est 1 - VPP
D. Ce risque est 1 - VPN
E. Ce risque dépend de la prévalence du diabète
1.6 On considère la variable aléatoire C, coût (au sens large) des erreurs de diagnostic. Cette va-
riable prend la valeur 1 pour l’erreur « déclarer non diabétique une personne diabétique », et la
valeur k pour l’erreur « déclarer diabétique une personne qui ne l’est pas ». On veut calculer le
coût moyen (espérance du coût) des erreurs de diagnostic.
A. E(C) = k + 1
B. E(C) = (k + 1) / 2
C. E(C) = 1 - Se + k (1 - Sp)
D. E(C) = 1 - Sp + k (1 - Se)
E. E(C) = 1 - VPP + k (1 - VPN)
1.7 Pour choisir le meilleur seuil de séparation entre les diabétiques et les non diabétiques, on sé-
lectionne, parmi g = 7 et g = 7,4, celui qui conduit au coût moyen le plus faible.
1.10 On suppose qu’une amputation du pied ne peut être due qu’au diabète et que le risque d’am-
putation ne dépend pas du niveau de la glycémie :
Pr[Amputation / (D ∩ (G ≥ 7))] = Pr[Amputation / D]
On admettra la relation suivante, valable pour 3 événements A, B et C quelconques :
Pr[(A ∩ B) / C] = Pr[A / (B ∩ C)] Pr(B / C)
2.1 (1 point)
Pour répondre à la question on doit effectuer un test d’hypothèses. Pourquoi ?
2.2 (5 points)
Répondre à cette question en précisant les étapes de mise en œuvre du test. Le cas échéant, vous
calculerez le degré de signification.
2.3 (1 point)
Si on voulait savoir si le comportement en cas d’épisode de maladie diffère entre les hommes et
les femmes, serait-il nécessaire de changer les modalités de l’expérience ? Discutez.
2.4 (3 points)
La survenue d’au moins un épisode de maladie dans l’année est-elle liée au genre ? Limitez-vous
à:
Concours 2004
Durée 45 minutes. Tout document autorisé.
La correction proposée en ligne est trop détaillée par rapport à ce qui est demandé pour le
concours. En particulier, les réponses aux QCM ne doivent pas être justifiées.
Exercice 1 (6 points)
Un examen d’exploration fonctionnelle respiratoire requérant la participation active du patient est
déconseillé chez les patients de plus de 80 ans, appelés sujets âgés, car sa réalisation est jugée trop
difficile à réussir chez de tels sujets. Malgré tout et pour vous convaincre de la justesse de cette
habitude, vous entreprenez une étude clinique concernant 200 patients : cent sujets âgés
(âge > 80 ans), et cent sujets non âgés (âge ≤ 80 ans). Parmi plusieurs autres caractéristiques vous
notez leur résultat à une épreuve cognitive permettant d’attribuer au patient le statut « état mental
normal » ou le statut « état mental altéré ».
A chacun de ces 200 patients vous avez tenté de faire passer l’épreuve fonctionnelle ; cela a pu
conduire à l’échec ou au succès.
Les résultats expérimentaux obtenus sont consignés dans le tableau ci-dessous :
1.1 (4 points)
Les probabilités de succès diffèrent-elles selon que le patient présente un état mental normal ou
un état mental altéré ?
Pour répondre à cette question on réalisera un test d’hypothèses dont on détaillera les étapes de
mise en œuvre.
1.4 (1 point)
Est-il raisonnable de déconseiller cet examen chez les patients âgés ?
Si non quelles seraient vos recommandations et pourquoi ?
Dans cet hôpital 60 % des boîtes de compresses proviennent du fournisseur f1, et les 40 % res-
tantes viennent du fournisseur f2.
Le fournisseur f1 indique que 3 % de ses boîtes ont 9 compresses, et 0,01 % en ont 11.
Le fournisseur f2 indique seulement que 2 % de ses boîtes ont 9 compresses.
Partie I
On notera 9C, 10C et 11C le fait qu’une boîte contient respectivement 9, 10 ou 11 compresses.
2.1 Dans l’hôpital, sans faire aucun calcul, les données précédentes permettent d’écrire
A. P(f1) = 0,6
B. P(f1 ∩ 9C) = 0,03
C. P(f1 / 9C) = 0,03
D. P(9C / f1) = 0,03
E. P(9C) est au plus égal à 0,03
F. P(11C) est au plus égal à 0,0001
2.3 Parmi les affirmations suivantes concernant f2, la(les)quelle(s) est(sont) exacte(s) ?
A. Lorsque l’hôpital utilise une boîte de compresses, il y a une chance sur deux qu’elle pro-
vienne de f2.
Partie II
On s’intéresse au nombre de boîtes de 9 compresses qu’on trouvera dans l’hôpital parmi un en-
semble de n boîtes de compresses.
2.4 On sait que la proportion observée po du nombre de boîtes de 9 compresses est une variable
aléatoire.
2.5 Lorsqu’on a deux variables aléatoires X et Y, telles que Y = aX, a étant une constante, on sait
que si X est distribuée selon une loi normale, Y aussi. Que sait-on aussi ?
A. E(Y) = E(X)
B. E(Y) = aE(X)
C. E(Y) = a 2E(X)
D. var(Y) = var(X)
E. var(Y) = avar(X)
F. var(Y) = a 2var(X)
2.6 On étudie n = 500 boîtes de compresses. On veut définir un intervalle contenant le nombre de
boîtes de 9 compresses qu’on va y trouver, avec un risque d’erreur de 10 %
Partie III
La présence de boîtes de 11 compresses peut conduire à oublier une compresse dans le corps du
patient, donc à une réintervention. On aimerait donc connaître la probabilité d’obtenir des boîtes
de 11 compresses avec le fournisseur f2.
Comme précédemment, on notera 11C le fait qu’une boîte contienne 11 compresses.
P ( 11C ⁄ f 1 )P ( f 1 )
En utilisant le théorème de la multiplication, on montre que P ( 11C ) = --------------------------------------- -
P ( f 1 ⁄ 11C )
P ( f1 )
On peut alors en déduire que P ( 11C ⁄ f 2 ) = P ( 11C ⁄ f 1 ) ------------- ⎛ -----------------------------------
- – 1⎞ et on peut vé-
1
P ( f 2 ) 1 – P ( f 2 ⁄ 11C ) ⎠
⎝
rifier qu’il s’agit d’une fonction croissante de P(f / 11C) 2
2.9 On finit par apprendre que f2 produit 0,03 % de boîtes contenant 11 compresses. On veut sa-
voir s’il ne serait pas préférable de s’adresser à un seul des 2 fournisseurs f1 et f2.
Pour l’hôpital, le coût d’une boîte de 10 compresses est égal à 1 (dans une certaine unité) quel
que soit le fournisseur.
Une boîte de 9 compresses est considérée comme ayant un coût de 1,5, puisqu’elle conduit à des
achats complémentaires et à des gênes lors de l’intervention.
Une boîte de 11 compresses a un coût bien plus élevé, noté 1+x
C. Si x = 10, il est préférable de n’acheter qu’au fournisseur f1 qui conduit au coût le plus faible
(en espérance mathématique)
D. Si x = 10, il est préférable de n’acheter qu’au fournisseur f2 qui conduit au coût le plus faible
(en espérance mathématique)
E. On peut continuer à acheter aux deux fournisseurs s’ils conduisent aux mêmes coûts (en es-
pérance mathématique), ce qui se produit lorsque x = 25
F. Les deux fournisseurs ont des coûts identiques (en espérance) lorsque x = 50
3.1 Un examen a une sensibilité égale à 0,8 et une spécificité égale à 0,9 pour une maladie M dans
une population A. La prévalence de M dans cette population est de 0,1.
3.2 Dans une population B, l’examen a les mêmes valeurs de sensibilité (0,8) et de spécificité (0,9)
pour la maladie M, mais sa valeur prédictive positive est de 2/3. Que peut-on en déduire ?
4.1 Si on souhaite estimer les sensibilité et spécificité de l’examen par des intervalles de confiance
de niveau 90 % et une précision (demi-longueur des intervalles) de 0,01 pour chaque paramètre,
combien d’individus au minimum doit-on tirer au sort dans les populations de malades et de non
malades ?
4.2 On imagine qu’on répète 20 fois l’expérience précédente dans 20 régions françaises diffé-
rentes. On s’intéresse à la variable aléatoire « nombre d’intervalles de confiance de niveau 90 %
contenant la vraie valeur de la sensibilité ».
Quelle est la moyenne de cette variable ?
A. 15
B. 16
C. 17
D. 18
E. 19
F. 20
4.3 Combien d’expériences en moyenne parmi les 20 fourniront un intervalle de confiance de ni-
veau 90 % contenant la vraie valeur de la sensibilité et un intervalle de confiance de niveau 90 %
contenant la vraie valeur de la spécificité ? (résultat arrondi à l’entier le plus proche).
A. 15
B. 16
C. 17
D. 18
E. 19
F. 20
4.4 Quelle est la probabilité pour qu’aucune des 20 expériences ne fournisse un intervalle de
confiance de niveau 90 % contenant la vraie valeur de la sensibilité ?
A. 0,920
B. 0,120
C. 0,910
D. 0,110
E. 0,88 (arrondi à 0,01 près)
F. 0,12 (arrondi à 0,01 près)
La correction proposée en ligne est trop détaillée par rapport à ce qui est demandé pour le
concours puisque les réponses aux QCM ne doivent pas être justifiées.
Dans cet énoncé, les questions comportent une ou plusieurs bonnes réponses.
Les 2 exercices sont indépendants.
• Une des causes connues de saturnisme est le fait d’habiter dans un immeuble dégradé et
construit avant 1948. Dans la suite, on notera HD un tel immeuble.
• Une autre cause de plombémie élevée est le comportement de PICA (l’enfant met à la bouche
tout ce qu’il ramasse).
1.1 Parmi les enfants habitant un HD, 35 % présentent une plombémie supérieure à 100 μg/l. Que
représente ce taux de 0,35 :
1.2 On veut savoir s’il y a indépendance entre les variables habitat (HD ou non) et saturnisme (pré-
sent ou absent)
1.5 Les enfants de l’arrondissement vivant dans des HD ont une probabilité de saturnisme de 0,49
s’ils ont un comportement de PICA, et de 0,05 sinon.
Si on restreint la population aux enfants de l’arrondissement vivant dans des HD :
A. La probabilité de saturnisme pour ces enfants est le produit des probabilités 0,49 et 0,05
B. La probabilité de saturnisme pour ces enfants est la somme de la probabilité de saturnisme
chez ceux ayant un comportement de PICA et de la probabilité de saturnisme chez ceux
n’ayant pas ce comportement
C. La probabilité de saturnisme pour ces enfants est la somme de la probabilité de saturnisme
et de comportement PICA, et de la probabilité de saturnisme et d’absence de comportement
PICA
D. La probabilité d’avoir un comportement PICA pour ces enfants est comprise entre 0,11 et
0,12
E. La probabilité d’avoir un comportement PICA pour ces enfants est comprise entre 0,68 et
0,69
F. La probabilité d’avoir un comportement PICA pour ces enfants est comprise entre 0,71 et
0,72
1.7 On admet sans calcul les probabilités suivantes concernant les familles de l’arrondissement ha-
bitant un HD (ces valeurs sont calculables à partir des données des questions précédentes) :
A. Dans une famille de 5 enfants habitant un HD, parmi lesquels 3 exactement ont un compor-
tement de PICA, la probabilité qu’il y ait exactement 2 enfants atteints de saturnisme et
qu’ils aient un comportement de PICA est comprise entre 0,032 et 0,034
B. La probabilité de l’événement défini dans la proposition A est comprise entre 0,214 et 0,216
C. La probabilité de l’événement défini dans la proposition A est comprise entre 0,331 et 0,333
D. Dans une famille de 5 enfants habitant un HD, parmi lesquels 3 exactement ont un compor-
tement de PICA, la probabilité qu’il y ait exactement 2 enfants atteints de saturnisme est
comprise entre 0,068 et 0,071
E. La probabilité de l’événement défini dans la proposition D est comprise entre 0,250 et 0,253
F. La probabilité de l’événement défini dans la proposition D est comprise entre 0,367 et 0,370
C. Sous l’hypothèse alternative, le paramètre z du test suit une loi normale de moyenne 0,2
D. L’intervalle de pari à utiliser est [-1,96 ; 1,96]
E. La valeur calculée du paramètre z est comprise entre 3,5 et 3,6
F. La valeur calculée du paramètre z est comprise entre 4,7 et 4,8
2.6 Conclusion
A. On n’a pas montré de différence entre les 2 arrondissements
B. On rejette l’hypothèse nulle au risque 5 %
C. Le taux de saturnisme dans l’arrondissement a2 est supérieur à celui de l’arrondissement a1.
D. Il ne faut pas calculer de degré de signification
E. Le degré de signification est inférieur à 10-5
F. Le degré de signification est inférieur à 10-3 (mais supérieur à 10-5)
2.7 On désire estimer la valeur du taux de saturnisme de l’arrondissement a2 par un intervalle sy-
métrique autour de la valeur observée, avec un risque d’erreur de 5 %. On admettra que toutes
les conditions de validité nécessaires aux calculs sont vérifiées.
Les bornes des intervalles proposés sont arrondies à 3 décimales.
10
Concours 2003
Durée 45 minutes. Tout document autorisé.
La correction proposée en ligne est trop détaillée par rapport à ce qui est demandé pour le
concours. En particulier, les réponses aux QCM ne doivent pas être justifiées.
Exercice 1 (7 points)
On souhaite savoir si un nouveau traitement médical a une efficacité préventive de la survenue
d’occlusion dans l’année suivant une certaine intervention digestive. On hésite en outre entre deux
doses d’administration. On envisage alors une étude dans laquelle vont être constitués trois groupes
de patients d’effectifs égaux. Un groupe recevra un placebo (traitement sans efficacité biologique),
un groupe le traitement à la dose D1, un groupe le traitement à la dose D2.
L’objectif de l’étude est de montrer que les probabilités de survenue d’occlusion ne sont globale-
ment pas identiques selon que les patients reçoivent le placebo, le traitement à la dose D1 ou le
traitement à la dose D2.
L’étude est conçue de sorte que la puissance du test statistique permettant de répondre à la question
posée soit de 80 % lorsque l’on suppose que la probabilité d’occlusion est 0,03 aussi bien avec la
dose D1 qu’avec la dose D2, alors qu’elle vaut 0,06 sous placebo. Les calculs montrent que dans
ces conditions il convient d’inclure 617 patients dans chacun des trois groupes.
Survenue d’occlusion 40 24 17
Non survenue d’occlusion 577 593 600
Y a-t-il une différence entre les trois groupes de patients vis-à-vis du risque d’occlusion à un an ?
Pour répondre à cette question on effectuera un test d’hypothèses dont on détaillera toutes les
étapes.
1.3 (1 point)
On se demande si les résultats obtenus chez les patients recevant le placebo sont compatibles
avec une probabilité de récidive à un an de 0,06 (qui est la probabilité supposée de survenue d’oc-
clusion chez les patients non traités). Pour répondre à cette question on décide de faire un test
autre qu’un χ2.
Parmi les propositions suivantes, choisissez la bonne réponse :
A. Au signe près, le paramètre du test vaut environ 3,13 et la probabilité d’occlusion est donc
supérieure à 0,06, p < 10-3
B. Au signe près, le paramètre du test vaut environ 3,13 et le résultat est donc compatible avec
une probabilité d’occlusion de 0,06
C. Au signe près le paramètre du test vaut environ 0,505 et la probabilité d’occlusion est donc
supérieure à 0,06, p < 10-3
D. Au signe près, le paramètre du test vaut environ 0,505 et le résultat est donc compatible avec
une probabilité d’occlusion de 0,06
E. Au signe près, le paramètre du test vaut environ 3,416 et le résultat est donc compatible avec
une probabilité d’occlusion de 0,06
F. Au signe près le paramètre du test vaut environ 3,416 et la probabilité d’occlusion est donc
supérieure à 0,06, p < 10-3
Partie I
Après une certaine opération digestive, la probabilité de faire une occlusion dans l’année est de
0,044. Le fait d’avoir ou non fait une occlusion pendant une année ne modifie pas le risque d’oc-
clusion pour les années suivantes.
On admettra dans l’exercice qu’on peut faire au plus une occlusion par an.
Les valeurs numériques proposées dans l’exercice sont arrondies avec 3 chiffres significatifs.
Cocher la ou les bonnes réponses.
2.1 Considérons les événements « faire une occlusion la première année » et « faire une occlusion
la deuxième année »
2.2 Quelle est la probabilité d’avoir fait au moins une occlusion au bout de 5 ans ?
A. 165 × 10-9
B. 0,019
C. 0,201
D. 0,220
E. 0,799
2.3 La loi de probabilité du nombre d’occlusions qu’a faites un patient au bout de 5 ans est :
A. Binomiale.
B. Normale (sans condition particulière).
C. Normale si on observe un nombre suffisant de patients.
D. Student (car n < 30).
E. χ2 à 5 degrés de liberté
2.4 L’espérance (μ) et l’écart type (σ) du nombre d’occlusions qu’a faites un patient au bout de 5
ans sont :
A. μ = 0 et σ = 1
B. μ = 0,044 et σ = 0,00841
C. μ = 0,044 et σ = 0,0917
D. μ = 0,220 et σ = 0,210
E. μ = 0,220 et σ = 0,459
Partie II
En fait l’intervention digestive est soit une intervention sur le tube digestif haut (dite intervention
TH), soit une intervention sur le tube digestif bas (dite intervention TB). La probabilité annuelle
d’occlusion est de 0,03 pour une intervention TH, et de 0,10 pour une intervention TB.
2.5 Considérons les événements « faire une occlusion la première année après intervention TH »
et « faire une occlusion la première année après une intervention TB » :
2.6 Quelle est la probabilité d’avoir fait au moins une occlusion au bout de 5 ans après une inter-
vention TB ?
A. 10-5
B. 0,090
C. 0,410
D. 0,500
E. 0,590
Partie III
On sait que 20 % des interventions ont lieu sur le tube digestif bas.
2.7 Quelle est la probabilité qu’un patient ait une intervention TB et au moins une occlusion dans
les 5 ans ?
A. 0,020
B. 0,082
C. 0,100
D. 0,138
E. 0,200
2.8 Quelle est, pour un patient, la probabilité d’avoir fait au moins une occlusion dans les 5 ans, si
on ne connaît pas le type de l’intervention digestive ?
A. 0,044
B. 0,195
C. 0,201
D. 0,410
E. 0,551
Partie IV
On se place dans la sous-population des patients ayant eu au moins une occlusion dans les 5 ans
après l’intervention. On veut y déterminer la probabilité pour un patient d’avoir eu une intervention
sur le tube digestif bas.
Partie V
On suit pendant 1 an un échantillon de 195 patients opérés. On calcule ensuite sur cet échantillon
le pourcentage des individus ayant fait au moins une occlusion dans l’année.
2.11 La probabilité que ce pourcentage soit compris entre 0,03 et 0,1 est (arrondie avec 2 déci-
males seulement) :
A. 0,17
B. 0,34
C. 0,50
D. 0,66
E. 0,83
2.12 Pour obtenir un intervalle de pari pour ce pourcentage, centré, de niveau 0,95, et de largeur
0,07, il faudrait envisager un échantillon de taille :
A. 94
B. 132
C. 195
D. 224
E. 328
3.1 Après cette étude, quel(s) paramètre(s) concernant l’intérêt de la scintigraphie pour diagnosti-
quer la thrombose coronaire pourrait-on estimer ?
A. La sensibilité.
B. La spécificité.
C. La valeur prédictive positive.
D. La valeur prédictive négative.
E. La prévalence de la thrombose coronaire.
3.2 La scintigraphie est positive chez 70 % des patients de la population concernée. Quand on réa-
lise une coronarographie chez les patients ayant une scintigraphie positive, on trouve en
4.2 On appelle intérêt du traitement antibiotique la fonction inverse du risque de rechute de l’in-
fection. (intérêt = 1/p, où p est le risque de rechute). L’intervalle de confiance de niveau 95 %
de l’intérêt du traitement antibiotique est (avec deux chiffres significatifs) :
A. [0,72 ; 0,88]
B. [3,6 ; 8,2]
C. [0,74 ; 0,86]
D. [3,8 ; 7,5]
E. [4,0 ; 6,0]
11
La correction proposée en ligne est trop détaillée par rapport à ce qui est demandé pour le
concours. En particulier, les réponses aux QCM ne doivent pas être justifiées.
Exercice 1 (7 points)
Tous les enfants d’une population de personnes porteuses d’une certaine anomalie génétique voient
apparaître un déficit moteur dans leurs 6 premières années.
Soit X la variable aléatoire représentant la date d’apparition du déficit.
Sa distribution de probabilité est définie de la manière suivante :
1.1 (1 point)
En remarquant que P([0 < X ≤ 6]) = 1, montrer que h = 1/4.
• Y = 1/2 ⇔ 0 < X ≤ 1
• Y =2⇔1<X ≤3
• Y = 9/2 ⇔ 3 < X ≤ 6
Exercice 2 (7 points)
Dans le but d’évaluer l’efficacité d’un nouveau traitement contre une infection virale, une étude
clinique portant sur 180 patients a été menée. Ces patients ont été répartis en un groupe N de 100
patients bénéficiant du nouveau traitement et un groupe C de 80 patients bénéficiant du traitement
classique.
Après douze semaines de traitement, la proportion de patients présentant une charge virale indé-
tectable, ce qui correspond au succès du traitement, a été de 0,65 dans le groupe N et de 0,45 dans
le groupe C.
2.1 (1 point)
Comment les patients ont-ils dû être répartis entre les deux groupes pour répondre à l’objectif
initial ?
Partie I (2 points)
Les sensibilités respectives de deux tests T1 et T2 de dépistage d’une infection virale sont Se1 et
Se2. Les résultats des deux tests sont indépendants dans la population des malades infectés.
3.1 Quelle serait la sensibilité d’un nouveau test T3 considéré comme positif si T1 et T2 le sont en
même temps ?
A. Se1 + Se2
B. Se1 × Se2
C. Se1 + Se2 - Se1 × Se2
D. (1 - Se1) × (1 - Se2)
E. On ne peut pas la calculer
3.2 Même question pour un test T4 considéré comme positif si au moins un des tests T1 et T2 est
positif.
A. Se1 + Se2
B. Se1 × Se2
C. Se1 + Se2 - Se1 × Se2
D. (1 - Se1) × (1 - Se2)
E. On ne peut pas la calculer
3.3 Dans un contexte de dépistage, quel test choisiriez-vous parmi les quatre proposés ?
A. T1
B. T2
C. T3
D. T4
E. On ne peut pas savoir
Partie II (2 points)
Dans le cadre du traitement d’un type de cancer, on a le choix entre deux modalités thérapeutiques :
chirurgie seule ou chirurgie associée à une chimiothérapie. Chaque modalité peut conduire soit au
succès, soit à un échec. L’ensemble du problème décisionnel est représenté par l’arbre ci-dessous :
Succès 0,6
100
Chirurgie seule
10
Echec
Succès p
80
Chirurgie + chimiothérapie
0
Echec
3.8 A partir de ces données, à quelle valeur pouvez-vous estimer la prévalence de l’infection ?
A. 0,2
B. 0,4
C. 0,5
D. 0,8
E. On ne peut pas l’estimer
3.10 En vous basant sur ces données, sur combien de personnes faudrait-il pratiquer le test pour
estimer la spécificité par un intervalle de confiance de niveau 95 % de longueur 0,02 (la longueur
est la différence entre les bornes supérieure et inférieure de l’intervalle).
Choisir la valeur la plus proche.
A. 59
B. 79
C. 1025
D. 3457
E. 6147
12
Concours 2002
Durée 45 minutes. Tout document autorisé.
La correction proposée en ligne est trop détaillée par rapport à ce qui est demandé pour le
concours. En particulier, les réponses aux QCM ne doivent pas être justifiées.
Exercice 1 (7 points)
On pense qu’une certaine mutation génétique est liée à une augmentation de l’épaisseur du septum
inter-ventriculaire. Afin d’étudier ce lien on procède à l’étude suivante. On génotype 90 sujets issus
de la population générale et on mesure chez ces sujets l’épaisseur du septum. Parmi ces sujets, 40
sont trouvés porteurs de la mutation, 50 non porteurs.
1.2 (2 points)
On craint que l’épaisseur du septum, voire la nature du lien éventuel mutation-épaisseur du sep-
tum, ne dépende de l’âge. Aussi reprend-on l’analyse chez les sujets jeunes seuls (moins de 25
ans). Chez ces sujets jeunes, les valeurs obtenues étaient les suivantes.
Peut-on dire que chez les sujets jeunes les épaisseurs moyennes vraies du septum diffèrent entre
les porteurs et les non porteurs ? On se contentera de :
Un patient suspect de présenter la maladie M se rend dans une consultation spécialisée. Il s’agit de
décider s’il faut le traiter ou non. La décision optimale sera celle de plus grande utilité moyenne.
B. 150 p - 100
C. 50 p - 50
D. 50 p
E. - 50 p
2.4 Un examen complémentaire E1 a une sensibilité égale à 0,6 et une spécificité égale à 0,8 pour
diagnostiquer la maladie M. On suppose que cette maladie a une prévalence égale à 0,1 dans la
population des patients de cette consultation spécialisée.
A. 0,08
B. 0,20
C. 0,25
D. 0,43
E. 0,75
2.5 Un deuxième examen E2 a la même sensibilité et la même spécificité que l’examen E1 pour
la maladie M. On veut évaluer un test qui consiste à pratiquer les examens E1 et E2, pour un pa-
tient donné. On conclut à la positivité du test si les deux examens sont positifs, et à sa négativité
si au moins un des deux examens est négatif. Les résultats des 2 examens sont supposés indépen-
dants pour un même patient.
2.6 En vous basant sur l’ensemble des informations fournies dans cet exercice (dans l’énoncé et
vos réponses), indiquez, parmi les propositions suivantes, laquelle est (ou lesquelles sont)
juste(s) :
On considère un test d’hypothèses dont le paramètre z est, sous H0, distribué selon une loi normale
centrée réduite.
On répète le test 5 fois sur la même population, de manière indépendante. Chaque test conduit à
une valeur calculée du paramètre notée zic (i variant de 1 à 5). On se demande comment utiliser
ces valeurs pour prendre une décision unique.
On choisit d’abord comme règle de décision de rejeter H0 si au moins une des 5 valeurs zic est en
dehors d’un intervalle de pari IP, à déterminer de manière à ce que le risque de première espèce α
soit 0,05.
3.1
3.1.1 Cocher la ou les affirmations correctes, concernant le risque de première espèce α :
3.1.2 On suppose H0 vraie, et on choisit comme intervalle de pari IP1 = [-1,96 ; 1,96]
Quelle est la probabilité de rejeter H0, compte tenu de la règle de décision choisie :
A. 0,05
B. 0,95
C. 5 × 0,05 (= 0,25)
D. 0,055 (≈ 3,1 × 10-7)
E. 0,955 (≈ 0,77)
F. 1 - 0,955 (≈ 0,23)
3.2 Dans cette partie, on prend un intervalle de pari IP2 tel que le risque de première espèce α soit
0,05 avec la règle de décision choisie.
3.2.1 On suppose H0 vraie. On note a2 la probabilité que le paramètre z n’appartienne pas à IP2.
La probabilité d’obtenir au moins une des 5 valeurs zic en dehors de IP2 est :
A. a2
B. 5 a2
C. a2 5
D. 1 - a2 5
E. (1 - a2 )5
F. 1 - (1 - a2 )5
3.2.3 Cocher la ou les affirmations correctes concernant le risque de deuxième espèce β, compte
tenu de la règle de décision adoptée.
3.2.4 On désire calculer β dans le cas où, dans la réalité, le paramètre z est distribué selon une
loi normale de moyenne 1 et de variance 1.
Dans ce cas, le paramètre z a une probabilité notée b2 d’appartenir à IP2. On montre alors que
β = b2 5.
Cocher la ou les affirmations correctes :
3.3 Dans cette partie, on veut baser la règle de décision sur la variable z 5 , moyenne expérimentale
construite sur les 5 répétitions de z.
C. Pour pouvoir continuer, on admettra que z 5 suit une loi normale bien que les conditions
de validité ne soient pas satisfaites
D. z 5 ~ N(0,1)
E. z 5 ~ N(0,5)
F. z 5 ~ N(0,1/5)
13
Concours 2001
Durée 45 minutes. Tout document autorisé.
La correction proposée en ligne est trop détaillée par rapport à ce qui est demandé pour le
concours. En particulier, les réponses aux QCM ne doivent pas être justifiées.
Dans une maladie M, on observe en général une élévation de la concentration d’une protéine P.
On tire au sort, dans la population des patients atteints de M, un échantillon de 100 malades. Les
moyenne et variance expérimentales de la concentration de P sont respectivement égales à 40 et
2500.
Soit μM la moyenne vraie de la concentration de P dans la population des malades atteints de M.
1.1
A. L’intervalle de confiance de niveau 95 % de μM contient la valeur 32
B. L’intervalle de confiance de niveau 60 % de μM est 40 ± 0,524 × 5
C. L’intervalle de confiance de niveau 99 % de μM est 40 ± 2,576 × 5
D. On ne peut pas calculer l’intervalle de confiance de niveau 99 % de μM , car une borne est
inférieure à 30
E. La probabilité que μM soit égale à 40 est 50 %
1.2 On tire au sort, dans la population des individus qui ne sont pas atteints de M, un échantillon
de 50 personnes. On calcule les moyenne et variance expérimentales de la concentration de P,
qui valent respectivement 20 et 2500.
Soit μ M la moyenne vraie de la concentration de P dans la population des individus non atteints
de M.
40 – 20 - = 2 ,3
On indique que : ----------------------------------
2500
------------ + 2500------------
50 100
A. μM et μ M diffèrent au risque 5 %
B. L’intervalle de confiance de μ M de niveau 95 % contient la valeur 32
C. La probabilité pour que μM et μ M soient égales vaut 0,05
D. Le degré de signification du test d’égalité des moyennes μM et μ M est inférieur à 0,01
E. On ne peut pas rejeter l’hypothèse nulle d’égalité des moyennes μM et μ M , peut-être par
manque de puissance
1.3 On définit un seuil de concentration au-dessus duquel on considère qu’un individu est atteint
de la maladie M. Si un individu a une concentration supérieure à ce seuil, on dit que l’examen
est positif, et il est négatif dans le cas contraire.
On obtient alors les données suivantes : le nombre de vrais positifs est 50, celui des faux positifs
est 5, le nombre de vrais négatifs est 45, et celui des faux négatifs est 50.
Quels sont les paramètres qu’on peut estimer à partir de ces données (ne pas faire les calculs) ?
A. La sensibilité
B. La spécificité
C. La valeur prédictive positive
D. La valeur prédictive négative
E. La prévalence de M
1.4 Parmi les hypothèses nulles suivantes, lesquelles peut-on tester en utilisant les mêmes données
(ne faire ni calcul, ni test) ?
A. Les proportions d’examens positifs chez les patients atteints de M et chez les individus non
atteints de M sont égales
B. La sensibilité de l’examen est égale à 0,50
C. La valeur prédictive positive de l’examen pour la maladie M est égale à 0,50
D. La proportion d’individus atteints de M et ayant un examen positif dans la population gé-
nérale est égale à 0,10
E. Les proportions de malades et de non malades parmi les patients ayant un examen positif
sont égales
1.5 On sait maintenant que la prévalence de la maladie M dans la population est égale à 0,30 ; la
sensibilité est estimée à 0,5 ; la spécificité est estimée à 0,9.
La valeur prédictive positive de l’examen pour la maladie M peut être estimée par la valeur :
A. 0,92
B. 0,71
C. 0,68
D. 0,32
E. 0,29
Exercice 2 (7 points)
Cet exercice comporte 4 questions principales indépendantes
Après une certaine forme d’accident cardiaque, on considère qu’en l’absence de prise en charge, il
y a 3 issues possibles : décès, complications donnant des séquelles irréversibles, état inchangé.
Lorsqu’un patient a eu des complications, on considère qu’il ne peut plus revenir à l’état inchangé.
Au bout d’un temps T 1 = 1 après l’accident, on définit donc 3 événements possibles : D 1 = être
décédé à T 1 (l’instant du décès est compris entre 0 et T 1) ; C 1 = être vivant, mais avec complica-
tions, à T 1 (les complications se sont produites entre 0 et T 1, et il n’y a pas eu de décès ensuite) ;
I 1 = être vivant dans l’état inchangé à T 1.
Si on attend jusqu’au temps T 2 = 2 après l’accident, on définit 3 nouveaux événements : D 2 = être
décédé à T 2 (l’instant du décès est entre 0 et T 2) ; C 2 = être vivant, mais avec complications, à T 2 ;
I 2 = être dans l’état inchangé à T 2.
• Une probabilité conditionnelle est une probabilité. En particulier pour 2 événements ex-
clusifs A et B, on a P((A ∪ B) / C) = P(A / C) + P(B / C).
• Un patient qui est dans l’état C 1 à T 1 ne peut être que C 2 ou D 2 à T 2.
Après prise en charge, le patient peut être guéri (uniquement s’il était dans un état inchangé),
avoir des complications (s’il en présentait déjà, ou si elles sont survenues après la prise en
charge), ou être décédé (décès avant la prise en charge, ou après).
On choisit comme utilités 100 pour la guérison, 50 pour les complications, et 0 pour le décès.
Guérison (0,85)
100
A
Complication (0,1)
50
0
(0,19) Décès (D2)
49,5 Décès (0,01) 0
C Complication (C2)
Choisir H2 (0,39)
50
Complication (0,99)
Inchangé (I2)
Décès (0,01) 0
(0,42)
Complication (0,05) 50
96,5
100
Guérison (0,94)
Exercice 3 (7 points)
On pense que la concentration d’un facteur biologique F est liée à la vitesse d’élimination d’une
substance S ; une trop faible vitesse d’élimination est génératrice de troubles.
• Le facteur F est étudié depuis longtemps, et on connaît la plage de ses valeurs normales. Cela
permet de classer la valeur observée du facteur chez un sujet en
Concentration du facteur
F
basse normale élevée
Etat
atteint 9 6 11
non atteint 14 38 14
3.2 (4 points)
Concentration du facteur F (par classes) et vitesse d’élimination de S (par classes) sont-elles
liées ? Le test effectué pour répondre à la question sera détaillé, incluant si nécessaire un degré
de signification.
14
Concours 2000
Durée 45 minutes. Tout document autorisé.
La correction proposée en ligne est trop détaillée par rapport à ce qui est demandé pour le
concours. En particulier, les réponses aux QCM ne doivent pas être justifiées.
1.1 La sensibilité du test diagnostique est-elle égale dans les deux populations ?
a. Non, car 0,76 est différent de 0,64.
b. Oui.
c. On ne peut répondre à la question, car on ne sait pas prouver une égalité stricte.
d. Oui, car les sensibilités ne sont pas significativement différentes.
e. Non, car les sensibilités sont différentes au risque α = 5 %.
1.2 La sensibilité du test diagnostique est-elle différente dans les deux populations ?
a. Oui, car 0,76 est différent de 0,64.
b. Non, car après avoir réalisé le test statistique, on ne peut pas conclure à une différence si-
gnificative.
c. Oui, car les sensibilités diffèrent au risque α = 5 %.
d. Non, elles sont égales.
e. Non, car la sensibilité d’un test diagnostique est toujours identique dans toutes les popula-
tions de malades.
1.3 Dans la suite de l’exercice, on suppose que la sensibilité du test diagnostique est égale dans
les 2 populations de diabétiques.
Exercice 2 (7 points)
Dans une certaine population, on considère une variable aléatoire X discrète (nombre d’accidents
thrombo-emboliques) dont les valeurs possibles sont 1 ; 2 ; 3 et dont les probabilités correspon-
dantes sont p 1 = 0,3 ; p 2 = 0,5 ; p 3 = 0,2.
f( y) = ∑ pi fi ( y ) = 0 ,3 f 1 ( y ) + 0 ,5 f 2 ( y ) + 0 ,2 f 3 ( y )
i=1
2.2.1
∞ ∞ ∞
2.2.1.1 Sans calcul, donner les valeurs de ∫–∞ yf 1 ( y ) dy , ∫– ∞ yf 2 ( y ) dy , et ∫–∞ yf3 ( y ) dy
2.2.1.2 Montrer que l’espérance de Y est égale à 0,1 (on rappelle que l’intégrale d’une somme
est la somme des intégrales).
2.2.2
2.2.2.1 En utilisant une des formules de calcul de la variance, déterminer les valeurs de
∞ ∞ ∞
∫–∞ ∫–∞ ∫–∞ y
2 2 2
y f 1 ( y ) dy , y f 2 ( y ) dy , et f 3 ( y ) dy
Exercice 3 (7 points)
Afin de faire la preuve de l’effet d’un médicament ancien sur le niveau d’une protéine circulante,
on charge deux investigateurs de recruter chacun un groupe de 50 sujets.
L’un des investigateurs dosera la protéine chez les sujets de son groupe sans administrer le traite-
ment, constituant ainsi le groupe NT de sujets.
L’autre investigateur administre le traitement aux 50 sujets de son groupe et dose la protéine sous
traitement, après un délai suffisant, constituant le groupe T de sujets.
Les résultats obtenus sont les suivants :
Groupe NT Groupe T
Moyenne expérimentale 105 102
Variance expérimentale 106 102
3.1 (4 points)
Comparer les moyennes expérimentales dans les deux groupes. Pour cela il conviendra de mettre
en œuvre un test d’hypothèses, dont on détaillera les étapes de mise en œuvre, que l’on interpré-
tera et dont on calculera, le cas échéant, le degré de signification.
3.3 (1 point)
Cet ajustement a également pour effet de réduire les écarts-types expérimentaux ; au total,
lorsque l’on effectue le test de la question 1 avec ces nouvelles valeurs on obtient un paramètre
zc égal à 2,78. Que conclut-on alors ?
15
Concours 1999
Durée 45 minutes. Aucun document autorisé.
La correction proposée en ligne est trop détaillée par rapport à ce qui est demandé pour le
concours. En particulier, les réponses aux QCM ne doivent pas être justifiées.
Exercice 1 (7 points)
Les trois parties de l’exercice peuvent être traitées séparément, à condition d’utiliser les informa-
tions données dans les parties précédentes.
Formules utiles :
1.1 (2 points)
1.1.1 Exprimer les probabilités des événements suivants en fonction de P(M 1), P(M 2) et P(N) :
• A = M 1 ∩ M 2 (M 1 et M 2 en même temps)
• M1 ∩ N
• B = M 1 ∩ M 2 (M 1 et pas M 2)
• N ∪ (M 1 ∪ M 2) (M 1 ou M 2 ou N)
1.1.2 Dans la suite de l’exercice, M 1 et M 2 correspondent à des états dont les probabilités sont
P(M 1) = 0,3 et P(M 2) = 0,2. L’événement N correspond au fait d’être ni dans M 1, ni dans
M 2 (donc : N ∪ M 1 ∪ M 2 = E). Ces événements sont représentés sur le schéma suivant où le
rectangle délimite E.
M2
N
N
M1
M2
M1
Montrer sur un schéma analogue, faisant apparaître N, M 2 et B, que ces trois événements for-
ment une partition de E.
1.1.3 Montrer que P(N) = 0,56.
1.2 (2,5 points)
Selon leur état, les individus présentent un signe S avec les probabilités suivantes :
0,20 pour ceux qui sont dans l’état M 1 ;
0,60 pour ceux qui sont dans l’état M 2 ;
0,11 pour ceux qui sont dans l’état N ;
0,83 pour ceux qui sont dans l’état A.
1.2.1 Quelle est la probabilité de présenter à la fois le signe S et l’état M 1 ?
Quelle est la probabilité de présenter à la fois le signe S et l’état A ?
1.2.2 En remarquant que A et B sont disjoints et que leur réunion est M 1, réécrire la probabilité
de présenter à la fois S et M 1 en fonction de la probabilité de présenter à la fois S et A, et de la
probabilité de présenter à la fois S et B. En déduire que la probabilité de présenter à la fois S
et B est environ 0,01.
1.2.3 En utilisant que B, M 2 et N forment une partition de E, montrer que la probabilité de pré-
sence de S est environ 0,19.
Exercice 2 (8 points)
Afin d’étudier le lien possible entre l’exposition professionnelle à un agent chimique gazeux et un
déficit neurologique léger, on a mesuré le degré d’exposition à cet agent dans un groupe de 35 tra-
vailleurs présentant ce déficit (sujets dits atteints dans la suite). La même chose a été accomplie
auprès de 42 travailleurs ne présentant pas le déficit (sujets dits non atteints dans la suite). Le degré
d’exposition est exprimé en mg/m3.
1 2 3
-4 -2 0 2 4 6 8 paramètre
IP0,95
Sans faire de calcul et à partir du graphique ci-joint, répondre par des valeurs approchées aux
questions suivantes. Les réponses seront justifiées et choisies parmi les valeurs suivantes : 0,01 ;
0,05 ; 0,25 ; 0,45 ; 0,55 ; 0,75 ; 0,95 ; 0,99.
• si la différence des moyennes vraies est égale à 1, quelle est la puissance du test effectué
question 2 ?
• si la différence des moyennes vraies est égale à 2, quel est le risque de seconde espèce du
test effectué question 2 ?
3.1 A partir d’un échantillon A de 100 malades tirés au sort dans la population concernée, on ob-
tient les données expérimentales suivantes : la moyenne expérimentale, notée mA , est égale à
100, et la variance expérimentale est égale à 100.
Dans cette question, les réponses quantitatives sont arrondies à 0,1 près.
3.1.1 Déterminer un intervalle de confiance de niveau 0,95 de la moyenne du dosage dans la po-
pulation.
A. [80,4 119,6]
B. [93,8 106,2]
C. [98,0 102,0]
D. [98,4 101,6]
E. [98,8 99,7]
A. [67,1 132,9]
B. [89,6 110,4]
C. [96,1 103,9]
D. [96,7 103,3]
E. [98,4 101,6]
3.2 Un autre échantillon B du même dosage, indépendant de A, donne les résultats expérimentaux
suivants : effectif 50 ; moyenne expérimentale, notée mB , égale à 97 ; variance expérimentale
100. On pense que les deux échantillons proviennent de la même population.
A. oui
B. non
A. non
B. oui, le test des séries appariées
C. oui, le test de comparaison de 2 moyennes observées
D. oui, le test du chi carré
E. oui, le test du coefficient de corrélation
3.2.3 Peut-on prouver l’égalité des moyennes dans les populations dont sont issus les échantil-
lons A et B ?
A. oui
B. non
3.3 On admet dans la suite que les deux échantillons proviennent de la même population et que
la variance vraie du dosage biologique est égale à 100. Les réponses quantitatives sont mainte-
nant arrondies à 0,01 près.
A. 97,00
B. 98,00
C. 98,50
D. 98,80
E. 99,00
A. 0,67
B. 0,60
C. 0,50
D. 0,40
E. 0,33
3.3.3 En admettant que les moyennes expérimentales mA et mB sont des variables aléatoires
indépendantes, et en utilisant l’expression de e 1 donnée ci-dessus, déterminez la valeur de la
variance de e 1.
A. 0,67
B. 0,75
C. 3,00
D. 56,00
E. 100,00
A. oui
B. non
A. 0,50
B. 0,67
C. 0,75
D. 3,00
E. 100,00
16
Concours 1998
Durée 45 minutes. Aucun document autorisé.
La correction proposée en ligne est trop détaillée par rapport à ce qui est demandé pour le
concours. En particulier, les réponses aux QCM ne doivent pas être justifiées.
Le coefficient de corrélation vrai entre ces variables est-il non nul ? On aura à effectuer un test
d’hypothèses dont on détaillera les étapes de mise en œuvre.
• Quelle estimation ponctuelle proposez-vous pour la moyenne vraie et l’écart type vrai du
délai D ? Justifiez
• Si le délai est distribué selon une loi normale, quelle est cette proportion attendue ?
Niveau de concentration
Bas Standard Elevé
Importance du Standard 6 32 8
délai Elevée 17 21 18
Pour identifier le trajet suivi par le faisceau, on met en œuvre la démarche suivante, apparentée
à un test d’hypothèses :
Hypothèses
H0 : la fonction de répartition de X est F 1(x) (le faisceau a suivi le trajet 1),
H1 : la fonction de répartition de X est F 2(x) (le faisceau a suivi le trajet 2).
Intervalle de pari pour X
Intervalle de la forme [-1 ; a] où a est un nombre compris entre -1 et 1.
Règle de décision
On observe une réalisation x de X et on adopte la règle suivante : si x ∈ [-1 ; a], on choisit
H0, sinon on choisit H1.
2.3.1 Si on observe un point lumineux dans l’intervalle [-1 ; 0,73], quelle est la probabilité que
le faisceau ait suivi le second trajet ?
Si le point est en dehors de cet intervalle, quelle est la probabilité que le faisceau ait suivi le
premier trajet ?
2.3.2 Mêmes questions pour l’intervalle [-1 ; -0,46].
2.3.3 En assimilant le fait que x soit dans l’intervalle [-1 ; 0,73] à « présence d’un signe » et le
fait que le faisceau ait suivi le premier trajet à « diagnostic vrai », calculer les sensibilité, spé-
cificité et valeurs prédictives.
Que vous suggère la comparaison entre les valeurs prédictives ?
Exercice 3 (5 points)
Pour comparer 2 traitements A et B d’une même maladie, on constitue par tirage au sort 2 groupes
de malades, l’un recevant A, l’autre B.
Le groupe A est constitué de 100 patients et le pourcentage observé de guérison est poA = 0,5. Le
pourcentage observé de guérison dans le groupe B est poB .
Pour chacune des affirmations suivantes, indiquez sur votre copie le numéro de l’affirmation et si
elle est :
3.1
3.1.1 On déduit des observations que la probabilité de guérison avec le traitement A est de 0,5.
3.1.2 La probabilité de guérison avec le traitement A est dans l’intervalle [0,40 ; 0,60] (valeurs
arrondies).
3.1.3 L’intervalle de confiance de niveau 95 % de la probabilité de guérison avec le traitement
A est [0,40 ; 0,60] (valeurs arrondies).
3.1.4 L’intervalle de pari de la proportion observée de guérison avec le traitement A est
[0,40 ; 0,60] (valeurs arrondies).
3.2 Si le test de comparaison entre poA et poB ne montre pas de différence significative :
3.2.1 Cela implique nécessairement que les traitements ont les mêmes effets.
3.2.2 Si en fait les proportions vraies de guérison diffèrent, le résultat du test est dû à un manque
de puissance.
3.3 Si le test de comparaison entre poA et poB montre une différence significative avec un degré
de signification p :
3.3.1 p est inférieur à 0,05.