Correction — Examen (Sujet 2) · Statistiques et Probabilités
Statistiques descriptives · Variables aléatoires à densité · Loi normale
Corrigé détaillé de l’examen (sujet 2).
Barème indicatif : Exercice 1 — 30 pts · Exercice 2 — 35 pts · Exercice 3 — 35 pts
Exercice 1 — Statistiques descriptives (30 points)
Partie A — Série discrète (16 points)
1. (3 pts) Tableau complété.
Les fréquences valent \(f_i = n_i / 50\) ; les effectifs cumulés croissants \(N_i^+ = \sum_{j \leq i} n_j\) et les fréquences cumulées \(F_i^+ = N_i^+ / 50\).
| \(x_i\) | 0 | 1 | 2 | 3 | 4 | 5 | Total |
|---|---|---|---|---|---|---|---|
| \(n_i\) | 6 | 13 | 15 | 9 | 5 | 2 | 50 |
| \(f_i\) | 0,12 | 0,26 | 0,30 | 0,18 | 0,10 | 0,04 | 1 |
| \(N_i^+\) | 6 | 19 | 34 | 43 | 48 | 50 | |
| \(F_i^+\) | 0,12 | 0,38 | 0,68 | 0,86 | 0,96 | 1,00 |
2. (1 pt) Mode.
La valeur de \(x_i\) dont l’effectif est le plus élevé est \(x = 2\) (avec \(n_2 = 15\)). Le mode est donc \(\boxed{Mo = 2}\).
3. (4 pts) Médiane, quartiles, écart interquartile.
On travaille avec la série ordonnée de \(n = 50\) valeurs.
Médiane. Les 25ᵉ et 26ᵉ valeurs déterminent la médiane. Or \(N_1^+ = 19 < 25\) et \(N_2^+ = 34 \geq 26\), donc ces deux valeurs sont égales à 2 : \[\boxed{Me = 2.}\]
Premier quartile \(Q_1\). La position \(n/4 = 12{,}5\) conduit à prendre la 13ᵉ valeur. \(N_0^+ = 6 < 13 \leq N_1^+ = 19\), d’où \(\boxed{Q_1 = 1.}\)
Troisième quartile \(Q_3\). La position \(3n/4 = 37{,}5\) conduit à prendre la 38ᵉ valeur. \(N_2^+ = 34 < 38 \leq N_3^+ = 43\), d’où \(\boxed{Q_3 = 3.}\)
Écart interquartile : \[\boxed{\mathrm{IQR} = Q_3 - Q_1 = 3 - 1 = 2.}\]
4. (5 pts) Moyenne, moyenne des carrés, variance, écart-type.
Moyenne : \[\bar{x} = \frac{1}{50}\sum n_i x_i = \frac{0 \times 6 + 1 \times 13 + 2 \times 15 + 3 \times 9 + 4 \times 5 + 5 \times 2}{50} = \frac{100}{50} = \boxed{2.}\]
Moyenne des carrés : \[\overline{x^2} = \frac{1}{50}\sum n_i x_i^2 = \frac{0 + 13 + 60 + 81 + 80 + 50}{50} = \frac{284}{50} = \boxed{5{,}68.}\]
Variance (König-Huygens) : \[\mathrm{Var}(x) = \overline{x^2} - \bar{x}^2 = 5{,}68 - 2^2 = 5{,}68 - 4 = \boxed{1{,}68.}\]
Écart-type : \[\sigma(x) = \sqrt{1{,}68} \approx \boxed{1{,}296.}\]
5. (3 pts) Transformation \(Y = 5X + 2\).
Pour \(Y = aX + b\) avec \(a = 5\), \(b = 2\) :
\[\bar{y} = a\,\bar{x} + b = 5 \times 2 + 2 = \boxed{12.}\]
\[\mathrm{Var}(Y) = a^2\,\mathrm{Var}(X) = 25 \times 1{,}68 = \boxed{42.}\]
\[\sigma(Y) = |a|\,\sigma(X) = 5 \times 1{,}296 \approx \boxed{6{,}481.}\]
Partie B — Série continue en classes (14 points)
6. (4 pts) Fréquences, amplitudes, densités de fréquence.
| Concentration (mg/L) | \([0\,;\,3[\) | \([3\,;\,8[\) | \([8\,;\,15[\) | \([15\,;\,30[\) |
|---|---|---|---|---|
| \(n_i\) | 5 | 13 | 14 | 8 |
| \(f_i\) | 0,125 | 0,325 | 0,350 | 0,200 |
| \(A_i\) | 3 | 5 | 7 | 15 |
| \(d_i\) | 0,042 | 0,065 | 0,050 | 0,013 |
7. (2 pts) Pourquoi les densités \(d_i\) et non les fréquences \(f_i\) ?
Dans un histogramme, c’est l’aire de chaque rectangle qui doit représenter la fréquence de la classe. L’aire est le produit de la hauteur par la largeur (amplitude) : \(\text{aire}_i = h_i \times A_i\). Pour que \(\text{aire}_i = f_i\), il faut \(h_i = f_i / A_i = d_i\).
Si l’on utilisait \(f_i\) comme hauteur avec des amplitudes inégales, les classes les plus larges auraient une aire disproportionnée par rapport à leur fréquence, ce qui fausserait la représentation visuelle.
8. (4 pts) Médiane par interpolation linéaire.
Fréquences cumulées croissantes :
| Borne sup. | 3 | 8 | 15 | 30 |
|---|---|---|---|---|
| \(F_i^+\) | 0,125 | 0,450 | 0,800 | 1,000 |
On cherche la classe où \(F\) atteint \(0{,}50\). On a \(F(8) = 0{,}450 < 0{,}50\) et \(F(15) = 0{,}800 \geq 0{,}50\). La médiane se trouve donc dans la classe \([8\,;\,15[\).
Par interpolation linéaire : \[Me = 8 + \frac{0{,}50 - 0{,}450}{0{,}800 - 0{,}450} \times (15 - 8) = 8 + \frac{0{,}05}{0{,}35} \times 7 = 8 + 1 = \boxed{9.}\]
9. (4 pts) Moyenne et variance par les centres de classe.
Les centres de classe sont \(c_1 = 1{,}5\), \(c_2 = 5{,}5\), \(c_3 = 11{,}5\), \(c_4 = 22{,}5\).
Moyenne : \[\bar{x} = \frac{1{,}5 \times 5 + 5{,}5 \times 13 + 11{,}5 \times 14 + 22{,}5 \times 8}{40} = \frac{7{,}5 + 71{,}5 + 161 + 180}{40} = \frac{420}{40} = \boxed{10{,}5.}\]
Moyenne des carrés : \[\overline{x^2} = \frac{1{,}5^2 \times 5 + 5{,}5^2 \times 13 + 11{,}5^2 \times 14 + 22{,}5^2 \times 8}{40} = \frac{11{,}25 + 393{,}25 + 1851{,}5 + 4050}{40} = \frac{6306}{40} = 157{,}65.\]
Variance : \[\mathrm{Var}(x) = \overline{x^2} - \bar{x}^2 = 157{,}65 - 10{,}5^2 = 157{,}65 - 110{,}25 = \boxed{47{,}4.}\]
Exercice 2 — Variable aléatoire à densité (35 points)
\[f(x) = \begin{cases} \frac{2}{9}\,x\,(3 - x) & \text{si } x \in [0\,;\,3], \\ 0 & \text{sinon.} \end{cases}\]
1. (1 pt) Vérification \(f(x) \geq 0\).
Sur \([0\,;\,3]\) on a \(x \geq 0\) et \(3 - x \geq 0\), donc \(x(3-x) \geq 0\). Comme \(k > 0\), on conclut \(f(x) = k\,x\,(3-x) \geq 0\).
2. (4 pts) Détermination de \(k\).
Pour que \(f\) soit une densité, il faut \(\displaystyle\int_{-\infty}^{+\infty} f(x)\,dx = 1\), soit : \[k \int_0^3 x(3-x)\,dx = 1.\] On utilise le résultat admis \(\displaystyle\int_0^3 x(3-x)\,dx = \frac{9}{2}\) : \[k \cdot \frac{9}{2} = 1 \implies \boxed{k = \frac{2}{9}.}\]
3. (4 pts) \(P(X = 1)\) et \(P(0 \leq X \leq 1)\).
\(X\) est une variable aléatoire continue ; la probabilité en un point isolé est toujours nulle : \[\boxed{P(X = 1) = 0.}\]
\[P(0 \leq X \leq 1) = \int_0^1 \frac{2}{9}\,x\,(3-x)\,dx = \frac{2}{9}\int_0^1 (3x - x^2)\,dx = \frac{2}{9}\left[\frac{3x^2}{2} - \frac{x^3}{3}\right]_0^1 = \frac{2}{9}\left(\frac{3}{2} - \frac{1}{3}\right) = \frac{2}{9} \cdot \frac{7}{6} = \boxed{\frac{7}{27} \approx 0{,}259.}\]
4. (8 pts) Fonction de répartition \(F_X\).
- Si \(x < 0\) : \(F_X(x) = 0\).
- Si \(0 \leq x \leq 3\) :
\[F_X(x) = \int_0^x \frac{2}{9}\,t\,(3-t)\,dt = \frac{2}{9}\int_0^x (3t - t^2)\,dt = \frac{2}{9}\left[\frac{3t^2}{2} - \frac{t^3}{3}\right]_0^x = \frac{2}{9}\left(\frac{3x^2}{2} - \frac{x^3}{3}\right) = \frac{9x^2 - 2x^3}{27}.\]
- Si \(x > 3\) : \(F_X(x) = 1\).
\[\boxed{F_X(x) = \begin{cases} 0 & \text{si } x < 0, \\ \dfrac{9x^2 - 2x^3}{27} & \text{si } 0 \leq x \leq 3, \\ 1 & \text{si } x > 3. \end{cases}}\]
5. (2 pts) Vérification \(F_X(3) = 1\).
\[F_X(3) = \frac{9 \times 9 - 2 \times 27}{27} = \frac{81 - 54}{27} = \frac{27}{27} = 1. \quad\checkmark\]
6. (3 pts) \(P(X > 2)\).
\[P(X > 2) = 1 - F_X(2).\]
\[F_X(2) = \frac{9 \times 4 - 2 \times 8}{27} = \frac{36 - 16}{27} = \frac{20}{27}.\]
\[\boxed{P(X > 2) = 1 - \frac{20}{27} = \frac{7}{27} \approx 0{,}259.}\]
7. (4 pts) Symétrie et \(\mathbb{E}(X)\).
Vérification de la symétrie : \[f\!\left(\tfrac{3}{2}+t\right) = \frac{2}{9}\left(\tfrac{3}{2}+t\right)\!\left(3-\tfrac{3}{2}-t\right) = \frac{2}{9}\left(\tfrac{3}{2}+t\right)\!\left(\tfrac{3}{2}-t\right) = \frac{2}{9}\left(\tfrac{9}{4} - t^2\right).\] \[f\!\left(\tfrac{3}{2}-t\right) = \frac{2}{9}\left(\tfrac{3}{2}-t\right)\!\left(3-\tfrac{3}{2}+t\right) = \frac{2}{9}\left(\tfrac{3}{2}-t\right)\!\left(\tfrac{3}{2}+t\right) = \frac{2}{9}\left(\tfrac{9}{4} - t^2\right).\]
On a bien \(f\!\left(\tfrac{3}{2}+t\right) = f\!\left(\tfrac{3}{2}-t\right)\) pour tout \(t \in \mathbb{R}\). \(\checkmark\)
Espérance : la densité \(f\) est symétrique par rapport à \(x = \frac{3}{2}\), donc le centre de symétrie est l’espérance : \[\boxed{\mathbb{E}(X) = \frac{3}{2}.}\]
8. (6 pts) \(\mathbb{E}(X^2)\) et \(\mathrm{Var}(X)\).
Par le théorème de transfert : \[\mathbb{E}(X^2) = \int_0^3 x^2 \cdot \frac{2}{9}\,x\,(3-x)\,dx = \frac{2}{9}\int_0^3 (3x^3 - x^4)\,dx.\]
\[= \frac{2}{9}\left[\frac{3x^4}{4} - \frac{x^5}{5}\right]_0^3 = \frac{2}{9}\left(\frac{3 \times 81}{4} - \frac{243}{5}\right) = \frac{2}{9}\left(\frac{243}{4} - \frac{243}{5}\right) = \frac{2}{9} \cdot \frac{243}{20} = \boxed{\frac{27}{10} = 2{,}7.}\]
Variance par König-Huygens : \[\mathrm{Var}(X) = \mathbb{E}(X^2) - \bigl[\mathbb{E}(X)\bigr]^2 = \frac{27}{10} - \left(\frac{3}{2}\right)^{\!2} = \frac{27}{10} - \frac{9}{4} = \frac{54 - 45}{20} = \boxed{\frac{9}{20} = 0{,}45.}\]
9. (3 pts) Loi exponentielle : détermination de \(\lambda\) et \(\mathbb{E}(T)\).
\(T \sim \mathcal{E}(\lambda)\) implique \(P(T > t) = e^{-\lambda t}\) pour \(t \geq 0\). On a : \[P(T > 4) = e^{-4\lambda} = e^{-2} \implies 4\lambda = 2 \implies \boxed{\lambda = \frac{1}{2}.}\]
\[\boxed{\mathbb{E}(T) = \frac{1}{\lambda} = 2 \text{ heures}.}\]
Exercice 3 — Loi normale (35 points)
Partie A — Loi normale centrée réduite (12 points)
\(Z \sim \mathcal{N}(0,1)\), \(\Phi\) désigne la fonction de répartition de \(Z\).
1. (4 pts) Calculs de probabilités.
\(P(Z \leq 2{,}33) = \Phi(2{,}33) = \boxed{0{,}9901.}\)
\(P(Z > -1{,}28) = 1 - \Phi(-1{,}28) = \Phi(1{,}28) = \boxed{0{,}8997.}\)
\(P(-1{,}96 \leq Z \leq 2{,}58) = \Phi(2{,}58) - \Phi(-1{,}96)\)
\[= \Phi(2{,}58) - \bigl[1 - \Phi(1{,}96)\bigr] = 0{,}9951 - 1 + 0{,}9750 = \boxed{0{,}9701.}\]
2. (2 pts) \(P(|Z| > 1{,}96)\).
\[P(|Z| > 1{,}96) = 1 - P(|Z| \leq 1{,}96) = 1 - \bigl[2\Phi(1{,}96) - 1\bigr] = 2\bigl[1 - \Phi(1{,}96)\bigr] = 2 \times 0{,}0250 = \boxed{0{,}05.}\]
3. (3 pts) Lecture inverse de la table.
\(P(Z \leq z_0) = 0{,}9332\). Par lecture directe, \(\Phi(1{,}50) = 0{,}9332\), donc \(\boxed{z_0 = 1{,}50.}\)
\(P(|Z| \leq d) = 0{,}95\) avec \(d > 0\). On a \(2\Phi(d) - 1 = 0{,}95\), soit \(\Phi(d) = 0{,}975\). Or \(\Phi(1{,}96) = 0{,}9750\), d’où : \[\boxed{d = 1{,}96.}\]
4. (3 pts) \(\mathbb{E}(Z)\) et \(\mathrm{Var}(Z)\).
La densité de \(\mathcal{N}(0,1)\) est \(\varphi(x) = \frac{1}{\sqrt{2\pi}}\,e^{-x^2/2}\). C’est une fonction paire : \(\varphi(-x) = \varphi(x)\). La densité est donc symétrique par rapport à \(0\), ce qui entraîne \(\boxed{\mathbb{E}(Z) = 0.}\)
Par définition de la loi \(\mathcal{N}(0,1)\) : \(\boxed{\mathrm{Var}(Z) = 1.}\)
Partie B — Loi normale générale (15 points)
\(X \sim \mathcal{N}(200,\, 100)\), c’est-à-dire \(\mu = 200\) et \(\sigma^2 = 100\).
5. (1 pt) Paramètres.
\[\boxed{\mathbb{E}(X) = 200, \qquad \sigma_X = 10.}\]
6. (5 pts) Calculs de probabilités.
On standardise avec \(Z = \dfrac{X - 200}{10}\).
\(P(X \leq 215) = P\!\left(Z \leq \dfrac{215 - 200}{10}\right) = \Phi(1{,}50) = \boxed{0{,}9332.}\)
\(P(185 \leq X \leq 210) = P\!\left(\dfrac{185 - 200}{10} \leq Z \leq \dfrac{210 - 200}{10}\right) = P(-1{,}50 \leq Z \leq 1{,}00)\)
\[= \Phi(1{,}00) - \Phi(-1{,}50) = \Phi(1{,}00) - \bigl[1 - \Phi(1{,}50)\bigr] = 0{,}8413 - 0{,}0668 = \boxed{0{,}7745.}\]
7. (3 pts) Seuil \(s\).
\[P(X > s) = 0{,}025 \iff P(X \leq s) = 0{,}975 \iff \Phi\!\left(\frac{s - 200}{10}\right) = 0{,}975.\]
Or \(\Phi(1{,}96) = 0{,}9750\), d’où : \[\frac{s - 200}{10} = 1{,}96 \implies s = 200 + 10 \times 1{,}96 = \boxed{219{,}6.}\]
8. (6 pts) Somme \(S = X_1 + X_2 + X_3 + X_4\).
Loi de \(S\) : les \(X_i\) sont indépendantes et de même loi \(\mathcal{N}(200, 100)\). Par stabilité de la loi normale par somme : \[\boxed{S \sim \mathcal{N}(4 \times 200,\; 4 \times 100) = \mathcal{N}(800,\, 400).}\]
Donc \(\mathbb{E}(S) = 800\) et \(\sigma_S = 20\).
Calcul de \(P(S \leq 830)\) : \[P(S \leq 830) = P\!\left(Z \leq \frac{830 - 800}{20}\right) = \Phi(1{,}50) = \boxed{0{,}9332.}\]
Partie C — Identification des paramètres (8 points)
9. (8 pts) Détermination de \(m\) et \(\sigma\).
\(X \sim \mathcal{N}(m, \sigma^2)\). On standardise \(Z = \dfrac{X - m}{\sigma}\).
Les conditions donnent :
\[P(X < 530) = 0{,}9332 \iff \Phi\!\left(\frac{530 - m}{\sigma}\right) = 0{,}9332.\]
\[P(X < 470) = 0{,}1587 \iff \Phi\!\left(\frac{470 - m}{\sigma}\right) = 0{,}1587.\]
Par lecture inverse de la table de \(\Phi\) :
- \(\Phi(z) = 0{,}9332 \implies z = 1{,}50\) (car \(\Phi(1{,}50) = 0{,}9332\)).
- \(\Phi(z) = 0{,}1587 \implies z = -1{,}00\) (car \(\Phi(1{,}00) = 0{,}8413\) et \(\Phi(-1{,}00) = 1 - 0{,}8413 = 0{,}1587\)).
On obtient le système : \[\begin{cases} \dfrac{530 - m}{\sigma} = 1{,}50 \\ \dfrac{470 - m}{\sigma} = -1{,}00 \end{cases} \iff \begin{cases} 530 - m = 1{,}50\,\sigma & (1) \\ 470 - m = -\sigma & (2) \end{cases}\]
En soustrayant \((2)\) de \((1)\) : \[530 - 470 = 1{,}50\,\sigma + \sigma = 2{,}50\,\sigma \implies \sigma = \frac{60}{2{,}5} = \boxed{24.}\]
En reportant dans \((2)\) : \[m = 470 + \sigma = 470 + 24 = \boxed{494.}\]
La masse suit donc la loi \(\mathcal{N}(494,\, 576)\).