Feuille d’exercices — Probabilités et statistiques à deux variables
Cette feuille propose 8 exercices progressifs pour s’entraîner sur la partie Deux variables du cours : statistiques bivariées, intégrales doubles, densité conjointe, lois marginales et conditionnelles, indépendance, covariance, corrélation et convolution. Chaque exercice est suivi d’un corrigé repliable pour permettre un vrai temps de recherche avant la vérification.
📍 Retour à la carte du cours · 📘 Revenir à la fiche de révision
Cette feuille d’entraînement couvre les cinq chapitres de la partie Deux variables. Commencez par chercher sans ouvrir le corrigé, puis comparez votre méthode au protocole de la fiche de révision.
Temps conseillé : pour chaque exercice, essayez de chercher pendant la durée indiquée avant d’ouvrir le corrigé.
Plan de travail
| Bloc | Compétences travaillées | Exercices |
|---|---|---|
| Statistiques bivariées | marginales, conditionnelles, indépendance visuelle, test du \(\chi^2\) | 1 à 2 |
| Intégrales et loi conjointe | description d’un domaine, changement d’ordre, probabilité sur une région | 3 à 4 |
| Marginales et grandeurs numériques | marginalisation, densité conditionnelle, espérance, covariance, corrélation | 5 à 6 |
| Indépendance et sommes | factorisation, calculs de probabilités, convolution | 7 à 8 |
1. Statistiques bivariées
Le tableau suivant croise la formule d’abonnement d’une plateforme vidéo et l’usage du mode hors ligne chez 180 abonnés.
| Formule | Hors ligne : oui | Hors ligne : non |
|---|---|---|
| Essentiel | 18 | 42 |
| Standard | 30 | 30 |
| Premium | 36 | 24 |
- Identifier les deux variables et leur type.
- Déterminer les distributions marginales.
- Calculer la proportion d’utilisateurs du mode hors ligne dans chaque formule.
- Les variables « formule » et « usage du mode hors ligne » semblent-elles indépendantes ?
Temps conseillé avant de consulter le corrigé : 15 à 20 min
1. Variables étudiées
- Formule d’abonnement : variable qualitative nominale à trois modalités.
- Usage du mode hors ligne : variable qualitative nominale binaire.
2. Distributions marginales
Le total vaut \[ n = 18+42+30+30+36+24 = 180. \]
Totaux par ligne :
| Formule | Total | Fréquence |
|---|---|---|
| Essentiel | 60 | \(60/180 = 1/3\) |
| Standard | 60 | \(60/180 = 1/3\) |
| Premium | 60 | \(60/180 = 1/3\) |
Totaux par colonne :
| Usage hors ligne | Total | Fréquence |
|---|---|---|
| Oui | 84 | \(84/180 = 7/15 \approx 0{,}467\) |
| Non | 96 | \(96/180 = 8/15 \approx 0{,}533\) |
3. Fréquences conditionnelles du mode hors ligne sachant la formule
\[ P(\text{oui}\mid \text{Essentiel})=\frac{18}{60}=0{,}30, \] \[ P(\text{oui}\mid \text{Standard})=\frac{30}{60}=0{,}50, \] \[ P(\text{oui}\mid \text{Premium})=\frac{36}{60}=0{,}60. \]
4. Indépendance visuelle
Si les variables étaient indépendantes, on devrait retrouver la même proportion globale d’utilisateurs du mode hors ligne, soit \[ P(\text{oui})=\frac{84}{180}\approx 0{,}467, \] dans chaque formule. Or on observe \(0{,}30\), \(0{,}50\) et \(0{,}60\).
Les profils sont différents : les variables ne semblent pas indépendantes.
On observe 200 visites d’un site e-commerce. Le tableau croise le temps de chargement de la page d’accueil et l’issue de la visite.
| Issue / Temps de chargement | Moins de 5 s | \([5;10[\) s | 10 s ou plus |
|---|---|---|---|
| Achat finalisé | 42 | 33 | 15 |
| Achat abandonné | 18 | 27 | 65 |
- Déterminer les effectifs théoriques sous l’hypothèse d’indépendance.
- Vérifier la condition de Cochran et calculer la statistique du \(\chi^2\).
- Conclure au seuil de 5 %.
Temps conseillé avant de consulter le corrigé : 25 à 30 min
1. Totaux et effectifs théoriques
Totaux lignes :
- Achat finalisé : \(90\).
- Achat abandonné : \(110\).
Totaux colonnes :
- Moins de 5 s : \(60\).
- \([5;10[\) s : \(60\).
- 10 s ou plus : \(80\).
Sous \(H_0\) (indépendance), les effectifs théoriques sont \[ e_{ij}=\frac{n_{i\cdot}n_{\cdot j}}{200}. \]
| Issue / Temps de chargement | Moins de 5 s | \([5;10[\) s | 10 s ou plus |
|---|---|---|---|
| Achat finalisé | \(90\times 60/200 = 27\) | \(90\times 60/200 = 27\) | \(90\times 80/200 = 36\) |
| Achat abandonné | \(110\times 60/200 = 33\) | \(110\times 60/200 = 33\) | \(110\times 80/200 = 44\) |
2. Condition de Cochran et statistique
Tous les effectifs théoriques sont supérieurs à \(5\), donc la condition de Cochran est satisfaite.
La statistique vaut \[ \chi^2_{obs} = \frac{(42-27)^2}{27} + \frac{(33-27)^2}{27} + \frac{(15-36)^2}{36} + \frac{(18-33)^2}{33} + \frac{(27-33)^2}{33} + \frac{(65-44)^2}{44}. \]
Donc \[ \chi^2_{obs} = \frac{225}{27}+\frac{36}{27}+\frac{441}{36}+\frac{225}{33}+\frac{36}{33}+\frac{441}{44} \approx 39{,}85. \]
3. Décision
Les degrés de liberté sont \[ \nu=(2-1)(3-1)=2. \]
Au seuil de 5 %, la valeur critique est \[ \chi^2_{0{,}95;2}\approx 5{,}991. \]
Comme \[ 39{,}85 \gg 5{,}991, \] on rejette l’hypothèse d’indépendance.
Le temps de chargement et l’issue de la visite sont donc dépendants : les abandons sont beaucoup plus fréquents quand le chargement est long.
2. Intégrales et loi conjointe
On considère le domaine \[ D=\{(x,y)\in\mathbb{R}^2 : 0\le y\le x\le 2\}. \]
- Décrire \(D\) en inversant l’ordre d’intégration.
- Calculer \[ I=\iint_D (x+y)\,dx\,dy. \]
- Un point est choisi uniformément dans \(D\). Calculer la probabilité de l’événement \(\{Y\le 1\}\).
Temps conseillé avant de consulter le corrigé : 15 à 20 min
1. Domaine avec l’ordre inversé
La description initiale est \[ 0\le y\le x\le 2. \]
Si l’on fixe \(y\), alors \(y\le x\le 2\) et \(y\) varie de \(0\) à \(2\). Donc \[ D=\{(x,y)\in\mathbb{R}^2 : 0\le y\le 2,\ y\le x\le 2\}. \]
2. Calcul de l’intégrale
Avec l’ordre donné : \[ I=\int_0^2\int_0^x (x+y)\,dy\,dx. \]
On calcule l’intégrale intérieure : \[ \int_0^x (x+y)\,dy = xy+\frac{y^2}{2}\Big|_{0}^{x} =x^2+\frac{x^2}{2} =\frac{3x^2}{2}. \]
Ainsi, \[ I=\int_0^2 \frac{3x^2}{2}\,dx =\frac{3}{2}\cdot\frac{x^3}{3}\Big|_0^2 =\frac{2^3}{2} =4. \]
3. Probabilité de \(\{Y\le 1\}\) sous la loi uniforme sur \(D\)
L’aire de \(D\) vaut \[ \mathcal{A}(D)=\int_0^2 x\,dx=2. \]
La région \(\{(x,y)\in D : y\le 1\}\) se décompose en :
- pour \(0\le x\le 1\), tout le segment \(0\le y\le x\) ;
- pour \(1\le x\le 2\), le segment \(0\le y\le 1\).
Son aire vaut donc \[ \int_0^1 x\,dx+\int_1^2 1\,dx =\frac{1}{2}+1 =\frac{3}{2}. \]
La probabilité demandée est \[ P(Y\le 1)=\frac{\mathcal{A}(\{(x,y)\in D : y\le 1\})}{\mathcal{A}(D)} =\frac{3/2}{2} =\frac{3}{4}. \]
Soit \((X,Y)\) un couple de variables continues de densité \[ f(x,y)=c(x+y)\,\mathbf{1}_{[0,1]^2}(x,y). \]
- Déterminer la constante \(c\).
- Calculer \(P(X+Y\le 1)\).
- Calculer \(P(X>Y)\).
- Les variables \(X\) et \(Y\) sont-elles indépendantes ?
Temps conseillé avant de consulter le corrigé : 30 à 35 min
1. Normalisation
La densité doit vérifier \[ \int_0^1\int_0^1 c(x+y)\,dy\,dx = 1. \]
Or \[ \int_0^1\int_0^1 (x+y)\,dy\,dx =\int_0^1 \left(x+\frac{1}{2}\right)\,dx =\frac{1}{2}+\frac{1}{2} =1. \]
Donc \[ c=1. \]
2. Probabilité de l’événement \(\{X+Y\le 1\}\)
On intègre sur le triangle \(0\le x\le 1\), \(0\le y\le 1-x\) : \[ P(X+Y\le 1)=\int_0^1\int_0^{1-x} (x+y)\,dy\,dx. \]
L’intégrale intérieure vaut \[ x(1-x)+\frac{(1-x)^2}{2} =\frac{1-x^2}{2}. \]
Donc \[ P(X+Y\le 1)=\int_0^1 \frac{1-x^2}{2}\,dx =\frac{1}{2}\left(1-\frac{1}{3}\right) =\frac{1}{3}. \]
3. Probabilité de l’événement \(\{X>Y\}\)
On intègre sur le triangle \(0\le y\le x\le 1\) : \[ P(X>Y)=\int_0^1\int_0^x (x+y)\,dy\,dx. \]
On obtient \[ \int_0^1 \left(x^2+\frac{x^2}{2}\right)\,dx =\frac{3}{2}\int_0^1 x^2\,dx =\frac{3}{2}\cdot\frac{1}{3} =\frac{1}{2}. \]
4. Indépendance
Les marginales valent \[ f_X(x)=\int_0^1 (x+y)\,dy = x+\frac{1}{2}, \qquad f_Y(y)=\int_0^1 (x+y)\,dx = y+\frac{1}{2}, \] pour \(x,y\in[0,1]\).
Le produit \[ f_X(x)f_Y(y)=\left(x+\frac{1}{2}\right)\left(y+\frac{1}{2}\right) \] n’est pas égal à \(x+y\) sur \([0,1]^2\).
Les variables \(X\) et \(Y\) ne sont donc pas indépendantes.
3. Marginales, conditionnelles et grandeurs numériques
Soit \((X,Y)\) un couple de densité \[ f(x,y)=2\,\mathbf{1}_{\{0<y<x<1\}}(x,y). \]
- Déterminer les densités marginales \(f_X\) et \(f_Y\).
- Déterminer la densité conditionnelle \(f_{Y\mid X}(y\mid x)\) pour \(0<x<1\).
- Calculer \(E(Y\mid X=x)\).
- Les variables \(X\) et \(Y\) sont-elles indépendantes ?
Temps conseillé avant de consulter le corrigé : 20 à 30 min
1. Densités marginales
Pour \(0<x<1\), on a \(0<y<x\), donc \[ f_X(x)=\int_0^x 2\,dy = 2x. \] Ainsi, \[ f_X(x)=2x\,\mathbf{1}_{(0,1)}(x). \]
Pour \(0<y<1\), on a \(y<x<1\), donc \[ f_Y(y)=\int_y^1 2\,dx = 2(1-y). \] Ainsi, \[ f_Y(y)=2(1-y)\,\mathbf{1}_{(0,1)}(y). \]
2. Densité conditionnelle
Pour \(0<y<x<1\), \[ f_{Y\mid X}(y\mid x)=\frac{f(x,y)}{f_X(x)}=\frac{2}{2x}=\frac{1}{x}. \]
Donc \[ f_{Y\mid X}(y\mid x)=\frac{1}{x}\,\mathbf{1}_{(0,x)}(y). \]
3. Espérance conditionnelle
\[ E(Y\mid X=x)=\int_0^x y\frac{1}{x}\,dy =\frac{1}{x}\cdot\frac{x^2}{2} =\frac{x}{2}. \]
4. Indépendance
Le support est triangulaire : \[ \{(x,y):0<y<x<1\}. \]
Il n’est pas rectangulaire, donc l’indépendance est impossible. On peut aussi remarquer que \[ f_X(x)f_Y(y)=4x(1-y) \] ne coïncide pas avec la densité conjointe \(2\) sur le support.
Les variables \(X\) et \(Y\) ne sont pas indépendantes.
On reprend le couple \((X,Y)\) de l’exercice 5.
- Calculer \(E(X)\), \(E(Y)\) et \(E(XY)\).
- En déduire \(\operatorname{Cov}(X,Y)\).
- Calculer le coefficient de corrélation \(\rho(X,Y)\).
Temps conseillé avant de consulter le corrigé : 30 à 40 min
1. Espérances
À partir de la marginale de \(X\) : \[ E(X)=\int_0^1 x\cdot 2x\,dx = 2\int_0^1 x^2\,dx = \frac{2}{3}. \]
À partir de la marginale de \(Y\) : \[ E(Y)=\int_0^1 y\cdot 2(1-y)\,dy =2\int_0^1 (y-y^2)\,dy =2\left(\frac{1}{2}-\frac{1}{3}\right) =\frac{1}{3}. \]
Pour \(E(XY)\) : \[ E(XY)=\int_0^1\int_0^x 2xy\,dy\,dx =\int_0^1 x\left(y^2\Big|_0^x\right)\,dx =\int_0^1 x^3\,dx =\frac{1}{4}. \]
2. Covariance
\[ \operatorname{Cov}(X,Y)=E(XY)-E(X)E(Y) =\frac{1}{4}-\frac{2}{3}\cdot\frac{1}{3} =\frac{1}{4}-\frac{2}{9} =\frac{1}{36}. \]
3. Corrélation
On calcule d’abord les variances.
Pour \(X\) : \[ E(X^2)=\int_0^1 x^2\cdot 2x\,dx = 2\int_0^1 x^3\,dx = \frac{1}{2}, \] donc \[ \operatorname{Var}(X)=\frac{1}{2}-\left(\frac{2}{3}\right)^2 =\frac{1}{2}-\frac{4}{9} =\frac{1}{18}. \]
Pour \(Y\) : \[ E(Y^2)=\int_0^1 y^2\cdot 2(1-y)\,dy =2\int_0^1 (y^2-y^3)\,dy =2\left(\frac{1}{3}-\frac{1}{4}\right) =\frac{1}{6}, \] donc \[ \operatorname{Var}(Y)=\frac{1}{6}-\left(\frac{1}{3}\right)^2 =\frac{1}{6}-\frac{1}{9} =\frac{1}{18}. \]
Le coefficient de corrélation vaut alors \[ \rho(X,Y)=\frac{\operatorname{Cov}(X,Y)}{\sigma_X\sigma_Y} =\frac{1/36}{\sqrt{1/18}\sqrt{1/18}} =\frac{1/36}{1/18} =\frac{1}{2}. \]
On obtient donc une corrélation linéaire positive modérée.
4. Indépendance et convolution
Soit \((X,Y)\) un couple de densité \[ f(x,y)=4xy\,\mathbf{1}_{[0,1]^2}(x,y). \]
- Déterminer \(f_X\) et \(f_Y\).
- Montrer que \(X\) et \(Y\) sont indépendantes.
- Calculer \(P\left(X\le \frac{1}{2},\,Y\le \frac{3}{4}\right)\).
- Calculer \(P(Y\le X)\).
Temps conseillé avant de consulter le corrigé : 15 à 20 min
1. Marginales
Pour \(x\in[0,1]\) : \[ f_X(x)=\int_0^1 4xy\,dy = 4x\cdot\frac{1}{2}=2x. \]
Pour \(y\in[0,1]\) : \[ f_Y(y)=\int_0^1 4xy\,dx = 4y\cdot\frac{1}{2}=2y. \]
Donc \[ f_X(x)=2x\,\mathbf{1}_{[0,1]}(x), \qquad f_Y(y)=2y\,\mathbf{1}_{[0,1]}(y). \]
2. Indépendance
Sur \([0,1]^2\), \[ f_X(x)f_Y(y)=(2x)(2y)=4xy=f(x,y). \]
La densité conjointe se factorise : les variables \(X\) et \(Y\) sont indépendantes.
3. Probabilité sur un rectangle
Par indépendance : \[ P\left(X\le \frac{1}{2},\,Y\le \frac{3}{4}\right) =P\left(X\le \frac{1}{2}\right)P\left(Y\le \frac{3}{4}\right). \]
Or \[ P\left(X\le \frac{1}{2}\right)=\int_0^{1/2}2x\,dx=\frac{1}{4}, \] et \[ P\left(Y\le \frac{3}{4}\right)=\int_0^{3/4}2y\,dy=\frac{9}{16}. \]
Donc \[ P\left(X\le \frac{1}{2},\,Y\le \frac{3}{4}\right)=\frac{1}{4}\cdot\frac{9}{16}=\frac{9}{64}. \]
4. Probabilité de l’événement \(\{Y\le X\}\)
On peut intégrer directement : \[ P(Y\le X)=\int_0^1\int_0^x 4xy\,dy\,dx =\int_0^1 2x^3\,dx =\frac{1}{2}. \]
On retrouve aussi ce résultat par symétrie entre \(X\) et \(Y\).
Soient \(X\) et \(Y\) deux variables indépendantes de loi uniforme sur \([0,1]\). On pose \[ S=X+Y. \]
- Déterminer la densité de \(S\) par convolution.
- Calculer \[ P\left(\frac{1}{2}\le S\le \frac{3}{2}\right). \]
Temps conseillé avant de consulter le corrigé : 20 à 25 min
Comme \(X\) et \(Y\) sont indépendantes et de densité \[ f_X(x)=f_Y(x)=\mathbf{1}_{[0,1]}(x), \] la densité de \(S=X+Y\) est donnée par la convolution \[ f_S(t)=\int_{\mathbb{R}} f_X(x)f_Y(t-x)\,dx. \]
1. Densité de \(S\)
Pour \(0\le t\le 1\), la condition \(0\le x\le 1\) et \(0\le t-x\le 1\) donne \(0\le x\le t\), donc \[ f_S(t)=\int_0^t 1\,dx = t. \]
Pour \(1\le t\le 2\), on a \(t-1\le x\le 1\), donc \[ f_S(t)=\int_{t-1}^1 1\,dx = 2-t. \]
En dehors de \([0,2]\), la densité vaut \(0\). Ainsi, \[ f_S(t)= \begin{cases} 0 & \text{si } t<0,\\ t & \text{si } 0\le t\le 1,\\ 2-t & \text{si } 1\le t\le 2,\\ 0 & \text{si } t>2. \end{cases} \]
2. Probabilité demandée
\[ P\left(\frac{1}{2}\le S\le \frac{3}{2}\right) =\int_{1/2}^1 t\,dt+\int_1^{3/2}(2-t)\,dt. \]
On obtient \[ \int_{1/2}^1 t\,dt =\frac{1}{2}\left(1-\frac{1}{4}\right) =\frac{3}{8}, \] et \[ \int_1^{3/2}(2-t)\,dt =\left(2t-\frac{t^2}{2}\right)\Big|_1^{3/2} =\frac{3}{8}. \]
Donc \[ P\left(\frac{1}{2}\le S\le \frac{3}{2}\right)=\frac{3}{8}+\frac{3}{8}=\frac{3}{4}. \]
Pour aller plus vite en autonomie
- En statistique bivariée, commencez toujours par les marginales, puis les conditionnelles.
- En continu, dessinez d’abord le support ou la région d’intégration avant toute formule.
- Pour l’indépendance, ne concluez jamais sur une intuition seule : vérifiez la factorisation.
- Pour la covariance, calculez séparément \(E(X)\), \(E(Y)\) et \(E(XY)\).
- Pour une somme de variables indépendantes, pensez immédiatement à la convolution.