Feuille d’exercices — Probabilités et statistiques à deux variables

Date de publication

18 février 2026

Modifié

5 mai 2026

Résumé

Cette feuille propose 8 exercices progressifs pour s’entraîner sur la partie Deux variables du cours : statistiques bivariées, intégrales doubles, densité conjointe, lois marginales et conditionnelles, indépendance, covariance, corrélation et convolution. Chaque exercice est suivi d’un corrigé repliable pour permettre un vrai temps de recherche avant la vérification.

📍 Retour à la carte du cours · 📘 Revenir à la fiche de révision

Cette feuille d’entraînement couvre les cinq chapitres de la partie Deux variables. Commencez par chercher sans ouvrir le corrigé, puis comparez votre méthode au protocole de la fiche de révision.

Temps conseillé : pour chaque exercice, essayez de chercher pendant la durée indiquée avant d’ouvrir le corrigé.

Plan de travail

Bloc Compétences travaillées Exercices
Statistiques bivariées marginales, conditionnelles, indépendance visuelle, test du \(\chi^2\) 1 à 2
Intégrales et loi conjointe description d’un domaine, changement d’ordre, probabilité sur une région 3 à 4
Marginales et grandeurs numériques marginalisation, densité conditionnelle, espérance, covariance, corrélation 5 à 6
Indépendance et sommes factorisation, calculs de probabilités, convolution 7 à 8

1. Statistiques bivariées

Exercice 1

Le tableau suivant croise la formule d’abonnement d’une plateforme vidéo et l’usage du mode hors ligne chez 180 abonnés.

Formule Hors ligne : oui Hors ligne : non
Essentiel 18 42
Standard 30 30
Premium 36 24
  1. Identifier les deux variables et leur type.
  2. Déterminer les distributions marginales.
  3. Calculer la proportion d’utilisateurs du mode hors ligne dans chaque formule.
  4. Les variables « formule » et « usage du mode hors ligne » semblent-elles indépendantes ?

Temps conseillé avant de consulter le corrigé : 15 à 20 min

1. Variables étudiées

  • Formule d’abonnement : variable qualitative nominale à trois modalités.
  • Usage du mode hors ligne : variable qualitative nominale binaire.

2. Distributions marginales

Le total vaut \[ n = 18+42+30+30+36+24 = 180. \]

Totaux par ligne :

Formule Total Fréquence
Essentiel 60 \(60/180 = 1/3\)
Standard 60 \(60/180 = 1/3\)
Premium 60 \(60/180 = 1/3\)

Totaux par colonne :

Usage hors ligne Total Fréquence
Oui 84 \(84/180 = 7/15 \approx 0{,}467\)
Non 96 \(96/180 = 8/15 \approx 0{,}533\)

3. Fréquences conditionnelles du mode hors ligne sachant la formule

\[ P(\text{oui}\mid \text{Essentiel})=\frac{18}{60}=0{,}30, \] \[ P(\text{oui}\mid \text{Standard})=\frac{30}{60}=0{,}50, \] \[ P(\text{oui}\mid \text{Premium})=\frac{36}{60}=0{,}60. \]

4. Indépendance visuelle

Si les variables étaient indépendantes, on devrait retrouver la même proportion globale d’utilisateurs du mode hors ligne, soit \[ P(\text{oui})=\frac{84}{180}\approx 0{,}467, \] dans chaque formule. Or on observe \(0{,}30\), \(0{,}50\) et \(0{,}60\).

Les profils sont différents : les variables ne semblent pas indépendantes.

Exercice 2

On observe 200 visites d’un site e-commerce. Le tableau croise le temps de chargement de la page d’accueil et l’issue de la visite.

Issue / Temps de chargement Moins de 5 s \([5;10[\) s 10 s ou plus
Achat finalisé 42 33 15
Achat abandonné 18 27 65
  1. Déterminer les effectifs théoriques sous l’hypothèse d’indépendance.
  2. Vérifier la condition de Cochran et calculer la statistique du \(\chi^2\).
  3. Conclure au seuil de 5 %.

Temps conseillé avant de consulter le corrigé : 25 à 30 min

1. Totaux et effectifs théoriques

Totaux lignes :

  • Achat finalisé : \(90\).
  • Achat abandonné : \(110\).

Totaux colonnes :

  • Moins de 5 s : \(60\).
  • \([5;10[\) s : \(60\).
  • 10 s ou plus : \(80\).

Sous \(H_0\) (indépendance), les effectifs théoriques sont \[ e_{ij}=\frac{n_{i\cdot}n_{\cdot j}}{200}. \]

Issue / Temps de chargement Moins de 5 s \([5;10[\) s 10 s ou plus
Achat finalisé \(90\times 60/200 = 27\) \(90\times 60/200 = 27\) \(90\times 80/200 = 36\)
Achat abandonné \(110\times 60/200 = 33\) \(110\times 60/200 = 33\) \(110\times 80/200 = 44\)

2. Condition de Cochran et statistique

Tous les effectifs théoriques sont supérieurs à \(5\), donc la condition de Cochran est satisfaite.

La statistique vaut \[ \chi^2_{obs} = \frac{(42-27)^2}{27} + \frac{(33-27)^2}{27} + \frac{(15-36)^2}{36} + \frac{(18-33)^2}{33} + \frac{(27-33)^2}{33} + \frac{(65-44)^2}{44}. \]

Donc \[ \chi^2_{obs} = \frac{225}{27}+\frac{36}{27}+\frac{441}{36}+\frac{225}{33}+\frac{36}{33}+\frac{441}{44} \approx 39{,}85. \]

3. Décision

Les degrés de liberté sont \[ \nu=(2-1)(3-1)=2. \]

Au seuil de 5 %, la valeur critique est \[ \chi^2_{0{,}95;2}\approx 5{,}991. \]

Comme \[ 39{,}85 \gg 5{,}991, \] on rejette l’hypothèse d’indépendance.

Le temps de chargement et l’issue de la visite sont donc dépendants : les abandons sont beaucoup plus fréquents quand le chargement est long.

2. Intégrales et loi conjointe

Exercice 3

On considère le domaine \[ D=\{(x,y)\in\mathbb{R}^2 : 0\le y\le x\le 2\}. \]

  1. Décrire \(D\) en inversant l’ordre d’intégration.
  2. Calculer \[ I=\iint_D (x+y)\,dx\,dy. \]
  3. Un point est choisi uniformément dans \(D\). Calculer la probabilité de l’événement \(\{Y\le 1\}\).

Temps conseillé avant de consulter le corrigé : 15 à 20 min

1. Domaine avec l’ordre inversé

La description initiale est \[ 0\le y\le x\le 2. \]

Si l’on fixe \(y\), alors \(y\le x\le 2\) et \(y\) varie de \(0\) à \(2\). Donc \[ D=\{(x,y)\in\mathbb{R}^2 : 0\le y\le 2,\ y\le x\le 2\}. \]

2. Calcul de l’intégrale

Avec l’ordre donné : \[ I=\int_0^2\int_0^x (x+y)\,dy\,dx. \]

On calcule l’intégrale intérieure : \[ \int_0^x (x+y)\,dy = xy+\frac{y^2}{2}\Big|_{0}^{x} =x^2+\frac{x^2}{2} =\frac{3x^2}{2}. \]

Ainsi, \[ I=\int_0^2 \frac{3x^2}{2}\,dx =\frac{3}{2}\cdot\frac{x^3}{3}\Big|_0^2 =\frac{2^3}{2} =4. \]

3. Probabilité de \(\{Y\le 1\}\) sous la loi uniforme sur \(D\)

L’aire de \(D\) vaut \[ \mathcal{A}(D)=\int_0^2 x\,dx=2. \]

La région \(\{(x,y)\in D : y\le 1\}\) se décompose en :

  • pour \(0\le x\le 1\), tout le segment \(0\le y\le x\) ;
  • pour \(1\le x\le 2\), le segment \(0\le y\le 1\).

Son aire vaut donc \[ \int_0^1 x\,dx+\int_1^2 1\,dx =\frac{1}{2}+1 =\frac{3}{2}. \]

La probabilité demandée est \[ P(Y\le 1)=\frac{\mathcal{A}(\{(x,y)\in D : y\le 1\})}{\mathcal{A}(D)} =\frac{3/2}{2} =\frac{3}{4}. \]

Exercice 4

Soit \((X,Y)\) un couple de variables continues de densité \[ f(x,y)=c(x+y)\,\mathbf{1}_{[0,1]^2}(x,y). \]

  1. Déterminer la constante \(c\).
  2. Calculer \(P(X+Y\le 1)\).
  3. Calculer \(P(X>Y)\).
  4. Les variables \(X\) et \(Y\) sont-elles indépendantes ?

Temps conseillé avant de consulter le corrigé : 30 à 35 min

1. Normalisation

La densité doit vérifier \[ \int_0^1\int_0^1 c(x+y)\,dy\,dx = 1. \]

Or \[ \int_0^1\int_0^1 (x+y)\,dy\,dx =\int_0^1 \left(x+\frac{1}{2}\right)\,dx =\frac{1}{2}+\frac{1}{2} =1. \]

Donc \[ c=1. \]

2. Probabilité de l’événement \(\{X+Y\le 1\}\)

On intègre sur le triangle \(0\le x\le 1\), \(0\le y\le 1-x\) : \[ P(X+Y\le 1)=\int_0^1\int_0^{1-x} (x+y)\,dy\,dx. \]

L’intégrale intérieure vaut \[ x(1-x)+\frac{(1-x)^2}{2} =\frac{1-x^2}{2}. \]

Donc \[ P(X+Y\le 1)=\int_0^1 \frac{1-x^2}{2}\,dx =\frac{1}{2}\left(1-\frac{1}{3}\right) =\frac{1}{3}. \]

3. Probabilité de l’événement \(\{X>Y\}\)

On intègre sur le triangle \(0\le y\le x\le 1\) : \[ P(X>Y)=\int_0^1\int_0^x (x+y)\,dy\,dx. \]

On obtient \[ \int_0^1 \left(x^2+\frac{x^2}{2}\right)\,dx =\frac{3}{2}\int_0^1 x^2\,dx =\frac{3}{2}\cdot\frac{1}{3} =\frac{1}{2}. \]

4. Indépendance

Les marginales valent \[ f_X(x)=\int_0^1 (x+y)\,dy = x+\frac{1}{2}, \qquad f_Y(y)=\int_0^1 (x+y)\,dx = y+\frac{1}{2}, \] pour \(x,y\in[0,1]\).

Le produit \[ f_X(x)f_Y(y)=\left(x+\frac{1}{2}\right)\left(y+\frac{1}{2}\right) \] n’est pas égal à \(x+y\) sur \([0,1]^2\).

Les variables \(X\) et \(Y\) ne sont donc pas indépendantes.

3. Marginales, conditionnelles et grandeurs numériques

Exercice 5

Soit \((X,Y)\) un couple de densité \[ f(x,y)=2\,\mathbf{1}_{\{0<y<x<1\}}(x,y). \]

  1. Déterminer les densités marginales \(f_X\) et \(f_Y\).
  2. Déterminer la densité conditionnelle \(f_{Y\mid X}(y\mid x)\) pour \(0<x<1\).
  3. Calculer \(E(Y\mid X=x)\).
  4. Les variables \(X\) et \(Y\) sont-elles indépendantes ?

Temps conseillé avant de consulter le corrigé : 20 à 30 min

1. Densités marginales

Pour \(0<x<1\), on a \(0<y<x\), donc \[ f_X(x)=\int_0^x 2\,dy = 2x. \] Ainsi, \[ f_X(x)=2x\,\mathbf{1}_{(0,1)}(x). \]

Pour \(0<y<1\), on a \(y<x<1\), donc \[ f_Y(y)=\int_y^1 2\,dx = 2(1-y). \] Ainsi, \[ f_Y(y)=2(1-y)\,\mathbf{1}_{(0,1)}(y). \]

2. Densité conditionnelle

Pour \(0<y<x<1\), \[ f_{Y\mid X}(y\mid x)=\frac{f(x,y)}{f_X(x)}=\frac{2}{2x}=\frac{1}{x}. \]

Donc \[ f_{Y\mid X}(y\mid x)=\frac{1}{x}\,\mathbf{1}_{(0,x)}(y). \]

3. Espérance conditionnelle

\[ E(Y\mid X=x)=\int_0^x y\frac{1}{x}\,dy =\frac{1}{x}\cdot\frac{x^2}{2} =\frac{x}{2}. \]

4. Indépendance

Le support est triangulaire : \[ \{(x,y):0<y<x<1\}. \]

Il n’est pas rectangulaire, donc l’indépendance est impossible. On peut aussi remarquer que \[ f_X(x)f_Y(y)=4x(1-y) \] ne coïncide pas avec la densité conjointe \(2\) sur le support.

Les variables \(X\) et \(Y\) ne sont pas indépendantes.

Exercice 6

On reprend le couple \((X,Y)\) de l’exercice 5.

  1. Calculer \(E(X)\), \(E(Y)\) et \(E(XY)\).
  2. En déduire \(\operatorname{Cov}(X,Y)\).
  3. Calculer le coefficient de corrélation \(\rho(X,Y)\).

Temps conseillé avant de consulter le corrigé : 30 à 40 min

1. Espérances

À partir de la marginale de \(X\) : \[ E(X)=\int_0^1 x\cdot 2x\,dx = 2\int_0^1 x^2\,dx = \frac{2}{3}. \]

À partir de la marginale de \(Y\) : \[ E(Y)=\int_0^1 y\cdot 2(1-y)\,dy =2\int_0^1 (y-y^2)\,dy =2\left(\frac{1}{2}-\frac{1}{3}\right) =\frac{1}{3}. \]

Pour \(E(XY)\) : \[ E(XY)=\int_0^1\int_0^x 2xy\,dy\,dx =\int_0^1 x\left(y^2\Big|_0^x\right)\,dx =\int_0^1 x^3\,dx =\frac{1}{4}. \]

2. Covariance

\[ \operatorname{Cov}(X,Y)=E(XY)-E(X)E(Y) =\frac{1}{4}-\frac{2}{3}\cdot\frac{1}{3} =\frac{1}{4}-\frac{2}{9} =\frac{1}{36}. \]

3. Corrélation

On calcule d’abord les variances.

Pour \(X\) : \[ E(X^2)=\int_0^1 x^2\cdot 2x\,dx = 2\int_0^1 x^3\,dx = \frac{1}{2}, \] donc \[ \operatorname{Var}(X)=\frac{1}{2}-\left(\frac{2}{3}\right)^2 =\frac{1}{2}-\frac{4}{9} =\frac{1}{18}. \]

Pour \(Y\) : \[ E(Y^2)=\int_0^1 y^2\cdot 2(1-y)\,dy =2\int_0^1 (y^2-y^3)\,dy =2\left(\frac{1}{3}-\frac{1}{4}\right) =\frac{1}{6}, \] donc \[ \operatorname{Var}(Y)=\frac{1}{6}-\left(\frac{1}{3}\right)^2 =\frac{1}{6}-\frac{1}{9} =\frac{1}{18}. \]

Le coefficient de corrélation vaut alors \[ \rho(X,Y)=\frac{\operatorname{Cov}(X,Y)}{\sigma_X\sigma_Y} =\frac{1/36}{\sqrt{1/18}\sqrt{1/18}} =\frac{1/36}{1/18} =\frac{1}{2}. \]

On obtient donc une corrélation linéaire positive modérée.

4. Indépendance et convolution

Exercice 7

Soit \((X,Y)\) un couple de densité \[ f(x,y)=4xy\,\mathbf{1}_{[0,1]^2}(x,y). \]

  1. Déterminer \(f_X\) et \(f_Y\).
  2. Montrer que \(X\) et \(Y\) sont indépendantes.
  3. Calculer \(P\left(X\le \frac{1}{2},\,Y\le \frac{3}{4}\right)\).
  4. Calculer \(P(Y\le X)\).

Temps conseillé avant de consulter le corrigé : 15 à 20 min

1. Marginales

Pour \(x\in[0,1]\) : \[ f_X(x)=\int_0^1 4xy\,dy = 4x\cdot\frac{1}{2}=2x. \]

Pour \(y\in[0,1]\) : \[ f_Y(y)=\int_0^1 4xy\,dx = 4y\cdot\frac{1}{2}=2y. \]

Donc \[ f_X(x)=2x\,\mathbf{1}_{[0,1]}(x), \qquad f_Y(y)=2y\,\mathbf{1}_{[0,1]}(y). \]

2. Indépendance

Sur \([0,1]^2\), \[ f_X(x)f_Y(y)=(2x)(2y)=4xy=f(x,y). \]

La densité conjointe se factorise : les variables \(X\) et \(Y\) sont indépendantes.

3. Probabilité sur un rectangle

Par indépendance : \[ P\left(X\le \frac{1}{2},\,Y\le \frac{3}{4}\right) =P\left(X\le \frac{1}{2}\right)P\left(Y\le \frac{3}{4}\right). \]

Or \[ P\left(X\le \frac{1}{2}\right)=\int_0^{1/2}2x\,dx=\frac{1}{4}, \] et \[ P\left(Y\le \frac{3}{4}\right)=\int_0^{3/4}2y\,dy=\frac{9}{16}. \]

Donc \[ P\left(X\le \frac{1}{2},\,Y\le \frac{3}{4}\right)=\frac{1}{4}\cdot\frac{9}{16}=\frac{9}{64}. \]

4. Probabilité de l’événement \(\{Y\le X\}\)

On peut intégrer directement : \[ P(Y\le X)=\int_0^1\int_0^x 4xy\,dy\,dx =\int_0^1 2x^3\,dx =\frac{1}{2}. \]

On retrouve aussi ce résultat par symétrie entre \(X\) et \(Y\).

Exercice 8

Soient \(X\) et \(Y\) deux variables indépendantes de loi uniforme sur \([0,1]\). On pose \[ S=X+Y. \]

  1. Déterminer la densité de \(S\) par convolution.
  2. Calculer \[ P\left(\frac{1}{2}\le S\le \frac{3}{2}\right). \]

Temps conseillé avant de consulter le corrigé : 20 à 25 min

Comme \(X\) et \(Y\) sont indépendantes et de densité \[ f_X(x)=f_Y(x)=\mathbf{1}_{[0,1]}(x), \] la densité de \(S=X+Y\) est donnée par la convolution \[ f_S(t)=\int_{\mathbb{R}} f_X(x)f_Y(t-x)\,dx. \]

1. Densité de \(S\)

Pour \(0\le t\le 1\), la condition \(0\le x\le 1\) et \(0\le t-x\le 1\) donne \(0\le x\le t\), donc \[ f_S(t)=\int_0^t 1\,dx = t. \]

Pour \(1\le t\le 2\), on a \(t-1\le x\le 1\), donc \[ f_S(t)=\int_{t-1}^1 1\,dx = 2-t. \]

En dehors de \([0,2]\), la densité vaut \(0\). Ainsi, \[ f_S(t)= \begin{cases} 0 & \text{si } t<0,\\ t & \text{si } 0\le t\le 1,\\ 2-t & \text{si } 1\le t\le 2,\\ 0 & \text{si } t>2. \end{cases} \]

2. Probabilité demandée

\[ P\left(\frac{1}{2}\le S\le \frac{3}{2}\right) =\int_{1/2}^1 t\,dt+\int_1^{3/2}(2-t)\,dt. \]

On obtient \[ \int_{1/2}^1 t\,dt =\frac{1}{2}\left(1-\frac{1}{4}\right) =\frac{3}{8}, \] et \[ \int_1^{3/2}(2-t)\,dt =\left(2t-\frac{t^2}{2}\right)\Big|_1^{3/2} =\frac{3}{8}. \]

Donc \[ P\left(\frac{1}{2}\le S\le \frac{3}{2}\right)=\frac{3}{8}+\frac{3}{8}=\frac{3}{4}. \]

Pour aller plus vite en autonomie

Réflexes à systématiser
  1. En statistique bivariée, commencez toujours par les marginales, puis les conditionnelles.
  2. En continu, dessinez d’abord le support ou la région d’intégration avant toute formule.
  3. Pour l’indépendance, ne concluez jamais sur une intuition seule : vérifiez la factorisation.
  4. Pour la covariance, calculez séparément \(E(X)\), \(E(Y)\) et \(E(XY)\).
  5. Pour une somme de variables indépendantes, pensez immédiatement à la convolution.