Statistiques
Les statistiques se divisent en deux branches complémentaires : la statistique descriptive, qui résume et visualise les données observées, et la statistique inférentielle, qui utilise un échantillon pour tirer des conclusions sur une population entière. Cette page présente l’articulation entre ces deux volets dans le cours.
“Tous les modèles sont faux, mais certains sont utiles.” — George E. P. Box
Les statistiques fournissent les outils pour collecter, résumer et interpréter des données. Ce cours distingue deux grandes branches.
Statistique descriptive
La statistique descriptive consiste à résumer un jeu de données à l’aide d’indicateurs numériques (moyenne, variance, médiane, quartiles) et de représentations graphiques (histogrammes, diagrammes en boîte, nuages de points).
- Statistiques descriptives à une variable — séries discrètes et continues, effectifs, fréquences, indicateurs de position et de dispersion.
- Statistiques descriptives à deux variables — tableaux de contingence, distributions marginales et conditionnelles, indépendance, test du \(\chi^2\).
Statistique inférentielle
La statistique inférentielle utilise un échantillon pour estimer les paramètres d’une loi parente et quantifier l’incertitude de ces estimations. Elle repose sur les théorèmes de convergence étudiés dans la partie probabilités du cours.
- Distribution d’échantillonnage — échantillon i.i.d., moyenne et variance empiriques, lois exactes en cas gaussien.
- Estimation ponctuelle et par intervalle de confiance — propriétés des estimateurs, méthode des moments, maximum de vraisemblance, intervalles de confiance.