

Cours de Statistiques - Séance 1 :
Introduction à la statistique et aux données
Objectif général du cours
Acquérir les bases de la statistique descriptive et les premiers outils d’analyse de données.
1. Objectifs pédagogiques de la séance
À l’issue de cette séance, l’étudiant doit être capable de :
-
Expliquer ce qu’est la statistique et à quoi elle sert ;
-
Identifier les principaux domaines d’application de la statistique ;
-
Distinguer population, échantillon et individu statistique ;
-
Reconnaître et classer les types de variables statistiques ;
-
Comprendre la notion de biais et d’erreur dans la collecte des données.
-
2. Introduction : Pourquoi faire des statistiques ?
La statistique est une discipline scientifique qui permet de :
-
Collecter des données,
-
Organiser des données,
-
Analyser des données,
-
Interpréter des données afin d’aider à la prise de décision.
Exemples concrets :
-
En économie : étude du chômage, de l’inflation
-
En santé : efficacité d’un traitement
-
En sciences sociales : enquêtes d’opinion
-
En gestion : analyse des ventes, performance d’une entreprise
-
En sciences naturelles : mesures biologiques, environnementales
👉 Idée clé : la statistique transforme des données brutes en information utile.
3. Définition et utilité de la statistique
Définition
La statistique est l’ensemble des méthodes permettant de recueillir, traiter, analyser et interpréter des données numériques ou qualitatives relatives à un phénomène.
Rôles principaux :
-
Décrire une situation (statistique descriptive),
-
Comparer des groupes,
-
Dégager des tendances,
-
Aider à la décision.
4. Notions fondamentales
4.1 Individu statistique
Un individu statistique est l’unité sur laquelle on observe un phénomène.
Exemples :
-
Une personne dans une enquête,
-
Un étudiant dans une classe,
-
Une entreprise dans une étude économique.
4.2 Population statistique
La population est l’ensemble de tous les individus concernés par l’étude.
Exemples :
-
Tous les étudiants de L1 d’une université,
-
L’ensemble des ménages d’un pays.
4.3 Échantillon
Un échantillon est une partie de la population, choisie pour représenter celle-ci.
On étudie souvent un échantillon car :
-
La population est trop grande,
-
Le coût ou le temps est limité.
Un bon échantillon doit être représentatif.
5. Types de variables statistiques
Une variable statistique est une caractéristique observée sur chaque individu.
5.1 Variables qualitatives
Elles décrivent une qualité ou une catégorie.
a) Variables qualitatives nominales
-
Pas d’ordre logique.
-
Exemples :
-
Sexe (homme/femme),
-
Nationalité,
-
Groupe sanguin.
-
b) Variables qualitatives ordinales
-
Il existe un ordre logique.
-
Exemples :
-
Niveau d’étude (primaire, secondaire, supérieur),
-
Satisfaction (faible, moyenne, élevée).
-
5.2 Variables quantitatives
Elles expriment une quantité numérique.
a) Variables quantitatives discrètes
-
Prennent des valeurs entières.
-
Exemples :
-
Nombre d’enfants,
-
Nombre d’absences.
-
b) Variables quantitatives continues
-
Peuvent prendre une infinité de valeurs dans un intervalle.
-
Exemples :
-
Taille,
-
Poids,
-
Durée.
-
Tableau récapitulatif
Type de variable
Sous-type
Exemple
Qualitative
Nominale
Sexe
Qualitative
Ordinale
Mention
Quantitative
Discrète
Nombre d’étudiants
Quantitative
Continue
Taille
6. Notion de biais et d’erreur
6.1 Erreur statistique
Différence entre la valeur observée et la valeur réelle.
Causes possibles :
-
Erreurs de mesure,
-
Erreurs de saisie,
-
Erreurs d’interprétation.
6.2 Biais statistique
Un biais est une erreur systématique qui fausse les résultats.
Exemples :
-
Echantillon non représentatif,
-
Questions orientées dans un questionnaire,
-
Exclusion d’une partie de la population.
Idée clé : un résultat statistique peut être faux même avec beaucoup de données si le biais est présent.
7. Travaux dirigés (TD)
Exercice 1 : Identifier les types de variables
Pour chaque variable, préciser son type :
-
Âge d’un étudiant
-
Sexe
-
Mention au bac
-
Nombre de frères et sœurs
-
Poids
(Correction attendue en fin de TD)
Exercice 2 : Constitution d’un jeu de données
En groupe :
-
Choisir une population (ex : étudiants de la classe),
-
Définir 5 variables (au moins 1 de chaque type),
-
Collecter les données sur 10 individus,
-
Présenter le tableau de données.
8. Conclusion de la séance
-
La statistique est un outil essentiel d’analyse de la réalité.
-
Toute étude statistique repose sur des données bien définies.
-
La compréhension des types de variables est indispensable pour la suite du cours.
-
Les notions vues aujourd’hui seront utilisées dans toutes les séances suivantes.


.png)