a) - Examen corrige
les corrigés du test et de l'examen de janvier ; des rendez-vous individuels .....
celles de l'analyse chronologique menant à l'économétrie des séries temporelles
.
part of the document
ves possibles pour répondre à une question, des résultats de leurs propres calculs ou des calculs avancés par dautres ;
à être rationnel et efficace dans lorganisation du travail spécifique du statisticien.
Méthodes pédagogiques
Visent à tempérer le caractère rébarbatif dun cours technique ex-cathédra donné simultanément à plus ou moins 350 étudiants.
Sont organisé(e)s et/ou rendus disponibles :
un TEST formatif et non évaluatif, fin octobre ; une séance de correction et remédiation après le TEST de fin octobre ;
la solution finale de la plupart des exercices du syllabus dexercices pour l(auto)contrôle de lassimilation de la matière ;
des exemples développés au cours, si possible en petits groupes encadrés ;
des exercices tirés des énoncés des examens des sessions récentes, certains corrigés seront mis à disposition et éventuellement commentés ;
un corrigé complet dexercices tirés du syllabus dexercices, des énoncés des examens des sessions précédentes avec une proposition de correction : disponibles et téléchargeables sur le site Internet des FUNDP (adresse : HYPERLINK http://fundp.ac.be/~jcjacque/index.html http://fundp.ac.be/~jcjacque/index.html). (N.B. La liste des nouveaux documents éventuellement produits cette année-ci sera affichée aux valves et mise à jour en fonction de lévolution de la production de ces documents) ;
deux séances questions-réponses : lundi 15 octobre et lundi 17 décembre 2001 de 10h45 à 12h40,
;
les corrigés du test et de lexamen de janvier ; des rendez-vous individuels seront possibles (et même - pour certains - obligatoires) avec les correcteurs ;
le support des assistants (voir détails ultérieurs aux valves pour horaires des quatre séances, coordonnées personnelles et heures de permanence ou modalités de rencontres).
Evaluation
Test : fin octobre : évaluation uniquement formative. Durée 1h.
Examen :
1ère session en janvier : obligatoire en Sc. éco. et de gestion, Sc. pol., soc. et de la communication ; faculté de le présenter en janvier OU en mai-juin pour orientation informatique et ing. en gestion ;
2ème session : août : pour tous. Durée 2h30.
Consignes :
Livre ouvert. (Sauf pour léventuelle partie mémorisation/restitution).
Calculatrices sans aucun module de communication (infra-rouge ou autre,
).
Téléphones mobiles (g.s.m., satellites, beepers,
) totalement éteints et objectivés.
Lors des examens quatre exercices (cotés chacun sur 25 points) dune certaine ampleur couvrant les trois parties de la matière sont proposés.
Le test est basé sur deux exercices similaires à des questions dexamen et cotés de la même façon.
Critères dévaluation :
rigueur dans le calcul,
respect des consignes et des énoncés,
qualité des interprétations demandées.
Possibilité de consultation de la copie corrigée et de rencontre (parfois obligatoire) avec le(s) correcteur(s).
Agrégation des cotes de statistique et de probabilités. Attention aux reports non groupés qui pourraient encore être non communiqués via le bulletin cette année-ci.
Offre pédagogique intersessions.
Année académique 2001 2002
Calendrier du cours de Statistique générale
Cours n°1 Lundi 17 septembre Horaire normal
Cours n°2 Vendredi 21 septembre 14h 16h
Cours n°3 Lundi 24 septembre Horaire normal
Cours n°4 Vendredi 28 septembre 14h 16h
Cours n°5 Lundi 1 octobre Horaire normal
Cours n°6 Vendredi 5 octobre 14h 16h
Cours n°7 Lundi 8 octobre Horaire normal
Lundi 15 octobre Horaire normal Préparation du test : Q/R
Lundi 22 octobre Tests
Cours n°8 Lundi 29 octobre Horaire normal
Cours n°9 Lundi 5 novembre Horaire normal
Cours n°10 Lundi 12 novembre Horaire normal
Cours n°11 Lundi 19 novembre Horaire normal
Cours n°12 Lundi 26 novembre Horaire normal
Cours n°13 Lundi 3 décembre Horaire normal
Cours n°14 Lundi 10 décembre Horaire normal
Lundi 17 décembre Horaire normal Séance Q/R
NB : Certains cours (5 max.) pourraient être consacrés à des exercices en petits groupes encadrés permettant une assimilation intégrée de la matière et une préparation continue de lexamen. Cependant, une telle organisation suppose des ressources humaines non encore disponibles à ce jour (3 septembre 2001).
Documents disponibles et référence bibliographique
Un « syllabus » : photocopie des « écrans » projetés au cours.
Un recueil dexercices.
Les documents téléchargeables à partir de la page web : HYPERLINK http://fundp.ac.be/~jcjacque/index.html http://fundp.ac.be/~jcjacque/index.html
Le manuel de référence du cours (très bon exception faite de son caractère lacunaire en exercices) :
DELMAS B., Statistique descriptive, Paris, Nathan Université, 2ème édition, 2000.
(La première édition (1996), même titre et même éditeur, convient également)
Plan général du cours
Introduction
Modalités pratiques de la formation et de lévaluation
La statistique : définition(s), perspective historique, généralités
Partie I : Séries de fréquences (univariées et bivariées)
CHAPITRE 1. LES SERIES DE FREQUENCES UNIVARIEES
SECTION 1 : PRESENTATION DUNE SERIE
SECTION 2 : PARAMETRES DE POSITION
SECTION 3 : PARAMETRES DE DISPERSION
SECTION 4 : PARAMETRES DE FORME
SECTION 5 : MESURE DE LA CONCENTRATION
CHAPITRE 2. LES SERIES DE FREQUENCES BIVARIEES
SECTION 1 : PRESENTATION DES SERIES, LE TABLEAU DE CONTINGENCE
SECTION 2 : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES
SECTION 3 : REPRESENTATION GRAPHIQUE
SECTION 4 : PARAMETRES DESCRIPTIFS DES DISTRIBUTIONS
SECTION 5 : ANALYSE DES LIENS ENTRE LES VARIABLES
SECTION 6 : LAJUSTEMENT LINEAIRE, LA REGRESSION LINEAIRE SIMPLE
Partie II : Chroniques (séries temporelles)
CHAPITRE 1. taux de croissance et indices simples
CHAPITRE 2. indices synthétiques
CHAPITRE 3. lissages et décomposition des chroniques
La statistique : définition(s) et perspective historique
Définition : la statistique est une mesure calculée à partir de données provenant dun échantillon
Autres utilisations du terme :
La statistique représente lensemble de la théorie statistique qui traite des propriétés des populations.
Exemple : la proportion de fumeurs dans une population, la proportion de personnes atteintes dune maladie respiratoire dans la même population, la relation éventuelle qui existe entre ces deux proportions.
Les statistiques représenteront alors un ensemble de données disponibles à propos dun phénomène déterminé.
Dans lexemple : lépidémiologie du cancer de la gorge et des poumons.
Sens moderne : ensemble des techniques devant conduire à lacquisition de connaissances générales à partir de données (incomplètes le plus souvent) à partir dun système scientifique rigoureux guidant le recueil des données, leur organisation, leur analyse et leur interprétation, pour autant quon puisse leur donner une valeur numérique.
Deux grands sous-ensembles :
la statistique descriptive ou générale (lobjet de ce cours) ;
la statistique stochastique ou inférentielle .
Bref historique : le terme « statistique » dérive du latin « status » (létat).
Utilisé pour la première fois en 1589 en Italie par lhistorien Girolamo Ghilini mais une statistique commune, la moyenne arithmétique était déjà utilisée au IIIème siècle avant J.C. par les astronomes babyloniens.
Développée, sous le nom darithmétique politique à partir de 1660 pour décrire des phénomènes économiques et démographiques.
Essor au XIXème siècle suite au développement des sciences expérimentales et humaines.
Devenue une discipline à part entière au XXème siècle vu la richesse et la diversité des techniques et méthodes. Première encyclopédie en 1978.La statistique : généralités
On abordera successivement :
La méthode dinvestigation statistique.
La notion de caractéristique (variable) statistique, ses modalités (valeurs) et les échelles de mesure.
Les données statistiques : collecte et fiabilité.
La présentation des nombres.
La méthode dinvestigation statistique.
Définition : la méthode dinvestigation statistique est une méthode générale de recherche visant à lobservation, la description et lanalyse des caractéristiques (variables) relatives à des ensembles, des phénomènes collectifs, appelés généralement des POPULATIONS.
On sintéresse donc aux propriétés des populations dans leur ensemble et on ne se préoccupe pas des propriétés individuelles de chaque personne ou objet faisant partie de cette population.
N.B. 1 : La statistique est une discipline ayant trait à des données numériques, les modalités des caractéristiques de la population étudiée sont exprimées (mesurées, codées) numériquement.
N.B. 2 : Le champ dinvestigation est toujours collectif, il porte sur des « populations » déléments ou objets, appelés généralement des unités statistiques ou cas ou encore « individus ».
N.B. 3 : En économie et dans les sciences sociales, la méthode diffère fortement de la démarche statistique utilisée dans les sciences naturelles, en effet :
Le chercheur ne contrôle pas les données de base.
Les objets détude sont souvent des sujets, induisant donc une possibilité de biais en réaction à lexpérience.
Au moins une unité de mesure est non constante dans le temps nécessitant des techniques de construction dindices.
But de la statistique : aide à la décision.
La base de la méthode est linformation statistique brute, cest-à-dire lobservation pour chaque individu appartenant à la population des modalités des caractéristiques intéressant le décideur.
La méthode dinvestigation de la statistique descriptive en économie et dans les sciences sociales est une démarche non expérimentale qui nexplique jamais mais simplifie et constate. Elle ne peut donc jamais dispenser dune élaboration théorique.
Note sur la prudence des commentaires
En sciences sociales, les sources derreur dans lobservation, le codage ou la mesure des modalités des caractéristiques sont nombreuses.
Elles peuvent sadditionner et pas nécessairement sannuler, amplifiant éventuellement les écarts par rapport à la réalité :
Exemples de leffet multiplicateur des erreurs dO. Morgenstern :
Exemple numérique :
Soit les deux systèmes déquations :
(x y = 1
(
(x (1,00001 . y) = 0 solution : x = 100 001 , y = 100 000
(x y = 1
(
(x (0,99999 . y) = 0 solution : x = - 99 999 , y = - 100 000
Les approximations du taux de croissance
Soit un PNB évoluant entre t0 et t1.
Soit P0, lestimation du PNB en t0 = 550 Gmon, et
P1, lestimation du PNB en t1 = 560 Gmon.
Lestimation du taux de croissance apparent = 1,8% = (560-550)/550.
Supposons quune erreur de mesure de maximum ( 5% puisse avoir été commise, on obtient les intervalles suivants sur la valeurs possibles de P0 et de P1 : P0 ([522,5, 577,5] et P1 ([532, 588].
Lintervalle potentiel des valeurs du taux de croissance sétablit à :
[-7,9 %, 12,5%] (-7,9 % = (532-577,5)/577,5 et 12,5% = (588-522,5)/522,5.)
Il en résulte donc des règles de comportement importantes :
Fournir (quand cest possible) lordre de grandeur de lerreur.
Pas de manipulations sophistiquées et coûteuses sur des données peu fiables.
Pas de conclusions péremptoires à propos de faibles variations.
Il importe dêtre rigoureux et extrêmement précis dans les manipulations intermédiaires
La notion de caractéristique (variable) statistique, ses modalités (valeurs) et les échelles de mesure.
Définitions
La statistique observe et analyse les modalités des caractéristiques dune population. Par exemple : les revenus des ménages, lâge des personnes, la couleur des objets.
La caractéristique étudiée peut connaître plusieurs modalités, prendre certaines valeurs ou, plus généralement, états (non nécessairement mesurables quantitativement), cette caractéristique est appelée variable (statistique), habituellement notée xi.
Le relevé statistique de base est donc lenregistrement, pour chaque unité statistique, de la (dans le cas de séries de fréquences univariées) ou des (dans le cas de séries de fréquences bi- ou multivariées) valeur(s) prise(s) par la (les) variable(s) étudiée(s) dans la population.
Types de variables
On distingue trois types de variables :
les variables qualitatives ;
les variables quantitatives :
discrètes ;
continues.
SynthèseVariableDiscrèteContinueQualitativeQualitative discrèteImpossibleQuantitativeQuantitative discrèteQuantitative continue
Les variables qualitatives.
Les variables qualitatives sont caractérisées par des modalités « non mesurables » correspondant à des rubriques dune nomenclature définie a priori.
Exemples : létat civil dune personne, la couleur des cheveux, la nationalité, la profession, etc.
Les variables binaires (oui/non, vrai/faux,
) ou dichotomiques en sont un cas particulier important.
Lensemble des valeurs que peut prendre une variable qualitative est appelé la nomenclature de la variable.
On peut représenter numériquement les valeurs dune variable qualitative par un codage arbitraire.
Leur échelle de mesure (voir infra § suivant) est soit nominale (ex. : bleu, blanc, rouge), cas le plus fréquent, soit parfois ordinale (ex. : petit, moyen, gros).
Les variables quantitatives.
Les variables quantitatives sont caractérisées par des modalités mesurables, cest-à-dire exprimées en unités de mesure physiques ou monétaires.
N.B. : les unités de mesure monétaires permettent dagréger des variables non homogènes en agrégats de valeurs : P.N.B, importations, panier de la ménagère,
Il faut cependant toujours en donner la référence de date et de lieu.
On distingue deux types de variables quantitatives :
Les variables quantitatives discrètes :
Leurs valeurs sont des nombres isolés, souvent entiers.
Exemples : le nombre denfants dans une famille, le nombre dannées détudes dun adulte,
Les variables quantitatives continues :
Leurs valeurs sont toutes les valeurs possibles dans un intervalle.
Exemples : le poids dun objet, la distance parcourue par un navire, le temps passé dans un embouteillage,
Remarques importantes :
La mesure des grandeurs continues est souvent discrète à cause de la (faible précision des instruments de mesure. (Ex. : âge, taille, poids,
)
Pour regrouper certaines observations, on utilise la technique du regroupement en classes.
La frontière est souvent floue entre variables qualitatives et variables quantitatives. (Ex. : classe dâge, de revenu,
)
Léchelle de mesure est plus élaborée que dans le cas des variables qualitatives, il peut sagir déchelles dintervalle ou déchelles proportionnelles (voir § suivant).
Les échelles de mesure
On distingue dhabitude 4 types déchelle de mesure : les « échelles » nominales, les échelles ordinales, dintervalle et proportionnelles.
Les « échelles » nominales
Ces « échelles » listent les modalités des caractéristiques des individus sans que lordre de ces modalités soit porteur de signification. Elles sont souvent associées à des variables qualitatives.
Donc « échelle » est ici un terme impropre.
Exemples : état civil, catégorie socioprofessionnelle,
Opérations autorisées :
Recodage.
Comptage des effectifs et calcul des fréquences. (voir infra)
Calcul du mode. (voir infra)
Construction et exploitation de tableaux de contingence. (voir infra)
N.B. !!! la moyenne ne signifie rien !!!
Les échelles ordinales
Ces échelles sont similaires aux « échelles » nominales à lexception près quune relation dordre existe entre les modalités de la variable considérée.
Exemples : niveaux dinstruction, classement des préférences,
Opérations autorisées :
Idem « échelles » nominales.
Transformations monotones (qui préservent lordre).
Calcul de rang : médiane, quartiles, percentiles. (voir infra)
N.B. !!! la moyenne, la différence ou le rapport ne signifient rien !!!
Les échelles dintervalle
Ces échelles sont similaires aux échelles ordinales à lexception près que la différence entre deux valeurs de la variable a du sens mais pas leur rapport. Le zéro est arbitraire et ne signifie pas labsence du phénomène.
Exemples : températures, échelles dattitude,
Opérations autorisées : toutes sauf le calcul de rapports.
Les échelles proportionnelles (de rapport, métriques)
Ces échelles possèdent un zéro naturel qui signifie labsence du phénomène.
Exemples : revenu, masse,
Opérations autorisées : toutes.
La dimension espace-temps
La constitution du relevé statistique de base peut se réaliser de différentes manières, en particulier dans ses dimensions spatio-temporelles. Selon que lune et/ou lautre option est choisie, les méthodes statistiques différent.
Les chroniques (voir infra Partie II)
Si les observations statistiques sont relevées en fonction du temps et classées suivant lordre croissant de leurs dates, on parle de chroniques (séries chronologiques, séries temporelles, time-series).
Les techniques mises en uvre sont celles de lanalyse chronologique menant à léconométrie des séries temporelles.
Exemples : lindice des prix à la consommation, le P.N.B. de la Belgique,
Les séries de fréquences (voir infra Partie I)
Si les observations statistiques sont relevées à un moment donné du temps, à travers « lespace », au sens large, et quune correspondance est établie entre les valeurs des variables et le nombre de fois que cette valeur est observée dans la population, on parle de séries de fréquences (coupe transversale, cross-section data).
Les techniques mises en uvre sont celles de lanalyse des données.
Exemples : le prix du pain, relevé aujourdhui, dans chaque boulangerie de la ville,
Les panels
La combinaison de chroniques et de coupes transversales fournit des panels.
Les techniques mises en uvre sont celles de lanalyse de panels.
Exemple : pour chaque année depuis 1970 à aujourdhui, le relevé des PIB de tous les pays de lUnion Européenne,
Les données statistiques : collecte et fiabilité.
Méthodes de collecte
Le recensement : collecte exhaustive.
Lexploitation de sources administratives constituées à dautres fins.
Le sondage, lenquête.
Exemples :
La fiabilité des données
Conditionne (voir supra) la qualité des résultats des différentes étapes de la démarche statistique.
Problèmes rencontrés :
Lerreur systématique : méthode inappropriée ou approximations inadéquates, ...
La non homogénéité : à un même intitulé correspondent des définitions changeantes en fonction du lieu de collecte,
Linstabilité : modification de la définition ou de la méthode de collecte sans changement dintitulé.
Attitude conseillée :
Prudence (cfr supra).
Critique.
Erudition.
Présentation des nombres.
Notation scientifique
Lobjectif de ce type de notation est de conserver le maximum de chiffres significatifs lors des opérations de calcul.
Le nombre est représenté comme un multiple de 10n, n entier qcq non nul.
N > 0 ( un déplacement vers la droite du point (de la virgule) décimal(e) de n positions (shift right).
N < 0 ( un déplacement vers la gauche du point (de la virgule) décimal(e) de n positions (shift left).
Très souvent la multiplication par 10n se représente par En.
Exemples :
98.000 = 98.103 = 98 E+3 ou 0,98 E+5
0,000443 = 443 E-6 ou 0,443 E-3
Les règles de calcul sont similaires à celles du calcul des puissances :
(0,3 E+8) . (0,5 E-5) = 0,15 E+3
Le degré de précision dans les calculs et résultats
Par nature, la mesure dune valeur (à lexception dun comptage) est établie avec un degré limité de précision.
Le choix du nombre de chiffres significatifs, quand il est possible, conditionne la précision de la mesure. Ainsi dire de quelquun quil mesure 1,75 m consiste à arrondir sa vraie taille au cm près, ou encore affirmer que sa vraie taille est comprise dans lintervalle [1,745 m, 1,755 m[.
Certaines données sont ambiguës, ainsi 186.000 peut comporter 3, 4, 5 ou 6 chiffres significatifs.
N.B. : attention à la précision artificielle générée par les calculs,
Exemple : soit les tailles de trois personnes mesurées au cm près : 1,75, 1,78 et 1,89 m. La taille moyenne « exacte » calculée sur ces données = 1,81667 m. Ce résultat donne limpression dune précision au 100e de mm alors que la précision des données de base est de lordre du cm.
Règles daction :
Le résultat ne peut être plus précis que les données originales.
Pour les additions et les soustractions, le résultat final ne peut avoir plus de chiffres significatifs après le point (la virgule) décimal(e) que nen a le nombre qui, dans lopération, possède le moins de chiffres significatifs après le point (la virgule) décimal(e).
Exemple : Ya = 873 382 Mons et Yb = 3 581 KMons, alors Ya + Yb ( 4.454.382 Mons mais est = 4.454 KMons.
Pour les multiplications, divisions extractions de racines, etc., le résultat ne peut posséder plus de chiffres significatifs au total que le nombre qui, dans lopération, a le moins de chiffres significatifs.
Exemple : Cat0 = 325 KMons et Cat1 = 413 KMons, on cherche à calculer le taux daccroissement de CA entre t0 et t1 = [(413-325)/325].100 = 27,1 % et non 27,07692308 %.
Kendall, M. G., Where shall the history of Statistics begin ? , Biometrika, 1960, Vol. 47, pp.447-449.
Kruksal, W.H. et Tanur, J.M., International Encyclopedia of Statistics, New-York, The Free Press, 1978.
Introduction : modalités de la formation I. PAGE 5
DATE \@ "dd/MM/yy" 06/05/02
Introduction : définition et perspective historique I. PAGE 6
Introduction : généralités : la méthode dinvestigation I. PAGE 9
Introduction : généralités : les variables statistiques I. PAGE 12
Introduction : généralités : les échelles de mesure I. PAGE 13
Introduction : généralités : la dimension espace-temps I. PAGE 15
Introduction : généralités : les données statistiques I. PAGE 16
Introduction : généralités : présentation des nombres I. PAGE 18