of 106

Le traitement statistique?

0 views
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Share
Description
Le traitement statistique? Diversité des données QUANTITATIVES : Les données quantitatives utilisées par la recherche peuvent être diverses. Elles peuvent être numériques (notes, fréquence cardiaque, pression
Transcript
Le traitement statistique? Diversité des données QUANTITATIVES : Les données quantitatives utilisées par la recherche peuvent être diverses. Elles peuvent être numériques (notes, fréquence cardiaque, pression artérielle, etc.). Dans le cas d un travail quantitatif, des calculs statistiques peuvent être envisagés. Il existe des outils informatiques de traitement de données (SPSS, Statistica ). TRAITEMENT et analyse des données Dans le cas d un travail QUALITATIF, on pourra procéder à une analyse de contenu, une analyse de discours. En associant une idée à un ensemble d indicateurs, celle-ci peut être repérée dans un texte de façon objective (logiciel SPHYNX). TRAITEMENT STATISTIQUE des DONNÉES : Les données quantitatives sont traitées, à un premier stade, par les statistiques descriptives simples. Celles-ci permettent de connaître les critères de POSITION des données (pourcentage, moyenne, etc.) et les critères de DISPERSION (écart-type, variance, etc.). POURCENTAGE On utilise le pourcentage lorsqu'un nombre représente une proportion ou une fraction d'un ensemble. Un pourcentage est une manière d'exprimer un nombre comme une fraction de cent en utilisant le signe %. On compare une valeur particulière à une VALEUR DE RÉFÉRENCE et on cherche à déterminer ce que vaudrait cette valeur particulière si la valeur de référence était ramenée à 100, tout en respectant les proportions. POURCENTAGE Avec un vocabulaire de statistique descriptive, on peut dire qu'on compare une population partielle à une population totale et que l'on cherche à déterminer ce que vaudrait cette population partielle si la population totale était ramenée à 100 tout en respectant les proportions. Prenons l exemple de deux classes de 6è pour lesquelles on veut évaluer le niveau en mathématiques. Dans la 6è1, il y a 36 élèves et dans la 6è4, il y en a 29. Dire que 12 élèves sur 36 ont la moyenne alors que 8 élèves sur 29 pour l autre classe l ont obtenue signifie quoi? En pourcentages, on obtient : 33 % pour la 6è1 et 27 % pour la 6è4. MOYENNE La moyenne est une mesure statistique. Elle exprime la grandeur qu'auraient chacun des membres de l'ensemble s'ils étaient tous identiques sans changer la dimension globale de l'ensemble. La moyenne est la valeur unique que devraient avoir tous les individus d'une population (ou d'un échantillon) pour que leur total soit inchangé. C'est un critère de position. MOYENNE La moyenne arithmétique est la moyenne «ordinaire», c'est-à-dire la somme des valeurs numériques (de la liste) divisée par le nombre de ces valeurs numériques. La moyenne est utilisée en évaluation scolaire. Dans de nombreux systèmes scolaires, une partie de l'évaluation des élèves débouche sur une note chiffrée. ÉCART-TYPE L'écart-type sert à mesurer la dispersion d'un ensemble de données autour de la moyenne. Par exemple, la répartition des notes d'une classe. Dans ce cas, plus l'écart-type est faible, plus la classe est HOMOGÈNE. À l'inverse, on peut souhaiter avoir un écart type plus large pour éviter que les notes ne soient trop resserrées (exemple de l enseignant qui note de 8 à 13/20). Dans le cas d'une notation de 0 à 20, l'écart type minimum est 0 (si tous les élèves ont la même note). ÉCART-TYPE En sciences humaines, il est fréquent de considérer que les valeurs se répartissent selon une courbe de Gauss (courbe en forme de cloche). Dans ce cas, la moyenne et l'écart-type permettent de déterminer l'intervalle dans lequel on trouve 95 % de la population. notes proches de la moyenne Nombre d élèves notes les + faibles notes les + fortes Moyenne de la classe VARIANCE En statistique et probabilité, la variance est une mesure servant à caractériser la dispersion d'une distribution ou d'un échantillon. On peut interpréter la variance comme la moyenne des carrés des écarts à la moyenne. Le fait que l'on prenne le carré de ces écarts à la moyenne évite que des écarts positifs et négatifs ne s'annulent. Elle permet de caractériser la dispersion des valeurs par rapport à la moyenne. Ainsi, une distribution avec une variance plus grande apparaîtra comme plus étalée. TRAITEMENT STATISTIQUE des DONNÉES : Pour approfondir l analyse, on peut recourir à d autres techniques statistiques (dites analytiques). Celles-ci permettent de faire ressortir les différences et les similitudes à l intérieur des données (analyse de variance, test du chi-deux...). D autres mettent en valeur les corrélations et les liens de causalité entre les variables (régression, analyse discriminante...). TRAITEMENT STATISTIQUE des DONNÉES : L analyse des données quantitatives est complexe, elles nécessite l application de différentes règles pour assurer l obtention de résultats fiables. Le choix d une méthode statistique dépend essentiellement de la nature des VARIABLES et du respect d un certain nombre de conditions statistiques strictes. La VALIDITÉ de la RECHERCHE La validité est un critère à double dimension : elle est interne et externe. La VALIDITÉ INTERNE Elle représente la capacité d une recherche à rendre compte de façon significative du terrain qu elle s est choisie. (Usinier et al., 2003). Les résultats obtenus doivent être le fait de la réalité de la situation. Si le chercheur mène une recherche identique auprès des mêmes sujets, il doit obtenir les mêmes résultats. Les résultats ne doivent pas être influencés par des facteurs externes à la réalité des faits. La VALIDITÉ EXTERNE Elle relève de la possibilité de généraliser les résultats obtenus à une population, à des situations ou à des variables dont l étendue est plus vaste que celle de l objet de la recherche. On parle de validité externe si les résultats obtenus dépassent l échantillon étudié dans leur application. Une recherche qui n autorise pas un minimum de généralisation perd sa qualité de recherche scientifique. (Zghal, 1992). ANALYSE des résultats obtenus : C est à ce moment que sont véritablement produites les connaissances. Cette analyse permettra de confirmer ou d infirmer les hypothèses formulées et donc de fournir des réponses aux questions posées. Le chercheur en sciences humaines utilise un nombre considérable de paramètres statistiques en vue de synthétiser et de présenter leurs données. Les statistiques descriptives désignent les paramètres de tendance centrale (moyenne, médiane), les paramètres de position (moyenne, pourcentage, centiles, déciles, quartiles) et les paramètres de dispersion (variance, écart-type, étendue, étendue semi-interquartile). 2. Le traitement statistique. ? Notions de variables et de facteurs Les TYPES de VARIABLES : On distingue 2 grands types de variables statistiques. Les variables QUALITATIVE et les variables QUANTITATIVE. 2. Le traitement statistique. Variable QUALITATIVE : Une variable statistique est dite qualitative lorsque ses modalités ne sont pas des nombres. Il existe 2 sortes de variables statistiques qualitatives. Variable qualitative NOMINALE : Une variable statistique qualitative est dite nominale s il n est pas possible de classer ses modalités suivant une relation d ordre logique. Par exemple, les modalités jaune, rouge et bleu de la variable statistique couleur de voiture ne peuvent être classées selon une relation qui a du sens. Variable qualitative ORDINALE : Une variable statistique qualitative est dite ordinale s il est possible de classer ses modalités suivant une relation d ordre logique. Par exemple, les modalités mauvaise, assez bonne, bonne et très bonne de la variable statistique opinion du gouvernement peuvent être classées selon un ordre logique. Indiquez le niveau de participation de l équipe pédagogique dans le projet d établissement. ( ) Aucune participation ( ) Une participation minime ( ) Une certaine participation ( ) Une forte participation ( ) Une très forte participation. Les TYPES de VARIABLES : On distingue 2 grands types de variables statistiques. Les variables QUALITATIVE et les variables QUANTITATIVE. Il existe 2 types de variables quantitatives. Les variables quantitatives DISCRÈTES et les variables quantitatives CONTINUES. Variable quantitative DISCRÈTE : La variable quantitative est dite discrète si la valeur de ses modalités relève d un comptage. Par exemple, les modalités 1, 2 et 3 de la variable statistique nombre de frère et sœurs relève d un comptage. Variable quantitative CONTINUE : La variable quantitative est dite continue si la valeur de ses modalités relève d une mesure. Par exemple, les modalités (150; 160), (160; 170) et (170; 180) de la variable statistique taille des filles dans une classe X relèvent d une mesure. Différents types de séries statistiques : On appelle série BRUTE toute série vierge de traitement. Série brute de la variable statistique pays d origine : France Pays-Bas Espagne Portugal Russie Turquie Angleterre France Italie Algérie Russie Pays-Bas Différents types de séries statistiques : On appelle série CLASSÉE d une variable statistique qualitative toute série classée (par exemple, par ordre alphabétique). Série classée de la variable statistique pays d origine : Algérie Allemagne Angleterre Italie Angleterre Espagne France Pays-Bas France France Italie Portugal Différents types de séries statistiques : On appelle série ORDONNÉE d une variable statistique quantitative, la liste des observations classées par ordre croissant. Pour étudier un échantillon, on relève un certain nombre d informations sur les individus qui la composent. Ces informations concernent des dimensions caractérisant les individus comme l âge, le sexe, la performance à une tâche. Ces dimensions sont donc les variables et les différentes valeurs que peuvent prendre ces variables sont appelées modalités. Une variable a forcément plus d une modalité, sinon la dimension étudiée ne varie pas et constitue une constante. Par ailleurs, une variable est constituée de modalités exclusives (aucun individu ne peut être associé à plus d une modalité) et exhaustives (tout individu doit être associé à au moins une modalité). Une variable est caractérisée par son échelle de mesure. Trois échelles de mesure sont à différencier : nominale, ordinale ou numérique selon les relations que les modalités entretiennent entre elles. Une variable se distingue également par son statut. On parle de variables dépendantes et de variables indépendantes. Les variables indépendantes sont également appelées facteur. Une variable nominale est caractérisée par le fait que ses modalités n entretiennent pas de relation d ordre. Le sexe, la profession, le sport pratiqué sont des variables nominales car il n est pas possible d ordonner les différentes modalités. Les variables nominales ne sont pas vraiment constituées en échelle, du fait de l absence d ordre entre les modalités. Elles servent à catégoriser les individus plutôt qu à les situer les uns par rapport aux autres, c est-à-dire à regrouper ce qui d un certain point de vue est jugé comme semblable et à distinguer ce qui est différent. Une variable ordinale est caractérisée par des modalités ordonnées entre elles. Cet ordre doit être total, c est-à-dire que toutes les modalités doivent être ordonnées. Une échelle comme d accord, assez d accord, pas d accord est une échelle ordinale. Si on ajoute la modalité non-réponse, alors l échelle n est plus ordinale puisque cette dernière modalité n entretient pas d ordre avec les autres. Le classement au tiercé est un exemple de variable ordinale. Une variable numérique a des modalités ordonnées et un intervalle constant entre modalités, c est-à-dire que la différence entre deux modalités consécutives est toujours la même. Le temps de réponse, le nombre de réponses correctes à un questionnaire sont des exemples de variables numériques. Dans un certain nombre de cas, il est possible de choisir l échelle de mesure. On a rarement une seule possibilité de caractériser une situation. Dans le cas d une étude sur l impact de la tabagie sur les performances intellectuelles, la caractérisation de la tabagie peut se faire de plusieurs façons. Il est possible de retenir seulement le fait qu un sujet fume ou non. On peut également distinguer des catégories de fumeurs en fonction de l importance de la tabagie. Elle peut être évaluée à l aide d une échelle ordinale (pas du tout, un peu, moyennement, beaucoup, énormément) ou à l aide d une échelle numérique (nombre de cigarettes par jour). Cela peut paraître sans importance, mais le choix de l échelle de mesure conditionne les analyses que l on peut faire et les conclusions que l on peut tirer. Les performances en lecture de 76 enfants bénéficiant de deux méthodologies didactiques différentes (une approche idéo-visuelle pure et une approche partiellement phonique) sont comparées au terme d une étude longitudinale de 28 mois (fin de la grande section de maternelle au début du cours élémentaire deuxième année). Les élèves bénéficiant d un enseignement idéo-visuel obtiennent des scores nettement inférieurs aux autres lors des évaluations nationales de CE2 malgré des performances équivalentes en fin de scolarité maternelle. Leurs vitesses d identification des mots écrits sont plus lentes. L absence d enseignement du code grapho-phonologique apparaît comme un obstacle à l apprentissage de la lecture au cycle 2 et pénalise les élèves quelque soit leur appartenance sociale. 1 GOIGOUX, R. (2000). Apprendre à lire à l école : les limites d une approche idéo-visuelle. Psychologie française, 45, Dans cette étude, les enfants sont caractérisés par la méthodologie didactique suivie (idéo-visuelle ou partiellement phonique), par leur performance initiale, leur score à l évaluation de CE2 et leur vitesse d identification des mots écrits. Il y a donc 4 variables : La méthodologie didactique : cette variable a deux modalités non ordonnées; il s agit donc d une variable nominale. La performance initiale : l article ne contient aucune précision sur l échelle de mesure utilisée. Si classiquement, l évaluation scolaire se fait par l attribution d une note (et donc d une variable numérique), la performance peut aussi être caractérisée avec des modalités ordonnées comme très bien, bien, moyen, passable et insuffisant. On peut également caractériser cette performance par une échelle nominale, en regardant simplement si l enfant a réussi ou pas le test. L évaluation du CE2 : donne lieu au calcul d un taux de réussite pour chacun des domaines d acquisition scolaire; il s agit donc d une variable numérique. La vitesse d identification des mots écrits : temps moyen mis par l enfant pour identifier un mot écrit; il s agit également d une variable numérique. Les facteurs constituent une sorte de variable. Les facteurs sont les variables dont les modalités vont servir à déterminer les groupes d observation que l on veut comparer. Ils sont également appelés variables indépendantes. Ce sont eux qui vont permettre de structurer le protocole. La méthode didactique représente un facteur. Elle sert à comparer des groupes d individus. Les facteurs peuvent aussi servir à comparer des individus à eux-mêmes en faisant varier le moment ou les conditions de la mesure. Si on fait passer le même test aux mêmes individus à six mois d intervalle, la variable moment de passation constitue un facteur, car elle permet de comparer deux groupes d observation. Qui dit variable indépendante, dit variable dépendante. Les variables dépendantes sont les indicateurs, c est-à-dire les dimensions dont on suppose qu elles reflètent les processus étudiés. Ces indicateurs peuvent être comportementaux (ce que fait ou dit le sujet), chronométriques (temps de réaction, temps de réponse, etc.) ou physiologiques (EEG, FC...). On cherche de quoi dépendent les variations de ces indicateurs. Pour cela, on contrôle un certain nombre de facteurs pour comparer les fluctuations de la variable dépendante en fonction des modalités de la variable indépendante. Dans l exemple précédent, l auteur cherche à comprendre comment se fait l acquisition de la lecture. Il définit un certain nombre d indicateurs de cette acquisition (performance initiale, évaluation de CE2, vitesse d identification) qui vont constituer les variables dépendantes. L auteur fait l hypothèse que l acquisition de la lecture dépend de la méthode d enseignement (variable indépendante). Pour le vérifier, il compare les valeurs observées sur les variables dépendantes pour chacune des modalités de la variable indépendante. ? Recodage de variables Les données recueillies ne sont pas toujours utilisables sous leur forme originale. Il est alors nécessaire de procéder à un RECODAGE des modalités. On distingue 2 types de recodage. Le premier consiste à regrouper les modalités de la variable pour en réduire le nombre et ainsi observer plus facilement la tendance générale des données. Le RECODAGE PAR REGROUPEMENT n est pas réversible*, autrement dit, la connaissance de la variable recodée ne permet pas de retrouver les modalités originales. Cette procédure de recodage s accompagne généralement d une diminution de la précision de la mesure puisque les modalités précédemment distinguées ne le seront plus par la suite. Il peut paraître paradoxal de vouloir réduire la précision de la mesure pour mieux observer et comprendre un phénomène. L excès de précision n est pas toujours le meilleur moyen d appréhender un phénomène. Avant regroupement Après regroupement réussite L é l è v e a b é n é fi c i é d e b o n s enseignements en primaire Le programme scolaire est adapté à la progression de l élève Environnement scolaire C est grâce aux compétences des enseignants C est grâce à l ambiance de la classe C est parce que l élève a un vrai désir de réussite Qualité de l élève C est grâce aux efforts de l élève Imaginons qu on demande à des individus d estimer la distance entre leur domicile et leur travail. Est-ce que l on aura une meilleure compréhension de l estimation si elle est faite en mètres, en centimètres, voire en millimètres que si celle-ci est donnée en kilomètres? Il en va de même pour les données qualitatives... Lorsque l on demande à des sujets leur couleur préférée, c est en général les couleurs de l arc-en-ciel qui constituent le niveau de finesse de la réponse. Il n y a qu à penser aux millions de couleurs d un nuancier informatique pour comprendre qu un tel excès de précision pourrait conduire à observer une modalité par sujet. Pour surmonter cette difficulté, on a donc tendance à regrouper les réponses par CATÉGORIES. Lorsque les réponses à une question sont si diverses que la tendance générale n est pas perceptible immédiatement, des regroupements s imposent en respectant des règles. Le second type de recodage consiste à appliquer une transformation mathématique à la variable, ce qui n est faisable que pour les variables numériques. Dans ce cas, la transformation est réversible puisqu il suffit d appliquer la transformation inverse pour retrouver la variable originale. La CONVERSION des unités de mesures. Le temps de réponse peut avoir été mesuré lors d une expérimentation assistée par ordinateur à la milliseconde près. Les conditions de recueil et la nature du phénomène étudié peuvent conduire le chercheur à considérer que la précision de la mesure n est au mieux que de l ordre du centième de seconde. Une division par 10 lui permettra de manipuler ses résultats sur l échelle qui lui semble la plus pertinente. On peut également considérer que le temps en soi n est pas intéressant et que ce qui importe, c est de savoir si le sujet a répondu dans les délais ou plus vite que la moyenne des individus de l échantillon. Sternberg (1966) s est intéressé aux mécanismes de récupération de l information en mémoire à court terme. Pour cela, il a utilisé une tâche de reconnaissance. Concrètement, l expérience consistait à montrer une liste d items aux sujets (chiffres), puis à leur présenter tout de suite après un chiffre test en leur demandant si oui ou non il faisait partie de la liste précédemment vue. Deux variables étaient mesurées pendant l expérience, le
Related Search
Advertisements
Related Docs
View more...
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks