Introduction
Le coefficient de corrélation produit-moment de Pearson (corrélation de Pearson, en abrégé) est une mesure de la force et de la direction de l’association qui existe entre deux variables mesurées sur au moins une échelle d’intervalle.
par exemple, vous pouvez utiliser une corrélation de Pearson pour comprendre s’il existe une association entre les performances de l’examen et le temps passé à réviser., Vous pouvez également utiliser une corrélation de Pearson pour comprendre s’il existe une association entre la dépression et la durée du chômage.
une corrélation de Pearson tente de tracer une ligne de meilleur ajustement à travers les données de deux variables, et le coefficient de corrélation de Pearson, r, indique à quelle distance tous ces points de données sont de cette ligne de meilleur ajustement (c.-à-d. Dans quelle mesure les points de données correspondent à ce modèle/ligne de meilleur ajustement). Vous pouvez en savoir plus dans notre guide plus général sur la corrélation de Pearson, que nous recommandons si vous n’êtes pas familier avec ce test.,
Remarque: Si l’une de vos deux variables est dichotomique, vous pouvez utiliser une corrélation point-biserial à la place, ou si vous avez une ou plusieurs variables de contrôle, vous pouvez exécuter une corrélation partielle de Pearson.
Ce guide de « démarrage rapide » vous montre comment effectuer une corrélation de Pearson à l’aide des statistiques SPSS, ainsi que d’interpréter et de rapporter les résultats de ce test. Cependant, avant de vous présenter cette procédure, vous devez comprendre les différentes hypothèses auxquelles vos données doivent répondre pour qu’une corrélation de Pearson vous donne un résultat valide., Nous discutons ensuite de ces hypothèses.
statistiques SPSS
hypothèses
lorsque vous choisissez d’analyser vos données à l’aide de la corrélation de Pearson, une partie du processus consiste à vérifier que les données que vous souhaitez analyser peuvent réellement être analysées à l’aide de la corrélation de Pearson. Vous devez le faire car il n’est approprié d’utiliser la corrélation de Pearson que si vos données « passent » quatre hypothèses requises pour que la corrélation de Pearson vous donne un résultat valide., En pratique, la vérification de ces quatre hypothèses ajoute juste un peu plus de temps à votre analyse, vous obligeant à cliquer sur quelques boutons supplémentaires dans les statistiques SPSS lors de l’exécution de votre analyse, ainsi que de penser un peu plus sur vos données, mais ce n’est pas une tâche difficile.
avant de vous présenter ces quatre hypothèses, ne soyez pas surpris si, lors de l’analyse de vos propres données à l’aide des statistiques SPSS, une ou plusieurs de ces hypothèses sont violées (c’est-à-dire qu’elles ne sont pas respectées)., Ce n’est pas rare lorsque vous travaillez avec des données réelles plutôt que des exemples de manuels, qui ne vous montrent souvent comment effectuer la corrélation de Pearson que lorsque tout se passe bien! Cependant, ne vous inquiétez pas. Même lorsque vos données échouent à certaines hypothèses, il existe souvent une solution pour surmonter cela. Tout d’abord, examinons ces quatre hypothèses:
- hypothèse #1: Vos deux variables doivent être mesurées au niveau de l’intervalle ou du rapport (c’est-à-dire qu’elles sont continues)., Des exemples de variables qui répondent à ce critère comprennent le temps de révision (mesuré en heures), l’intelligence (mesurée à l’aide du score de QI), la performance à l’examen (mesurée de 0 à 100), le poids (mesuré en kg), etc. Vous pouvez en savoir plus sur les variables d’intervalle et de rapport dans notre guide Types de variables.
- hypothèse #2: Il existe une relation linéaire entre vos deux variables., Bien qu’il existe un certain nombre de façons de vérifier si une relation linéaire existe entre vos deux variables, nous vous suggérons de créer un nuage de points à l’aide des statistiques SPSS, où vous pouvez tracer une variable par rapport à l’autre variable, Puis inspecter visuellement le nuage de points pour vérifier la linéarité., Votre nuage de points peut ressembler à l’un des éléments suivants:
Si la relation affichée dans votre nuage de points n’est pas linéaire, vous devrez exécuter un équivalent non paramétrique à la corrélation de Pearson ou transformer vos données, ce que vous pouvez, Dans nos guides améliorés, nous vous montrons comment: (a) créer un nuage de points pour vérifier la linéarité lorsque vous effectuez la corrélation de Pearson à l’aide des statistiques SPSS; (b) interpréter différents résultats de nuage de points; et (c) transformer vos données à l’aide des statistiques SPSS s’il n’y a pas de relation linéaire entre vos deux variables.
Remarque: La corrélation de Pearson détermine le degré auquel une relation est linéaire. Autrement dit, il détermine s’il existe une composante linéaire d’association entre deux variables continues. En tant que telle, la linéarité n’est pas en fait une hypothèse de la corrélation de Pearson., Cependant, vous ne voudriez normalement pas poursuivre la corrélation de Pearson pour déterminer la force et la direction d’une relation linéaire lorsque vous savez déjà que la relation entre vos deux variables n’est pas linéaire. Au lieu de cela, la relation entre vos deux variables pourrait être mieux décrite par une autre mesure statistique. Pour cette raison, il n’est pas rare de voir la relation entre vos deux variables dans un nuage de points pour voir si l’exécution d’une corrélation de Pearson est le meilleur choix en tant que mesure d’association ou si une autre mesure serait meilleure.,
- hypothèse No 3: il ne devrait pas y avoir de valeurs aberrantes significatives. Les valeurs aberrantes sont simplement des points de données uniques dans vos données qui ne suivent pas le modèle habituel (par exemple, dans une étude sur les scores de QI de 100 élèves, où le score moyen était de 108 avec seulement une faible variation entre les élèves, une élève avait un score de 156, ce qui est très inhabituel, et peut même, Les nuages de points suivants mettent en évidence l’impact potentiel des valeurs aberrantes:
Le coefficient de corrélation de Pearson, r, est sensible aux valeurs aberrantes, ce qui peut avoir un effet très important sur la ligne de meilleur ajustement et le coefficient de corrélation de Pearson. Par conséquent, dans certains cas, l’inclusion de valeurs aberrantes dans votre analyse peut entraîner des résultats trompeurs. Par conséquent, il est préférable qu’il n’y ait pas de valeurs aberrantes ou qu’elles soient réduites au minimum., Heureusement, lorsque vous utilisez les statistiques SPSS pour exécuter la corrélation de Pearson sur vos données, vous pouvez facilement inclure des procédures pour détecter les valeurs aberrantes. Dans notre guide de corrélation de Pearson amélioré, nous: (a) vous montrons comment détecter les valeurs aberrantes à l’aide d’un nuage de points, qui est un processus simple lors de l’utilisation des statistiques SPSS; et (b) discutons de certaines des options qui s’offrent à vous afin de traiter les valeurs aberrantes.
- hypothèse # 4: Vos variables doivent être approximativement distribuées normalement., Afin d’évaluer la signification statistique de la corrélation de Pearson, vous devez avoir une normalité bivariée, mais cette hypothèse est difficile à évaluer, donc une méthode plus simple est plus couramment utilisée. Cette méthode plus simple consiste à déterminer la normalité de chaque variable séparément. Pour tester la normalité, vous pouvez utiliser le test de normalité Shapiro-Wilk, qui est facilement testé pour l’utilisation des statistiques SPSS. En plus de vous montrer comment procéder dans notre guide de corrélation de Pearson amélioré, nous expliquons également ce que vous pouvez faire si vos données échouent à cette hypothèse.,
Vous pouvez vérifier les hypothèses #2, #3 et #4 en utilisant les statistiques SPSS. N’oubliez pas que si vous ne testez pas correctement ces hypothèses, les résultats que vous obtenez lors de l’exécution d’une corrélation de Pearson peuvent ne pas être valides. C’est pourquoi nous consacrons un certain nombre de sections de notre guide de corrélation de Pearson amélioré pour vous aider à y parvenir. Vous pouvez en savoir plus sur notre contenu amélioré sur notre page Fonctionnalités: Aperçu, ou plus précisément, apprendre comment nous aidons à tester les hypothèses sur notre page Fonctionnalités: hypothèses.,
dans la section, Procédure de Test dans les statistiques SPSS, nous illustrons la procédure de statistiques SPSS pour effectuer une corrélation de Pearson en supposant qu’aucune hypothèse n’a été violée. Tout d’abord, nous présentons l’exemple que nous utilisons pour expliquer la procédure de corrélation de Pearson dans les statistiques SPSS.