Introducción
El coeficiente de correlación producto-momento de Pearson (correlación de Pearson, para abreviar) es una medida de la fuerza y dirección de asociación que existe entre dos variables medidas en al menos una escala de intervalo.
por ejemplo, podría usar una correlación de Pearson para comprender si existe una asociación entre el rendimiento del examen y el tiempo dedicado a la revisión., También podría utilizar una correlación de Pearson para entender si hay una asociación entre la depresión y la duración del desempleo.
una correlación de Pearson intenta dibujar una línea de mejor ajuste a través de los datos de dos variables, y el coeficiente de correlación de Pearson, r, indica qué tan lejos están todos estos puntos de datos de esta línea de mejor ajuste (es decir, qué tan bien los puntos de datos encajan en este modelo/línea de mejor ajuste). Puede obtener más información en nuestra guía más general sobre la correlación de Pearson, que recomendamos si no está familiarizado con esta prueba.,
Nota: Si una de sus dos variables es dicotómica, puede usar una correlación punto-biserial en su lugar, o si tiene una o más variables de control, puede ejecutar una correlación parcial de Pearson.
esta guía de «inicio rápido» le muestra cómo realizar una correlación de Pearson utilizando estadísticas SPSS, así como interpretar e informar los resultados de esta prueba. Sin embargo, antes de presentarle este procedimiento, debe comprender las diferentes suposiciones que deben cumplir sus datos para que una correlación de Pearson le dé un resultado válido., Discutimos estas suposiciones a continuación.
estadísticas SPSS
suposiciones
cuando elige analizar sus datos utilizando la correlación de Pearson, parte del proceso implica verificar para asegurarse de que los datos que desea analizar puedan analizarse realmente utilizando la correlación de Pearson. Debe hacer esto porque solo es apropiado usar la correlación de Pearson si sus datos «pasan» cuatro suposiciones que se requieren para que la correlación de Pearson le dé un resultado válido., En la práctica, la comprobación de estas cuatro suposiciones solo añade un poco más de tiempo a su análisis, lo que requiere que haga clic en algunos botones más en las estadísticas de SPSS al realizar su análisis, así como pensar un poco más sobre sus datos, pero no es una tarea difícil.
antes de presentarle estas cuatro suposiciones, no se sorprenda si, al analizar sus propios datos utilizando estadísticas SPSS, se viola una o más de estas suposiciones (es decir, no se cumple)., Esto no es raro cuando se trabaja con datos del mundo real en lugar de ejemplos de libros de texto, que a menudo solo le muestran cómo llevar a cabo la correlación de Pearson cuando todo va bien! Sin embargo, no te preocupes. Incluso cuando sus datos fallan ciertas suposiciones, a menudo hay una solución para superar esto. Primero, echemos un vistazo a estas cuatro suposiciones:
- suposición # 1: Sus dos variables deben medirse en el nivel de intervalo o relación (es decir, son continuas)., Ejemplos de variables que cumplen este criterio incluyen el tiempo de revisión (medido en horas), la inteligencia (medida mediante la puntuación de CI), el rendimiento del examen (medido de 0 a 100), el peso (medido en kg), y así sucesivamente. Puede obtener más información sobre las variables de intervalo y relación en nuestra guía de tipos de variables.
- suposición #2: hay una relación lineal entre sus dos variables., Si bien hay varias maneras de comprobar si existe una relación lineal entre las dos variables, sugerimos crear una gráfica de dispersión utilizando estadísticas SPSS, donde se puede trazar una variable contra la otra variable, y luego inspeccionar visualmente la gráfica de dispersión para comprobar la linealidad., La gráfica de dispersión puede parecerse a una de las siguientes:
Si la relación mostrada en la gráfica de dispersión no es lineal, tendrá que ejecutar un equivalente no paramétrico a la correlación de Pearson o transformar sus datos, lo que puede hacer utilizando estadísticas SPSS., En nuestras guías mejoradas, le mostramos cómo: (a) crear una gráfica de dispersión para verificar la linealidad al llevar a cabo la correlación de Pearson utilizando estadísticas SPSS; (b) interpretar diferentes resultados de la gráfica de dispersión; y (c) transformar sus datos utilizando estadísticas SPSS si no hay una relación lineal entre sus dos variables.
Nota: La correlación de Pearson determina el grado en que una relación es lineal. Dicho de otra manera, determina si hay un componente lineal de asociación entre dos variables continuas. Como tal, la linealidad no es en realidad una suposición de la correlación de Pearson., Sin embargo, normalmente no querrías perseguir una correlación de Pearson para determinar la fuerza y la dirección de una relación lineal cuando ya sabes que la relación entre tus dos variables no es lineal. En su lugar, la relación entre sus dos variables podría describirse mejor mediante otra medida estadística. Por esta razón, no es raro ver la relación entre sus dos variables en una gráfica de dispersión para ver si ejecutar una correlación de Pearson es la mejor opción como medida de asociación o si otra medida sería mejor.,
- suposición # 3: no debe haber valores atípicos significativos. Los valores atípicos son simplemente puntos de datos individuales dentro de sus datos que no siguen el patrón habitual (por ejemplo, en un estudio de las puntuaciones de CI de 100 estudiantes, donde la puntuación media fue de 108 con solo una pequeña variación entre los estudiantes, una estudiante tuvo una puntuación de 156, lo cual es muy inusual, e incluso puede colocarla en el 1% superior de las puntuaciones de CI a nivel mundial)., Los siguientes gráficos de dispersión destacan el impacto potencial de los valores atípicos:
El coeficiente de correlación de Pearson, r, es sensible a los valores atípicos, que pueden tener un efecto muy grande en la línea de mejor ajuste y el coeficiente de correlación de Pearson. Por lo tanto, en algunos casos, incluir valores atípicos en su análisis puede conducir a resultados engañosos. Por lo tanto, es mejor si no hay valores atípicos o se mantienen al mínimo., Afortunadamente, al usar Estadísticas SPSS para ejecutar la correlación de Pearson en sus datos, puede incluir fácilmente procedimientos para detectar valores atípicos. En nuestra guía de correlación mejorada de Pearson: (a) le mostramos cómo detectar valores atípicos utilizando una gráfica de dispersión, que es un proceso simple cuando se usan estadísticas SPSS; y (b) analizamos algunas de las opciones disponibles para usted con el fin de lidiar con valores atípicos.
- suposición # 4: sus variables deben distribuirse aproximadamente normalmente., Para evaluar la significación estadística de la correlación de Pearson, es necesario tener normalidad bivariada, pero esta suposición es difícil de evaluar, por lo que se usa más comúnmente un método más simple. Este método más simple implica determinar la normalidad de cada variable por separado. Para comprobar la normalidad, puede utilizar la prueba de normalidad de Shapiro-Wilk, que se prueba fácilmente con estadísticas SPSS. Además de mostrarle cómo hacer esto en nuestra guía de correlación de Pearson mejorada, también explicamos lo que puede hacer si sus datos fallan en esta suposición.,
puede comprobar las suposiciones #2, # 3 y # 4 utilizando las estadísticas de SPSS. Recuerde que si no prueba estas suposiciones correctamente, los resultados que obtiene al ejecutar una correlación de Pearson podrían no ser válidos. Es por eso que dedicamos una serie de secciones de nuestra guía de correlación mejorada de Pearson para ayudarlo a hacer esto bien. Puede obtener información sobre nuestro contenido mejorado en nuestra página Características: Descripción general o, más específicamente, aprender cómo ayudamos a probar suposiciones en nuestra página Características: suposiciones.,
en la sección Procedimiento de prueba en la estadística SPSS, ilustramos el procedimiento estadístico SPSS para realizar una correlación de Pearson asumiendo que no se han violado las suposiciones. En primer lugar, presentamos el ejemplo que utilizamos para explicar el procedimiento de correlación de Pearson en la estadística SPSS.