Coeficiente de correlación de Pearson

¿Alguna vez te has preguntado si existe una relación matemática entre dos variables? Por ejemplo, ¿será cierto que a mayor altura, mayor peso? ¿O que cuantas más horas estudies, mejores notas obtengas? El coeficiente de correlación de Pearson es precisamente la herramienta que nos permite responder a estas preguntas de forma científica y objetiva.

Este concepto es más sencillo de lo que parece y, créeme, una vez que lo domines, verás el mundo de los datos con otros ojos. Además, es un tema fundamental para la EVAU y te será tremendamente útil en estudios superiores de ciencias, economía o cualquier disciplina que trabaje con datos.

Fundamentos teóricos: entendiendo la correlación

Vamos a empezar por lo básico. El coeficiente de correlación de Pearson, que denotamos con la letra r, es una medida estadística que nos indica:

  • Si existe una relación lineal entre dos variables cuantitativas
  • Qué tan fuerte es esa relación
  • En qué dirección se da esa relación (positiva o negativa)

Recuerda que el valor de r siempre está comprendido entre -1 y 1, es decir: -1 ≤ r ≤ 1

Interpretación de los valores

Fíjate que la interpretación es bastante intuitiva:

  • r = 1: correlación positiva perfecta (los puntos forman una línea recta creciente)
  • r = -1: correlación negativa perfecta (los puntos forman una línea recta decreciente)
  • r = 0: no existe correlación lineal
  • 0 < r < 1: correlación positiva (a mayor valor de una variable, mayor valor de la otra)
  • -1 < r < 0: correlación negativa (a mayor valor de una variable, menor valor de la otra)

La fórmula del coeficiente de correlación de Pearson

La fórmula que necesitas conocer para los exámenes es:

r = Σ(xi – x̄)(yi – ȳ) / √[Σ(xi – x̄)² × Σ(yi – ȳ)²]

Donde:

  • xi, yi son los valores individuales de cada variable
  • x̄, ȳ son las medias aritméticas de cada variable
  • Σ representa la suma de todos los valores

Ejemplo resuelto paso a paso: Horas de estudio y calificaciones

Vamos a ver un ejemplo práctico que te resultará familiar. Supongamos que queremos estudiar la relación entre las horas de estudio semanales y las calificaciones en matemáticas de 5 estudiantes:

Datos:

  • Estudiante 1: 2 horas, nota 5
  • Estudiante 2: 4 horas, nota 6
  • Estudiante 3: 6 horas, nota 8
  • Estudiante 4: 8 horas, nota 9
  • Estudiante 5: 10 horas, nota 10

Paso 1: Calcular las medias

x̄ = (2 + 4 + 6 + 8 + 10) / 5 = 30 / 5 = 6 horas

ȳ = (5 + 6 + 8 + 9 + 10) / 5 = 38 / 5 = 7,6 puntos

Paso 2: Calcular las desviaciones

Para cada estudiante calculamos (xi – x̄) y (yi – ȳ):

  • Estudiante 1: (2-6) = -4, (5-7,6) = -2,6
  • Estudiante 2: (4-6) = -2, (6-7,6) = -1,6
  • Estudiante 3: (6-6) = 0, (8-7,6) = 0,4
  • Estudiante 4: (8-6) = 2, (9-7,6) = 1,4
  • Estudiante 5: (10-6) = 4, (10-7,6) = 2,4

Paso 3: Aplicar la fórmula

Numerador: Σ(xi – x̄)(yi – ȳ) = (-4)(-2,6) + (-2)(-1,6) + (0)(0,4) + (2)(1,4) + (4)(2,4) = 10,4 + 3,2 + 0 + 2,8 + 9,6 = 26

Denominador:

Σ(xi – x̄)² = (-4)² + (-2)² + 0² + 2² + 4² = 16 + 4 + 0 + 4 + 16 = 40

Σ(yi – ȳ)² = (-2,6)² + (-1,6)² + (0,4)² + (1,4)² + (2,4)² = 6,76 + 2,56 + 0,16 + 1,96 + 5,76 = 17,2

Por tanto: r = 26 / √(40 × 17,2) = 26 / √688 = 26 / 26,23 ≈ 0,99

¡Excelente! Tenemos una correlación positiva muy fuerte (r ≈ 0,99), lo que confirma que existe una relación casi perfecta entre las horas de estudio y las calificaciones.

Segundo ejemplo: Temperatura y ventas de helados

Veamos otro caso práctico. Una heladería quiere estudiar la relación entre la temperatura diaria y sus ventas:

Datos de 4 días:

  • Día 1: 15°C, 20 helados vendidos
  • Día 2: 25°C, 50 helados vendidos
  • Día 3: 30°C, 70 helados vendidos
  • Día 4: 20°C, 35 helados vendidos

Calculando paso a paso:

x̄ = (15 + 25 + 30 + 20) / 4 = 22,5°C

ȳ = (20 + 50 + 70 + 35) / 4 = 43,75 helados

Aplicando la fórmula completa obtenemos r ≈ 0,91, indicando una correlación positiva muy fuerte entre temperatura y ventas.

Errores comunes que debes evitar

Recuerda estos puntos clave para no cometer fallos típicos en los exámenes:

Error 1: Confundir correlación con causalidad

Que dos variables estén correlacionadas no significa que una cause la otra. El coeficiente de correlación de Pearson solo mide la relación lineal, no la causalidad.

Error 2: Olvidar el rango de valores

Si obtienes r > 1 o r < -1, revisa tus cálculos porque hay un error. El coeficiente siempre debe estar entre -1 y 1.

Error 3: Interpretar mal la correlación cero

r = 0 significa que no hay correlación LINEAL, pero puede existir otro tipo de relación (cuadrática, exponencial, etc.).

Error 4: Errores de cálculo en las desviaciones

Fíjate bien en los signos al calcular (xi – x̄) y (yi – ȳ). Un error aquí afecta todo el resultado.

Aplicaciones en el mundo real

El coeficiente de correlación de Pearson no es solo teoría de bachillerato. Se utiliza constantemente en:

  • Medicina: para estudiar la relación entre factores de riesgo y enfermedades
  • Economía: para analizar la correlación entre variables económicas
  • Psicología: para medir la relación entre diferentes rasgos de personalidad
  • Marketing: para entender cómo se relacionan las estrategias publicitarias con las ventas
  • Investigación científica: para validar hipótesis y establecer relaciones entre fenómenos

Por ejemplo, durante la pandemia de COVID-19, los epidemiólogos utilizaron correlaciones de Pearson para estudiar la relación entre medidas de confinamiento y tasas de contagio.

Consejos para el examen

Para dominar este tema en la EVAU, ten en cuenta:

  1. Practica el cálculo manual de la fórmula hasta automatizarlo
  2. Memoriza la interpretación de los valores de r
  3. Siempre verifica que tu resultado esté en el rango [-1, 1]
  4. Entrena la interpretación contextual de los resultados

Conclusión: dominando la correlación de Pearson

El coeficiente de correlación de Pearson es una herramienta fundamental que te acompañará no solo en bachillerato, sino en tus estudios superiores y vida profesional. Recuerda los puntos clave:

  • Mide la relación lineal entre dos variables cuantitativas
  • Sus valores oscilan entre -1 y 1
  • No implica causalidad, solo asociación
  • Es esencial para el análisis de datos en múltiples disciplinas

Con práctica y comprensión de estos conceptos, estarás perfectamente preparado para afrontar cualquier ejercicio sobre correlación en tus exámenes. ¡El dominio de esta herramienta estadística te abrirá las puertas a un mundo de análisis de datos cada vez más relevante en nuestra sociedad digital!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio