La correlación Calculadora de distancia es una herramienta usada en statistics y análisis de datos para medir la disimilitud entre dos conjuntos de datos. Ayuda a determinar la solidez de la relación entre variables y se aplica a menudo en campos como el aprendizaje automático, las finanzas y la investigación científica.
Calculadora de fórmula de distancia de correlación
La fórmula para la distancia de correlación es:
distancia de correlación = 1 – coeficiente de correlación
Componentes de la fórmula detallada
- Coeficiente de correlación:
El coeficiente de correlación de Pearson se calcula como:
coeficiente de correlación = covarianza de x e y dividido por (desviación estándar de x multiplicado por la desviación estándar de y)
Lugar:- covarianza de x e y: mide cómo varían dos conjuntos de datos juntos.
- desviación estándar de x y desviación estándar de y: miden la dispersión de los conjuntos de datos.
- Distancia de correlación:
- 0 indica correlación positiva perfecta (el coeficiente de correlación es igual a 1).
- 1 indica que no hay correlación (el coeficiente de correlación es igual a 0).
- 2 indica correlación negativa perfecta (el coeficiente de correlación es -1).
Pasos para calcular la distancia de correlación
- Calcule el coeficiente de correlación:
- Calcular la media de cada conjunto de datos.
- Encuentre las desviaciones de la media para cada valor en ambos conjuntos de datos.
- Calcule la covarianza de los dos conjuntos de datos.
- Divida la covarianza por el producto de las desviaciones estándar.
- Usa la fórmula:
distancia de correlación = 1 – coeficiente de correlación
Tabla precalculada
A continuación se muestra una tabla con los escenarios de correlación más comunes:
Coeficiente de correlación | Distancia de correlación | Interpretación |
---|---|---|
1.0 | 0.0 | Correlación positiva perfecta |
0.5 | 0.5 | Correlación positiva moderada |
0.0 | 1.0 | Sin correlación |
-0.5 | 1.5 | Correlación negativa moderada |
-1.0 | 2.0 | Correlación negativa perfecta |
Ejemplo de calculadora de distancia de correlación
Escenario:
Tienes dos conjuntos de datos:
- Conjunto de datos x = [2, 4, 6, 8]
- Conjunto de datos y = [1, 2, 3, 4]
Solución paso-a-paso:
- Calcular medias:
- Media de x = (2 + 4 + 6 + 8) dividido por 4 = 5
- Media de y = (1 + 2 + 3 + 4) dividido por 4 = 2.5
- Calcular desviaciones:
- Desviaciones de la media para x = [-3, -1, 1, 3]
- Desviaciones de la media para y = [-1.5, -0.5, 0.5, 1.5]
- Calcular covarianza:
- Covarianza = ((-3 multiplicado por -1.5) + (-1 multiplicado por -0.5) + (1 multiplicado por 0.5) + (3 multiplicado por 1.5)) dividido por 4 = 1.25
- Calcular desviaciones estándar:
- Desviación estándar de x = raíz cuadrada de ((-3 al cuadrado + -1 al cuadrado + 1 al cuadrado + 3 al cuadrado) dividido por 4) = 2.236
- Desviación estándar de y = raíz cuadrada de ((-1.5 al cuadrado + -0.5 al cuadrado + 0.5 al cuadrado + 1.5 al cuadrado) dividido por 4) = 1.118
- Calcular el coeficiente de correlación:
coeficiente de correlación = 1.25 dividido por (2.236 multiplicado por 1.118) = 0.50 - Calcular la distancia de correlación:
distancia de correlación = 1 – 0.50 = 0.50
Resultado:
La distancia de correlación entre los conjuntos de datos x e y es 0.50, lo que indica una correlación positiva moderada.
Preguntas frecuentes más comunes
La distancia de correlación mide la disimilitud entre dos conjuntos de datos. Los valores más pequeños indican una correlación más fuerte, mientras que los valores más grandes sugieren una correlación más débil o negativa.
Úselo al analizar la relación entre dos variables, especialmente en campos como la ciencia de datos, el aprendizaje automático y la estadística.
El coeficiente de correlación mide la fuerza y la dirección de una relación, mientras que la distancia de correlación cuantifica la disimilitud, expresada como un valor positivo entre 0 y 2.