相関 距離計算機 で使用されるツールです 統計 2 つのデータセット間の相違点を測定するデータ分析。変数間の関係の強さを判断するのに役立ち、機械学習、金融、科学研究などの分野でよく適用されます。
相関距離計算機の式
相関距離の式は次のとおりです。
相関距離 = 1 – 相関係数
詳細なフォーミュラ成分
- 相関係数:
ピアソン相関係数は次のように計算されます。
相関係数 = 共分散 xとyを(標準偏差 x の標準偏差に y の標準偏差を掛けたもの)
どこ:- x と y の共分散: 2 つのデータセットがどのように変化するかを測定します。
- x の標準偏差と y の標準偏差: データセットの広がりを測定します。
- 相関距離:
- 0 は完全な正の相関を示します (相関係数は 1 に等しい)。
- 1 は相関がないことを示します (相関係数は 0 です)。
- 2 は完全な負の相関を示します (相関係数は -1 に等しい)。
相関距離を計算する手順
- を計算する 相関係数:
- 各データセットの平均を計算します。
- 両方のデータセットの各値の平均からの偏差を見つけます。
- 2 つのデータセットの共分散を計算します。
- 共分散を標準偏差の積で割ります。
- 次の式を使用します。
相関距離 = 1 – 相関係数
事前計算されたテーブル
一般的な相関シナリオの表を以下に示します。
相関係数 | 相関距離 | 解釈 |
---|---|---|
1.0 | 0.0 | 完全な正の相関 |
0.5 | 0.5 | 中程度の正の相関 |
0.0 | 1.0 | 相関関係なし |
-0.5 | 1.5 | 中程度の負の相関 |
-1.0 | 2.0 | 完全な負の相関 |
相関距離計算機の例
シナリオ:
データセットは 2 つあります。
- データセット x = [2, 4, 6, 8]
- データセット y = [1, 2, 3, 4]
段階的な解決策:
- 平均値の計算:
- xの平均 = (2 + 4 + 6 + 8) ÷ 4 = 5
- yの平均 = (1 + 2 + 3 + 4) ÷ 4 = 2.5
- 偏差を計算する:
- x = [-3, -1, 1, 3]の平均からの偏差
- y = [-1.5, -0.5, 0.5, 1.5]の平均からの偏差
- 共分散を計算する:
- 共分散 = ((-3 × -1.5) + (-1 × -0.5) + (1 × 0.5) + (3 × 1.5)) を 4 で割った値 = 1.25
- 標準偏差を計算する:
- xの標準偏差 = 平方根 ((-3の1乗+-1の3乗+4の2.236乗+XNUMXのXNUMX乗)をXNUMXで割ったもの) = XNUMX
- y の標準偏差 = ((-1.5 の 0.5 乗 + -0.5 の 1.5 乗 + 4 の 1.118 乗 + XNUMX の XNUMX 乗) を XNUMX で割った値の平方根 = XNUMX
- 相関係数の計算:
相関係数 = 1.25 ÷ (2.236 × 1.118) = 0.50 - 相関距離を計算する:
相関距離 = 1 – 0.50 = 0.50
結果:
データセット x と y 間の相関距離は 0.50 であり、中程度の正の相関を示しています。
最も一般的な FAQ
1. 相関距離とは何ですか?
相関距離は、2 つのデータセット間の相違点を測定します。値が小さいほど相関が強いことを示し、値が大きいほど相関が弱いか負であることを示します。
2. 相関距離計算機はいつ使用すればよいですか?
特にデータ サイエンス、機械学習、統計などの分野で、2 つの変数間の関係を分析するときに使用します。
3. 相関距離と相関係数の違いは何ですか?
相関係数は関係の強さと方向を測定し、相関距離は非類似性を定量化し、0 から 2 までの正の値として表されます。