聚类 距离计算器 计算数据点之间的距离,即 键 聚类分析中的组件。此工具有助于确定数据点之间的距离,从而使用户能够将相似的点分组到聚类中。通过使用欧几里得距离、曼哈顿距离、明可夫斯基距离或马哈拉诺比斯距离等各种距离度量,该计算器支持各种聚类技术,例如 K 均值、层次聚类和 DBSCAN。
这款计算器在机器学习等领域至关重要, 统计、图像处理和地理分析,了解数据点之间的关系可以发现隐藏的模式。
聚类距离计算器公式
欧氏距离
欧几里得距离度量欧几里得空间中两点之间的直线距离。
d(p, q) = sqrt(Σ(pi – qi)^2)
其中:
d(p, q) 是点 p 和 q 之间的距离。
pi 和 qi 分别是点 p 和 q 的第 i 个坐标。
n 是维数。
曼哈顿距离
曼哈顿距离将两个点的笛卡尔坐标的绝对差相加。
d(p, q) = Σ|pi – qi|
闵可夫斯基距离
这是欧几里得距离和曼哈顿距离的概括。
d(p, q) = (Σ|pi – qi|^p)^(1/p)
当p=1时,就变成曼哈顿距离。
当p=2时,就变成欧几里得距离。
马氏距离
该指标考虑了 协方差 数据的结构,使得它在特征相关时很有用。
d(x, y) = sqrt((x – y)^T * Σ^(-1) * (x – y))
其中:
x 和 y 是数据点。
Σ 是数据的协方差矩阵。
一般术语和参考表
下面是总结关键术语及其描述的表格:
米制 | 定义 | 最佳用例 |
---|---|---|
欧氏距离 | 欧几里得空间中的直线距离。 | 用于像 K-means 这样的简单聚类。 |
曼哈顿距离 | 坐标之间的绝对差异总和。 | 非常适合城市地图等网格状数据。 |
闵可夫斯基距离 | 欧几里得距离和曼哈顿距离的概括。 | 当 p 值需要调整时使用。 |
马氏距离 | 考虑数据中的协方差和相关性。 | 最适合高维相关数据。 |
聚类距离计算器示例
考虑二维空间中的两点:
点A:(3,4)
点 B:(7, 1)
欧几里得距离:
使用公式:
d(A,B) = sqrt(4^2 + (-3)^2)
d(A,B) = sqrt(25) = 5
曼哈顿距离:
使用公式:
d(A,B)= |7-3|+|1-4|
d(A,B) = 4 + 3 = 7
明可夫斯基距离(p=3):
使用公式:
d(A,B) = ((4^3 + (-3)^3))^(1/3)
d(A, B) = ((64 + 27))^(1/3) = (91)^(1/3) ≈ 4.497
最常见的常见问题解答
不同的度量标准可以捕捉各种类型的关系。欧几里得距离很简单,适用于不相关的数据,而马哈拉诺比斯距离更适合相关或高维数据。选择取决于数据集和聚类方法。
欧几里得距离测量直线距离,而曼哈顿距离计算沿轴的点之间的总绝对差异。
是的,明可夫斯基距离允许灵活地使用 p 值来适应特定的聚类需求。常见的选择是 p=1(曼哈顿)和 p=2(欧几里得)。