总结
度量标准 | 最优解 | 数学工具 | 直观意义 |
---|---|---|---|
绝对差之和 | 中位数 | 分段函数分析 | 平衡左右两侧的数据点数量 |
差的平方之和 | 平均数 | 导数与二次函数极值分析 | 最小化整体偏差的“能量” |
解释
- 中位数 vs 绝对差:
- 绝对差对离群值不敏感。中位数平衡了左右两侧的数据点数量,确保向左或向右移动时,增减的绝对差数量相等。
- 平均数 vs 差的平方:
- 差的平方对大偏差惩罚更重。平均数通过最小化平方和,使得整体偏差的“能量”最小。
数学证明
- 中位数最小化绝对差之和:
- 通过分段函数分析,中位数是使总绝对差最小的点。
- 平均数最小化差的平方之和:
- 通过求导和二阶导数验证,平均数是使差的平方之和最小的点。
例子
- 中位数:
- 数据:
[1, 3, 5]
,中位数是3
,总绝对差为2 + 0 + 2 = 4
。 - 若选择
x=2
,总绝对差为1 + 1 + 3 = 5
,明显更大。
- 数据:
- 平均数:
- 数据:
[1, 3, 5]
,平均数是3
,差的平方之和为4 + 0 + 4 = 8
。 - 若选择
x=2
,差的平方之和为1 + 1 + 9 = 11
,明显更大。
- 数据: