# 1. 最小二乘法
# 1.1. 最小二乘法
有五把尺子,用它们来分别测量一线段的长度,得到的数值分别为10.2、10.3、9.8、9.9、9.9,产生了误差,这种情况下,一般取平均值来作为线段的长度。因为误差是长度,还要取绝对值,计算起来麻烦,就干脆用平方来代表误差:
总的误差的平方就是
让总的误差的平方最小的y就是真值,这是基于,如果误差是随机的,应该围绕真值上下波动。
这就是最小二乘法,即:
这是一个二次函数,对其求导,导数为0的时候取得最小值,求得y为算术平均数的时候,正好误差最小。
# 1.2. 推广
算术平均数只是最小二乘法的特例,适用范围比较狭窄,而最小二乘法用途广泛。
可以选择不同的f(x),通过最小二乘法可以对同一系列的点得到不一样的拟合曲线。
# 1.3. 最小二乘法与正态分布
误差的分布是正态分布,那么最小二乘法得到的就是最有可能的值。