例题
调查某市出租车使用年限和该年支出维修费用(万元),得到数据如下:
使用年限(x) | 2 | 3 | 4 | 5 | 6 |
维修费用(y) | 2.2 | 3.8 | 5.5 | 6.5 | 7.0 |
1. 求线性回归方程
2. 由
(1)中结论预测第
10年所支出的维修费用
1. 线性回归方程
设使用年限为x,维修费用为y,列出回归方程
y=wx+b
考虑到该方程是线性回归方程,可以求出解析解
设估计值yi^=wxi+b,i∈[1,5]
得到平方损失函数,其中n=5
Loss=21i=1∑n(yi−yi^)2=21i=1∑n(yi−wxi−b)2
为了计算平方损失函数的最小值,对其求偏导,并令偏导数为零.实际上,这就是简单的求多元函数极值的问题
∂w∂Loss=i=1∑n(−xi)(yi−wxi−b)=0∂b∂Loss=i=1∑n(−1)(yi−wxi−b)=0
由于对b的偏导数系数为(−1),比较好求,因此我们先求出b的表达式
对b的偏导数化简,得
i=1∑nb=bn=i=1∑nyi−wi=1∑nxi
所以
b=ni=1∑nyi−wi=1∑nxi=yˉ−wxˉ
再对w的偏导数化简,得
i=1∑nxiyi=wi=1∑nxi2+bi=1∑nxi
代入已经算出来的b,得
i=1∑nxiyi=wi=1∑nxi2+ni=1∑nxii=1∑nyi−w(i=1∑nxi)2
左右同乘n,得
ni=1∑nxiyi=nwi=1∑nxi2+i=1∑nxii=1∑nyi−w(i=1∑nxi)2
所以
w=ni=1∑nxi2−(i=1∑nxi)2ni=1∑nxiyi−i=1∑nxii=1∑nyi=i=1∑n(xi−xˉ)2i=1∑n(xi−xˉ)(yi−yˉ)
代入数据,计算得(wb)=(1.230.08)
所以得到线性回归方程y=1.23x+0.08
2. 维修费用估计
yˉ∣x=10=(1.23x+0.08)∣x=10=12.38