抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

例题

调查某市出租车使用年限和该年支出维修费用(万元),得到数据如下:

使用年限(x)(x)23456
维修费用(y)(y)2.23.85.56.57.0


1. 求线性回归方程
2. 由(1)(1)中结论预测第1010年所支出的维修费用

1. 线性回归方程

设使用年限为xx,维修费用为yy,列出回归方程

y=wx+by=wx+b

考虑到该方程是线性回归方程,可以求出解析解

设估计值yi^=wxi+b,i[1,5]\hat{y_i}=wx_i+b,i\in [1,5]

得到平方损失函数,其中n=5n = 5

Loss=12i=1n(yiyi^)2=12i=1n(yiwxib)2Loss=\frac{1}{2} \sum\limits_{i=1}^{n}(y_i-\hat{y_i})^2=\frac{1}{2} \sum\limits_{i=1}^{n}(y_i-wx_i-b)^2

为了计算平方损失函数的最小值,对其求偏导,并令偏导数为零.实际上,这就是简单的求多元函数极值的问题

Lossw=i=1n(xi)(yiwxib)=0Lossb=i=1n(1)(yiwxib)=0\begin{array}{ll} \frac{\partial Loss}{\partial w}=\sum\limits_{i=1}^{n}(-x_i)(y_i-wx_i-b)=0 \\\\ \frac{\partial Loss}{\partial b}=\sum\limits_{i=1}^{n}(-1)(y_i-wx_i-b)=0 \end{array}

由于对bb的偏导数系数为(1)(-1),比较好求,因此我们先求出bb的表达式

bb的偏导数化简,得

i=1nb=bn=i=1nyiwi=1nxi\sum\limits_{i=1}^{n}b=bn=\sum\limits_{i=1}^{n}y_i-w\sum\limits_{i=1}^{n}x_i

所以

b=i=1nyiwi=1nxin=yˉwxˉb=\frac{\sum\limits_{i=1}^{n}y_i-w\sum\limits_{i=1}^{n}x_i}{n}=\bar{y}-w\bar{x}

再对ww的偏导数化简,得

i=1nxiyi=wi=1nxi2+bi=1nxi\sum\limits_{i=1}^{n}x_iy_i=w\sum\limits_{i=1}^{n}x_i^2+b\sum\limits_{i=1}^{n}x_i

代入已经算出来的bb,得

i=1nxiyi=wi=1nxi2+i=1nxii=1nyiw(i=1nxi)2n\sum\limits_{i=1}^{n}x_iy_i=w\sum\limits_{i=1}^{n}x_i^2+\frac{\sum\limits_{i=1}^{n}x_i\sum\limits_{i=1}^{n}y_i-w\left (\sum\limits_{i=1}^{n}x_i \right )^2}{n}

左右同乘nn,得

ni=1nxiyi=nwi=1nxi2+i=1nxii=1nyiw(i=1nxi)2n\sum\limits_{i=1}^{n}x_iy_i=nw\sum\limits_{i=1}^{n}x_i^2+\sum\limits_{i=1}^{n}x_i\sum\limits_{i=1}^{n}y_i-w\left (\sum\limits_{i=1}^{n}x_i \right )^2

所以

w=ni=1nxiyii=1nxii=1nyini=1nxi2(i=1nxi)2=i=1n(xixˉ)(yiyˉ)i=1n(xixˉ)2\begin{array}{ll} w&=\frac{n\sum\limits_{i=1}^{n}x_iy_i-\sum\limits_{i=1}^{n}x_i\sum\limits_{i=1}^{n}y_i}{n\sum\limits_{i=1}^{n}x_i^2-\left (\sum\limits_{i=1}^{n}x_i \right )^2} \\\\ &=\frac{\sum\limits_{i=1}^{n}(x_i-\bar{x})(y_i-\bar{y})}{\sum\limits_{i=1}^{n}(x_i-\bar{x})^2} \end{array}

代入数据,计算得(wb)=(1.230.08)\begin{pmatrix} w \cr b \cr \end{pmatrix}=\begin{pmatrix} 1.23 \cr 0.08 \cr \end{pmatrix}

所以得到线性回归方程y=1.23x+0.08y = 1.23x+0.08

2. 维修费用估计

yˉx=10=(1.23x+0.08)x=10=12.38\bar{y}|_{x=10}=(1.23x+0.08)|_{x=10}=12.38

评论