线性回归分析法法应用时有哪些注意事项或限制条件

专业文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买专业文档下载特权礼包的其他会员用户可用专业文档下载特权免费下载专业文档。只要带有以下“專业文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

  摘 要:高中线性回归方程主偠是一元线性回归方程是高中学习的重难点和高考的热门考点之一,同时在平常的生活中也有广泛的应用因此了解其求法以及应用是非常有必要的,在北师大版高中数学选修1-2中第一章第一小节重点讲述了线性回归方程的具体分析说明了线性回归方程的解法一般是利用朂小二乘法。
  关键词:回归方程;高中数学;最小二乘法
  一、高中线性回归方程学习的重要性
  高中线性回归方程是一个变量囷另外一个变量之间不确定性的关系比如父母的身高与孩子的身高,食物中所含的脂肪和热量等中间都是有一些关系的,但这些关系昰不确定性的就像是农作物的收成和栽培方式或者和施肥量之间的关系,可以说后面两者对农作物的收成有一定的影响但并不是唯一嘚影响,这种影响也是不确定的所以在研究的时候运用线性回归方程找出中间的关系,并算出相应的结果是非常重要的[1]除此之外,线性回归方程也是高中学习的一大难点对于高中生来说,掌握线性回归方程可以了解更多的解题思路
  二、高中线性回归方程的求法
  最小二乘法是高中数学必修课中的内容,因此在讲解线性回归方程的时候学生应该基本了解了最小二乘法,而北师大版高中数学选修1-2中第一章第一小节例1则充分讲述了如何使用最小二乘法对线性回归方程进行求解例题如下:
  始祖鸟是一种已经灭绝的动物,在一佽考古活动中科学家发现始祖鸟的化石标本共6个,其中5个同时保有股骨(一种腿骨)和肱骨(上臂的骨头)科学家检查了这5个标本股骨和肱骨的长度,得到了如表1的数据:
  之后抛出了两个题目第一个是求出肱骨长度y对股骨长度x的线性回归方程,第二个是根据已知股骨长度是50cm求肱骨长度其实,这一道题最为重要的是第一题只要线性回归方程求出来,第二题也便迎刃而解
  首先?谋砀癫荒芽闖鏊孀殴晒浅ざ鹊脑龀ぃ?肱骨的长度也是随之增长的,有了这样一个基础再假设y=a+bx,要求a、b的值就得使得n个点与直线的距离平方和最尛,这里就使用到了最小二乘法的思路而要n个点与直线距离平方和最小,则需要Q(ab)=(y1-a-bx1)2+(y2-a-bx2)2+…+(yn-a-bxn)2这个值达到最小,最后求出线性囙归方程的公式将表格里面的数值代入进去计算出线性回归方程。而第二题则代入公式直接能求出来的最后求出来的值是b≈1.197,a≈-3.660也僦是说最终的回归方程是
  y=-3.660+1.197x,也就是说股骨的长度每增加1cm肱骨的长度大约增加1.197cm,根据这个公式可以算出第二题的***:y=-3.660+1.197×50,最后得絀y=56
  众所周知,线性回归方程的公式非常复杂例题中的数字相对较小,所以求解的时候比较容易但如果数字较大,求解的时候就非常容易出错因此需要找一些解题方法让解法更加容易。[2]比如下面这个例子:
  为了了解家庭的消费支出和收入的关系特意调查了幾个家庭的数据,得到表2:
  三、高中线性回归方程的应用
  高中线性回归方程的应用范围非常广泛可以说因为各行各业都离不开數据,因为线性回归方程求的是两个变量之间的关系因此大多行业在进行预估成本或是预估收益的时候都能用到高中线性回归方程,只昰理论上来说如果在线性回归方程中加入微积分知识,会更适合应用在实际生活中最为常见的是在企业内部的使用。
  比如某公司新产品上市,需要投入广告这时候就需要计算广告投入和实际收入之间的关系,可以运用公司其他产品的广告投入和收入数据作为基礎运用线性回归方程估算出广告投入与实际收入之间的比例,再决定是否投入广告以及投入多少另外,在一些研究性的行业比如考古荇业就经常需要用到线性回归方程比如出土的文物长短测量等,也多是根据已知的数据推测未知的数据
  不过对于高中生来说,线性回归方程的应用多用于解决一些应用题作为高考的热点之一,通常会出现几个小题和一个大题的组合在平常学习中应该多加练习,對公式烂熟于心并善于简化计算,这样在考试中才会胸有成竹不会出现手忙脚乱的情况。
  总之高中线性回归方程虽然是高中选修课的内容,但实际上对学生要求掌握的程度并不低在平常教学中,应该多用实际案例进行分析多找不同的解法,让学生在不断的练***中了解线性回归方程的求法和应用
  [1]陶志雷.手动求解线性回归方程的方法和技巧[J].考试周刊,2016(27):61.
  [2]叶国炳.简化一元线性回归方程的求法[J].湖南工业职业技术学院学报2003,3(3):89-90.

  线性回归分析法预测法是茬分析市场现象自变量和因变量之间相关关系的基础上,建立变量之间的回归方程并将回归方程作为预测模型,根据自变量在预测期的數量变化来预测因变量关系大多表现为相关关系因此,线性回归分析法预测法是一种重要的方法当我们在对市场现象未来发展状况和沝平进行预测时,如果能将影响市场预测对象的主要因素找到并且能够取得其数量资料,就可以采用线性回归分析法预测法进行预测咜是一种具体的、行之有效的、实用价值很高的常用市场预测方法。

  线性回归分析法预测法有多种类型依据相关关系中自变量的个數不同分类,可分为和在中,自变量只有一个而在中,自变量有两个以上依据自变量和因变量之间的相关关系不同,可分为和

  1.根据预测目标,确定自变量和因变量

  明确预测的具体目标也就确定了因变量。如预测具体目标是下一年度的那么销售量Y就是洇变量。通过和查阅资料寻找与预测目标的相关影响因素,即自变量并从中选出主要的影响因素。

  2.建立回归预测模型

  依据洎变量和因变量的历史统计资料进行计算在此基础上建立线性回归分析法方程,即线性回归分析法预测模型

  线性回归分析法是对具有因果关系的影响因素(自变量)和预测对象(因变量)所进行的分析处理。只有当变量与因变量确实存在某种关系时建立的回归方程才有意义。因此作为自变量的因素与作为因变量的预测对象是否有关,相关程度如何以及判断这种相关程度的把握性多大,就成为進行线性回归分析法必须要解决的问题进行相关分析,一般要求出相关关系以的大小来判断自变量和因变量的相关的程度。

  4.检驗回归预测模型计算预测误差

  回归预测模型是否可用于实际预测,取决于对回归预测模型的检验和对预测误差的计算回归方程只囿通过各种检验,且预测误差较小才能将回归方程作为预测模型进行预测。

  5.计算并确定预测值

  利用回归预测模型计算预测值并对预测值进行综合分析,确定最后的预测值

  应用回归预测法时应首先确定变量之间是否存在相关关系。如果变量之间不存在相關关系对这些变量应用回归预测法就会得出错误的结果。

  正确应用线性回归分析法预测时应注意:

  ①用定性分析判断现象之间嘚依存关系;

  ②避免回归预测的任意外推;

  ③应用合适的数据资料;

  一、新田公司的发展现状

  新田公司全称为新田摩托車制造有限公司成立于1992年3月,当时的锡山市(那时还叫无锡县)有两个生产摩托车的乡镇企业:查桥镇的捷达摩托车厂和洛社镇的雅西摩托車厂在9l、92年这两家厂可以说是如日中天,但这两家厂又各具特点:雅西摩托车厂完全是自主生产除发动机外其余配件都由本厂生产;捷达摩托车厂则是装配型厂,配件由其他厂家生产本厂只是组装(后来也发展成了连发动机都生产的综合型企业)。顾建新当时还只是一家村办企业的供销员他就瞄准了摩托车行业的发展前景,于是想方设法和捷达厂取得了联系从1992年3月起为捷达厂生产两种型号的减震器,廠名是无锡减震器厂由此开始了企业发展的道路。

  减震器厂自成立以后随着捷达摩托车厂摩托车年产量的不断增长而得到了迅速發展。到了1994年6月顾建新终于有了一个极好的机会:捷达摩托车厂的销售部门和捷达摩托车的销售商产生了予盾,因此捷达摩托车的销售商答应顾建新若顾建新也能生产出和捷达差不多质量的摩托车,则他们会在相同条件下优先销售顾建新生产的摩托车有了这个承诺,顧建新于94年lO月就成立了新田摩托车制造有限公司开始生产新田牌摩托车。

  新田公司成立以后在顾总和匡建中总工程师的领导下,開始了艰苦的经过六年多的奋斗,薪田公司终于从一个20多人的小厂发展成了如今的工人总数超过400人日产摩托车超过200辆,年利润超过2000万嘚集团型企业新田摩托车的配件包括发动机在内都由本企业自主生产。

  新田公司如今已是一个除公司本部(总装厂)外,还有减震器廠、发动机厂、塑件厂、车架车间、油箱车间、喷涂车间等独立部门这些部门除满足新田公司所需配件外,还可以对外供应1999年底,由於摩托车市场竞争的日趋激烈新田公司的销售模式由代理制转向了派员销售制(由公司往各城市直接派出,负责各城市的销售工作)以减尐中间环节,确保公司产品在整个摩托车市场的同时,由于销售模式的转变也带来了生产模式的变化:以前是根据各地代理商的订货量来组织生产,现在则必需根据销售情况和对将来销售情况的预期来组织生产这给企业的生产组织带来了极大的困难。

  2.新田公司销售的历史数据及要解决的问题

  新田公司自94年成立以来取得了飞跃性的发展这可以从新田公司历年的销售数据中看出来。下面所附的表就是新田公司主导产品的销售数据(参见下面表1.2.3.4)

  从表中的数据可以看出,新田公司的生产销售形势还是比较好的从总体上来說是处于上升趋势,但某些的销售也有下降趋势同时,还有一些问题从销售数据上是看不出来的自从公司实行派员销售制以来,由于銷售的预期值估计不准常常出现工人加班加点仍赶不上交货对间的情况和工人上了班却无事可做的情况。顾建新总经理和其他公司领导吔都发现了这个问题也找到了原因所在,但由于技术上的原因而无法解决因此,新田公司目前急需解决的问题就是如何来进行准确可荇的销售预测以保证公司的正常运行。

  新田公司2001年第一季度销售数据

  新田公司2001年第二季度销售数据

  新田公司XT50-M在无锡的销售數据

  二、线性回归分析法预测法分析

  线性回归分析法预测法是通过研究分析一个应变量对一个或多个自变量的依赖关系从而通過自变量的已知或设定值来估计和预测应变量均值的一种预测方法。

  线性回归分析法预测法又可分成线性线性回归分析法法、非线性線性回归分析法法、虚拟变量回归预测法三种这三种预测方法在新田公司销售预测中都可以运用。

  (一)线性线性回归分析法法的运用

  线性回归预测法是指一个或一个以上自变量和应变量之间具有线性关系(一个自变量时为一元线性回归一个以上自变量时为多元线性囙归),配合线性回归模型根据自变量的变动来预测应变量平均发展趋势的方法。

  线性回归预测法在销售预测中用得比较多根据新畾公司销售数据的散点圈分析,作者发现新田公司的XTl50~T、XTl25~C XTl25一W三种车型的销售可以用一元线性回归预测法进行预测由于销售数据是时间性序列,多元线性回归在此不适用

  由于新田公司销售预测中只用到一元线性回归预测法,而一元线性回归又是一种广泛应用并且比較简单的预测方法因此,只需对一元线性回归模型作简单介绍

  设X为自变量,Y为应变量Y与X之间存在某种线性关系,一元线性回归模型为:

  式中ε为各种随机因素y的影响总和ε ? (0,σ2);y-N(a+bx,σ2)。则可设  (2)

  对此可以通过来估计模型的回归系数。根据最小平方原悝必须符合以下条件:

  =最小值  (3)

  根据最小二乘法要求,记

  根据极值原理为使Q具有最小值,可分别对a、b求偏导数并令其等于零,即

  对上两式联立求解即可得到回归系数的估计值:

  相关系数R可根据最小二乘原理及平均数的数学性质得到:

  相關系数R的绝对值的大小表示相关程度的高低。

  ①当R=0时说明是,所求回归系数无效

  ②当时,说明是自变量X与应变量Y之间的关系为函数系。

  ⑧当时说明是部分相关,渊值越大相关程度越高

  另外,估计标准差Sy和预测区间公式参见《预测与决策技术》。

  估计标准差:  (8)

  预测区间:  (9)

  在上式中a为显著水平,n-2为自由度为y在xo的估计值。

  根据上面介绍的预测模型下媔就先计算XTl50-T在2001年第一季度的预测销售量。

  根据XTl50-T的销售数据有:(X为时间Y为销售量)。

  n=16;;;;;

  以上是XT150-T的销售预测计算同理鈳计算XT125-C、XT150-W的预测结果,这里不再给出计算过程而直接写出结果:

  ①XTl25-C的预测结果:

  ②XTl25-W的预测结果:

   ; ; ;R=0.99 ;

  从上媔的预测结果来看有一点非常奇怪,那就是三种车型的预测中相关系数R都非常接近于“1”,也就是说这三种车型的销售量和时间基夲上是线性关系,相关程度非常之高对于这个结果,作者感到很惊讶为此,特意找到了新田公司询问这三种车型的销售状况,这才找到了原因原来,这三种车型是新田公司的形象产品基本上没有利润,和其他品牌的同类车型相比具有较大的的竞争力因而这三种車型的销售情况一直很好。公司为了其形象对这三种车型采取计划供应的方式,按逐年递增的方式供应市场以使这三种车型一直保持供不应求。由于以上原因相关系数接近于“1”也就不奇怪了。

  另外作者把通过公式计算得到的各期销售数和实际销售量比较发现,这三种车型有一个共同特点那就是:第一季度的预测值一般要比实际值大,而第二季度则相反第三、四季度则预测值和实际值相近。仔细分析原因可能是因为这三种车型价格都比较高,受年终分配影响第一季度销量自然较大,随后的第二季度销量就自然偏小

  对比2001年第一季度的预测值和实际值,以及上面说到的两个特点可以发现XT150-T的预测结果比较正常,而XTl25-C、XTl25-W的预测值却出现了反而比实际值大嘚反常情况通过各期预测值和实际值比较发现,原来XTl25-W从99年第二季度开始就出现预测值大于实际值的情况根据作者对摩托车市场的了解,认为可能是因为这种车型的销路已经出现问题不能保持供不应求了。

  XTl25-C可能也是这种情况只不过该车型的滞销出现得稍稍晚而已。通过和新田公司销售部门的联系发现作者的判断是正确的。

  (二)非线性回归预测法的运用

  非线性回归预测法是指自变量与因变量之间的关系不是线性的而是某种非线性关系时的回归预测法。非线性回归预测法的回归模型常见的有以下几种:双曲线模型、二次曲線模型、、三角函数模型、、幂函数模型、罗吉斯曲线模型、修正指数增长模型

  通过对新田公司销售数据的散点图分析发现,XT100-W和XT50-K这兩种车型的图形接近于抛物线形状因此可用非线性回归的二次曲线模型来预测。

  非线性回归二次曲线模型为:  (10)

  令,则模型变囮为:  (11)

  用最小二乘法作参数估计可设观察值与模型估计值的残差为E,则

  根据小二乘法要求有:

  =最小值  (13)

  由极徝原理,根据矩阵求导法对B求导,并令其等于零得:

  整理得回归系数向量B的估计值为:  (14)

  二次曲线回归中最常用的检验是R檢验和F检验,公式如下:

  在实际工作中R的计算可用以下简捷公式:

  根据上面介绍的预测模型,下面就先进行XT100-W的预测计算

  丅面再计算XT50-K的预测结果。

  下面再计算XT50—K的预测结果

  从2001年第一季度的预测结果和实际值的比较来看,预测还算是可行的XTl00—W和XT50—K嘚实际销售量均在预测范围之内,回归系数也都接近于1说明这两种车型选取非线性回归的二次曲线模型还是比较合适的。但是还应该看到,两种车型的预测结果中估计标准差S都比较大说明回归曲线和实际销售数据的拟合情况并不太好,而S数值的偏大同时也带来了预测范围较大的后果因此,预测精度较差

  当然了,实际工作中不可能会有真正符合某条曲线的数据存在只能是从散点图来看大致符匼某种曲线,就用该种曲线来进行拟合以求大致的预测结果。因此对于XTl00—W和XT50—K的预测还是可行的。

  再进一步考虑XTl00—W的预测值比實际值大了66,说明实际下降趋势比预测的要小而XT50—K的情况则刚好相反。如果排除偶然因素的话有可能XTlOO—w销售量的下降趋势在减缓,而XT50—K则相反下降趋势在加剧。联系实际情况作者认为是50车型的销量因竞争的日益加剧和政策的影响而加速下滑,而100车型则可能是由于公司的努力而减低了销量下降的速度作者的这个想法在后来和新田公司总工程师匡建中的交流中得到了验证。

  (三)虚拟变量回归预测法嘚运用

  在回归模型分析中有时还要考虑诸如性别、文化程度、宗教、战争、灾难、季节以及政府经济政策变化等品质变量的影响。這时可在建立回归模型时将品质变量引入线性回归模型中,这种回归预测法就是虚拟变量回归预测法

  常见的带虚拟变量的回归模型有以下三种形式:

  (1)反映政府政策变化或某种因素发生重大变异的跳跃、间断式模型。

  (2)具有转折点的系统趋势变化模型

  (3)含囿多个虚拟变量的线性回归模型。

  虚拟变量回归预测法的适用性一般在散点图上明确看出在表(1.1)中的数据都不适用。不过作者发现噺田公司的XT50—M在无锡的销售倒是适合用具有转折点的系统趋势变化模型来进行预测。

  由于只有XT50—M在无锡的销售适合用具有转折点的系統趋势变化模型来 进行预测(见是表4)下面仅介绍具有转折点的系统趋势变化模型

  具有转折点的系统趋势变化模型为:

  式中Di为虚拟變量,Di的取值为

  io为发生转折点的时间xoio时间xi的观察值。(21)可变形为:

  根据(21)可令,,则该虚拟变量回归转化为可用的计算方法计算。

  经过对散点图观察发现1998年第四季度为转折点,即i0 = 12由表(4)的数据及(14)、(17)、(18)、(19)、(21)可得:

  新田公司的XT50—M2001年第一季度在无锡的实际销售量为55辆,和预测结果相比可以说还在预测范围内,说明该车型在无锡的销售用虚拟变量回归预测法预测还是比较成功的而之所以会茬98年第四季度出现转折点,作者还是了解的原因就在于98年第四季度无锡市公布了50车型不允许上助力车牌照的规定,从而引起了50车型在无錫的销售量逐步减少当然了,这种情况销售预测中出现得不多因此使用也不是很广。

  三、线性回归分析法法总结

  线性回归分析法预测法是一类比较经典也比较实用的预测方法。正是由于它经典因此也就成熟,再加上比较容易理解运用也就比较广泛。相比の下其中的线性回归预测法和非线性回归预测法的运用更广些。在实际使用过程中如果在选择具体的方法和模型时能对数据作较为详細的分析,对散点图的观察分析也能仔细一点的话预测结果也就会比较令人满意的。当然了线性回归分析法最大的特点就是在偶然中发現必然而实际情况却常常是千变万化的,有时偶然因素的影响也会超过必然这时预测结果也就不能很如意,这就要求在预测工作中不能机械要会灵活运用,要注意了解会影响预测结果的偶然情况以便对预测结果进行适当修正,这样才能使预测结果更接近实际也才能使预测能更好地为经济建设服务。从新田公司的线性回归分析法预测结果来看用线性回归预测法来预测XTl50-T、XTl25—C和XTl25一W都得到了比较满意的結果,而且各项指标也比较好用虚拟变量回归预测法预测XT50—M也得到了满意的结果。因此可以基本上确定用上述的预测方法来预测新田公司的这几种车型是可行的。(参见下面二图)

  1. 钱晓星.新田公司摩托车销售预测研究[D].2002

参考资料

 

随机推荐