第一节 基本原理及分类情况
现在一般用回归两个字来表明一种现象伴随着另一种现象的变化而发生变化的现象。根据某些影响因素的变动,来推测所研究对象的变化方向和程度,就是回归预测。它是在定性研究的基础上,对实际调查的定量资料进行分析,出事物发展的内部因素,确定自变量与因变量以及它们之间的相互关系,得到一个回归方程,然后利用回归方程进行预测。它是一种利用事物发展变化的因果关系来预测未来发展趋势的一种方法,所以又称之为因果关系预测。 回归问题可以分为只有一个解释变量情况的一元回归问题和多个解释变量情况的多元回归问题。又可以根据自变量和因变量之间的关系来进行分类,如果自变量和因变量是线性关系则为线性回归问题,否则为非线性回归问题。这是两种不同的分类方法。一元回归问题又可再详细的分为一元线性回归法、一元对数回归法、一元幂函数回归法、一元双曲线回归法、一元指数回归法,等。其中后四种方法属于非线性的回归问题。多元回归问题我们主要介绍多元线性回归和多元线性加权回归两种,同时对于多元线性回归根据选择自变量的不同,又可以分为强行进入法、向前选择法、向后剔除法和逐步回归法。
第二节 一元回归预测
一 概述
一元回归预测也称单因素回归预测。社会经济现象的发展变化是受许多因素影响的,任何一种经济现象的数量表现都与多种因素有关。如果影响预测对象的诸多因素中有一个因素是基本的、起决定性的作用,那么就可以考虑应用一元回归模型来预测对象的发展变化规律,进而预测其未来发展趋势。这就需要对预测对象的影响因素进行比较认真的、全面的分析,从许多影响因素中选择一个最重要的、影响最大的、起决定性作用的因素作为自变量,如果随便采用任意一个因素作为自变量,就可能使预测结果准确性降低。 一元回归预测分为一元线性回归预测和一元非线性回归预测两类。一元非线性回归主要包括:一元对数回归、一元幂函数回归、一元双曲线回归、一元指数回归、一元倒指数回归、一元S型回归和一元多次回归,其中一元多次回归最常用的是一元二次回归、一元三次回归和一元四次回归。在这所有的回归曲线中中一元线性回归是最简单、最基本的一种形式。
二 主要曲线形状
1、一元线性回归
其中,:预测值; x:样本值或自变量;a,b为参数。
2、一元对数回归
3、 一元幂函数回归
4、一元双曲线回归
5、一元指数回归
6、一元倒指数回归
7、一元S型回归
8、一元二次回归
9、一元三次回归
10、一元四次回归
三 一元回归模型
对于一元回归的模型和操作步骤,我们只详细介绍一元线性回归模型和一元线性回归的操作步骤。社会经济现象中的变量是复杂的,变量之间除线性关系以外,在许多实际问题中,大量地存在着非线性关系,对这类问题只有选择适当的曲线来拟合,才会符合实际情况,在具体问题中,往往不知道回归函数的类型,这就必须首先对回归函数的形式进行假定。回归函数可以根据理论分析或经验来进行假定。如果根据理论或经验无法推知X与Y之间的函数类型,就需要根据实测数据从散点图的分布状况选择适当的曲线来拟合。这样得出的其它四种的模型可以通过变换变为线性模型,而操作步骤来讲,其它四种和一元线性回归的操作步骤相似。
对于一元线性回归预测而言,如何建立预测的回归模型,初看起来很简单,如先作散点图,再从散点图中看发展趋势。如果散点图大致呈直线趋势时,可用趋势直线来描述散点图以建立直线模型。但是建立的模型是否切实有效,只能依靠人们的经济理论水平、经济分析能力以及个人的抉择。因而,预测工作者的知识水平和实践工作经验是相当重要的。
税收楔子在建立模型时,应注意以下几个问题:
1、 确定因变量和自变量。一般是先应用经济理论出事物发展变化的主要矛盾以及事物内部的必然联系,从多方面进行探讨,从而决定自变量的取舍。若建立了模型,在经过参数估计等之后,发现所拟模型不适用,则应重新建立模型并检验。
2、 尽可能地搜集有关统计资料。不言而喻,有关的统计资料愈丰富,则预测结果愈有可能准确。
3、 选择自变量时,一个重要原则是统计数据容易获得,另一个原则是统计数据变化大致有规律可循,或比较稳定。
上面的思想应贯串整个模型建立的过程。
对于一组数据(xr,yr),r=1,2,…,N,已经确定它们之间存在线性相关关系,即 :
其中,er为随机变量,一般认为er~N(0,),且er是不相关的,即E(er, ej)=0,i≠j. er和xr也不相关,这样yr~. xr认为是非随机变量。利用数据组(xr,yr),r=1,2,…,N求出回归方程,即用这组数据估计回归方程中的两个参数a和b,记估计值为和,得回归方程:
其中,称作回归系数,其实际意义是当x每增加一个单位时平均引起y的变化。
四 重要参数解释和求解
回归方程:
其中为回归方程中两个参数a和b的估计值,估计参数的准则是使回归方程计算值与y的实际值的差的平方和达到最小,即使
最小。式中,且,称作残差。由此得到:
根据数学分析中求极值的方法,要使Q达到最小,需取Q关于的偏导数,并令其为零,即
或
解得
利用相关系数的系数表,可直接算出和的值。的大小表示相关因素对预测指标影响的大小,的正负方向表示相关因素与预测指标是正相关还是负相关。
上述算出参数确定回归方程所依据的准则是使残差平方和Q达到最小,这一准则下估计和的方法称为最小二乘法。可以证明,和是a和b的无偏估计,且是所有用y的线性函数作无偏估计中方差最小的。
五 回归方程的检验
通过对模型的未知参数a,b进行估计,求出了这一线性回归模型,它在一定程度上揭示了两个相关变量X,Y之间的的内在规律。如果要明确X与Y的相关程度、模型的精度及稳定性,还必须对模型进行检验。所谓检验,一般包括两个方面,即经济理论检验和统计检验。
1、 经济理论检验。例如所求预测模型,其社会商品零售额预测值yi的主要决定因素是居民货币收入xi。显然,居民货币收入xi越大,社会商品零售额预测值yi也越大,它们之间的关系是正的关系。因此=0.3044前的符号也应该是正号。如果的符号与经济理论不符,就要检查其原因。
2、 统计检验。统计检验有:相关系数检验、t检验,F检验。计算剩余均方差以及计算可决定系数等。现在主要介绍相关系数检验、t检验和F检验。
相关系数检验
通过经济分析可以判断两个经济变量之间有没有相依关系。为了定量地说明两个变量之间线性关系的密切程度,用一个相关系数的量来衡量。对一组数据(xr,yr),r=1,2,…,N的相关系数为:
人因式中:为求和记号是的简写形式;
;
。
容易证明,相关系数的取值范围为0≤|r|≤1。下面简单分析一下r的含义
1、当撒胡椒面|r|=1,说明变量x与变量y完全线性相关,即x与y之间存在确定的线性函数关系。这时,所有数据点(xr,yr)都严格地落在一条直线上。
2、当r=0,说明变量x和变量y完全没有线性相关关系,数据点的分布一般是不规则的。
3、当|r|<1,说明变量x和变量y之间存在一定的线性关系。
一般地说相关系数愈接近±1表示线性关系愈密切,愈接近0线性关系愈不密切。但要确定相关系数要多大时才能用线性回归方程来描述变量之间的相关关系有时并不是很容易,比较常用的方法是在建模时检验一下其相关系数是否大于临界值r成人性行为min ,当|r|>rmin时,才能
用线性回归方程描述两个变量间的关系,否则建立线性回归方程是没有意义的,rmin 的值可以查表得到,只要有N和置信度,就可以查到。如果通过计算相关系数,知道变量之间是密切的线性相关的,则可下一步建立相应的回归方程。
对于相关系数需要注意的一点是,变量x与变量y数值之间存在线性相关的联系,不一定就反映了变量之间的内在联系,因此,不能把存在线性相关关系就认为存在有因果关系,当然不存在相关关系也不能就认为没有因果关系。计算相关系数之前需要对两个变量的经济联系做出分析,再计算相关系数才有其实际意义。
T检验
T值的计算公式为:
计算出t值后,按给给定的显著性水平a查t分布表,求临界值,对临界值进行推断。如果,表示x与y之间的相关程度显著;如果,表示x和y之间的相关程度不显著。
F检验
根据方差分析的原理将离差平方和与自由度进行分解,方差分析的所有结果列入表中:
一元线性回归方差分析
离差名称 | 平方和 | 自由度 | 方差 |
总离差 | | n-1 | |
回归 | | 1 | |
剩余 | | n-2 | |
| | | |
上表中,总离差平方和的自由度为n-1,这是因为Y共有n个已知数据,而在中n-1个数据可以自由变动,当n-1个数据确定以后,第n个数据就不能再变动了,必须受的约束。回归平方自由度为1,因为一元线性回归中,自变量的个数为1,这样剩余平方和的自由度就等于n-1-1=n-2个。根据上表,求出F值。
然后在给定的显著水平下,按自由度查F分布表(可以参考其它书获得此表),得临界值Fα收购网站。在附表中,横行为分子自由度,也就是自变量的个数;纵列为分母n-1,两个自由度对应的焦点为所查的,如果,即为F检验表明变量X,Y之间在显著水平a下存在线性关系;如果,即为F检验表明变量X,Y之间在显著水平a下不存在线性关系。
六 模型的适应性
任何事物的发生和发展都受到一些因素的影响和制约,预测所要研究的经济变量也是在一系列因素作用下才会发生和发展的。由于因和果之间的联系,在一定的因素下对结果可以进行预测。例如,随着职工收入的增加,社会购买力也就增加;工业产值增加,能源消费量也就增加。在这种情况下,“结果”主要受一个“原因”的影响,就可以考虑用一元回归的方法进行处理。在实际经济生活中,“结果”一般会受多个“原因”的影响,例如考虑我国近期衣着消费需求问题,就要涉及更多的因素,像前一期的衣着消费需求、消费总需求、人口、纺织品消费价格指数等多种因素。这种情况下就需要考虑使用多元回归模型。因此,一元回归模型是一种特定经济现象的近似。
七 操作步骤
一元回归预测法的操作步骤与趋势预测法的操作步骤基本相同,其区别主要有一下两点:
1、用户使用一元回归预测法进行预测时,应至少选择两列数据,因为回归模型必须有相关指标和预测指标。这与时间序列预测模型有所不同,时间序列预测模型只需一列数据。
2、在一元回归预测法的预测结果图中,除了实绩曲线和预测曲线外,还有第三条曲线,即相关因素曲线。用户应注意比较相关因素曲线和预测曲线。
八 实例分析
例1:一元线性回归预测
设有下列资料(如表所示),试预测第9年社会商品(消费品)的零售额。假设已知第9年居民货币收入为21亿元。
某市居民货币收入和社会商品零售额统计表 单位:亿元
女乳
年份 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
居民货币收入 | 11.6 | 12.9 | 13.7 | 14.6 | 14.4 | 16.5 | 18.2 | 19.2 |
社会商品零售额 | 10.4 | 11.5 | 12.4 | 13.1 | 13.2 | 14.5 | 15.8 | 17.2 |
| | | | | | | | | | | | |
求解过程: