论文查重 | 论文文献库 | 基于ARIMA模型的渔业经济预测及其优化

基于ARIMA模型的渔业经济预测及其优化

来源:论文查重 时间:2020-01-16 21:10:02

摘要:渔业作为国民经济的重要基础之一,对其进行预测十分必要。 本文采用时间序列 ARIMA 模型对渔业总产值进行 预测,根据模型预测结果进行误差分析。 考虑通货膨胀对预测模型的影响,利用居民消费价格指数(CPI)对模型进行进 一步优化。 进而以江苏省渔业总产值为例,将 1995—2014 年的数据作为训练样本,建立模型并结合 CPI 指数对其优化, 以 2015—2018 年数据作为测试样本,验证了优化模型具有较好的预测效果。
关键词:渔业总产值; ARIMA 模型; CPI 指数
0 引 言
自 20 世纪 90 年代以来,随着世界海洋经济的加 速发展,国家之间的海洋经济竞争呈现白热化的趋 势。 在世界海洋强国和大国中,海洋经济的 GDP 占 比大多在 7% ~15% 之间[1]。 从世界范围来看,海洋 经济发展的一个重要趋势是,人口、经济和产业不断 向沿海地区集中。 目前,全球有 60% 以上的人口和 近 70% 的大中城市位于沿海地区[2],这无疑是海洋 经济越来越具有吸引力的重要体现。 而在我国,海洋 开发历史悠久,海洋经济在国民经济中的地位日渐提高,海洋产业增加值占全国 GDP 的比重上升很快,海 洋产业对国民经济的贡献也越来越大。 进入 21 世纪 以来,伴随中国经济发展和资源需求的增长,也适时 调整了海洋经济发展战略。 2017 年,我国海洋生产 总值 77611 亿元,占国内生产总值的 9. 4% [3],成为 支撑经济增长的重要力量。 我国“十二五”规划中就 明确提出要“大力发展海洋经济”,“坚持海陆统筹, 制定并实施海洋发展战略,提髙海洋开发控制综合管 理能力”, 标志着我国 “ 海洋强国战略” 的全面实 施[4]。 而随着我国海洋经济的快速发展,关于海洋 产业及海洋经济的相关研究领域也逐渐引起重视并发展起来。 当前,我国关于海洋产业及海洋经济的相 关研究主要集中于 2 个方面。 首先在理论层面,主要 是对海洋渔业发展现状的分析、存在问题的探讨及发 展战略设计等方面的研究。 其次在实证层面的研究, 则主要集中在影响因素的分析和综合实力的测评。
对于整体海洋经济发展趋势的预测的研究则相对较 少,这极大地制约了海洋经济学科的发展。
目前国内对于海洋经济预测的定量方法主要包 括趋势外推法、灰色系统法以及成长曲线法。 趋势外 推法是长期趋势预测的主要方法,它是根据时间序列 的发展趋势,配合合适的曲线模型,外推预测未来的 趋势值。 所谓灰色系统理论,就是研究灰色系统的有 关建模、控模、预测、决策、优化等问题的理论。 基于 灰色系统理论的灰色模型主要有 GM(1,1)灰色微分 预测模型。 当原始时间序列隐含着指数变化规律时, 灰色模型 GM(1,1) 可成功地进行预测。 灰色模型 GM(1,1)用作短期预测时,一般能取得较高的精度。 而用作长期预测时,由于经济系统运行起伏较大,往 往产生较大的偏差也相对滞后,这极大地制约了海洋 经济学科的发展。 成长曲线是一条 S 型曲线,最初用 于描述生物生长,在生物学、系统分析、经济学及预测 学等领域中广泛应用。 由于产业成长与生命体类似, 也具有成长、成熟、衰退等特征,因此在经济预测中它 反映经济开始增长缓慢,随后增长加快,达到一定程 度后,增长率逐渐减慢,最后达到饱和状态的过程。
上述模型均可用于海洋渔业总产值的预测,其本 质都是基于时间序列模型构建的。 本文将使用时间 序列分析的方法去分析海洋渔业总产值的变动趋势。 然而传统的时间序列预测法因突出时间序列暂不考 虑外界因素影响,往往存在着预测误差的缺陷,这种 误差的缺陷在经济现象上尤为明显。 其主要表现在 分析海洋渔业总产值的变动趋势时,将货币价值视为 固定不变,只分析渔业总产值随时间变动的而产生的 变化情况。 而事实上,货币价值在每年的实际价值是 不同的,若不考虑这部分因素就直接去构建海洋渔业 总产值的预测模型,将会使得最终预测结果与实际值 有较大误差。 因此,本文将通过探究同时期居民消费 价格指数的动态变化特征,打破传统时间序列模型的 构建局限,将时间以及居民消费价格变动指数这 2 个 主要影响因素结合起来,最终构建出误差更小更精确 的海洋渔业总产值预测模型。
1 数学模型
1. 1 模型选择说明
本文主要基于时间序列分析来对我国短期渔业 总产值进行分析预测。 时间序列是指将某种现象某 一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。 时间序列分析是指根据过 去的变化趋势预测未来的发展,它的前提是假定事物 的过去延续到未来[5]。 对于我国每年的海洋渔业总 产值历史数据来说,可以构成一个时间序列,利用历 史数据的变化趋势来预测未来的渔业总产值。
由于不同的时间序列有不同的特征,需要使用不 同的时间序列预测方法[6]。 ARIMA 模型是时间序列 预测方法的一种,它是处理带有趋势、季节性等因素 的模型类[6]。 考虑到渔业总产值是一个有趋势,并 且受季节因素影响的一个指标,因此本文采用 ARI MA 模型对我国海洋渔业总产值进行分析,得出其规 律性,并预测其未来值。
1. 2 时间序列模型
ARIMA 模型,全称为自回归积分滑动平均模型, 是指将非平稳时间序列转化为平稳时间序列,然后将 因变量仅对它的滞后值以及随机误差项的现值和滞 后值进行回归所建立的模型。 其根据是原序列是否 平稳以及回归中所含部分的不同,包括移动平均过程 (MA)、自回归过程(AR)、自回归移动平均过程(AR MA)以及 ARIMA 过程。 其中 AR 是自回归,p 为自回 归项;MA 为移动平均,q 为移动平均项数,d 为时间 序列成为平稳时所做的差分次数。
1. 3 确定时间序列模型
图 1 为确定时间序列模型流程图[5,8-9,11-13]。
确定时间序列模型流程图
如果模型有效,则可以建立此模型:
首先通过数据画散点图,看数据是否平稳,如果 非平稳,则要进行差分处理;在有效的差分后若平稳, 则可建立 ARIMA 模型。 然后通过模型识别,确定 p、 d、q;再对模型的参数进行估计和检验,以及残差项白 噪声检验。 至此模型建立完毕[14-15]。 考虑到渔业总产值数据受 CPI(居民消费价格指 数) 影响,因此通过历史 CPI 数据对初等模型进行 优化[18]。
根据上述 ARIMA 模型可知,t 期的预测值 Xt 受 BrX t(0 < r ≤d,r∈N)的影响,因此本文通过消除 BrXt 期通货膨胀对 Xt 的影响,达到模型优化的目的。 优 化模型结构如下:
其中 ϕt 是 t 期的 CPI 指数,Xt 是 t 期渔业生产总值, a t 是随机误差。
优化模型是在基于时间序列模型参数估计完毕 的基础上,利用 t 期的 CPI 指数 ϕt 对模型(1) 进行 优化。
2 案例分析
以江苏省渔业总产值预测为例, 利用 1995— 2014 年江苏省渔业生产总值数据进行分析和模型训 练,并对 2015—2018 年的数据进行预测。
2. 1 数据简述
1995—2014 年这 20 年间的江苏海洋渔业生产总产值数据如表 1 所示。 图 2 展示了这 20 个观测值 的散点图。 易见,随着时间的增长渔业生产总产值也 随之增长。
1995—2014 年的江苏省渔业总产值散点图
2. 2 数学建模
Step1 对年度渔业生产总值数据的时间序列进 行一阶差分[5]。
由图 2 可知,随着时间的增长,渔业生产总值也 随之增长,据此得出该时间序列成上升趋势,不平稳。 因此,对此时间序列进行一阶差分,得出结果见表 2。 由表2 可知,如果给定 α =0. 05,白噪声检验的 P 值均小于 0. 05,则表明白噪声检验显著,所以年度渔 业生产总值数据一阶差分之后是不平稳的。 所以需 要进行二阶差分。
1995—2014 年的江苏省渔业生产总产值
α 对年度渔业生产总值数据的时间序列进行二 阶差分[16],所得结果见表 3。
一阶差分后自相关系数的白噪声检验结果
由表3 可知,如果给定 α =0. 05,白噪声检验的 P 值均大于 0. 05,则表明白噪声检验不显著,所以年度 渔业生产总值数据二阶差分之后是平稳的。
二阶差分后自相关系数的白噪声检验结果
Step2 模型的识别。
1)计算扩展的样本自相关函数并利用其估计值 进行模型识别[17]。
在 SAS 中,通过 ARIMA 过程的 IDENTIFY 语句, 在该语句中加入 ESACF 关键词,可得出运行结果,见表4.
时间序列二阶差分数据的 ESACF 模型识别
从表 4 中可以看出 p + d = 0、q = 0 时的模型最 佳,其次是 p + d = 1、q = 0 的模型。 因为对于该数据 已经进行了二阶差分,上述结果是针对序列二阶差分 之后的数据而言的,故此时的 d =0。 最优结果为 p = 0、q =0,次优结果为 p + d = 1、q = 0 的模型。 选择最 优结果 p =0、q =0,即为 ARIMA(0,2,0)。 2)利用典型相关系数平方估计值进行模型识别。 在 SAS 中,通过 ARIMA 过程的 IDENTIFY 语句, 在该语句中加入 SCAN 关键词,可得出运行结果,见 表 5。
时间序列二阶差分数据的 SCAN 模型识别
从表 5 中可以看出 p + d =1、q =0 时的模型是最 优选择,即模型为 ARIMA(0,2,0)。
综上 2 种方法,可得出年度渔业生产总值数据的 时间序列模型为 ARIMA(0,2,0)。
Step3 模型残差白噪声检验。
在对该时间序列进行识别并确定模型之后,还需 要保证其残差项无自相关性,即需对残差进行白噪声 检验。 如果模型残差项非白噪声,则需要重新对模型 进行识别。 模型残差项的白噪声检验见表 6。
模型残差项的白噪声检验
残差项白噪声检验的原假设为残差项是白噪声, 备选假设为非白噪声。 各滞后期的残差项不存在相 关,即 Pr > 卡方均远大于 α = 0. 05,可以认为该模型 的残差项为白噪声。 因此 ARIMA(0,2,0)模型对于 年度渔业生产总值数据二阶差分序列而言是合适 的[18,21-23]。
2. 3 模型预测
根据上述所得模型,利用 SAS 的 forecast 语句对 2015—2018 年江苏省海洋渔业总产值进行预测,预 测结果如表 7 所示。
2015—2018 年江苏省海洋渔业总产值预测值和实际值
通过预测可以发现,采用 ARIMA(0,2,0)模型所进 行的预测,某些年份的预测值与实际值仍存在较大的误 差,因此,本文考虑到国内通货膨胀这个因素的影响,根 据上述模型结合我国 CPI 的变动对模型进行修正。
2. 4 模型优化
为了能较好地分析居民消费价格指数与年度渔 业生产总值模型之间的关系, 在此, 同样 选 取 了 1995—2014 年在 20 年间的我国居民消费价格指数 (CPI)这一数据,具体数据见表 8。 并利用 1995— 2014 年的 CPI 数据去预测 2015—2018 年的 CPI 值, 在此通过 ARMA(p,q)模型预测 CPI 值[19],通过 SAS 软件的计算,最终可以预测出 2015—2018 年 CPI 值 如表 9 所示。
1995—2014 年我国居民消费价格指数
根据上述优化后的模型,对每年数据进行预测,得到结果如表 10 所示。
2015—2018 年的优化后预测值和实际值
2. 5 模型评价
通过对预测误差进行优化前的模型和优化后的 模型的比较,得到如下结果,具体见表 11。
模型比较
通过表 11 可以看出,优化后模型的误差均值比 优化前的更小,优化后的预测值更接近实际值,表明 优化后的模型精确度优于优化前的模型,因此上述优 化模型是合理的。
但由于每年政府出台的政策变化,数据本身存在 误差,以及海洋渔业生产受气候等诸多干扰因素的影 响,使得最终优化后的模型所做出的预测与实际值仍 存在一定偏差,因此在模型中加入每期的干扰因素 β: 其中 βt - 1是 t -1 期的干扰因素,βt - 2是 t -2 期的干扰 因素。
这一模型,对于未来江苏省海洋渔业生产总产值 的预测仍具有较大的参考价值。
3 结束语
本文采用 ARIMA 模型对海洋渔业总产值进行分 析。 由于渔业总产值数据受 CPI 指数的影响,因此通 过历史 CPI 数据对初等模型进行优化。 本文以江苏 省渔业总产值为例,通过 1995—2014 年的历史数据, 对其建立时间序列模型,预测出 2015—2018 年的渔 业总产值。 再利用 CPI 指数对模型优化, 预测出 2015—2018 年的渔业总产值。 通过对优化前与优化 后的预测模型进行比较,发现优化后的模型预测误差 更小,表明优化后的模型预测更精确。

上一篇:高校大学生Word2007利用中常见问题及解决措施
下一篇:工程能力导向的三维度六环节工程管理人才培养实践


相关推荐:

  • 2020-01-13 基于OBE理念的纺织工程专业实践教学改革
  • 2020-01-13 教育新闻负面评价对教师心理影响调查研究
  • 2020-01-13 浅谈音乐鉴赏对加强学生音乐审美的重要性
  • 2020-01-13 基于Python的校园贴吧数据爬虫技术研究
  • 2020-01-13 高职护理专业毕业实习学生管理科学体系探究