一个提供高水平学术成果服务的平台
关闭

职称阁

高水平学术成果包括

SCI论文、SSCI论文、AHCI论文、
EI论文、著作出版、专利申请

都是我们的服务项目

点击咨询

Lasso回归模型区域可持续发展

时间:2020-09-27浏览:130

  以四川省为例,构建区域社会经济可持续发展模型。首先采用PCA方法计算近15年四川省的可持续发展水平;再根据可持续发展水平指标体系获取27个指标数据,通过相关性分析、交叉验证递归特征消除与Lasso回归相结合的方法进行特征筛选;最后采用Lasso回归构建可持续发展模型,结果表明:模型训练集精度达到99.74%,结构风险较小,加入的L1正则化增强了模型的泛化能力;构建的模型能够较好地应用到中短期区域社会经济可持续发展水平的预测,对于区域可持续发展的研究具有一定的应用价值。

Lasso回归模型区域可持续发展

  [关键词]PCA;区域可持续发展水平;递归特征消除;Lasso回归

  区域可持续发展是全球面临的中心问题之一,区域社会经济可持续发展水平直接影响了可持续发展战略的实施。本文以四川省为研究区域,利用主成分分析法、Lasso回归等算法构建和优化经济社会可持续发展模型,时间跨度为2004年到2018年共计15年,社会发展、资源和环境发展数据来自国家统计局、四川省统计局等多家单位。

  1指标体系构建

  可持续发展的评估通常基于可持续发展指标(SDI)[4]。与可持续发展相关的评估方法和指标选择模型有所不同,一个关键问题是指标数据的可用性以及可用统计信息中的不确定性[1]。根据文献[5]的总结分析,可持续发展指标始终包括三类指标,即经济发展,社会发展,资源和环境发展,故本文主要参考文献[6]构建相应的指标体系见表1。

  2区域可持续发展水平计算

  采用主成分分析法(PCA)计算四川省的区域可持续发展水平。为了消除量纲和方向性,首先对于正向型指标(值越大越好)按照公式1进行规范化处理,对于负向型指标(越小越好)按照公式2进行规范化处理[2]之后按照公式3将其转换为服从均值为0、标准差为1分布的数据。根据27个指标数据间的相关系数,可以进一步计算出相关系矩阵的特征值与主成分的贡献率、累积贡献率;然后按照“选择的新指标个数累积能代表原指标信息的90%以上为止”原则,提取主成分;最后构造综合得分函数,并求出四川省2004-2018年的得分。计算出的得分即为当年的可持续发展水平,输出结果如下。

  3特征筛选

  基于搜集到的数据具有不同的量纲,为了使不同量纲的量也能进行比较以及满足回归模型构建的需要,且不改变因子数据的分布,采用最大最小平移方法对数据进行无量纲化处理,将数据压缩在[0,1]区间上。显然所有的都在区间上,同时也消除了量纲的影响。首先基于相关性分析结果初步筛除与可持续发展水平相关性弱的指标。进行相关性分析可以发现,除了城市人口密度、客运量和人均水资源共三个指标的相关系数小于0.6,剩余24个指标均与区域可持续发展水平高度显著相关。其中人均水资源指标与可持续发展水平的相关系数仅为0.262、p值为0.345,相关性很弱,而城市人口密度、客运量与可持续发展水平的相关系数分别为0.552和-0.56,相关性不高;根据相关系数矩阵可以得到关于指标间的相关性热力图,据图可以很清晰地看出,城市人口密度(X13)、客运量(X15)和人均水资源(X24)对可持续发展水平的影响很弱。进一步对初筛后指标数据采用具有交叉验证的递归特征消除(RFECV)确定影响因素个数,并基于确定的影响因素个数采用Lasso回归方法识别影响可持续发展水平的关键因素。其中通过RFECV算法可以得到最佳特征个数为12个,进一步得到Lasso回归识别结果见图2,从图中可以确定反映区域经济发展的第一生产总值、反映社会发展的民事专利申请和授权、反映资源环境状况的废水总量等12个指标为关键影响因素。

  4模型建立及结果分析

  将得到的关键指标作为本文的建模因子,然后探讨因子数据与可持续发展水平间的线性关系。通过12个因子数据与可持续发展水平间的散点图可以看出,各个因子数据与可持续发展水平均存在很强的线性关系,且影响方向基本统一,故适合建立线性回归模型;其次由前面的相关性分析可以发现,因子数据间也存在线性关系,即存在共线性问题。由前文分析,简单的线性回归无法完成此时模型的构建,故为了防止过拟合问题,增加模型的泛化能力,考虑采用正则化则方法。所以本文采用Lasso回归来构建可持续发展模型[3]。经过调参优化与模型求解,可以得到可持续发展模型如下:经计算,该模型输出的训练集精度达到了99.74%,结构风险较小;同时加入了L1正则化,增强了模型的泛化能力。可见本文构建的模型能够较好地应用到中短期区域社会经济可持续发展水平的预测中,对于区域可持续发展水平的预测研究具有一定的应用价值。

  作者:李小虹 常睿春

学术顾问解答 快准稳
上一篇新时期钢铁企业降低采购成本 下一篇类比法在现代邮政类专业的应用
返回列表

了解并选择服务可填写信息

注:学术顾问稍后添加您,可放心通过