摘要 摘 要: 统计了对广东省造成直接经济损失的台风数据,包括致灾因子、孕灾环境和承灾体等评估因子,对数据进行无量纲化、归一化处理,作为验证模型的数据集。建立 BP 神经网络和空
摘 要: 统计了对广东省造成直接经济损失的台风数据,包括致灾因子、孕灾环境和承灾体等评估因子,对数据进行无量纲化、归一化处理,作为验证模型的数据集。建立 BP 神经网络和空间向量模型( VSM) 相结合的综合评估模型,利用 BP 神经网络进行初步预测,基于 VSM 对预测结果进行修正,从而构建台风灾害经济损失评估模型。将收集的历史台风经济损失数据分为训练和测试集,对模型进行训练和检验。经验证,采用 BP 神经网络和 VSM 相结合的台风灾害经济损失评估模型能够有效降低训练数据不足对评估结果的影响,平均误差率由30%降低到14%。
关键词: 台风灾害; 经济损失; BP 神经网络; VSM; 损失评估; 广东
广东省位于太平洋西岸,濒临南海,是西太平洋台风登陆中国的主要地区。每年登陆中国的 9. 5 个台风中,广东省就占了 3. 5 个。自 1985 年以来因台风和洪水造成的直接经济损失超过 200 亿元[1]。特别是随着全球气候变暖带来海平面上升等气候因素,对台风的强度和频度都有增强作用,台风灾害的危害将更为严重[2 - 3]。因此,深入研究台风灾害损失评估具有重大的意义。
自然灾害灾情统计是灾害评估、应急救 助、灾后恢复重建等工作的基础。目前,我国对自然灾害灾情统计工作主要由各行政管理或业务部门完成,灾情信息大多以基层部门调查上报得到。由于各部门对灾情管理的侧重点存在差异,灾情统计内容不规范、不统一的问题十分突出,已成为提升自然灾害管理工作水平的瓶颈。因此,研究如何准确预测台风灾害损失,对提升台风灾害管理具有重大的意义。台风灾害损失评估方法大致可分为资料分析法、实验模拟法、数学模型法和遥感 GIS 法[4]。有采用基于主成分析和支持向量机技术,对房屋倒塌间数进行评估[5]; 应用基于主成分神经网络技术,实现灾害的经济损失评估[6]。也有综合评估台风灾害损失的方法,如刘少军等[7]采用可拓方法建立损失评估模型,并实现评估结果的 GIS 显示; 文献[8]采用多元线性依赖模型,对中国的台风灾害损失进行评估; 文献[9]结合 GIS 和图像识别理论,应用模糊灾害评价方法实现台风灾害的损失评估。文献[10]提出采用基于离散型 Hopfield 神经网络的台风灾情评估模型,主要对灾情的等级进行评估。文献[11]尝试探索广东台风灾情预测系统,并给出了系统的建设思路和必须解决的重要问题。文献[12]基于极值理论的 POT 模型拟合广东省历年台风灾害的经济损失。
文献[13]采集了东南沿海 1990 - 2010 受台风影响严重地区的台风灾害统计数据资料,基于标准化变换的熵值法进行风险等级评估,然后运用聚类分析对评估结果进行等级划分并分析总体变化趋势。目前,对台风灾害损失评估的方法主要采用基于单模型的评估方法,容易受到训练数据统计不完整的影响,导致模型训练效果差,预测结果输出与实际偏离较远,存在评估结果不准确的缺点。鉴于此,本文提出一种基于 BP 神经网络和向量空间模型 VSM( Vector Space Model) 相结合的台风灾害经济损失综合评估方法,这种方法将训练 BP 神经网络作为评估模型,将 VSM 作为调整模型,可有效克服单一模型的适应性弱的缺陷,经验证模型能取得更高的评估准确性。
1 资料来源
为了确保统计数据的准确性,在充分考虑数据来源的可行性情况下,本文主要收集了广东省相关民政部门的最终台风灾情数据及广东省统计局的相关经济、人口等信息。还从《台风年鉴》和《热带气旋年鉴》等年鉴中,统计台风的信息。主要统计了从 1988 - 2008 年对广东省造成直接经济损失的 72 个台风。其中,最高经济损失为 9615 号台风,损失高达 171. 62 亿元; 最低经济损失为 9018 号台风,损失金额为 0. 25 亿元。台风数与经济损失分布如表 1 所示,所统计的台风灾害经济损失跨度较全面,分布比较符合台风的实际情况。抽取各个范围中的台风作为训练数据,训练所得模型将会比较符合台风的实际情况。
2 基于 BP 神经网络和 VSM 的台风灾害经济损失评估模型
2. 1 BP 神经网络预测标准的 BP 网络由输入层、隐含层和输出层三个神经元层次组成,层与层的神经元之间形成全交互连接,层内的神经元之间彼此独立[14]。BP 网络可描述为,存在 3 层的 BP 神经网络,可在任意的 ε = ∑ N i = 1 ∑ m j = 1 ( Tri j - kyi j) 2 N > 0 精度内逼近 f: X( x1, x2,…xi,…,xn ) N → yN m。其 中,X( x1,x2,…,xi,…, xn ) N 与 TrN m ( 由 X 所得的实际结果) 为训练数据集, yN m 网络输出数据集,ε 为网络输出数据集与实际数据集的误差( n 为输入层神经元数,N 为输入数据集行数,m 为输出向量的维度) 。本研究采用如图 1 所示的 BP 网络建立台风灾害经济损失评估模型,包括了模型输入层、隐含层和输出层,属于典型的 3 层 BP 网络模型。设台风样本个数为 TF_ num,则输入层 X( x1,x2,…, xi,…,xn ) j ,( j < TF_ num) 代表第 j 个台风相应的评估因子,X 的选取主要参考了文献[8]中的主成分分析之后所选择的评估因子; 模型的输出为一维( 台风灾害经济损失额) ,m = 1 时,用 yj ,( j < TF_num) 来代表 yj m。
Step1: 初始化 BP 网络,为层与层之间的连接权值和隐层、输出层节点的阈值为( - 1,1) 之间随机小量。 Step2: 将数据集分为训练数据集 Tr_ set 和测试数据集 Te_ set,设置训练精度 acc∈( 0,1) 测试精度 Te_ acc∈( 0,1) 网络输出误差 ε = 1。 Step3: 网络输入神经元为评估因子,中间隐层神经元数为输入层的 75% ,输出层只有台风经济损失 1 个神经元。训练函数采用 Sigmoid 函数,如式( 1) 所示。 f( x) = 1 1 + e - x。 ( 1) 则隐层神经元和输出层神经元的输出结果 hj 和 yk : hj = f( ∑ n i = 1 wjixi + θj) ; ( 2) yk = f( ∑ H j = 1 ukjhj + φk ) 。 ( 3) 式中: θj 和 φk 为隐层和输出层的神经元阈值,wji 为入层神经元 i 与隐层神经元 j 之间的连接权值, xi 为入层神经元 i 的输入评估因子,ukj为层神经元 j 与输出层神经元 k 之间的连接权值。这里只有 1 个输出神经元,即 k = 1,式( 3) 可简化为式( 4) 。 y = f( ∑ H j = 1 ujhj + φ) 。 ( 4) Step4: 第 l 个台风样本的网络输出的评估值 yl 与实际值 Trl 之间的误差 Dl。 Dl = yl ( 1 - yl ) ( yl - Trl ) 。 ( 5) 误差 Dl 网络连接反向传播过程中,当传播到隐层神经元出的误差为 Ej = hj( 1 - hj) ∑Dluj。 ( 6) 按照 Dl 方向调整各层之间的权值和阈值。一般情况下,学习参数 α,β∈[0. 1,0. 5],经实验验证这里取 α = 0. 35,β = 0. 45。 Step5: 将台风训练样本集 Tr _ set 输入训练,计算均方误差 ε,当 acc≥ε 时,停止训练,暂存网络; 否则,更新学习次数,返回对样本再训练,直至满足误差精度。 Step6: 将台风测试样本集 Te _ set 输入 Step5 中的网络测试,计算均方误差 Te_ ε,当 Te_ acc≥ Te_ε 保存网络为 M _ set; 否则,重新改变网络参数,再训练到满足误差精度。
2. 2 VSM( Vector Space Model) 调整
向量空间模型可用于并行信息检索[15]。由于不同时期发生的台风,其经济环境也不一样,如果直接将 BP 网络作为评估结果输出,比较适合特定时期内发生的台风评估,评估模型的适应性不强。鉴于此,本文考虑了结合不同时期的经济因子进行评估,利用 VSM 来检索待评估台风与台风样本集台风信息相似度度最高的台风,计算两个台风评估因子之间的距离,结合台风发生时段的物价指数、GDP 等经济信息,对 BP 神经网络的输出进行调整。 VSM 检索台风时,用 Vdb i 示台风样本集中第 i 个台风的致灾因子向量,则 Vdb i = ( ZXQYdb,ZXFSdb, YDSDdb,CXSJdb,JYLdb,YDFXdb ) ,其中 ZXQYdb 为台风过程中最低中心气压,ZXFSdb为过程最大风速, YDSDdb为台风的移动速度,CXSJdb为台风在广东省持续的时间,JYLdb 为台风过程广东省的平均降雨量,YDFXdb为台风移动方向,主要分为 8 个方向。评估台风的向量 Vpg = ( ZXQYpg,ZXFSpg,YDSDpg, CXSJpg,YDFXpg ) ,向量内容与 Vdb i 相同。检索时,遍历台风样本集中每一个台风,计算与评估台风之间的相似度,如式( 7) 所示。 Simi ( Vdb i ,Vpg ) = ∑ j ( Vdb ij × Vpg j ) ∑ j ( Vdb ij ) 2 × ( Vpg j ) 槡 2 ,j ∈ [1,2,…, length( Vdb i ) ]。 ( 7) 通过 max( Sim) 获得与评估台风最大相似度的台风,对 BP 网络的输出进行调整。R = ybp × max( Sim) × w1 w2 × GDP1 GDP2 。 ( 8) 式中: ybp为 BP 神经网络评估输出的经济损失额 ( 万元) ; max( Sim) 为最大相似度; w1 和 w2 分别为评估台风发生时的物价指数和最相似样本台风发生时间的物价指数; GDP1 和 GDP2 分别为评估台风发生时的 GDP 和最相似样本台风发生时间的 GDP。
3 实验结果及分析
将收集的 72 个样本台风对广东省造成的经济损失信息如表 2 所示,GDP 与物价指数来自广东省统计局,1988 年为标准物价指数 100。
将 72 个台风分为 2 组,一组用于训练模型的训练集 Tr_ set,共有 63 个台风; 另一组用于测试模型的有效性,为测试集 Te_ set,共有台风 10 个。 Tr_ set 与 Te_ set 的台风样本数如表 3 所示。
由表 4 可知,利用训练集 Tr_ set 对 BP 神经网络进行训练,将测试集 Te_ set 作为输入,BP 网络的评估输出结果与实际经济损失结果对比,发现训练数据比较多的经济损失区间,其评估结果会与实际损失结果更接近。如经济损失区间在[1 亿~ 20 亿]和[20 亿 ~ 40 亿]分别训练数据占了 67% 和 15% ,这两个区间的评估结果相对比较准确。由此可以得出,仅利用 BP 神经网络对台风灾害损失进行评估,其评估结果受训练数据集的影响比较大,模型比较不稳定,适应性较差。对比 VSM 调整之后的结果,发现 BP 神经网络和 VSM 相结合的模型输出,明显优于仅使用 BP 神经网络,两者的误差率对比如图 3 所示。
由图 3 可知,BP 神经网络和 VSM 相结合的模型能保持在较低的误差率,特别是 0814 号台风,经济损失大于 100 亿元,训练数据只有 3 条,占训练集的比例的 4. 7% ,但经过 VSM 调整之后,其误差率由 49% 降低到 19% 。台风编号 0116 经济损失为 5 958. 6 万元,属于 1 亿以内的区间,训练数据集较少,经过 VSM 的调整,其误差率由 60% 降低到 31% 。由实验结果和误差率对比可知,采用 BP 神经网络对台风灾害经济损失进行评估,基于 VSM 模型对评估结果进行调整,可以获得与实际更接近的评估结果,同时评估结果受到训练数据集的影响非常小,模型具有较强的稳定性。
4 结论
针对现有台风灾害经济损失评估模型的不足,提出一种基于 BP 神经网络和 VSM 模型相结合的台风灾害经济损失评估模型,该模型能够有效降低训练数据不足对评估结果的影响,将平均误差由 30% 降低到 14% 。台风灾害经济损失评估一直是研究的热点,由于评估受到区域特点等因素的影响,今后的研究可在此基础上,引入区域因素,将地理信息网格化,实现精细化的数据源,同时结合 Boosting 方法来进一步提高经济损失的评估准确度。
参考文献:
[1] 叶雯. 广东省台风灾害特点及减灾对策[J]. 灾害学,2002, 17( 3) : 54 - 59.
[2] Emanuel,K. and R. Sundararajan,et al. Hurricanes and global warming[J]. Bull. Am. Meteorol. Soc,2008,89: 347 - 367.
[3] WANG Xiaoling,WU Liguang,REN Fumin,et al. Influences of tropical cyclones on China during 1965 - 2004[J]. Advances in Atmospheric Sciences,2008,25( 3) : 417 - 426.
[4] 孙绍骋. 灾害评估研究内容与方法探讨[J]. 地理科学进展, 2001,20( 2) : 122 - 130.
BP 神经网络和 VSM 台风灾害经济损失评估相关论文你还可以参考:《计算机网络数字电子技术的运用》
转载请注明来自:http://www.lunwenhr.com/hrlwfw/hrsklw/11312.html