摘要:为解决现有公共建筑能耗预测中因数据量少、样本维度高导致的精度低、误差大问题,本文提出一种基于多元线性回归(Multiple linear regression,MLR)与遗传算法(Genetic algorithm,G A)优化小波神经网络(Wavelet neural network,WNN)的建筑能耗预测模型。利用Pearson相关系数分析方法与多元线性回归对历史数据进行预处理,选取相关性强的因素用于GA-WNN模型的训练与测试,构成MLR-GA-WNN建筑能耗预测模型,该模型精度达到了 96.4%。仿真结果表明,文中提出的方法不但预测精度优于WNN、GA-WNN、GA-BP与GA-SVM模型,而且仿真运行时长、误差也均小于上述四种模型,验证了提出模型对于公共建筑能耗预测的可行性。
叶永雪; 马鸿雁; 李晟延, 计算机仿真 发表时间:2021-09-15
关键词:数据处理;多元线性回归;遗传算法;小波神经网络;能耗预测
1 引言
随着生活质量的不断提高,人们对公共建筑内部环境的舒适度要求也不断升高,导致城市中公共建筑的能耗占比呈一种逐年上升的趋势。公共建筑单位面积能耗远超农村建筑单位面积能耗与城镇建筑单位面积能耗,其能耗约为建筑总能耗的 39% [1]。因此,怎样合理降低公共建筑能耗问题成为了研究里的重中之重。通过采集公共建筑能耗数据及其他因素后,建立相应的能耗预测模型对其进行预测,可以为公共建筑实施能源管理与分配提供有效的依据。
目前,建筑能耗预测模型主要分为两类,一类是基于热力学计算的物理模型,另一类为基于机器学习的数据模型[2]。现有数据较为充足的情况下,多采用基于机器学习数据模型对建筑能耗进行预测。
申思等[3]利用改进熵权法与单一神经网络模型进行对比,证明了提出方法的有效性与可行性,但没有与优化模型如 GA-BP、GA-WNN 等进行对比,进一步验证提出方法的优势。肖冉等[4]将能耗数据按季节性区分,利用网格搜索优化支持向量机模型对办公建筑进行逐时能耗预测;田亚清[5]利用遗传算法的全局优化搜索能力对小波神经网络进行优化用于建筑能耗的预测,但对于应用的数据样本没有进行预处理。
现有研究中主要存在以下几个问题:以小波神经网络为基础,将其拟合程度高、收敛能力强等优势应用于其他领域[6-9]较多,而应用到公共建筑能耗预测研究领域较少;现有的建筑物能耗预测研究中[10],需要应用大量数据对模型进行训练,才能获得较好的预测效果,若数据量较少[11],则难以保证预测精度;现有研究对于应用的数据样本没有进行处理,造成了网络模型输入样本维度高、仿真运行时间较长等问题。
对此,本文先利用 Pearson 相关系数分析方法与多元线性回归对现有的逐日能耗数据样本进行处理后;再利用遗传算法优化小波神经网络,构成 MLR-GA-WNN 模型对公共建筑能耗问题进行研究。
2 数据收集与处理
2.1 数据收集
实际能够影响建筑物能耗的因素如图 1 所示。
本文以北京市某高校图书馆为研究对象的原因有以下几点:
(1)学校为了满足学生们的学习需求,延长了图书馆的开放时间,造成高校图书馆能耗的不断增加。
(2)图书馆内,温度过高或过低都会导致部分同学频繁开启门窗,引起图书馆的电能消耗。
(3)高校图书馆在建立时过多的考虑了天气状况的影响,造成电气设备预留量,空调设备会出现“大材小用”现象。
由于,高校图书馆的节能潜力较大,对该建筑能耗进行预测具有研究意义。
通过实际调研,获得的数据样本示例如表 1 所示。
2.2 数据预处理
2.2.1 Pearson 相关系数分析方法
常用的相关分析方法如图 2 所示,其中 Spearman 相关系数与 Kendall 相关系数分析方法对于数据中存在着的数据错误值与极端值的反应不敏感,常用于反应变量间的单调关系,无法像 Pearson 相关系数分析方法去评估变量之间的线性关系。最终,选择 Pearson 相关系数分析方法对现有数据进行分析。相关系数表示两个变量之间关系[12],定义为:
式中,E 表示均值,D 表示方差,其中 D X D Y ( ) ( ) 表示标准差。Cov(X,Y)表示变量 X 与 Y 之间的协方差,相关系数 PXY 为两变量之间的协方差与两变量的标准差的商,取值范围为 [-1,1],其绝对值越大,表示相关性越强。
利用 SPSS22.0 软件可以得到各变量间 Pearson 相关系数计算结果,结果如表 2 所示。
从表 2 中可以看出,因为逐日能耗与相对湿度的相关系数值为-0.014,且该 Sig 值为 0.325,表明相对湿度与建筑物能耗情况呈弱相关,所以该气象特征值对于能耗预测的结果影响不大。其他气象因素的 Sig 值均小于 0.05,说明剩余因素参与建模均具有统计学意义,且与总耗电量具有显著相关性关系。
综上,去除相对湿度这一因素,不作为训练集参与能耗的预测。在原有的五维数据基础上,利用 Pearson 相关系数分析方法,不仅可以降低数据样本的维度,还可以减小各个因素间的相互影响。
2.2.2 多元线性回归
在减少各因素间的相互影响后,对剩余因素利进行多元线性回归拟合[13],软件分析结果如表 3 所示。
通过分析表 3,可以得到的多元线性回归预测模型为: 1 2 3 9089.30 33.53 31.84 503.47 Y Z Z X X X (3) 式中:Y 为逐日总耗电量,单位 kWh;X1 为最高温度,单位℃;X2为最低温度,单位℃; X3 为日照时间,单位 h
通过 Pearson 相关系数分析方法与多元线性回归的筛选,平均湿度与平均温度为被排除变量,未被加入到预测模型中。将数据代入后发现,多元线性回归预测模型的预测效果不佳。但得到的公式(3)表明:三维数据的天气因素足以代替原有数据作为后续机器学习方法的训练集与预测集,对公共建筑物进行能耗预测。
3. 遗传算法优化小波神经网络模型
3.1 遗传算法
遗传算法是基于自然界生物遗传和进化特征而提出的方法,可以在复杂的计算中找到最优的参数赋值。从本质上来说,遗传算法属随机算法中的一种,首先从具有代表性问题中存在解的集合中的一个种群开始,按照语言设定的进化方式和配比的适应度函数,进行不断的遗传进化和变异交叉,从参数的全局范围内找到最佳的参数。本文适应度函数为: 1 1 F E (4) 式中,E 为 WNN 的误差函数。遗传算法优化小波神经网络,可以帮助神经网络在初值上进行选取,并提高寻找最优初值的速度和精度[14]。
3.2 小波神经网络
小波神经网络本质上是利用小波基函数代替原有人工神经网络中的传递函数。隐含层小波神经元采用 Morlet 小波函数,其表达式为: 2 ( ) cos(1.75 )exp( 0.5 ) x x x (5) 小波神经网络不仅结合了 BP 神经网络自适应学习特点,还拥有着小波变换良好的时频域特点。因此,小波神经网络具有学习能力强,较快的收敛性能力,以及较高精度的预测能力。
小波神经网络与 BP 神经网络结构类似,具备着输入层,隐藏层,输出层共计三部分。各层之间,通过权值参数来影响各神经元的输出,小波神经网络的物理层结构如图 3 所示。
4. 公共建筑能耗预测
4.1 模型介绍
图4 为基于 MLR-GA-WNN的公共建筑能耗预测模型的流程图,该流程图主要由以下几部分组成。
(1)数据处理:将获取的数据先进行相关性分析判断,排除与能耗数据相关性不强的因素后,对剩余影响因素进行多元线性回归拟合后,将数据分为训练集与测试集。
(2)遗传算法优化:将训练集与测试集加入到遗传算法进行训练,对初始值进行编码,设定适应度函数后,进行选择、交叉变异等操作,在选取适合的网络权值和伸缩平移尺度值后,替换小波神经网络中的原有值。
(3)小波神经网络的预测输出:在构建小波神经网络模型时,需要注意小波函数的选取以及偏导数。在获取最佳的权值与伸缩平移尺度值后,通过对网络模型的训练过程中的最大迭代次数和训练网络的收敛误差,来判断训练过程是否需要结束,结束后会得到相应的仿真结果。
4.2 能耗模型评价指标
(1) 均 方 根 误 差 (Root Mean Squared Error ,RMSE)
均方根误差可以很好的反映出预测的精密度,其值越小越能反应预测数据的精确性。其公式为: n 2 i 1 1 ( ) RMSE f Y Y i i n (9)
(2)平均预测精确度(AC)
用AC来表示平均预测精确度,预测精度是评价预测模型拟合的好坏程度的标准之一,在本文中由神经网络建筑能耗预测模型所产生的能耗预测值与实际能耗值拟合程度的优劣。平均预测精确度是衡量该方法是否适用于预测对象的重要指标。
式中:Yi为建筑能耗的实际值; Y 为网络模型的预测值。
(3) 仿真运行时间
用T来表示仿真运行时长,输入数据量的大小会直接影响仿真时间,不同算法在预测建筑物能耗时,结果有所不同,统计各模型的仿真运行时长。
综上,在预测能耗建筑物能耗时应选取平均预测精确度高,误差小,运行时间较短的模型。
5. 模型参数设置及其结果分析
5.1 模型参数设置
对 WNN、GA-WNN、GA-BP、GA-SVM 与 MLR-GA-WNN 等模型参数进行配置。
WNN、GA-WNN、GA-BP 等参数设置如下:输入节点个数为 5、输出节点个数为 1、隐含层节点个数为 6;其中,WNN 与 GA-WNN 采用的小波函数为公式(3);迭代次数为 1000,学习概率为 0.01。
遗传算法参数如下:个体数目为 80,代沟为 0.9,最大遗传代数为 100。GA-SVM 神经网络参数设置如下:核函数参数 g 选取范围为 [0,1000]、惩罚系数 c 选取范围为[0,100]。
MLR-GA-WNN 的 输 入 节 点 个 数 因 Pearson 相关系数分析法与多元线性回归处理后为 3,输出节点、隐含层节点、遗传算法优化等参数设置同其他模型设置参数。
5.2 公共建筑能耗预测结果
MLR-GA-WNN 公共建筑能耗预测结果如图 5 所示。
图 5 中,圆圈字符代表公共建筑物当日实际能耗,星号字符为基于 MLR-GA-WNN 能耗预测模型的预测曲线。二者之间的预测误差,呈百分比形式表示。如图 6 所示。
在图 6 中,星号字符代表着四月中下旬的预 测 误 差 百 分 比 , 可 以 看 出 ,利用 MLR-GA-WNN 模型预测的公共建筑物能耗预测误差均在 10%左右,说明预测的精度在 90% 以上。
5.3 仿真结果分析
通过1-4月所获取的数据,按照8:2的比例分为训练集以及测试集。从WNN、GA-WNN、 GA-BP、GA-SVM、MLR-GA-WNN预测模型随机抽取四月中下旬的部分预测结果如表4所示。
通过分析表4发现,不同的预测方法在预测同一天的建筑能耗时,预测结果不同。如较早出现的WNN神经网络模型,对于特定的时间或场合,其预测效果较好,但总体预测效果不佳。因此,利用提出的能耗模型评价标准对各模型进行计算,可以得到不同预测模型评价指标,如表5所示。
分析表 5 可知:
(1)单一模型 WNN 神经网络与优化模型 GA-WNN 相比,预测精度相差 2%,用时缩短 0.6s。证明,利用遗传算法对单一预测模型 WNN 进行优化,可以提高预测精度,减小均方根误差,但遗传算法寻找最优解的过程会增加运行时长。
(2) 优 化 模 型 GA-WNN 、 GA-BP 与 GA-SVM 三种模型中遗传算法的参数设置相同;其中,GA-WNN 的预测精度最低为 94.1%,与另外两种模型预测精度相差不多,仿真运行时长最短为 3.5s。说明,GA-WNN 在调用小波函数时可以从数据之间寻找规律,获得较好的预测精度并减少相应的仿真运行时长。
(3)组合优化模型 MLR-GA-WNN 整体预测平均精确度约为 96.4%,仿真运行时长为 2.5s,与 GA-WNN、GA-BP、GA-SVM 相比预测精度提高约 2%左右,仿真运行时长也得到了缩短;而与普通的WNN相比MLR-GA-WNN 整体预测的精度提高了约 4.3%,仿真运行时长缩短 0.5s。
结果表明,组合优化模型与优化模型相比,不仅可以提高预测精确度,还可以有效的减少仿真时常以及均方根误差值,避免了神经网络易陷入局部最优的问题。
6 结论
本文提出了基于多元线性回归与遗传算法优化小波神经网络的公共建筑能耗预测模型,通过仿真研究,可以得出以下几点结论:
(1)遗传算法优化后的模型与普通单一模型相比,可以提高模型的预测精度,但在寻找最优解的过程中可能会增加仿真运行时长。
(2)通过运用 Pearson 相关系数分析方法与多元线性回归对天气因素数据进行降维处理,不但减小了变量间影响因素的相互影响,而且可以提高数据质量,减少仿真运行时长。
(3) 将 经 过 降 维 处 理 后 的 数 据 作 为 GA-WNN 神经网络模型的训练集与测试集,构成 MLR-GA-WNN 模型,将其公共建筑能耗预测结果 与 优 化 模 型 GA-WNN 、 GA-BP 、 GA-SVM 预测结果进行对比。
仿真结果表明,MLR-GA-WNN 模型与其他模型相比,不但预测效果更加准确,可靠程度高,而且仿真运行时长较短,均方差更小。因此,本文提出的网络模型可以有效的对公共建筑能耗进行预测。
论文指导 >
SCI期刊推荐 >
论文常见问题 >
SCI常见问题 >