关键词:
机器学习
能耗预测
高校教学楼
数据预处理
摘要:
随着我国城镇化进程的加快,建筑能耗在全国总能耗中所占的比例越来越大,其中,中央空调运行能耗所占比例更是不容忽视。据研究显示,空调的运行能耗占全国建筑总能耗的60%以上。因此,为了降低建筑能耗和实现可持续发展,需要采取措施减少空调系统的能耗,提高其能源利用效率。空调系统的智慧运维技术是近年空调节能技术研究的重点方向,而建筑空调能耗预测则是其中的关键环节之一。目前,基于机器学习的空调能耗预测研究较多,也取得了许多富有成就的研究成果,但仍存在一部分不足有待完善。首先,由于空调系统的复杂性和多变性,空调系统的建模过程需要考虑多种因素,包括环境因素、用户行为等;其次,不同的机器学习算法对于数据量、数据质量和特征选择等方面的要求不同,如何选择适合的算法来进行能耗预测是一个需要解决的问题;此外,基于机器学习的能耗预测模型的可解释性和可靠性也需要进一步研究,以提高其在实际应用中的可信度和可用性。本文以某高校教学楼建筑中央空调运行数据作为支撑,通过空调能耗数据预处理、空调能耗特征分析、机器学习算法能耗预测模型建立、模型预测结果分析评价与优化等工作,建立起建筑空调系统与机器学习算法模型之间的适配性关系,最终总结提出标准化的基于机器学习的空调系统能耗预测方法。本文主要研究内容和成果如下:首先,本文对某高校教学楼建筑能耗数据信息进行了整理分析,介绍了数据来源,验证了数据质量,并利用数据可视化的手段,分别对整个建筑的能耗数据、各分项能耗数据、建筑冷负荷数据、空调子系统能耗数据进行了特征分析,明确了能耗特征规律,指出了中央空调运行中存在的问题。其次,本文提出基于k-means算法和KNN算法的建筑能耗异常数据识别和填补方法,并将离散变量通过独热编码转换为模型可以处理的输入形式,最后利用Boruta算法对输入特征进行筛选,为后续研究提供了数据基础。再次,本文建立了基于支持向量回归算法、随机森林算法、XGBoost算法和BP神经网络这四种具有代表性的机器学习算法的能耗预测模型,并选取MAE、RMSE、R2三种评价指标对模型的预测结果进行准确性评价。结果表明,基于BP神经网络建立的能耗预测模型可以取得最令人满意的预测准确度。最后,采用粒子群优化算法和遗传算法对BP神经网络进行优化,建立两种混合模型,然后计算两种混合模型预计结果与真实值的误差。结果表明,基于PSO-BP神经网络建立的教学楼能耗预测模型表现出最佳的预测精度,对比单一的BP神经网络模型,MAE由8.76降低至3.74,RMSE由12.57降低至6.32,R2由0.88提高至0.96。