本發(fā)明屬于建筑能耗預(yù)測(cè),具體涉及一種基于spearman&gbdt特征選擇和bka-fedformer&bka-bilstm的建筑能耗預(yù)測(cè)方法。
背景技術(shù):
1、隨著社會(huì)經(jīng)濟(jì)的快速發(fā)展,全球建筑能耗迅速增長(zhǎng),已占全球總能耗的三分之一以上,降低建筑能耗已成為全球能源管理的重要課題。建筑能耗預(yù)測(cè)是優(yōu)化能源利用、降低能耗的重要手段之一,它有助于電力系統(tǒng)的優(yōu)化調(diào)控,提高能源使用效率,并推動(dòng)可持續(xù)發(fā)展。
2、目前,建筑能耗預(yù)測(cè)方法主要包括三類(lèi)模型:(1)白盒物理模型,基于建筑物的物理信息、天氣條件及內(nèi)部活動(dòng)等數(shù)據(jù)進(jìn)行建模,該方法需要詳盡的建筑物物理特性參數(shù),然而由于建筑結(jié)構(gòu)復(fù)雜、類(lèi)型多樣,實(shí)際應(yīng)用中建模過(guò)程繁瑣,對(duì)專(zhuān)業(yè)人員要求高,且耗時(shí)較長(zhǎng)。(2)灰盒降階模型,基于簡(jiǎn)化墻體結(jié)構(gòu)及其熱阻、電容特性構(gòu)建數(shù)學(xué)模型,但其理論基礎(chǔ)尚不清晰,且假設(shè)條件較多,導(dǎo)致模型變量復(fù)雜、輸入?yún)?shù)不穩(wěn)定,影響預(yù)測(cè)的精度和適用性。(3)黑盒數(shù)據(jù)驅(qū)動(dòng)模型,純粹依賴(lài)歷史數(shù)據(jù)進(jìn)行能耗預(yù)測(cè),無(wú)需詳細(xì)的物理參數(shù),適用于多種場(chǎng)景,且預(yù)測(cè)精度較高,因此逐漸成為研究熱點(diǎn)。
3、盡管黑盒數(shù)據(jù)驅(qū)動(dòng)方法具有較高的靈活性和預(yù)測(cè)精度,但現(xiàn)有研究仍存在不足。例如,劉健等人在2024年提出的基于自適應(yīng)信號(hào)分解增強(qiáng)itransformer網(wǎng)絡(luò)的戶(hù)用能耗預(yù)測(cè)方法,僅采用單一神經(jīng)網(wǎng)絡(luò)進(jìn)行能耗預(yù)測(cè),容易受到噪聲數(shù)據(jù)的干擾,從而降低模型的魯棒性。同時(shí),特征選擇在能耗預(yù)測(cè)中具有至關(guān)重要的作用,若缺乏有效的特征選擇機(jī)制,數(shù)據(jù)中的冗余特征將顯著增加模型的計(jì)算負(fù)擔(dān)并降低預(yù)測(cè)精度(jian?liu,fan?yang,keyan,et?al.household?energy?consumption?forecasting?based?on?adaptive?signaldecomposition?enhanced?itransformer?network.energy?and?buildings,2024,324:114894)。另一研究中,馮增熙等人于2024年提出利用白鯨優(yōu)化算法優(yōu)化長(zhǎng)短期記憶網(wǎng)絡(luò)對(duì)寫(xiě)字樓能耗進(jìn)行預(yù)測(cè)的方法,雖然在一定程度上改善了模型性能,但其優(yōu)化算法仍面臨自適應(yīng)能力不足、局部搜索精度低以及過(guò)早收斂的問(wèn)題,限制了其在更復(fù)雜場(chǎng)景下的應(yīng)用(zengxi?feng,jianhu?an,mingyue?han,et?al.office?building?energy?consumptionforecast:adaptive?long?short?term?memory?networks?driven?by?improved?belugawhale?optimization?algorithm.journal?of?building?engineering.2024,91:109612)。由此可見(jiàn),亟需一種高效、穩(wěn)定且精準(zhǔn)的能耗預(yù)測(cè)方法,以提升建筑能耗管理水平。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明旨在提供一種基于spearman&gbdt特征選擇和bka-fedformer&bka-bilstm的建筑能耗預(yù)測(cè)方法,以解決現(xiàn)有技術(shù)中單一神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)穩(wěn)定性差、預(yù)測(cè)精度不高等問(wèn)題,從而提升建筑能耗預(yù)測(cè)的準(zhǔn)確性和適用性。
2、針對(duì)上述問(wèn)題,本發(fā)明提出了一種基于黑翅鳶優(yōu)化算法(black-winged?kitealgorithm,bka)優(yōu)化的bka-fedformer&bka-bilstm組合預(yù)測(cè)模型。具體而言,本方法首先使用spearman相關(guān)系數(shù)和集成學(xué)習(xí)算法(gradient?boosting?decision?tree,gbdt)進(jìn)行特征選擇,以剔除冗余變量,減少數(shù)據(jù)維度,提高模型的計(jì)算效率。隨后,利用bka優(yōu)化fedformer(frequency?enhanced?decomposed?transformer)和雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(bi-directional?long?short-term?memory,bilstm)的超參數(shù),提高模型的穩(wěn)定性和泛化能力。最后,采用分時(shí)預(yù)測(cè)策略,構(gòu)建bka-fedformer&bka-bilstm組合模型,實(shí)現(xiàn)更精準(zhǔn)的建筑能耗預(yù)測(cè)。
3、為了實(shí)現(xiàn)以上技術(shù)目的,本發(fā)明具體采用以下技術(shù)方案:
4、一種結(jié)合特征選擇、優(yōu)化算法及神經(jīng)網(wǎng)絡(luò)分時(shí)預(yù)測(cè)的建筑能耗預(yù)測(cè)方法,包括以下步驟:
5、步驟一:特征選擇。通過(guò)spearman相關(guān)系數(shù)和gbdt技術(shù)進(jìn)行特征變量篩選,剔除冗余特征,提高模型計(jì)算效率;
6、步驟二:數(shù)據(jù)分區(qū)處理。將數(shù)據(jù)集劃分為建模數(shù)據(jù)集和預(yù)測(cè)數(shù)據(jù)集,其中建模數(shù)據(jù)集進(jìn)一步劃分為訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集,以用于模型訓(xùn)練和參數(shù)優(yōu)化;
7、步驟三:神經(jīng)網(wǎng)絡(luò)優(yōu)化。采用bka分別優(yōu)化fedformer和bilstm的超參數(shù),提高模型的穩(wěn)定性和預(yù)測(cè)精度;
8、步驟四:子模型訓(xùn)練。使用優(yōu)化后的bka-fedformer和bka-bilstm模型分別訓(xùn)練得到兩個(gè)子模型;
9、步驟五:預(yù)測(cè)時(shí)間分布分析。結(jié)合五重交叉驗(yàn)證,分析兩個(gè)子模型在不同時(shí)間段的預(yù)測(cè)誤差,確定最佳預(yù)測(cè)時(shí)間分布方案;
10、步驟六:構(gòu)建分時(shí)預(yù)測(cè)組合模型。根據(jù)預(yù)測(cè)時(shí)間分布,組合bka-fedformer和bka-bilstm模型,形成最終的分時(shí)預(yù)測(cè)神經(jīng)網(wǎng)絡(luò);
11、步驟七:能耗預(yù)測(cè)。采用組合神經(jīng)網(wǎng)絡(luò)對(duì)測(cè)試數(shù)據(jù)進(jìn)行預(yù)測(cè),以實(shí)現(xiàn)建筑能耗的精準(zhǔn)預(yù)測(cè)。
12、進(jìn)一步地,步驟一中采用spearman相關(guān)系數(shù)和gbdt技術(shù)對(duì)特征變量進(jìn)行篩選,以減少冗余數(shù)據(jù),提高模型計(jì)算效率,具體包括以下步驟:
13、(1)通過(guò)spearman相關(guān)系數(shù)和gbdt技術(shù)分別對(duì)數(shù)據(jù)集中的特征變量進(jìn)行評(píng)分,并按照重要性排序;
14、(2)重復(fù)上述評(píng)分過(guò)程5次,并采用平均值法計(jì)算最終評(píng)分結(jié)果;
15、(3)設(shè)定特征選擇閾值,分別篩選spearman和gbdt評(píng)分高于閾值的特征變量;
16、(4)取spearman和gbdt篩選結(jié)果的交集,保留兩種方法都認(rèn)為重要的特征變量,作為最終的輸入特征集。
17、進(jìn)一步地,步驟二將數(shù)據(jù)劃分為建模數(shù)據(jù)集和預(yù)測(cè)數(shù)據(jù)集,并進(jìn)一步細(xì)分,包括下述步驟:
18、(1)建模數(shù)據(jù)集用于模型的開(kāi)發(fā),包括訓(xùn)練數(shù)據(jù)集:用于模型參數(shù)學(xué)習(xí),驗(yàn)證數(shù)據(jù)集:用于模型參數(shù)優(yōu)化和超參數(shù)調(diào)整;
19、(2)預(yù)測(cè)數(shù)據(jù)集用于模型的最終測(cè)試,以評(píng)估模型的泛化能力和預(yù)測(cè)精度。
20、進(jìn)一步地,步驟三為提升預(yù)測(cè)精度,采用bka對(duì)神經(jīng)網(wǎng)絡(luò)超參數(shù)進(jìn)行優(yōu)化,具體優(yōu)化流程如下:
21、(1)確保fedformer和bilstm模型使用相同的輸入特征集,即基于spearman&gbdt方法篩選出的特征變量;
22、(2)使用訓(xùn)練數(shù)據(jù)對(duì)fedformer和bilstm模型進(jìn)行初步訓(xùn)練,并使用驗(yàn)證數(shù)據(jù)計(jì)算bka的適應(yīng)度函數(shù);
23、(3)采用bka迭代搜索最優(yōu)超參數(shù)配置,直至滿(mǎn)足終止條件;
24、(4)確定最終的最佳參數(shù)設(shè)置,分別應(yīng)用于bka-fedformer和bka-bilstm模型。
25、進(jìn)一步地,步驟四基于優(yōu)化后的超參數(shù),分別訓(xùn)練bka-fedformer和bka-bilstm模型,具體步驟如下:
26、(1)采用訓(xùn)練數(shù)據(jù)集訓(xùn)練bka-fedformer,得到分時(shí)組合神經(jīng)網(wǎng)絡(luò)的第一個(gè)子模型;
27、(2)采用相同的訓(xùn)練數(shù)據(jù)集訓(xùn)練bka-bilstm,得到分時(shí)組合神經(jīng)網(wǎng)絡(luò)的第二個(gè)子模型。
28、進(jìn)一步地,步驟五采用五重交叉驗(yàn)證法,分析兩個(gè)子模型在不同時(shí)間段的預(yù)測(cè)誤差,具體步驟如下:
29、(1)分別使用bka-fedformer和bka-bilstm模型對(duì)相同的建模數(shù)據(jù)集進(jìn)行訓(xùn)練和預(yù)測(cè);
30、(2)采用五重交叉驗(yàn)證計(jì)算兩個(gè)子模型的預(yù)測(cè)誤差,并記錄每個(gè)時(shí)間段的誤差情況;
31、(3)在同一時(shí)間段內(nèi),比較兩個(gè)子模型的預(yù)測(cè)誤差,選擇誤差較小的子模型作為當(dāng)前時(shí)間段的預(yù)測(cè)模型。
32、進(jìn)一步地,步驟六構(gòu)建的分時(shí)預(yù)測(cè)組合模型,基于預(yù)測(cè)時(shí)間分布分析的結(jié)果,確定bka-fedformer和bka-bilstm的最優(yōu)適用時(shí)間段:
33、(1)0:00-12:00,bka-fedformer的預(yù)測(cè)誤差小于bka-bilstm,因此采用bka-fedformer進(jìn)行預(yù)測(cè);
34、(2)12:00-24:00,bka-bilstm的預(yù)測(cè)誤差小于bka-fedformer,因此采用bka-bilstm進(jìn)行預(yù)測(cè)。
35、通過(guò)該分時(shí)組合策略,實(shí)現(xiàn)更精準(zhǔn)、更穩(wěn)定的建筑能耗預(yù)測(cè)。
36、進(jìn)一步地,步驟七能耗預(yù)測(cè),使用構(gòu)建的bka-fedformer&bka-bilstm組合模型對(duì)測(cè)試數(shù)據(jù)進(jìn)行能耗預(yù)測(cè)。該方法能夠有效結(jié)合兩種神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì),提升預(yù)測(cè)精度和模型穩(wěn)定性。
37、采用本發(fā)明的技術(shù)方案具有的創(chuàng)新點(diǎn)主要包括:(1)基于spearman&gbdt特征選擇,有效降低冗余特征,提高數(shù)據(jù)質(zhì)量;(2)bka優(yōu)化深度學(xué)習(xí)模型,提高超參數(shù)調(diào)優(yōu)效率,避免傳統(tǒng)試錯(cuò)法帶來(lái)的低效問(wèn)題;(3)分時(shí)組合預(yù)測(cè)模型,解決單一模型穩(wěn)定性不足的問(wèn)題,提高預(yù)測(cè)精度和適應(yīng)性。相比傳統(tǒng)方法,該方法能夠更準(zhǔn)確地預(yù)測(cè)建筑能耗,具有更廣泛的適用性和推廣價(jià)值。
38、與現(xiàn)有技術(shù)相比,本發(fā)明具有如下技術(shù)優(yōu)勢(shì):
39、(1)創(chuàng)新的特征選擇方法
40、本發(fā)明采用spearman相關(guān)系數(shù)和gbdt相結(jié)合的方式進(jìn)行特征選擇,使特征篩選過(guò)程更加全面,從而有效減少模型復(fù)雜度,提高預(yù)測(cè)精度。spearman相關(guān)系數(shù)在處理非線性關(guān)系較弱但線性關(guān)系顯著的特征變量時(shí),能夠發(fā)揮更好的篩選作用。gbdt技術(shù)作為一種集成學(xué)習(xí)算法,能夠衡量特征變量對(duì)目標(biāo)變量的影響程度,進(jìn)一步優(yōu)化特征選擇結(jié)果。通過(guò)這兩種方法的結(jié)合,本發(fā)明能夠篩選出對(duì)預(yù)測(cè)目標(biāo)影響因子更高的特征變量,從而降低數(shù)據(jù)冗余,提高模型訓(xùn)練效率,提升預(yù)測(cè)精度。
41、(2)全新的優(yōu)化算法
42、本發(fā)明采用bka對(duì)神經(jīng)網(wǎng)絡(luò)超參數(shù)進(jìn)行優(yōu)化,進(jìn)一步提高預(yù)測(cè)精度和模型穩(wěn)定性。bka算法由wang等人于2024年提出,是一種受黑翅鳶遷徙與捕食行為啟發(fā)的元啟發(fā)式優(yōu)化算法。相較于傳統(tǒng)優(yōu)化算法(如麻雀搜索算法、粒子群優(yōu)化算法等),bka算法具有更強(qiáng)的全局搜索能力和更快的收斂速度,能夠更高效地尋找到神經(jīng)網(wǎng)絡(luò)的最佳超參數(shù)配置。經(jīng)過(guò)研究驗(yàn)證,bka算法的優(yōu)化效果優(yōu)于多種傳統(tǒng)優(yōu)化算法,使得模型能夠在更短時(shí)間內(nèi)達(dá)到更優(yōu)的預(yù)測(cè)精度。通過(guò)bka算法的引入,本發(fā)明有效提升了神經(jīng)網(wǎng)絡(luò)參數(shù)優(yōu)化的效率,避免了傳統(tǒng)試錯(cuò)法調(diào)參的低效問(wèn)題,使預(yù)測(cè)結(jié)果更加精準(zhǔn)可靠。
43、(3)新型的分時(shí)預(yù)測(cè)組合模型
44、當(dāng)前,大多數(shù)建筑能耗預(yù)測(cè)模型采用單一神經(jīng)網(wǎng)絡(luò)架構(gòu),但這類(lèi)方法往往存在預(yù)測(cè)穩(wěn)定性差,易受到數(shù)據(jù)噪聲的影響;無(wú)法兼顧不同時(shí)間段的特征變化,導(dǎo)致模型在某些時(shí)段預(yù)測(cè)精度較低。為了解決上述問(wèn)題,本發(fā)明提出了一種基于分時(shí)預(yù)測(cè)的組合模型,結(jié)合bka-fedformer與bka-bilstm,利用二者在不同時(shí)間段的預(yù)測(cè)優(yōu)勢(shì),提高整體預(yù)測(cè)精度。0:00-12:00時(shí)段,bka-fedformer模型的預(yù)測(cè)誤差較低,因此采用其預(yù)測(cè)結(jié)果。12:00-24:00時(shí)段,bka-bilstm模型的預(yù)測(cè)誤差較低,因此采用其預(yù)測(cè)結(jié)果。通過(guò)該分時(shí)組合策略,本發(fā)明有效避免了單一模型預(yù)測(cè)穩(wěn)定性差的問(wèn)題,使得整體預(yù)測(cè)精度和魯棒性得到顯著提升。