本發(fā)明涉及交通的一種線路推薦方法,尤其涉及一種基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦方法,還涉及一種基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦設(shè)備。
背景技術(shù):
1、隨著城市化進(jìn)程的加快以及區(qū)域經(jīng)濟(jì)的協(xié)同發(fā)展,城市之間的人員流動(dòng)日益頻繁。城際交通作為連接不同城市的重要紐帶,其便捷性對(duì)于區(qū)域發(fā)展和人們的出行體驗(yàn)有著至關(guān)重要的作用。傳統(tǒng)的城際交通方式主要包括鐵路、長(zhǎng)途客運(yùn)等,但公交線路作為一種靈活且覆蓋面廣的交通形式,在城際交通中也有著不可忽視的潛力。
2、目前,城際公交線路的推薦與規(guī)劃大多源于經(jīng)驗(yàn)數(shù)據(jù)和有限的調(diào)查信息。例如,交通部門(mén)根據(jù)城市間主要人口聚居點(diǎn)、經(jīng)濟(jì)活動(dòng)中心等宏觀因素確定線路走向,或者通過(guò)網(wǎng)絡(luò)問(wèn)卷調(diào)查了解乘客的出行需求。然而,這些方法存在著許多局限性。一方面,經(jīng)驗(yàn)數(shù)據(jù)難以全面反映實(shí)際的人員流動(dòng)情況,城市間的人口流動(dòng)模式是復(fù)雜多變的,受到時(shí)間、季節(jié)、特殊活動(dòng)等多種因素的影響,僅僅依據(jù)固定的宏觀因素容易導(dǎo)致線路規(guī)劃與實(shí)際需求的偏差。另一方面,小規(guī)模問(wèn)卷調(diào)查的樣本量有限,且存在樣本偏差問(wèn)題,不能準(zhǔn)確地捕捉到不同人群的出行習(xí)慣和需求。因此,現(xiàn)有技術(shù)未能有效挖掘有價(jià)值的信息來(lái)為城際公交線路的科學(xué)規(guī)劃和精準(zhǔn)推薦提供支持,導(dǎo)致城際公交線路無(wú)法更好地滿足乘客的實(shí)際出行需求,降低了城際公交的運(yùn)營(yíng)效率和吸引力。
技術(shù)實(shí)現(xiàn)思路
1、為解決現(xiàn)有的技術(shù)問(wèn)題,本發(fā)明提供一種基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦方法及其設(shè)備,解決了現(xiàn)有的城際公交線路無(wú)法滿足乘客的實(shí)際出行需求的問(wèn)題。
2、本發(fā)明采用以下技術(shù)方案實(shí)現(xiàn):一種基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦方法,其包括以下步驟:
3、s1:對(duì)移動(dòng)信令數(shù)據(jù)預(yù)處理以獲得城際出行數(shù)據(jù),執(zhí)行步驟s2;
4、s2:對(duì)所述城際出行數(shù)據(jù)進(jìn)行聚合處理,生成用戶出行軌跡鏈,執(zhí)行步驟s3;
5、s3:對(duì)所述用戶出行軌跡鏈進(jìn)行聚類(lèi),以生成城際公交推薦線路;
6、其中,所述城際出行數(shù)據(jù)的聚合處理方法包括以下步驟:
7、s2.1:對(duì)所述城際出行數(shù)據(jù)的基站h3網(wǎng)格化處理,執(zhí)行步驟s2.2;
8、s2.2:將目標(biāo)用戶信令數(shù)據(jù)與h3網(wǎng)格編碼表關(guān)聯(lián),執(zhí)行步驟s2.3;
9、s2.3:判斷用戶是否在h3網(wǎng)格中停留,是則計(jì)算用戶在h3網(wǎng)格中連續(xù)停留時(shí)間,執(zhí)行步驟s2.4;
10、s2.4:判斷所述連續(xù)停留時(shí)間是否低于一個(gè)預(yù)設(shè)時(shí)間,是則刪除對(duì)應(yīng)的用戶數(shù)據(jù)。
11、作為上述方案的進(jìn)一步改進(jìn),所述步驟s1包括:
12、從所述移動(dòng)信令數(shù)據(jù)中篩選出城際出行的用戶數(shù)據(jù);
13、在所述用戶數(shù)據(jù)中刪除乒乓漂移數(shù)據(jù)、重復(fù)或無(wú)效數(shù)據(jù),并對(duì)時(shí)間戳、坐標(biāo)類(lèi)型進(jìn)行轉(zhuǎn)換,篩選出城際od數(shù)據(jù),以獲得所述城際出行數(shù)據(jù)。
14、作為上述方案的進(jìn)一步改進(jìn),所述步驟s2.3,先對(duì)用戶在單一網(wǎng)格內(nèi)的停留時(shí)間進(jìn)行排序,并得到排序值,并統(tǒng)計(jì)最早進(jìn)入網(wǎng)格的時(shí)間,再根據(jù)所述排序值和所述最早進(jìn)入網(wǎng)格的時(shí)間判斷后面每一個(gè)時(shí)刻是否歸屬第一個(gè)時(shí)刻時(shí)間,最后根據(jù)所述第一個(gè)時(shí)刻時(shí)間判斷用戶是否在h3網(wǎng)格中停留。
15、進(jìn)一步地,所述時(shí)間tstartt的計(jì)算公式為:
16、tstart=t-rk*1
17、其中,tstart為所述第一個(gè)時(shí)刻時(shí)間,t為所述最早進(jìn)入網(wǎng)格的時(shí)間,rk為所述排序值。
18、作為上述方案的進(jìn)一步改進(jìn),所述步驟s3,對(duì)所述用戶出行軌跡鏈的聚類(lèi)通過(guò)dbscan聚類(lèi)算法、k-means聚類(lèi)算法以及bert+k-means聚類(lèi)算法中的一種或多種實(shí)現(xiàn)。
19、進(jìn)一步地,所述bert+k-means聚類(lèi)算法包括以下步驟:
20、通過(guò)bert模型訓(xùn)練所述用戶出行軌跡鏈;
21、基于h3網(wǎng)格的網(wǎng)格代碼構(gòu)建詞匯表并編碼;
22、將所述用戶出行鏈數(shù)據(jù)轉(zhuǎn)換為embedding向量;
23、驗(yàn)證評(píng)估所述embedding向量,并基于轉(zhuǎn)換后的embedding向量使用k-means聚類(lèi)算法聚類(lèi)。
24、再進(jìn)一步地,通過(guò)bert模型對(duì)所述用戶出行軌跡鏈的訓(xùn)練方法包括以下步驟;
25、將所述用戶出行軌跡鏈所經(jīng)過(guò)的h3網(wǎng)格編碼轉(zhuǎn)換為文本處理基本單元,并對(duì)文本處理基本單元進(jìn)行編碼;
26、將編碼后的數(shù)據(jù)使用bert模型進(jìn)行訓(xùn)練,將數(shù)據(jù)轉(zhuǎn)換為embedding向量;
27、隨機(jī)抽取用戶出行鏈樣例,通過(guò)對(duì)比轉(zhuǎn)換前的用戶出行軌跡鏈與轉(zhuǎn)換為embedding向量后的用戶出行軌跡鏈的相似度對(duì)embedding向量進(jìn)行評(píng)估。
28、作為上述方案的進(jìn)一步改進(jìn),所述連續(xù)停留時(shí)間的計(jì)算公式為:
29、tstay=tmax-tmin
30、其中,tstay為所述連續(xù)停留時(shí)間,tmax為用戶在網(wǎng)格內(nèi)停留的最末時(shí)刻,tmin為用戶在網(wǎng)格內(nèi)停留的起始時(shí)刻。
31、作為上述方案的進(jìn)一步改進(jìn),所述步驟s2還包括:先將所述用戶數(shù)據(jù)聚合到所述h3網(wǎng)格,再對(duì)所述h3網(wǎng)格按照時(shí)間序列排序,最后根據(jù)排序后的h3網(wǎng)格生成所述用戶出行軌跡鏈。
32、本發(fā)明還提供一種基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦設(shè)備,其包括:
33、預(yù)處理模塊,其用于對(duì)移動(dòng)信令數(shù)據(jù)預(yù)處理以獲得城際出行數(shù)據(jù);
34、聚合處理模塊,其用于對(duì)所述城際出行數(shù)據(jù)進(jìn)行聚合處理,生成用戶出行軌跡鏈;以及
35、聚類(lèi)模塊,其用于對(duì)所述用戶出行軌跡鏈進(jìn)行聚類(lèi),以生成城際公交推薦線路;
36、其中,所述聚合處理模塊聚合處理所述城際出行數(shù)據(jù)的方法包括以下步驟:
37、s2.1:對(duì)所述城際出行數(shù)據(jù)的基站h3網(wǎng)格化處理,執(zhí)行步驟s2.2;
38、s2.2:將目標(biāo)用戶信令數(shù)據(jù)與h3網(wǎng)格編碼表關(guān)聯(lián),執(zhí)行步驟s2.3;
39、s2.3:判斷用戶是否在h3網(wǎng)格中停留,是則計(jì)算用戶在h3網(wǎng)格中連續(xù)停留時(shí)間,執(zhí)行步驟s2.4;
40、s2.4:判斷所述連續(xù)停留時(shí)間是否低于一個(gè)預(yù)設(shè)時(shí)間,是則刪除對(duì)應(yīng)的用戶數(shù)據(jù)。。
41、本發(fā)明的基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦方法及其設(shè)備,利用移動(dòng)信令數(shù)據(jù)對(duì)城際公交線路進(jìn)行推薦和規(guī)劃,充分使用了移動(dòng)信令數(shù)據(jù)所蘊(yùn)含的大量的位置信息和時(shí)間信息,采樣的數(shù)據(jù)量更大、覆蓋面更廣且數(shù)據(jù)精準(zhǔn)度更高,能夠全面反映實(shí)際的人員流動(dòng)情況,規(guī)避固定的宏觀因素導(dǎo)致線路規(guī)劃與實(shí)際需求的偏差問(wèn)題,能準(zhǔn)確地捕捉到不同人群的出行習(xí)慣和需求,能更好地滿足乘客的實(shí)際出行需求,提升了城際公交的運(yùn)營(yíng)效率和吸引力。
1.一種基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦方法,其特征在于,其包括以下步驟:
2.如權(quán)利要求1所述的基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦方法,其特征在于,所述步驟s1包括:
3.如權(quán)利要求1所述的基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦方法,其特征在于,所述步驟s2.3,先對(duì)用戶在單一網(wǎng)格內(nèi)的停留時(shí)間進(jìn)行排序,并得到排序值,并統(tǒng)計(jì)最早進(jìn)入網(wǎng)格的時(shí)間,再根據(jù)所述排序值和所述最早進(jìn)入網(wǎng)格的時(shí)間判斷后面每一個(gè)時(shí)刻是否歸屬第一個(gè)時(shí)刻時(shí)間,最后根據(jù)所述第一個(gè)時(shí)刻時(shí)間判斷用戶是否在h3網(wǎng)格中停留。
4.如權(quán)利要求3所述的基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦方法,其特征在于,所述時(shí)間tstartt的計(jì)算公式為:
5.如權(quán)利要求1所述的基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦方法,其特征在于,所述步驟s3,對(duì)所述用戶出行軌跡鏈的聚類(lèi)通過(guò)dbscan聚類(lèi)算法、k-means聚類(lèi)算法以及bert+k-means聚類(lèi)算法中的一種或多種實(shí)現(xiàn)。
6.如權(quán)利要求5所述的基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦方法,其特征在于,所述bert+k-means聚類(lèi)算法包括以下步驟:
7.如權(quán)利要求6所述的基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦方法,其特征在于,通過(guò)bert模型對(duì)所述用戶出行軌跡鏈的訓(xùn)練方法包括以下步驟;
8.如權(quán)利要求1所述的基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦方法,其特征在于,所述連續(xù)停留時(shí)間的計(jì)算公式為:
9.如權(quán)利要求1所述的基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦方法,其特征在于,所述步驟s2還包括:先將所述用戶數(shù)據(jù)聚合到所述h3網(wǎng)格,再對(duì)所述h3網(wǎng)格按照時(shí)間序列排序,最后根據(jù)排序后的h3網(wǎng)格生成所述用戶出行軌跡鏈。
10.一種基于移動(dòng)信令數(shù)據(jù)的城際公交線路推薦設(shè)備,其特征在于,其包括: