本發(fā)明涉及計算機(jī),特別涉及微服務(wù)的異常根因定位方法、設(shè)備、介質(zhì)和計算機(jī)程序產(chǎn)品。
背景技術(shù):
1、近年來,隨著微服務(wù)架構(gòu)的廣泛應(yīng)用,越來越多的企業(yè)采用基于微服務(wù)的系統(tǒng)架構(gòu),以提升系統(tǒng)的靈活性和擴(kuò)展性。然而,微服務(wù)架構(gòu)的高度復(fù)雜性也帶來了新的技術(shù)挑戰(zhàn),尤其是在系統(tǒng)出現(xiàn)異常時,錯誤的排查和定位通常需要耗費大量研發(fā)和運維資源。這種低效率的故障排查過程可能導(dǎo)致企業(yè)運營效率下降,甚至造成顯著的經(jīng)濟(jì)損失。因此,在微服務(wù)系統(tǒng)中,針對異常場景,如何快速、智能地定位錯誤根因并實現(xiàn)故障恢復(fù),已成為實際應(yīng)用中的一項重要需求。
2、現(xiàn)有的技術(shù)方案通?;诒O(jiān)控指標(biāo)、調(diào)用鏈路和日志進(jìn)行問題定位。然而,由于微服務(wù)架構(gòu)的分布式特性以及云原生技術(shù)的引入,如何有效整合這些工具,在復(fù)雜系統(tǒng)中快速準(zhǔn)確地定位問題仍然具有很大的技術(shù)難度和挑戰(zhàn)性。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供微服務(wù)的異常根因定位方法、設(shè)備、介質(zhì)和計算機(jī)程序產(chǎn)品,解決如何結(jié)合微服務(wù)的異常指標(biāo)、微服務(wù)的圖、微服務(wù)的更新事件文本快速異常根因定位的技術(shù)問題。
2、本發(fā)明的第一實施方式公開了一種微服務(wù)的異常根因定位方法,用于電子設(shè)備,所述方法包括:
3、獲取多個微服務(wù)的異常指標(biāo);
4、獲取所述多個微服務(wù)的圖,其中,所述圖的節(jié)點表示微服務(wù),邊表示微服務(wù)之間存在的調(diào)用關(guān)系;
5、獲取所述多個微服務(wù)的多個更新事件文本;
6、基于所述異常指標(biāo),為所述圖的邊賦第一權(quán)重,所述第一權(quán)重表示邊連接的節(jié)點之間的關(guān)聯(lián)度;
7、基于預(yù)訓(xùn)練的圖-文本模型,確定異常子圖與所述多個更新事件文本的相關(guān)度,所述圖的異常子圖為所述圖中被賦權(quán)的邊及其所連接的節(jié)點;
8、在所述相關(guān)度達(dá)到預(yù)定閾值的情況下,對于所述異常子圖中被所述多個更新事件文本表示的更新節(jié)點,增加所述更新節(jié)點的第二權(quán)重,所述第二權(quán)重表示節(jié)點在隨機(jī)游走算法或隨機(jī)傳送算法中優(yōu)先被確定為異常根因節(jié)點的可能性;
9、對所述異常子圖執(zhí)行隨機(jī)游走算法,或隨機(jī)游走算法和隨機(jī)傳送算法,確定異常根因節(jié)點。
10、根據(jù)本發(fā)明的第一實施方式,所述獲取多個微服務(wù)的異常指標(biāo),包括:
11、使用adtk的無監(jiān)督異常檢測算法,獲取微服務(wù)性能異常指標(biāo)、微服務(wù)可用性異常指標(biāo),其中,所述微服務(wù)性能異常指標(biāo)為微服務(wù)之間調(diào)用的響應(yīng)時間,所述微服務(wù)可用性異常指標(biāo)為微服務(wù)的錯誤計數(shù)。
12、根據(jù)本發(fā)明的第一實施方式,所述基于所述異常指標(biāo),為所述圖的邊賦第一權(quán)重,包括:
13、根據(jù)所述微服務(wù)性能異常指標(biāo)和所述微服務(wù)可用性異常指標(biāo)的高低,使用皮爾遜相關(guān)系數(shù)為表示異常微服務(wù)的節(jié)點之間的邊的所述第一權(quán)重賦值。
14、根據(jù)本發(fā)明的第一實施方式,所述獲取所述多個微服務(wù)的圖,包括:
15、獲取預(yù)定時間段內(nèi)的trace數(shù)據(jù),包括所述預(yù)定時間段內(nèi)微服務(wù)之間的調(diào)用關(guān)系和調(diào)用時長;
16、根據(jù)所述trace數(shù)據(jù),生成所述圖的邊;
17、獲取所述多個微服務(wù)的描述文本。
18、根據(jù)本發(fā)明的第一實施方式,所述基于預(yù)訓(xùn)練的圖-文本模型,確定異常子圖與所述多個更新事件文本的相關(guān)度,包括:
19、提取所述異常子圖中節(jié)點對應(yīng)微服務(wù)的所述描述文本的第一向量,作為所述節(jié)點的屬性;
20、提取所述多個更新事件文本中與所述節(jié)點對應(yīng)的更新事件文本的第二向量;
21、利用圖注意力網(wǎng)絡(luò),提取所述第一向量的特征;
22、確定所述特征和所述第二向量之間的相似度。
23、根據(jù)本發(fā)明的第一實施方式,所述第一向量和所述第二向量利用bert模型提取。
24、根據(jù)本發(fā)明的第一實施方式,所述更新事件文本包括更新的api接口的描述文本。
25、根據(jù)本發(fā)明的第一實施方式,還包括:
26、在所述相關(guān)度達(dá)到預(yù)定閾值的情況下,新建虛擬節(jié)點,所述虛擬節(jié)點指向所述異常子圖中被所述多個更新事件文本表示的更新節(jié)點,所述虛擬節(jié)點的第二權(quán)重為1。
27、根據(jù)本發(fā)明的第一實施方式,所述對所述異常子圖執(zhí)行隨機(jī)游走算法,或隨機(jī)游走算法和隨機(jī)傳送算法,確定異常根因節(jié)點,包括:
28、對所述異常子圖執(zhí)行personalized?pagerank算法,確定異常根因節(jié)點。
29、本發(fā)明的第二實施方式公開了一種電子設(shè)備,所述電子設(shè)備包括存儲有計算機(jī)可執(zhí)行指令的存儲器和處理器,當(dāng)所述指令被所述處理器執(zhí)行時,使得所述電子設(shè)備實施根據(jù)本發(fā)明的第一實施方式的微服務(wù)的異常根因定位方法。
30、本發(fā)明的第三實施方式公開了一種計算機(jī)存儲介質(zhì),在所述計算機(jī)存儲介質(zhì)上存儲有指令,當(dāng)所述指令在計算機(jī)上運行時,使得所述計算機(jī)執(zhí)行根據(jù)本發(fā)明的第一實施方式的微服務(wù)的異常根因定位方法。
31、本發(fā)明的第四實施方式公開了一種計算機(jī)程序產(chǎn)品,包括計算機(jī)可執(zhí)行指令,所述指令被處理器執(zhí)行以實施根據(jù)本發(fā)明的第一實施方式的微服務(wù)的異常根因定位方法。
32、本發(fā)明實施方式與現(xiàn)有技術(shù)相比,主要區(qū)別及其效果在于:
33、通過本發(fā)明的技術(shù)方案,將監(jiān)控指標(biāo)、包含調(diào)用關(guān)系的微服務(wù)圖數(shù)據(jù)和更新事件文本相關(guān)性相結(jié)合,實現(xiàn)了對故障根因的快速定位。其中,通過結(jié)合監(jiān)控指標(biāo)和微服務(wù)圖數(shù)據(jù)得到異常子圖;再通過結(jié)合更新事件文本,調(diào)整異常子圖的權(quán)重,將更新事件與異常之間的關(guān)聯(lián)關(guān)系引入考慮;最后,在調(diào)整權(quán)重的異常子圖上執(zhí)行隨機(jī)游走,或者隨機(jī)游走和隨機(jī)傳送,提取異常子圖動態(tài)和全局信息,找出異常根因節(jié)點??梢钥焖俅_定異常對應(yīng)的根因微服務(wù),從而顯著縮短故障排查時間,提高系統(tǒng)運維效率。
1.一種微服務(wù)的異常根因定位方法,用于電子設(shè)備,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取多個微服務(wù)的異常指標(biāo),包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于所述異常指標(biāo),為所述圖的邊賦第一權(quán)重,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取所述多個微服務(wù)的圖,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述基于預(yù)訓(xùn)練的圖-文本模型,確定異常子圖與所述多個更新事件文本的相關(guān)度,包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述第一向量和所述第二向量利用bert模型提取。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述更新事件文本包括更新的api接口的描述文本。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述異常子圖執(zhí)行隨機(jī)游走算法,或隨機(jī)游走算法和隨機(jī)傳送算法,確定異常根因節(jié)點,包括:
10.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括存儲有計算機(jī)可執(zhí)行指令的存儲器和處理器,當(dāng)所述指令被所述處理器執(zhí)行時,使得所述電子設(shè)備實施根據(jù)權(quán)利要求1-9中任一項所述的微服務(wù)的異常根因定位方法。
11.一種計算機(jī)存儲介質(zhì),其特征在于,在所述計算機(jī)存儲介質(zhì)上存儲有指令,當(dāng)所述指令在計算機(jī)上運行時,使得所述計算機(jī)執(zhí)行根據(jù)權(quán)利要求1-9中任一項所述的微服務(wù)的異常根因定位方法。
12.一種計算機(jī)程序產(chǎn)品,其特征在于,包括計算機(jī)可執(zhí)行指令,所述指令被處理器執(zhí)行以實施根據(jù)權(quán)利要求1-9中任一項所述的微服務(wù)的異常根因定位方法。