本公開涉及數(shù)據(jù)處理技術、文本生成,具體涉及根因分析方法、裝置、計算機設備、存儲介質及程序產品。
背景技術:
1、在提供各類服務以滿足用戶特定需求的信息技術系統(tǒng)中,綜合了集成的技術體系,它包含了若干相互關聯(lián)的要素,如計算機硬件(服務器、終端設備等)、軟件(操作系統(tǒng)、應用程序等)、網絡通信設備(路由器、交換機等)、數(shù)據(jù)以及相關人員等。其核心在于利用信息技術實現(xiàn)信息的收集、存儲、處理、傳輸和應用等功能,以支持組織或企業(yè)的業(yè)務運作和決策管理。在系統(tǒng)發(fā)生故障時,往往需要通過自動歸因識別導致系統(tǒng)故障的根本原因。舉例來說,通過設定閾值、模式識別或機器學習算法等方式,檢測數(shù)據(jù)的異常變化,及時發(fā)現(xiàn)服務平臺出現(xiàn)的故障或性能下降等問題。例如,當服務器的處理器使用率突然升高超過一定閾值,并且持續(xù)一段時間,就可能被判斷為出現(xiàn)了故障。
2、然而,在相關的根因分析方案中,往往忽略了在服務變更頻繁發(fā)生時引發(fā)系統(tǒng)故障或異常情況。對于一些涉及多個系統(tǒng)組件、多種技術因素相互交織的復雜故障,自動根因分析可能需要更強大的算法和更復雜的模型才能準確地找出根因,否則可能會得出不準確的結論,從而導致根因分析準確率較差。
技術實現(xiàn)思路
1、有鑒于此,本公開提供了一種根因分析方法、裝置、計算機設備、存儲介質及程序產品,以解決信息技術系統(tǒng)中根因分析準確率較差的問題。
2、第一方面,本公開提供了一種根因分析方法,該方法包括:
3、在檢測到故障事件的情況下,獲取信息技術系統(tǒng)中與故障事件相關聯(lián)的變更事件,其中,變更事件用于指示對信息技術系統(tǒng)中的服務進行更新產生的事件;
4、獲取變更事件的事件數(shù)據(jù),其中,事件數(shù)據(jù)用于指示變更事件對應的信息技術系統(tǒng)中的特定操作或狀態(tài)變化所產生的記錄數(shù)據(jù);
5、基于事件數(shù)據(jù),確定變更事件與故障事件之間的關聯(lián)級別;
6、根據(jù)關聯(lián)級別在變更事件中確定目標事件,并基于目標事件對故障事件進行根因分析,得到分析結果。
7、第二方面,本公開提供了一種根因分析裝置,該裝置包括:
8、檢測模塊,用于在檢測到故障事件的情況下,獲取信息技術系統(tǒng)中與故障事件相關聯(lián)的變更事件,其中,變更事件用于指示對信息技術系統(tǒng)中的服務進行更新產生的事件;
9、獲取模塊,用于獲取變更事件的事件數(shù)據(jù),其中,事件數(shù)據(jù)用于指示變更事件對應的信息技術系統(tǒng)中的特定操作或狀態(tài)變化所產生的記錄數(shù)據(jù);
10、確定模塊,用于基于事件數(shù)據(jù),確定變更事件與故障事件之間的關聯(lián)級別;
11、分析模塊,用于根據(jù)關聯(lián)級別在變更事件中確定目標事件,并基于目標事件對故障事件進行根因分析,得到分析結果。
12、第三方面,本公開提供了一種計算機設備,包括:存儲器和處理器,存儲器和處理器之間互相通信連接,存儲器中存儲有計算機指令,處理器通過執(zhí)行計算機指令,從而執(zhí)行上述第一方面或其對應的任一實施方式的根因分析方法。
13、第四方面,本公開提供了一種計算機可讀存儲介質,該計算機可讀存儲介質上存儲有計算機指令,計算機指令用于使計算機執(zhí)行上述第一方面或其對應的任一實施方式的根因分析方法。
14、第五方面,本發(fā)明提供了一種計算機程序產品,包括計算機指令,計算機指令用于使計算機執(zhí)行上述第一方面或其對應的任一實施方式的根因分析方法。
15、在本公開實施例中,可以響應于檢測到的故障事件,獲取與故障事件相關聯(lián)的變更事件,其中,變更事件用于指示對信息技術系統(tǒng)中的服務進行更新產生的事件。然后,可以獲取變更事件的事件數(shù)據(jù),其中,事件數(shù)據(jù)用于指示變更事件對應的特定操作或狀態(tài)變化所產生的記錄數(shù)據(jù)。接下來,可以基于事件數(shù)據(jù),確定變更事件與故障事件之間的關聯(lián)級別,并根據(jù)關聯(lián)級別在變更事件中確定目標事件,以基于目標事件對故障事件進行根因分析,得到分析結果,從而在根因分析的過程中,對有時可能會引發(fā)系統(tǒng)故障或異常情況的變更事件進行分析,以診斷出變更事件是否為故障的根本原因,提高了根因分析的準確率,對于快速恢復系統(tǒng)正常運行、提升系統(tǒng)穩(wěn)定性以及優(yōu)化后續(xù)變更管理等方面都有著至關重要的作用。
1.一種根因分析方法,其特征在于,所述方法包括:
2.根據(jù)權利要求1所述的方法,其特征在于,所述獲取所述變更事件的事件數(shù)據(jù),包括:
3.根據(jù)權利要求1所述的方法,其特征在于,所述基于所述事件數(shù)據(jù),確定所述變更事件與所述故障事件之間的關聯(lián)級別,包括:
4.根據(jù)權利要求3所述的方法,其特征在于,所述事件數(shù)據(jù)包括:所述變更事件對應的檢測數(shù)據(jù)、所述變更事件與所述故障事件的依賴關系以及所述變更事件的時間記錄;
5.根據(jù)權利要求4所述的方法,其特征在于,所述基于所述關聯(lián)度,確定所述關聯(lián)級別,包括:
6.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)所述關聯(lián)級別在所述變更事件中確定目標事件,包括:
7.根據(jù)權利要求6所述的方法,其特征在于,所述基于所述變更事件的關聯(lián)級別對所述目標事件進行排序,得到排序結果,包括:
8.根據(jù)權利要求1所述的方法,其特征在于,所述事件數(shù)據(jù)包括:所述變更事件與故障事件之間的依賴關系;
9.根據(jù)權利要求8所述的方法,其特征在于,所述方法還包括:
10.一種根因分析裝置,其特征在于,所述裝置包括:
11.一種計算機設備,其特征在于,包括:
12.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機指令,所述計算機指令用于使計算機執(zhí)行權利要求1至9中任一項所述的根因分析方法。
13.一種計算機程序產品,其特征在于,包括計算機指令,所述計算機指令用于使計算機執(zhí)行權利要求1至9中任一項所述的根因分析方法。