本發(fā)明屬于一種推薦方法,具體是涉及到一種基于超圖的在線招聘雙邊互惠推薦方法、裝置及電子設備。
背景技術(shù):
1、現(xiàn)在,隨著智能招聘的快速發(fā)展,眾多在線招聘平臺應運而生,在線招聘服務的興起促進了無數(shù)求職者與招聘人員之間的互動,產(chǎn)生了大量的簡歷和招聘廣告數(shù)據(jù)。因此,求職者往往難以快速找到合適的職位,而招聘人員則面臨著有效識別合格候選人的挑戰(zhàn)。
2、通常,招聘人員會發(fā)布招聘廣告,概述職位要求和描述,包括職位名稱、學歷要求、工作地點和薪水。同時,求職者提交個人簡歷,詳細描述自己的偏好和工作經(jīng)歷,例如最近的工作類別、教育背景、期望的工作地點和期望的薪水。因此,在線招聘平臺的關鍵在于簡歷偏好與工作要求的匹配程度,即簡歷-工作匹配(或人-工作匹配)。與傳統(tǒng)的單向用戶-項目推薦系統(tǒng)不同,簡歷-工作匹配是一個雙向互惠的過程,需要考慮招聘市場的雙邊需求。
3、具體來說,在線招聘表現(xiàn)出三個主要特征:(1)雙邊主義。求職者和招聘人員從不同的角度提供信息。求職者通常分享個人背景信息,而招聘人員則關注與工作相關的要求。然而,對簡歷和職位相同屬性的期望可能會有所不同。例如,求職者通常尋求更高的薪水,而招聘人員則旨在盡量減少成本,以盡可能低的薪水找到符合工作要求的候選人。(2)互惠。有效的簡歷-工作匹配需要滿足招聘雙方的期望,這意味著既要滿足求職者的偏好,又要滿足工作的要求。傳統(tǒng)的單邊推薦系統(tǒng)只能滿足一方的需求,因此往往無法實現(xiàn)成功的匹配。例如,求職者可能申請了一個職位但被招聘人員拒絕,或者招聘人員發(fā)出了面試邀請但求職者拒絕了。(3)數(shù)據(jù)結(jié)構(gòu)多樣性。求職者的簡歷和招聘廣告通常由多種數(shù)據(jù)結(jié)構(gòu)組成,包括結(jié)構(gòu)化屬性(即學歷、工作地點和薪水)和非結(jié)構(gòu)化文本數(shù)據(jù)(即工作經(jīng)驗和職位描述)。
4、根據(jù)在線招聘的上述特征,簡歷-職位匹配是在線招聘中的雙邊互惠推薦問題,與傳統(tǒng)的單向用戶項目模型不同,它需要深入了解求職者和招聘人員的偏好?,F(xiàn)有的一些研究大致可以分為兩類:基于文本匹配的方法和基于行為的方法?;谖谋酒ヅ涞姆椒ù蠖嗤ㄟ^學習求職者簡歷數(shù)據(jù)和招聘職位要求的表示來生成個性化推薦?;谛袨榈姆椒ㄖ饕迷诰€招聘平臺中求職者與招聘職位的歷史交互數(shù)據(jù)來生成推薦。現(xiàn)有技術(shù)中將簡歷-職位匹配作為監(jiān)督文本匹配問題,忽略了簡歷和職位數(shù)據(jù)之間復雜的語義關系,從而導致匹配結(jié)果的準確度較差,進而使得推薦結(jié)果難以滿足雙方需求。
技術(shù)實現(xiàn)思路
1、本發(fā)明要解決的技術(shù)問題是現(xiàn)有技術(shù)常用的上述方法將簡歷職位匹配作為監(jiān)督文本匹配問題,忽略了簡歷數(shù)據(jù)和職位數(shù)據(jù)之間復雜的語義關系,從而導致匹配結(jié)果的準確度較差,進而使得推薦結(jié)果難以滿足雙方需求,為了解決上述問題,本發(fā)明提供一種基于超圖的在線招聘雙邊互惠推薦方法、裝置及電子設備。
2、本發(fā)明的內(nèi)容包括:
3、第一方面,本發(fā)明實施例提供了一種基于超圖的在線招聘雙邊互惠推薦方法,包括:
4、對多個簡歷數(shù)據(jù)和多個職位數(shù)據(jù)分別進行特征提取,得到每一個所述簡歷數(shù)據(jù)的屬性特征和每一個所述職位數(shù)據(jù)的屬性特征,所述簡歷數(shù)據(jù)的屬性特征包括第一結(jié)構(gòu)化屬性特征和第一非結(jié)構(gòu)化屬性特征,所述職位數(shù)據(jù)的屬性特征包括第二結(jié)構(gòu)化屬性特征和第二非結(jié)構(gòu)化屬性特征;
5、基于所述第一結(jié)構(gòu)化屬性特征生成簡歷特征嵌入,基于所述第二結(jié)構(gòu)化屬性特征生成職位特征嵌入,基于所述第一非結(jié)構(gòu)化屬性特征生成初始簡歷文本嵌入,基于所述第二非結(jié)構(gòu)化屬性特征生成初始職位文本嵌入;
6、對所述簡歷特征嵌入和所述職位特征嵌入進行融合,得到簡歷結(jié)構(gòu)化嵌入和職位結(jié)構(gòu)化嵌入,對所述初始簡歷文本嵌入和所述初始職位文本嵌入進行融合,得到簡歷文本嵌入和職位文本嵌入;
7、基于總特征表示對多個所述簡歷數(shù)據(jù)和多個所述職位數(shù)據(jù)的匹配概率進行預測并基于預測結(jié)果確定推薦結(jié)果,所述總特征表示由所述簡歷結(jié)構(gòu)化嵌入、所述職位結(jié)構(gòu)化嵌入、所述簡歷文本嵌入和所述職位文本嵌入拼接得到。
8、可選地,所述對多個簡歷數(shù)據(jù)和多個職位數(shù)據(jù)分別進行特征提取,得到每一個所述簡歷數(shù)據(jù)的屬性特征和每一個所述職位數(shù)據(jù)的屬性特征,包括:
9、對多個所述簡歷數(shù)據(jù)中的結(jié)構(gòu)化數(shù)據(jù)進行特征提取,得到每一個所述簡歷數(shù)據(jù)的第一結(jié)構(gòu)化屬性特征;
10、對多個所述簡歷數(shù)據(jù)中的非結(jié)構(gòu)化數(shù)據(jù)進行特征提取,得到每一個所述簡歷數(shù)據(jù)的第一非結(jié)構(gòu)化屬性特征;
11、對多個所述職位數(shù)據(jù)中的結(jié)構(gòu)化數(shù)據(jù)進行特征提取,得到每一個所述職位數(shù)據(jù)的第二結(jié)構(gòu)化屬性特征;
12、對多個所述職位數(shù)據(jù)中的非結(jié)構(gòu)化數(shù)據(jù)進行特征提取,得到每一個所述職位數(shù)據(jù)的第二非結(jié)構(gòu)化屬性特征。
13、可選地,所述基于所述第一結(jié)構(gòu)化屬性特征生成簡歷特征嵌入,基于所述第二結(jié)構(gòu)化屬性特征生成職位特征嵌入,包括:
14、基于所述第一結(jié)構(gòu)化屬性特征構(gòu)建簡歷特征超圖并生成第一節(jié)點嵌入和第一超邊嵌入,所述第一超邊嵌入用于表征所述簡歷特征嵌入,所述簡歷特征超圖的節(jié)點用于表征所述第一結(jié)構(gòu)化屬性特征,所述簡歷特征超圖的超邊用于表征所述簡歷數(shù)據(jù),所述簡歷特征超圖的超邊的數(shù)量等于所述簡歷數(shù)據(jù)的數(shù)量;
15、基于所述第二結(jié)構(gòu)化屬性特征構(gòu)建職位特征超圖并生成第二節(jié)點嵌入和第二超邊嵌入,所述第二超邊嵌入用于表征所述職位特征嵌入,所述職位特征超圖的節(jié)點用于表征所述第二結(jié)構(gòu)化屬性特征,所述職位特征超圖的超邊用于表征所述職位數(shù)據(jù),所述職位特征超圖的超邊的數(shù)量等于所述職位數(shù)據(jù)的數(shù)量。
16、可選地,所述基于所述第一非結(jié)構(gòu)化屬性特征生成初始簡歷文本嵌入,基于所述第二非結(jié)構(gòu)化屬性特征生成初始職位文本嵌入,包括:
17、獲取所述第一非結(jié)構(gòu)化屬性特征對應的子組件,以及獲取所述第二非結(jié)構(gòu)化屬性特征對應的子組件,所述子組件包括屬性源、屬性特征名稱和屬性特征值,所述第一非結(jié)構(gòu)化屬性特征對應的屬性源為簡歷數(shù)據(jù),所述第二非結(jié)構(gòu)化屬性特征對應的屬性元為職位數(shù)據(jù);
18、分別將所述第一非結(jié)構(gòu)化屬性特征對應的子組件和所述第二非結(jié)構(gòu)化屬性特征對應的子組件輸入預先訓練的語言模型,得到所述初始簡歷文本嵌入和所述初始簡歷文本嵌入,所述預先訓練的語言模型基于bert構(gòu)建。
19、可選地,所述對所述簡歷特征嵌入和所述職位特征嵌入進行融合,得到簡歷結(jié)構(gòu)化嵌入和職位結(jié)構(gòu)化嵌入,包括:
20、基于所述簡歷數(shù)據(jù)的屬性特征之間的內(nèi)部語義關聯(lián)對所述簡歷特征超圖進行學習,得到初始簡歷超邊嵌入;
21、基于所述職位數(shù)據(jù)的屬性特征之間的內(nèi)部語義關聯(lián)對所述職位特征超圖進行學習,得到初始職位超邊嵌入;
22、基于所述簡歷數(shù)據(jù)的屬性特征和所述職位數(shù)據(jù)的屬性特征之間的跨語義關聯(lián)對所述初始簡歷超邊嵌入和所述初始職位超邊嵌入進行更新,得到所述簡歷結(jié)構(gòu)化嵌入和所述職位結(jié)構(gòu)化嵌入。
23、可選地,所述對所述初始簡歷文本嵌入和所述初始職位文本嵌入進行融合,得到簡歷文本嵌入和職位文本嵌入,包括:
24、將所述初始簡歷文本嵌入輸入簡歷文本注意力層并基于所述簡歷數(shù)據(jù)的屬性特征之間的內(nèi)部語義關聯(lián)對所述初始簡歷文本嵌入進行更新,得到簡歷交互特征;
25、將所述初始職位文本嵌入輸入職位文本注意力層并基于所述職位數(shù)據(jù)的屬性特征之間的內(nèi)部語義關聯(lián)對所述初始職位文本嵌入進行更新,得到職位交互特征;
26、將所述簡歷交互特征和所述職位交互特征連接后輸入內(nèi)部注意力層,基于所述簡歷數(shù)據(jù)的屬性特征與所述職位數(shù)據(jù)的屬性特征之間的跨語義關聯(lián)進行屬性交互,得到交互特征;
27、將所述交互特征進行拆分后輸入平均池化層,得到所述簡歷文本嵌入和所述職位文本嵌入。
28、可選地,所述基于總特征表示對多個所述簡歷數(shù)據(jù)和多個所述職位數(shù)據(jù)的匹配概率進行預測并基于預測結(jié)果確定推薦結(jié)果,包括:
29、將所述總特征表示輸入外部注意力層進行交互融合,得到簡歷職位特征表示;
30、將所述簡歷職位特征表示輸入平均池化層和多層感知機進行處理,得到輸出特征;
31、基于所述輸出特征計算任一所述簡歷數(shù)據(jù)與任一所述職位數(shù)據(jù)之間的匹配概率,得到預測結(jié)果;
32、基于所述預測結(jié)果將所述匹配概率大于或等于閾值的所述簡歷數(shù)據(jù)與所述職位數(shù)據(jù)進行雙向推薦,得到推薦結(jié)果。
33、第二方面,本發(fā)明實施例還提供了一種基于超圖的在線招聘雙邊互惠推薦裝置,包括:
34、特征提取模塊,用于對多個簡歷數(shù)據(jù)和多個職位數(shù)據(jù)分別進行特征提取,得到每一個所述簡歷數(shù)據(jù)的屬性特征和每一個所述職位數(shù)據(jù)的屬性特征,所述簡歷數(shù)據(jù)的屬性特征包括第一結(jié)構(gòu)化屬性特征和第一非結(jié)構(gòu)化屬性特征,所述職位數(shù)據(jù)的屬性特征包括第二結(jié)構(gòu)化屬性特征和第二非結(jié)構(gòu)化屬性特征;
35、嵌入生成模塊,用于基于所述第一結(jié)構(gòu)化屬性特征生成簡歷特征嵌入,基于所述第二結(jié)構(gòu)化屬性特征生成職位特征嵌入,基于所述第一非結(jié)構(gòu)化屬性特征生成初始簡歷文本嵌入,基于所述第二非結(jié)構(gòu)化屬性特征生成初始職位文本嵌入;
36、特征融合模塊,用于對所述簡歷特征嵌入和所述職位特征嵌入進行融合,得到簡歷結(jié)構(gòu)化嵌入和職位結(jié)構(gòu)化嵌入,對所述初始簡歷文本嵌入和所述初始職位文本嵌入進行融合,得到簡歷文本嵌入和職位文本嵌入;
37、預測推薦模塊,用于基于總特征表示對多個所述簡歷數(shù)據(jù)和多個所述職位數(shù)據(jù)的匹配概率進行預測并基于預測結(jié)果確定推薦結(jié)果,所述總特征表示由所述簡歷結(jié)構(gòu)化嵌入、所述職位結(jié)構(gòu)化嵌入、所述簡歷文本嵌入和所述職位文本嵌入拼接得到。
38、第三方面,本發(fā)明實施例提供一種電子設備,包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的程序;所述處理器,用于讀取存儲器中的程序?qū)崿F(xiàn)如第一方面所述的基于超圖的在線招聘雙邊互惠推薦方法中的步驟。
39、第四方面,本發(fā)明實施例提供一種可讀存儲介質(zhì),用于存儲程序,所述程序被處理器執(zhí)行時實現(xiàn)如第一方面所述的基于超圖的在線招聘雙邊互惠推薦方法中的步驟。
40、本發(fā)明的有益效果是,在本發(fā)明實施例中,首先分別獲取簡歷數(shù)據(jù)和職位數(shù)據(jù)的屬性特征,得到簡歷數(shù)據(jù)的結(jié)構(gòu)化屬性特征和非結(jié)構(gòu)化屬性特征,職位數(shù)據(jù)的結(jié)構(gòu)化屬性特征和非結(jié)構(gòu)化屬性特征。通過上述方法,充分考慮到了簡歷數(shù)據(jù)和職位數(shù)據(jù)中不同類型的數(shù)據(jù)中包含的信息,提高了特征提取的精確度和全面性。然后對于結(jié)構(gòu)化屬性特征和非結(jié)構(gòu)屬性特征,分別采用對應的方法生成其對應的特征嵌入,以獲取準確度更高的嵌入表示。然后對結(jié)構(gòu)化屬性特征和非結(jié)構(gòu)屬性特征的嵌入進行融合,充分考慮求職者和招聘者的需求,基于融合得到的總特征表示進行預測,得到最終的推薦結(jié)果,實現(xiàn)求職者和招聘者雙邊互惠的推薦。