本公開的實(shí)施方式涉及計(jì)算機(jī),更具體地,本公開的實(shí)施方式涉及一種推薦方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算設(shè)備。
背景技術(shù):
1、本部分旨在為本公開的實(shí)施方式提供背景或上下文。此處的描述不因?yàn)榘ㄔ诒静糠种芯统姓J(rèn)是現(xiàn)有技術(shù)。
2、賬號(hào)推薦(account?recommendation)是一種細(xì)分的推薦系統(tǒng)應(yīng)用場(chǎng)景,以賬號(hào)為最細(xì)粒度的內(nèi)容,為用戶推薦有潛在興趣的賬號(hào)集合。
3、在相關(guān)技術(shù)中,賬號(hào)推薦一般采用基于用戶的協(xié)同過濾推薦算法?;谟脩舻膮f(xié)同過濾算法的基本思路就是先找到與當(dāng)前用戶相似的其它用戶,從其它用戶的關(guān)注列表中找出當(dāng)前用戶還未關(guān)注的賬號(hào),將這些賬號(hào)按照一定的排列順序推薦給當(dāng)前用戶。
4、基于用戶的協(xié)同過濾推薦算法的缺點(diǎn)主要包括擴(kuò)展性和稀疏性問題。隨著用戶和賬號(hào)數(shù)量的增加,計(jì)算用戶之間相似性的開銷也會(huì)顯著增加。
技術(shù)實(shí)現(xiàn)思路
1、在本公開實(shí)施方式的第一方面中,提供了一種推薦方法。所述方法包括:
2、響應(yīng)于針對(duì)目標(biāo)用戶的賬號(hào)推薦,獲取所述目標(biāo)用戶的歷史瀏覽記錄;
3、將所述目標(biāo)用戶以及歷史瀏覽記錄輸入到包含思維鏈的預(yù)訓(xùn)練模型;其中,所述思維鏈位于所述預(yù)訓(xùn)練模型的輸入層和輸出層之間,所述思維鏈用于將預(yù)先學(xué)習(xí)到的被關(guān)注賬號(hào)與關(guān)注者瀏覽記錄之間潛在的對(duì)應(yīng)關(guān)系作為提示信息,引導(dǎo)所述預(yù)訓(xùn)練模型生成所述目標(biāo)用戶感興趣的推薦賬號(hào);
4、獲取所述預(yù)訓(xùn)練模型輸出的推薦賬號(hào),并將所述推薦賬號(hào)推薦給所述目標(biāo)用戶。
5、可選的,所述包含思維鏈的預(yù)訓(xùn)練模型通過以下方式訓(xùn)練得到:
6、接收用于構(gòu)建訓(xùn)練樣本集的被關(guān)注賬號(hào)與關(guān)注該賬號(hào)的關(guān)注者集合;
7、獲取關(guān)注者集合中每個(gè)關(guān)注者的歷史興趣類別和瀏覽記錄;其中,所述瀏覽記錄包括所述關(guān)注者在關(guān)注該被關(guān)注賬號(hào)之前瀏覽的該被關(guān)注賬號(hào)發(fā)布的內(nèi)容;
8、構(gòu)建由所述歷史興趣類別和瀏覽記錄作為模型輸入,以及所述被關(guān)注賬號(hào)作為模型輸出的訓(xùn)練樣本集;
9、在所述預(yù)訓(xùn)練模型基于所述模型輸入生成所述模型輸出的訓(xùn)練過程中,利用所述思維鏈學(xué)習(xí)所述被關(guān)注賬號(hào)與關(guān)注者瀏覽記錄之間潛在的對(duì)應(yīng)關(guān)系。
10、可選的,獲取關(guān)注者集合中每個(gè)關(guān)注者的瀏覽記錄,包括:
11、獲取關(guān)注者集合中每個(gè)關(guān)注者對(duì)應(yīng)的瀏覽內(nèi)容序列,其中,所述瀏覽內(nèi)容序列包括關(guān)注者瀏覽的內(nèi)容以及瀏覽時(shí)刻的數(shù)據(jù)對(duì);
12、獲取被關(guān)注賬號(hào)的歷史發(fā)布內(nèi)容序列;其中,所述歷史發(fā)布內(nèi)容序列包括所述被關(guān)注賬號(hào)發(fā)布的內(nèi)容以及發(fā)布時(shí)刻的數(shù)據(jù)對(duì);
13、根據(jù)所述關(guān)注者關(guān)注所述被關(guān)注賬號(hào)的關(guān)注時(shí)刻,獲取同時(shí)位于所述瀏覽內(nèi)容序列和歷史發(fā)布內(nèi)容序列中且位于所述關(guān)注時(shí)刻之前的目標(biāo)內(nèi)容;
14、將所述目標(biāo)內(nèi)容作為所述關(guān)注者在關(guān)注該被關(guān)注賬號(hào)之前瀏覽的該被關(guān)注賬號(hào)發(fā)布的內(nèi)容。
15、可選的,在所述預(yù)訓(xùn)練模型基于所述模型輸入生成所述模型輸出的訓(xùn)練過程中,通過以下至少四種訓(xùn)練任務(wù)對(duì)所述預(yù)訓(xùn)練模型進(jìn)行模型微調(diào):
16、關(guān)注者關(guān)注賬號(hào)理由的生成任務(wù),潛在賬號(hào)的推薦任務(wù),關(guān)注者畫像的生成任務(wù),賬號(hào)畫像的生成任務(wù)。
17、可選的,所述預(yù)訓(xùn)練模型的損失函數(shù)包括:
18、
19、其中,x表示模型輸入,y表示模型輸出;|d|表示模型微調(diào)的樣本數(shù)量,|y|表示模型輸出的文本單元個(gè)數(shù)。
20、可選的,所述模型輸入采用整詞詞嵌入表示。
21、可選的,所述預(yù)訓(xùn)練模型包括大語言模型。
22、在本公開實(shí)施方式的第二方面中,提供了一種推薦裝置,所述裝置包括:
23、獲取單元,響應(yīng)于針對(duì)目標(biāo)用戶的賬號(hào)推薦,獲取所述目標(biāo)用戶的歷史瀏覽記錄;
24、計(jì)算單元,將所述目標(biāo)用戶以及歷史瀏覽記錄輸入到包含思維鏈的預(yù)訓(xùn)練模型;其中,所述思維鏈位于所述預(yù)訓(xùn)練模型的輸入層和輸出層之間,所述思維鏈用于將預(yù)先學(xué)習(xí)到的被關(guān)注賬號(hào)與關(guān)注者瀏覽記錄之間潛在的對(duì)應(yīng)關(guān)系作為提示信息,引導(dǎo)所述預(yù)訓(xùn)練模型生成所述目標(biāo)用戶感興趣的推薦賬號(hào);
25、推薦單元,獲取所述預(yù)訓(xùn)練模型輸出的推薦賬號(hào),并將所述推薦賬號(hào)推薦給所述目標(biāo)用戶。
26、可選的,所述包含思維鏈的預(yù)訓(xùn)練模型通過訓(xùn)練單元訓(xùn)練得到,所述訓(xùn)練單元進(jìn)一步包括:
27、接收子單元,接收用于構(gòu)建訓(xùn)練樣本集的被關(guān)注賬號(hào)與關(guān)注該賬號(hào)的關(guān)注者集合;
28、獲取子單元,獲取關(guān)注者集合中每個(gè)關(guān)注者的歷史興趣類別和瀏覽記錄;其中,所述瀏覽記錄包括所述關(guān)注者在關(guān)注該被關(guān)注賬號(hào)之前瀏覽的該被關(guān)注賬號(hào)發(fā)布的內(nèi)容;
29、構(gòu)建子單元,構(gòu)建由所述歷史興趣類別和瀏覽記錄作為模型輸入,以及所述被關(guān)注賬號(hào)作為模型輸出的訓(xùn)練樣本集;
30、訓(xùn)練子單元,在所述預(yù)訓(xùn)練模型基于所述模型輸入生成所述模型輸出的訓(xùn)練過程中,利用所述思維鏈學(xué)習(xí)所述被關(guān)注賬號(hào)與關(guān)注者瀏覽記錄之間潛在的對(duì)應(yīng)關(guān)系。
31、可選的,所述獲取子單元,進(jìn)一步包括:
32、獲取關(guān)注者集合中每個(gè)關(guān)注者對(duì)應(yīng)的瀏覽內(nèi)容序列,其中,所述瀏覽內(nèi)容序列包括關(guān)注者瀏覽的內(nèi)容以及瀏覽時(shí)刻的數(shù)據(jù)對(duì);
33、獲取被關(guān)注賬號(hào)的歷史發(fā)布內(nèi)容序列;其中,所述歷史發(fā)布內(nèi)容序列包括所述被關(guān)注賬號(hào)發(fā)布的內(nèi)容以及發(fā)布時(shí)刻的數(shù)據(jù)對(duì);
34、根據(jù)所述關(guān)注者關(guān)注所述被關(guān)注賬號(hào)的關(guān)注時(shí)刻,獲取同時(shí)位于所述瀏覽內(nèi)容序列和歷史發(fā)布內(nèi)容序列中且位于所述關(guān)注時(shí)刻之前的目標(biāo)內(nèi)容;
35、將所述目標(biāo)內(nèi)容作為所述關(guān)注者在關(guān)注該被關(guān)注賬號(hào)之前瀏覽的該被關(guān)注賬號(hào)發(fā)布的內(nèi)容。
36、可選的,所述訓(xùn)練子單元還用于通過以下至少四種訓(xùn)練任務(wù)對(duì)所述預(yù)訓(xùn)練模型進(jìn)行模型微調(diào):
37、關(guān)注者關(guān)注賬號(hào)理由的生成任務(wù),潛在賬號(hào)的推薦任務(wù),關(guān)注者畫像的生成任務(wù),賬號(hào)畫像的生成任務(wù)。
38、可選的,所述預(yù)訓(xùn)練模型的損失函數(shù)包括:
39、
40、其中,x表示模型輸入,y表示模型輸出;|d|表示模型微調(diào)的樣本數(shù)量,|y|表示模型輸出的文本單元個(gè)數(shù)。
41、可選的,所述模型輸入采用整詞詞嵌入表示。
42、可選的,所述預(yù)訓(xùn)練模型包括大語言模型。
43、在本公開實(shí)施方式的第三方面中,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),包括:
44、當(dāng)所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中的指令由電子設(shè)備的處理器執(zhí)行時(shí),使得電子設(shè)備能夠執(zhí)行如前任一項(xiàng)所述的推薦方法。
45、在本公開實(shí)施方式的第四方面中,提供了一種計(jì)算設(shè)備,包括:
46、處理器;
47、用于存儲(chǔ)所述處理器可執(zhí)行指令的存儲(chǔ)器;
48、其中,所述處理器被配置為執(zhí)行所述可執(zhí)行指令,以實(shí)現(xiàn)如前任一項(xiàng)所述的推薦方法。
49、根據(jù)本公開實(shí)施方式提供的推薦方案,將思維鏈技術(shù)應(yīng)用到用于賬號(hào)推薦的預(yù)訓(xùn)練模型中,通過思維鏈學(xué)習(xí)被關(guān)注賬號(hào)與關(guān)注者瀏覽記錄之間潛在的對(duì)應(yīng)關(guān)系,并將所述潛在的對(duì)應(yīng)關(guān)系作為預(yù)訓(xùn)練模型的提示信息,從而引導(dǎo)預(yù)訓(xùn)練模型生成所述目標(biāo)用戶感興趣的推薦賬號(hào)。