本申請涉及數(shù)據(jù)搜索,尤其涉及一種最近鄰點的搜索方法、裝置與電子設備。
背景技術:
1、最近鄰搜索是非結構化搜索領域中的一個基礎問題。其中,非結構化數(shù)據(jù)是指不符合固定格式或模式的數(shù)據(jù),例如,非結構化數(shù)據(jù)可以為文本、圖像、音頻、視頻以及日志文件等等。由于非結構數(shù)據(jù)的形式多樣,導致非結構化數(shù)據(jù)并能夠像結構化數(shù)據(jù)一樣,可以通過預定義的數(shù)據(jù)模型(例如關系數(shù)據(jù)庫中的表格)來組織和存儲。
2、在實際應用中,一般通過提取非結構化數(shù)據(jù)的特征,來對非結構化數(shù)據(jù)進行表示,且非結構化數(shù)據(jù)對應的特征越多,便越能夠準確地對非結構化數(shù)據(jù)進行表示。但是,非結構化數(shù)據(jù)對應的特征越多,即維度越高,在對非結構化數(shù)據(jù)進行搜索的過程中,計算開銷就變得越大以及搜索效率就變得越低。
技術實現(xiàn)思路
1、本申請?zhí)峁┝艘环N最近鄰點的搜索方法、裝置與電子設備,以至少解決相關技術中對非結構化數(shù)據(jù)進行搜索時,計算開銷大以及搜索效率低的問題。
2、本申請?zhí)峁┝艘环N最近鄰點的搜索方法,包括:獲取待查詢點在第一空間上的第一分量,確定第一分量到第一空間的第一距離下界,以及第一空間中各數(shù)據(jù)點對應的數(shù)據(jù)間隔;獲取待查詢點在第二空間上的第二分量,確定第二分量到第二空間的第二距離下界,其中,第一空間中多個特征維度之間的相關度大于第二空間中多個特征維度之間的相關度;按照第一距離下界、數(shù)據(jù)間隔以及第二距離下界,對待查詢點對應的候選數(shù)據(jù)點進行分層過濾,從候選數(shù)據(jù)點中確定出待查詢點對應的最近鄰點。
3、本申請還提供了一種最近鄰點的搜索裝置,包括:第一獲取模塊,用于獲取待查詢點在第一空間上的第一分量,確定第一分量到第一空間的第一距離下界,以及第一空間中各數(shù)據(jù)點對應的數(shù)據(jù)間隔;第二獲取模塊,用于獲取待查詢點在第二空間上的第二分量,確定第二分量到第二空間的第二距離下界,其中,第一空間中多個特征維度之間的相關度大于第二空間中多個特征維度之間的相關度;分層過濾模塊,用于按照第一距離下界、數(shù)據(jù)間隔以及第二距離下界,對待查詢點對應的候選數(shù)據(jù)點進行分層過濾,從候選數(shù)據(jù)點中確定出待查詢點對應的最近鄰點。
4、本申請還提供了一種電子設備,包括:存儲器,用于存儲計算機程序;處理器,用于執(zhí)行計算機程序時實現(xiàn)上述任一種最近鄰點的搜索方法的步驟。
5、本申請?zhí)峁┝艘环N最近鄰點的搜索方法、裝置與電子設備。針對于待查詢點在第一空間上的第一分量,能夠確定出該第一分量到第一空間的第一距離下界;針對于待查詢點在第二空間上的第二分量,能夠確定出該第二分量到第二空間的第二距離下界;針對于第一空間中的多個數(shù)據(jù)點,能夠確定出各數(shù)據(jù)點對應的數(shù)據(jù)間隔。如此,便可以按照第一距離下界、數(shù)據(jù)間隔以及第二距離下界這樣的順序,依次對第一距離下界、數(shù)據(jù)間隔以及第二距離下界對應的數(shù)據(jù)點,也即為待查詢點對應的候選數(shù)據(jù)點,進行分層過濾,從而可以高效和快速地從候選數(shù)據(jù)點中確定出待查詢點對應的最近鄰點,且分層過濾的機制,也使得從候選數(shù)據(jù)點中確定出待查詢點對應的最近鄰點的計算開銷較小,進而解決了對非結構化數(shù)據(jù)進行搜索時,計算開銷大以及搜索效率低的問題。
1.一種最近鄰點的搜索方法,其特征在于,包括:
2.根據(jù)權利要求1所述的方法,其特征在于,按照所述第一距離下界、所述數(shù)據(jù)間隔以及所述第二距離下界,對所述待查詢點對應的候選數(shù)據(jù)點進行分層過濾,從所述候選數(shù)據(jù)點中確定出所述待查詢點對應的最近鄰點,包括:
3.根據(jù)權利要求2所述的方法,其特征在于,在所述第一目標下界小于或者等于所述距離初始值的情況下,按照所述數(shù)據(jù)間隔以及所述第二距離下界,對所述待查詢點對應的所述候選數(shù)據(jù)點進行分層過濾,從所述候選數(shù)據(jù)點中確定出所述待查詢點對應的最近鄰點,包括:
4.根據(jù)權利要求3所述的方法,其特征在于,在所述第二目標下界小于或者等于所述距離初始值的情況下,利用所述第二距離下界,對所述待查詢點對應的候選數(shù)據(jù)點進行分層過濾,從所述候選數(shù)據(jù)點中確定出所述待查詢點對應的最近鄰點,包括:
5.根據(jù)權利要求4所述的方法,其特征在于,利用所述目標距離和所述距離初始值的大小關系,確定所述待查詢點的最近鄰點,包括:
6.根據(jù)權利要求1至5中任意一項所述的方法,其特征在于,確定所述第一分量到所述第一空間的第一距離下界,以及所述第一空間中各數(shù)據(jù)點對應的數(shù)據(jù)間隔,包括:
7.根據(jù)權利要求1至5中任意一項所述的方法,其特征在于,確定所述第二分量到所述第二空間的第二距離下界,包括:
8.根據(jù)權利要求1至5中任意一項所述的方法,其特征在于,獲取待查詢點在第一空間上的第一分量,以及獲取所述待查詢點在第二空間上的第二分量,包括:
9.一種最近鄰點的搜索裝置,其特征在于,包括:
10.一種電子設備,其特征在于,包括: