本發(fā)明涉及地理信息系統(tǒng)(gis)、人工智能(ai)與跨模態(tài)數(shù)據(jù)融合,具體涉及一種基于電子照片的信息提取與關(guān)聯(lián)文本生成方法。
背景技術(shù):
0、技術(shù)背景
1、近年來,人工智能與多源時(shí)空數(shù)據(jù)融合技術(shù)在地理信息系統(tǒng)(gis)領(lǐng)域展現(xiàn)出顯著的應(yīng)用潛力[1-2]。隨著深度學(xué)習(xí)技術(shù)的突破性進(jìn)展,ai圖像識(shí)別技術(shù)已在物體檢測與場景理解方向取得重要進(jìn)展[3]。研究表明,基于opencv的數(shù)據(jù)增強(qiáng)方法可顯著提升復(fù)雜場景下的物體識(shí)別精度[4],而幾何不變性特征的引入則為三維物體識(shí)別提供了新的理論框架[5]。與此同時(shí),圖像exif信息的提取技術(shù)已趨成熟,實(shí)現(xiàn)圖像元數(shù)據(jù)(經(jīng)緯度坐標(biāo)、時(shí)間戳)的解析與提取[6]。
2、盡管現(xiàn)有技術(shù)已具備多模態(tài)數(shù)據(jù)處理能力,但關(guān)鍵性瓶頸仍然存在:其一,主流ai圖文互譯工具生成內(nèi)容與時(shí)空數(shù)據(jù)庫的關(guān)聯(lián)度不足,導(dǎo)致輸出缺乏場景化語義[7];其二,多源數(shù)據(jù)融合研究多聚焦于結(jié)構(gòu)化數(shù)據(jù)分析,鮮有涉及用戶生成內(nèi)容(ugc)的動(dòng)態(tài)整合。例如,星際空間(天津)科技發(fā)展有限公司提出的多源時(shí)空數(shù)據(jù)匯聚方法,雖實(shí)現(xiàn)了非空間數(shù)據(jù)向空間數(shù)據(jù)的轉(zhuǎn)化,但未解決圖像時(shí)空關(guān)聯(lián)與多維敘事生成問題[8];廣州市城市規(guī)劃勘測設(shè)計(jì)研究院的交通流量預(yù)測模型,雖通過時(shí)空相關(guān)性融合提升了預(yù)測精度,卻未集成文本生成技術(shù)[9]。
3、為了改善現(xiàn)有情況,本發(fā)明提出一種基于電子照片的信息提取與關(guān)聯(lián)文本生成方法,通過分析電子照片,獲取電子照片的物體信息、場景信息、日期與時(shí)間信息和地理位置信息。通過將電子照片與數(shù)據(jù)庫中地圖數(shù)據(jù)相關(guān)聯(lián),包括但不限于地名及歷史地名信息。將以上信息作為提示詞輸入跨模態(tài)ai模型中,實(shí)現(xiàn)“位置-時(shí)間-場景”三維度動(dòng)態(tài)敘事,并通過gis應(yīng)用對位置關(guān)聯(lián)跳轉(zhuǎn)方式進(jìn)行可視化展示。本發(fā)明不僅能夠突破傳統(tǒng)地圖的靜態(tài)信息展示,還可以在文化保護(hù)、環(huán)境變化等多場景應(yīng)用,為智慧城市與數(shù)字人文研究提供了新的技術(shù)范式。
4、參考文獻(xiàn)
5、[1]吉根林,趙斌.面向大數(shù)據(jù)的時(shí)空數(shù)據(jù)挖掘綜述[j].南京師大學(xué)報(bào)(自然科學(xué)版),2014,37(01):1-7.
6、[2]趙彬彬,李光強(qiáng),鄧敏.時(shí)空數(shù)據(jù)挖掘綜述[j].測繪科學(xué),2010,35(02):62-65+20.doi:10.16251/j.cnki.1009-2307.2010.02.058.
7、[3]于德山.人工智能時(shí)代的視覺真相及其反思[j].社會(huì)科學(xué)戰(zhàn)線,2020,(01):224-233.
8、[4]孫曉凱,倪卿元,陳文強(qiáng).圖像增強(qiáng)方法在深度學(xué)習(xí)圖像識(shí)別場景應(yīng)用中的可行性研究[j].電信科學(xué),2020,36(s1):172-179.
9、[5]黃凱奇,任偉強(qiáng),譚鐵牛.圖像物體分類與檢測算法綜述[j].計(jì)算機(jī)學(xué)報(bào),2014,37(06):1225-1240.
10、[6]申川.數(shù)碼照片真實(shí)性鑒定中exif信息應(yīng)用分析[j].影像技術(shù),2017,29(03):74-76.
11、[7]李白楊,白云,詹希旎,等.人工智能生成內(nèi)容(aigc)的技術(shù)特征與形態(tài)演進(jìn)[j].圖書情報(bào)知識(shí),2023,40(01):66-74.doi:10.13366/j.dik.2023.01.066.
12、[8]楊文博,馬翱慧,劉紅月,等.一種面向多源時(shí)空數(shù)據(jù)匯聚與共享的方法[p].天津市:cn202311448569.x,2025-01-14.
13、[9]鄧興棟,李冠耀,劉洋,等.融合多源時(shí)空數(shù)據(jù)的交通流量預(yù)測方法、裝置及存儲(chǔ)介質(zhì)[p].廣東省:cn202310084450.2,2025-01-17.
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供了一種基于電子照片的信息提取與關(guān)聯(lián)文本生成方法,其特征在于,針對電子照片集合依次進(jìn)行解析與處理,獲取電子照片的物體信息、場景信息、日期與時(shí)間信息和地理位置信息。通過將電子照片與數(shù)據(jù)庫中地圖數(shù)據(jù)相關(guān)聯(lián),包括但不限于地名及歷史地名信息。將物體信息、場景信息、日期與時(shí)間信息、地理位置信息和地名及歷史地名信息為作提示詞一同輸入ai模型中,智能生成敘事文本,實(shí)現(xiàn)“位置-時(shí)間-場景”三維度動(dòng)態(tài)敘事,并通過gis應(yīng)用對位置關(guān)聯(lián)跳轉(zhuǎn)方式進(jìn)行可視化展示。
2、具體包括:
3、電子照片集合(a)包含全部待處理電子照片序列,所述電子圖片包含地理坐標(biāo)信息;
4、所述處理電子照片包括圖像分析(a),利用圖像識(shí)別技術(shù)提取電子照片中的物體信息、場景信息;
5、所述處理電子照片包括日期與時(shí)間解析(b),利用計(jì)算機(jī)程序自動(dòng)獲取電子照片標(biāo)簽信息,進(jìn)一步提取日期與時(shí)間信息;
6、所述處理電子照片包括經(jīng)緯度坐標(biāo)解析(c),利用計(jì)算機(jī)程序自動(dòng)獲取電子照片標(biāo)簽信息,進(jìn)一步提取經(jīng)緯度坐標(biāo)信息;
7、ai生成(d)是利用ai模型,根據(jù)輸入的提示詞,按時(shí)間順序,智能生成敘事文本;
8、數(shù)據(jù)庫(b)用于存儲(chǔ)地理空間數(shù)據(jù)及元數(shù)據(jù);
9、所述數(shù)據(jù)庫(b)還用于與地理位置信息建立關(guān)聯(lián)關(guān)系,包括地名和歷史地名信息;
10、客戶端(c)集成在線地圖(1)與圖文故事(2);
11、在線地圖(1)用于實(shí)現(xiàn)地理位置信息在地圖上的標(biāo)注展示,支持地圖圖層切換;
12、圖文故事(2)用于展示生成的敘事文本,支持用戶交互。
13、本發(fā)明具體步驟包括:
14、s1圖像分析(a):通過圖像分析技術(shù)獲取電子照片的物體信息、場景信息;
15、s2日期與時(shí)間解析(b):通過計(jì)算機(jī)程序自動(dòng)獲取電子照片日期與時(shí)間信息;
16、s3坐標(biāo)解析(c):通過計(jì)算機(jī)程序自動(dòng)獲取電子照片gps經(jīng)緯度坐標(biāo)信息;
17、s4地理信息關(guān)聯(lián):通過經(jīng)緯度坐標(biāo)信息將電子照片與數(shù)據(jù)庫(b)中地圖數(shù)據(jù)進(jìn)行匹配關(guān)聯(lián),在地圖中標(biāo)注坐標(biāo)點(diǎn),建立標(biāo)注點(diǎn)與地理位置信息的關(guān)聯(lián)關(guān)系,包括地名和歷史地名信息;
18、s5文本生成:將電子照片的物體信息、場景信息、日期與時(shí)間信息、地理位置信息、地名及歷史地名信息作為提示詞,輸入ai模型中,由ai生成(d)敘事文本;
19、s6可視化展示:客戶端集(c)成gis應(yīng)用與內(nèi)容展示,實(shí)時(shí)接收地圖標(biāo)注結(jié)果與及ai生成(d)的敘事文本,并支持用戶交互操作。
20、作為優(yōu)選,一種基于電子照片的信息提取與關(guān)聯(lián)文本生成方法,其特征在于:
21、本方法利用計(jì)算機(jī)程序?qū)崿F(xiàn)自動(dòng)化處理,并實(shí)時(shí)輸出處理結(jié)果。
22、作為優(yōu)選,一種基于電子照片的信息提取與關(guān)聯(lián)文本生成方法,其特征在于:
23、所述ai文本生成輸出的敘事文本包含以下關(guān)鍵信息:
24、地理位置關(guān)聯(lián),包括地名及歷史地名;
25、時(shí)間獲取,日期與時(shí)間信息決定電子照片集合敘事順序;
26、場景內(nèi)容解讀,基于物體信息與場景信息的語義文本描述;
27、歷史信息關(guān)聯(lián),歷史地名來源及歷史故事描述。
28、作為優(yōu)選,步驟s4地理位置信息關(guān)聯(lián),包括地名及歷史地名信息,其特征在于:
29、根據(jù)數(shù)據(jù)庫中與經(jīng)緯度坐標(biāo)信息匹配的地理空間數(shù)據(jù),獲取屬性要素,進(jìn)一步關(guān)聯(lián)地理位置信息,包括地名及歷史地名信息。
30、作為優(yōu)選,s6可視化展示,客戶端集成gis應(yīng)用與內(nèi)容展示,其特征在于:
31、點(diǎn)擊電子照片或地名文本觸發(fā)事件,地圖視圖移動(dòng)至地圖標(biāo)注點(diǎn);
32、切換歷史/現(xiàn)代地圖圖層對比展示。
33、本發(fā)明的有益效果為:
34、將空間位置、實(shí)時(shí)環(huán)境、歷史事件通過統(tǒng)一模型關(guān)聯(lián),生成場景化文本,增加故事性,提升用戶體驗(yàn)。
35、生成具有“位置-時(shí)間-場景”三維度動(dòng)態(tài)敘事并具有時(shí)間性的內(nèi)容,幫助用戶更好地理解和描述數(shù)據(jù)或事件隨時(shí)間和空間變化的情況。
36、歷史數(shù)據(jù)動(dòng)態(tài)可視化:通過ai與可視化技術(shù),將靜態(tài)檔案轉(zhuǎn)化為可交互內(nèi)容,擴(kuò)展場景時(shí)空切換,可應(yīng)用于文化、教育等領(lǐng)域。