面向空間文本對(duì)象的集合查詢(xún)與推薦技術(shù)研究
發(fā)布時(shí)間:2021-09-13 17:49
隨著手機(jī)等移動(dòng)智能設(shè)備以及GPS的急速發(fā)展和應(yīng)用,基于位置的服務(wù)(Location-based Services,簡(jiǎn)稱(chēng)LBS)得到了普及。地圖搜索引擎將這些LBS服務(wù)作為處理對(duì)象,對(duì)LBS的搜索與推薦技術(shù)具有重要的應(yīng)用價(jià)值,因此成為了近年來(lái)空間數(shù)據(jù)庫(kù)領(lǐng)域的研究熱點(diǎn)?臻g文本對(duì)象搜索旨在綜合考慮空間鄰近性和文本相關(guān)性,根據(jù)用戶(hù)的查詢(xún)意圖匹配合理的空間文本對(duì)象,支持多樣的LBS搜索功能?臻g文本對(duì)象推薦則通過(guò)分析用戶(hù)的個(gè)性化偏好,為用戶(hù)推薦其可能感興趣的空間文本對(duì)象。然而,現(xiàn)有方法不能充分地滿(mǎn)足地圖搜索引擎的多目標(biāo)搜索與精準(zhǔn)推薦的需求,亟需展開(kāi)針對(duì)性的空間文本對(duì)象集合搜索與個(gè)性化推薦技術(shù)研究。為了解決這些問(wèn)題,本文面向地圖搜索引擎的共性需求,研究了面向空間文本對(duì)象的集合查詢(xún)與個(gè)性化推薦技術(shù),實(shí)現(xiàn)更加精準(zhǔn)且有效的LBS檢索。在空間文本對(duì)象檢索方面,本文首先針對(duì)現(xiàn)有的方法對(duì)多目標(biāo)查詢(xún)支持能力不足的缺點(diǎn),設(shè)計(jì)了融合語(yǔ)義的空間關(guān)鍵詞集合查詢(xún)框架,該框架通過(guò)詞嵌入等方法解析文本語(yǔ)義。其次,本文提出了一個(gè)無(wú)縫融合了多維度信息的層次索引結(jié)構(gòu)來(lái)組織數(shù)據(jù)。最后,本文利用一系列具有理論保證的界限定理優(yōu)化查詢(xún)處...
【文章來(lái)源】:蘇州大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3-丨IR-tree索引結(jié)構(gòu)??
個(gè)數(shù)L、??每個(gè)哈希表內(nèi)的哈希函數(shù)的個(gè)數(shù)AT等參數(shù);??(3)最后,將數(shù)據(jù)集中的全部空間文本對(duì)象利用設(shè)定好的LSH函數(shù)族進(jìn)行映??射,構(gòu)造出對(duì)應(yīng)的哈希表。??對(duì)于任意一個(gè)語(yǔ)義分布向量/?,吋以通過(guò)以下的步驟在LSH索引上做近鄰査詢(xún):??(1)首先,將該句量經(jīng)過(guò)LSH函數(shù)族哈希后得到相應(yīng)的桶號(hào);??(2)然后,將1:??步中的所有哈希桶中的空間文本對(duì)象取出,一般只収2L個(gè)空??間文本對(duì)象以保證搜索速度;??(3)最后,按照杳詢(xún)g與這些空間文本對(duì)象間的距離將其排序并返回最近鄰。??圖3-2給出f??個(gè)LSH參數(shù)設(shè)置為L?=?3且1?=?2時(shí)的k近鄰搜索示例。從圖屮可以??看出共有三個(gè)不同的哈希表。數(shù)據(jù)集中的,...,對(duì)象通過(guò)對(duì)其語(yǔ)義分布做哈??希映射被分配到r這二個(gè)哈希農(nóng)中。給出-個(gè)查詢(xún)+通過(guò)檢查這三個(gè)哈希表屮的包??含查詢(xún)V的桶,可以得到候選集丨。根據(jù)候選集屮的對(duì)象與查詢(xún)(7之間的距??離,M終返作為2-近鄰的結(jié)。妫。??!? ̄ipn ̄irni ̄ ̄;????!?〇4?〇,?〇,?!??丨?丨??(04??〇,、〇,,〇,'?LSH?N???_?_?_?_—_?_?.??(??^??)?=>:?‘丨??iUUbJHHLJ:??(I??一?_〇x??〇i?!??L?_????????.?i??圖3-2?LSH索引搜索示例??3.2.3?混合索引結(jié)構(gòu)UR-trce??本節(jié)在IR-tree索引和LSH索引的基礎(chǔ)上設(shè)計(jì)/??個(gè)新的索引結(jié)構(gòu)UR-tree來(lái)整合??空間、語(yǔ)義和文本三個(gè)維度的信息,如圖3-3所示。LIR-tree?-方面保證j'索引結(jié)構(gòu)在??17??
第二章基于語(yǔ)義表示的空間關(guān)鍵詞集合查詢(xún)處理?面向空間文本對(duì)象的集合查詢(xún)與推薦技術(shù)研宂??空間和文本兩個(gè)維度的剪枝效果,另一方面也解決了語(yǔ)義分布的維度過(guò)高而可能引??起的“維數(shù)災(zāi)難”問(wèn)題。??……1;??Topic?Layer?▲?Q?_……??I?Is&■?■■■?0?|l??I?L.j?;?U.j??Root?—?InvFile??一…^…??Textual?Layer??Leaf?Leaf?Leaf?Leaf??t?i?t?▼??InvFile?InvFile?InvFile?InvFile??圖3-3?LIR-tree索引結(jié)構(gòu)??為了能夠更好地利用己有的研究成果,LIR-tree索引首先處理所有對(duì)象的語(yǔ)義信??息。眾所周知,LSH是一種廣泛應(yīng)用于高維相似搜索的方法,適用于表示語(yǔ)義信息??的高維語(yǔ)義分布向量,這一章中利用LSH方法根據(jù)對(duì)象的語(yǔ)義分布將所有空間文本??對(duì)象哈希到桶中。每一個(gè)桶的編號(hào)都可以被看作是這個(gè)桶中所有對(duì)象的語(yǔ)義標(biāo)簽,??在同一個(gè)桶中的對(duì)象被認(rèn)為在語(yǔ)義上是相似的。接著,LIR-tree會(huì)在空間維度處理對(duì)??象,因?yàn)槊總(gè)對(duì)象在空間維度上只包含二維的地理位置信息(經(jīng)緯度),相對(duì)于文本??信息來(lái)說(shuō)對(duì)搜索空間的剪枝程度更大,因此對(duì)所有的空間文本對(duì)象都根據(jù)其空間位??置關(guān)系利用R-tree來(lái)索引。最后,將經(jīng)過(guò)LSH處理后的對(duì)象的語(yǔ)義標(biāo)簽看做是對(duì)象包??含的新的文本信息,由此對(duì)R-tree的每一個(gè)節(jié)點(diǎn),都創(chuàng)建一個(gè)基于對(duì)象語(yǔ)義標(biāo)簽的倒??排文件作為文本索引。??18??
【參考文獻(xiàn)】:
期刊論文
[1]基于對(duì)象集合的空間關(guān)鍵詞查詢(xún)[J]. 梁銀,董永權(quán). 計(jì)算機(jī)應(yīng)用. 2014(07)
[2]道路網(wǎng)中的移動(dòng)對(duì)象連續(xù)K近鄰查詢(xún)[J]. 趙亮,陳犖,景寧,廖巍. 計(jì)算機(jī)學(xué)報(bào). 2010(08)
[3]支持關(guān)鍵詞搜索的空間連接查詢(xún)研究[J]. 陳德華,劉良旭,樂(lè)嘉錦. 計(jì)算機(jī)科學(xué). 2009(07)
本文編號(hào):3395065
【文章來(lái)源】:蘇州大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3-丨IR-tree索引結(jié)構(gòu)??
個(gè)數(shù)L、??每個(gè)哈希表內(nèi)的哈希函數(shù)的個(gè)數(shù)AT等參數(shù);??(3)最后,將數(shù)據(jù)集中的全部空間文本對(duì)象利用設(shè)定好的LSH函數(shù)族進(jìn)行映??射,構(gòu)造出對(duì)應(yīng)的哈希表。??對(duì)于任意一個(gè)語(yǔ)義分布向量/?,吋以通過(guò)以下的步驟在LSH索引上做近鄰査詢(xún):??(1)首先,將該句量經(jīng)過(guò)LSH函數(shù)族哈希后得到相應(yīng)的桶號(hào);??(2)然后,將1:??步中的所有哈希桶中的空間文本對(duì)象取出,一般只収2L個(gè)空??間文本對(duì)象以保證搜索速度;??(3)最后,按照杳詢(xún)g與這些空間文本對(duì)象間的距離將其排序并返回最近鄰。??圖3-2給出f??個(gè)LSH參數(shù)設(shè)置為L?=?3且1?=?2時(shí)的k近鄰搜索示例。從圖屮可以??看出共有三個(gè)不同的哈希表。數(shù)據(jù)集中的,...,對(duì)象通過(guò)對(duì)其語(yǔ)義分布做哈??希映射被分配到r這二個(gè)哈希農(nóng)中。給出-個(gè)查詢(xún)+通過(guò)檢查這三個(gè)哈希表屮的包??含查詢(xún)V的桶,可以得到候選集丨。根據(jù)候選集屮的對(duì)象與查詢(xún)(7之間的距??離,M終返作為2-近鄰的結(jié)。妫。??!? ̄ipn ̄irni ̄ ̄;????!?〇4?〇,?〇,?!??丨?丨??(04??〇,、〇,,〇,'?LSH?N???_?_?_?_—_?_?.??(??^??)?=>:?‘丨??iUUbJHHLJ:??(I??一?_〇x??〇i?!??L?_????????.?i??圖3-2?LSH索引搜索示例??3.2.3?混合索引結(jié)構(gòu)UR-trce??本節(jié)在IR-tree索引和LSH索引的基礎(chǔ)上設(shè)計(jì)/??個(gè)新的索引結(jié)構(gòu)UR-tree來(lái)整合??空間、語(yǔ)義和文本三個(gè)維度的信息,如圖3-3所示。LIR-tree?-方面保證j'索引結(jié)構(gòu)在??17??
第二章基于語(yǔ)義表示的空間關(guān)鍵詞集合查詢(xún)處理?面向空間文本對(duì)象的集合查詢(xún)與推薦技術(shù)研宂??空間和文本兩個(gè)維度的剪枝效果,另一方面也解決了語(yǔ)義分布的維度過(guò)高而可能引??起的“維數(shù)災(zāi)難”問(wèn)題。??……1;??Topic?Layer?▲?Q?_……??I?Is&■?■■■?0?|l??I?L.j?;?U.j??Root?—?InvFile??一…^…??Textual?Layer??Leaf?Leaf?Leaf?Leaf??t?i?t?▼??InvFile?InvFile?InvFile?InvFile??圖3-3?LIR-tree索引結(jié)構(gòu)??為了能夠更好地利用己有的研究成果,LIR-tree索引首先處理所有對(duì)象的語(yǔ)義信??息。眾所周知,LSH是一種廣泛應(yīng)用于高維相似搜索的方法,適用于表示語(yǔ)義信息??的高維語(yǔ)義分布向量,這一章中利用LSH方法根據(jù)對(duì)象的語(yǔ)義分布將所有空間文本??對(duì)象哈希到桶中。每一個(gè)桶的編號(hào)都可以被看作是這個(gè)桶中所有對(duì)象的語(yǔ)義標(biāo)簽,??在同一個(gè)桶中的對(duì)象被認(rèn)為在語(yǔ)義上是相似的。接著,LIR-tree會(huì)在空間維度處理對(duì)??象,因?yàn)槊總(gè)對(duì)象在空間維度上只包含二維的地理位置信息(經(jīng)緯度),相對(duì)于文本??信息來(lái)說(shuō)對(duì)搜索空間的剪枝程度更大,因此對(duì)所有的空間文本對(duì)象都根據(jù)其空間位??置關(guān)系利用R-tree來(lái)索引。最后,將經(jīng)過(guò)LSH處理后的對(duì)象的語(yǔ)義標(biāo)簽看做是對(duì)象包??含的新的文本信息,由此對(duì)R-tree的每一個(gè)節(jié)點(diǎn),都創(chuàng)建一個(gè)基于對(duì)象語(yǔ)義標(biāo)簽的倒??排文件作為文本索引。??18??
【參考文獻(xiàn)】:
期刊論文
[1]基于對(duì)象集合的空間關(guān)鍵詞查詢(xún)[J]. 梁銀,董永權(quán). 計(jì)算機(jī)應(yīng)用. 2014(07)
[2]道路網(wǎng)中的移動(dòng)對(duì)象連續(xù)K近鄰查詢(xún)[J]. 趙亮,陳犖,景寧,廖巍. 計(jì)算機(jī)學(xué)報(bào). 2010(08)
[3]支持關(guān)鍵詞搜索的空間連接查詢(xún)研究[J]. 陳德華,劉良旭,樂(lè)嘉錦. 計(jì)算機(jī)科學(xué). 2009(07)
本文編號(hào):3395065
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3395065.html
最近更新
教材專(zhuān)著