天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于密度聚類的空間文本查詢

發(fā)布時(shí)間:2020-09-30 14:41
   近年來,基于位置服務(wù)的應(yīng)用發(fā)展迅速。用戶可以基于位置進(jìn)行信息檢索,從而得到更加符合現(xiàn)實(shí)需求的檢索結(jié)果。作為基于位置的信息檢索的基礎(chǔ),空間文本查詢?cè)絹碓绞艿綄W(xué)者的關(guān)注。在空間文本查詢領(lǐng)域,學(xué)者提出了多種查詢方式解決現(xiàn)實(shí)場(chǎng)景中的問題,但現(xiàn)有的查詢方式鮮有考慮到周圍興趣點(diǎn)對(duì)返回結(jié)果的影響;赥op-k空間文本聚集查詢,本文提出了基于密度聚類的空間文本查詢。該查詢方式為用戶返回符合密度要求的結(jié)果簇集,即為用戶推薦符合查詢條件且空間文本對(duì)象密集的區(qū)域。本文提出的查詢方式解決了Top-k空間文本聚集查詢中系統(tǒng)IO開銷大和索引結(jié)構(gòu)參數(shù)敏感等問題。該方法首先使用IR~2樹索引結(jié)構(gòu)對(duì)空間文本對(duì)象進(jìn)行索引。然后,根據(jù)查詢關(guān)鍵字和最大可接受距離對(duì)IR~2樹進(jìn)行搜索,并返回相關(guān)空間文本對(duì)象集。最后,使用基于密度的聚類算法對(duì)相關(guān)對(duì)象集進(jìn)行聚類,并返回最終的結(jié)果簇集。這樣可以避免對(duì)整個(gè)數(shù)據(jù)集進(jìn)行遍歷,降低了系統(tǒng)IO開銷和查詢時(shí)間。本文將IR~2樹索引結(jié)構(gòu)與傳統(tǒng)的DBSCAN算法相結(jié)合,設(shè)計(jì)了基于DBSCAN的聚類空間文本查詢算法。然而,DBSCAN算法時(shí)間復(fù)雜度高,影響查詢效率。針對(duì)這一問題,本文提出了兩種不同的改進(jìn)算法:(1)基于規(guī)則的聚類空間文本查詢改進(jìn)算法。該算法使用規(guī)則策略減少了DBSCAN算法中對(duì)于核心對(duì)象的?鄰域中對(duì)象的擴(kuò)展數(shù)量,從而降低聚類時(shí)間。(2)基于快速DBSCAN的聚類空間文本查詢改進(jìn)算法。該算法根據(jù)用戶輸入的查詢條件建立網(wǎng)格結(jié)構(gòu),并結(jié)合快速DBSCAN算法,降低了算法的時(shí)間復(fù)雜度。通過對(duì)IR~2樹索引結(jié)構(gòu)和本文查詢方式的分析,本文發(fā)現(xiàn)搜索IR~2樹時(shí),可以去除掉包含明顯異常對(duì)象的節(jié)點(diǎn)。針對(duì)這一問題,本文提出了基于剪枝策略的聚類空間文本近似查詢算法。首先,本文通過增加IR~2樹中簽名文件的標(biāo)志位改進(jìn)了IR~2樹索引結(jié)構(gòu)。其次,本文設(shè)計(jì)了具體的剪枝策略,對(duì)改進(jìn)后的IR~2樹的搜索過程進(jìn)行剪枝,實(shí)現(xiàn)了近似查詢算法。近似查詢算法對(duì)改進(jìn)的IR~2樹進(jìn)行搜索時(shí)能在樹的高層及時(shí)去掉包含明顯異常對(duì)象的節(jié)點(diǎn),降低了系統(tǒng)IO開銷和IR~2樹搜索時(shí)間。為了驗(yàn)證不同查詢參數(shù)對(duì)各個(gè)算法運(yùn)行時(shí)間和系統(tǒng)IO開銷的影響,本文在兩個(gè)不同規(guī)模的數(shù)據(jù)集上對(duì)本文所設(shè)計(jì)算法進(jìn)行對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,在相同實(shí)驗(yàn)條件下,基于快速DBSCAN的改進(jìn)算法較本文其他精準(zhǔn)算法相比效果最好。此外,本文提出的近似查詢算法能夠有效識(shí)別到包含異常對(duì)象的節(jié)點(diǎn),并對(duì)其進(jìn)行剪枝,進(jìn)一步提升了算法性能。
【學(xué)位單位】:西安電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TP311.13;TP391.1
【部分圖文】:

影響圖,關(guān)鍵字,對(duì)象集,對(duì)相


西安電子科技大學(xué)碩士學(xué)位論文40圖5.1 查詢關(guān)鍵字個(gè)數(shù)對(duì)相關(guān)對(duì)象集和系統(tǒng) IO 開銷的影響圖圖5.2 查詢關(guān)鍵字個(gè)數(shù)對(duì)精準(zhǔn)算法的影響圖圖 5.2 展示了不同算法的運(yùn)行時(shí)間與查詢關(guān)鍵字?jǐn)?shù)量之間的關(guān)系。實(shí)驗(yàn)表明,隨著查詢關(guān)鍵字個(gè)數(shù)的增多,搜索到的相關(guān)空間文本對(duì)象的數(shù)量在不斷增加,各個(gè)算法的運(yùn)行時(shí)間都有不同程度的增加,主要有如下兩方面的原因:一是隨著查詢關(guān)鍵字?jǐn)?shù)量的增多,在對(duì)IR2樹搜索時(shí)需要遍歷到更多的節(jié)點(diǎn),增加了生成相關(guān)對(duì)象集的時(shí)間;二是相關(guān)對(duì)象集的增大,增加了對(duì)相關(guān)對(duì)象集進(jìn)行基于密度聚類的時(shí)間。隨著查詢關(guān)鍵字個(gè)數(shù)的增加 Base 算法的運(yùn)行時(shí)間增長幅度最大。因?yàn)楫?dāng)查詢關(guān)鍵字個(gè)數(shù)多時(shí),相關(guān)對(duì)象集中對(duì)象的密度會(huì)變大

影響圖,關(guān)鍵字,影響圖,相關(guān)對(duì)象


40圖5.1 查詢關(guān)鍵字個(gè)數(shù)對(duì)相關(guān)對(duì)象集和系統(tǒng) IO 開銷的影響圖圖5.2 查詢關(guān)鍵字個(gè)數(shù)對(duì)精準(zhǔn)算法的影響圖圖 5.2 展示了不同算法的運(yùn)行時(shí)間與查詢關(guān)鍵字?jǐn)?shù)量之間的關(guān)系。實(shí)驗(yàn)表明,隨著查詢關(guān)鍵字個(gè)數(shù)的增多,搜索到的相關(guān)空間文本對(duì)象的數(shù)量在不斷增加,各個(gè)算法的運(yùn)行時(shí)間都有不同程度的增加,主要有如下兩方面的原因:一是隨著查詢關(guān)鍵字?jǐn)?shù)量的增多,在對(duì)IR2樹搜索時(shí)需要遍歷到更多的節(jié)點(diǎn),增加了生成相關(guān)對(duì)象集的時(shí)間;二是相關(guān)對(duì)象集的增大,增加了對(duì)相關(guān)對(duì)象集進(jìn)行基于密度聚類的時(shí)間。隨著查詢關(guān)鍵字個(gè)數(shù)的增加 Base 算法的運(yùn)行時(shí)間增長幅度最大。因?yàn)楫?dāng)查詢關(guān)鍵字個(gè)數(shù)多時(shí),相關(guān)對(duì)象集中對(duì)象的密度會(huì)變大

對(duì)象集,對(duì)相,文本對(duì)象,相關(guān)對(duì)象


在使用基于密度聚類的空間文本查詢方法時(shí),用戶可以輸入指定的最大可接受距離 r,即返回的所有相關(guān)空間文本對(duì)象都在此區(qū)域內(nèi),避免了返回的結(jié)果簇集距離查詢點(diǎn)過遠(yuǎn)用戶難以接受的情況。如圖5.3所示,隨著用戶輸入最大可接受距離的增大,會(huì)有更多的相關(guān)對(duì)象產(chǎn)生。相比于查詢關(guān)鍵字?jǐn)?shù)量對(duì)相關(guān)對(duì)象集中對(duì)象數(shù)量的影響,最大可接受距離的影響較小。這是因?yàn)閿?shù)據(jù)集中空間文本對(duì)象的密度固定,增大距離搜索到的相關(guān)對(duì)象集變化較小。同樣隨著最大可接受距離的增大,在對(duì) IR2樹搜索時(shí)需要訪問更多的節(jié)點(diǎn)從而增加了系統(tǒng)的 IO 開銷。最大可接受距離和查詢關(guān)鍵字?jǐn)?shù)量對(duì)系統(tǒng) IO 開銷的影響類似,在相同最大接受距離的情況下,雁塔區(qū)數(shù)據(jù)集的系統(tǒng) IO開銷大。圖 5.4 展示了不同最大可接受距離對(duì)各算法運(yùn)行時(shí)間的影響,各算法的運(yùn)行時(shí)間增加主要有如下兩方面的原因:首先是隨著最大可接受距離的增大,對(duì) IR2樹中的節(jié)點(diǎn)搜索增加

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 汪明霓;BASIC文本系統(tǒng)[J];計(jì)算機(jī)應(yīng)用研究;1988年01期

2 易樹鴻;張為群;;一種基于粗集的文本數(shù)據(jù)特征信息的挖掘方法[J];計(jì)算機(jī)科學(xué);2002年08期

3 婁道國;李若斌;劉冰;張冬冬;;云計(jì)算下各分散文本數(shù)據(jù)的全方位集成融合方法[J];科技通報(bào);2019年02期

4 張慧倫;;伴隨文本:透視網(wǎng)絡(luò)文學(xué)發(fā)展的重要路徑[J];百家評(píng)論;2019年04期

5 潘大勝;;不確定噪聲下海量文本數(shù)據(jù)的模糊挖掘算法研究[J];微電子學(xué)與計(jì)算機(jī);2017年09期

6 潘艷艷;;陳運(yùn)文:做文本數(shù)據(jù)領(lǐng)域的“先知”[J];張江科技評(píng)論;2020年01期

7 王珊珊;馮利鑫;;基于新詞識(shí)別的大數(shù)據(jù)聊天文本輿情熱點(diǎn)挖掘[J];電子商務(wù);2018年01期

8 陳曉峰;如何在flash中讀入外部文本數(shù)據(jù)[J];電腦知識(shí)與技術(shù);2004年13期

9 馬欣欣;林克;;大文本數(shù)據(jù)快速分析統(tǒng)計(jì)理論與算法[J];電子元器件與信息技術(shù);2019年01期

10 施瑞朗;;基于社交平臺(tái)數(shù)據(jù)的文本分類算法研究[J];電子科技;2018年10期

相關(guān)會(huì)議論文 前10條

1 易天元;葉春生;;工業(yè)鍋爐圖紙輸入的文本數(shù)據(jù)處理[A];1997中國控制與決策學(xué)術(shù)年會(huì)論文集[C];1997年

2 陳光強(qiáng);楊樹強(qiáng);張曉輝;李潤恒;賈焰;;面向海量文本數(shù)據(jù)的多任務(wù)并行調(diào)度加載技術(shù)研究與實(shí)現(xiàn)[A];第15屆全國信息存儲(chǔ)技術(shù)學(xué)術(shù)會(huì)議論文集[C];2008年

3 周純潔;黎]

本文編號(hào):2830967


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2830967.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶42dfa***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
欧美一级日韩中文字幕| 91精品国产品国语在线不卡 | 国产日韩欧美在线播放| 成人精品一区二区三区在线| 美女被后入视频在线观看| 欧美日韩乱码一区二区三区| 国产精品十八禁亚洲黄污免费观看| 色老汉在线视频免费亚欧| 我的性感妹妹在线观看| 国产主播精品福利午夜二区| 中文字幕日韩一区二区不卡| 男女一进一出午夜视频| 成人欧美精品一区二区三区| 亚洲精品国产第一区二区多人| 亚洲国产成人爱av在线播放下载| 色小姐干香蕉在线综合网| 国产女高清在线看免费观看| 开心激情网 激情五月天| 黄片三级免费在线观看| 99精品国产自在现线观看| 亚洲精品中文字幕欧美| 日韩欧美高清国内精品| 偷拍偷窥女厕一区二区视频| 免费国产成人性生活生活片| 最近最新中文字幕免费| 国产伦精品一区二区三区高清版| 日韩中文字幕视频在线高清版| 亚洲熟妇中文字幕五十路| 久久热在线视频免费观看| 亚洲欧洲成人精品香蕉网| 都市激情小说在线一区二区三区| 国产精品午夜性色视频| 成人精品欧美一级乱黄| 亚洲精品欧美精品一区三区| 亚洲少妇人妻一区二区| 国产女性精品一区二区三区| 中文字幕日韩欧美理伦片| 高清在线精品一区二区| 亚洲天堂精品在线视频| 五月婷婷六月丁香狠狠| 九九热这里有精品20|