天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

面向多樣性檢索的子主題挖掘技術(shù)的研究

發(fā)布時間:2017-05-21 19:06

  本文關(guān)鍵詞:面向多樣性檢索的子主題挖掘技術(shù)的研究,由筆耕文化傳播整理發(fā)布。


【摘要】:信息時代的快速發(fā)展使得互聯(lián)網(wǎng)數(shù)據(jù)呈現(xiàn)“井噴式”增長。作為信息檢索在互聯(lián)網(wǎng)中最成功的應(yīng)用,搜索引擎已經(jīng)成為用戶查找信息的不可或缺的工具。然而,由于對效率,并發(fā)等系統(tǒng)性能的考慮,目前搜索引擎還是基于關(guān)鍵詞的檢索方式。此外用戶提交的相同查詢也可能有不同的查詢意圖。為了解決用戶查詢經(jīng)常存在的表意模糊或歧義性等問題,明確用戶的查詢意圖,滿足用戶的多樣性需求,本文針對用戶查詢主題進行分析,提出潛在多樣性子主題挖掘方法,充分考慮了相關(guān)文檔集及查詢?nèi)罩緦ψ又黝}多樣性的影響。 首先,分析研究多樣性子主題挖掘方法,本文提出了采用基于LCS的頻繁序列挖掘算法抽取文檔片段集中的候選子主題序列,同時使用《知網(wǎng)》及查詢?nèi)罩緦Y(jié)果進行語義聚類和排序;實驗證明,該方法可有效地挖掘子主題,聚類查詢意圖。 其次,本文提出了一種無指導(dǎo)的子主題挖掘方法。該方法先在相關(guān)文檔片段集中,利用ATF×PDF模型挖掘候選主題詞;為保證子主題的多樣性,本文基于《知網(wǎng)》語義相似度方法對候選主題詞進行了聚類分析,進而得到潛在主題;最后,利用基于LCS的子主題組合排序算法生成多樣性子主題。實驗結(jié)果顯示,系統(tǒng)平均I-rec@10,,D-nDCG@10,D#-nDCG@10分別達到0.5745,0.5714和0.573,結(jié)果表明該方法在明確查詢主題表意方面取得較好效果。 最后,設(shè)計并實現(xiàn)了面向多樣性檢索的子主題挖掘系統(tǒng)。該系統(tǒng)支持用戶查詢檢索,挖掘查詢子主題,獲得多樣性檢索結(jié)果。
【關(guān)鍵詞】:信息檢索 查詢意圖 多樣性 子主題挖掘 潛在主題
【學(xué)位授予單位】:沈陽航空航天大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.3
【目錄】:
  • 摘要6-7
  • Abstract7-11
  • 第1章 引言11-16
  • 1.1 研究背景與意義11-14
  • 1.1.1 研究背景11-13
  • 1.1.2 研究意義13-14
  • 1.2 本文主要工作14
  • 1.3 本文組織結(jié)構(gòu)14-16
  • 第2章 相關(guān)研究16-25
  • 2.1 多樣性檢索16-18
  • 2.2 候選子主題抽取18-21
  • 2.3 子主題多樣性排序21-23
  • 2.4 相關(guān)評價指標23-24
  • 2.5 本章小結(jié)24-25
  • 第3章 基于 LCS 的子主題挖掘算法25-37
  • 3.1 LCS 算法25-27
  • 3.2 基于 LCS 的子主題挖掘算法27-32
  • 3.2.1 語料預(yù)處理28
  • 3.2.2 候選子主題挖掘28-29
  • 3.2.3 子主題聚類排序29-32
  • 3.3 本章實驗與分析32-36
  • 3.3.1 實驗準備32-33
  • 3.3.2 實驗結(jié)果與分析33-36
  • 3.4 本章小結(jié)36-37
  • 第4章 無指導(dǎo)的子主題挖掘算法37-50
  • 4.1 潛在主題挖掘37-42
  • 4.1.1 候選主題詞抽取37-38
  • 4.1.2 候選主題詞聚類38-42
  • 4.2 子主題組合排序算法42-43
  • 4.3 本章實驗與分析43-49
  • 4.3.1 實驗準備43-45
  • 4.3.2 實驗結(jié)果與分析45-49
  • 4.4 本章小結(jié)49-50
  • 第5章 面向多樣性檢索的子主題挖掘系統(tǒng)設(shè)計與實現(xiàn)50-56
  • 5.1 系統(tǒng)設(shè)計50-51
  • 5.2 系統(tǒng)實現(xiàn)51-55
  • 5.3 本章小結(jié)55-56
  • 結(jié)論56-58
  • 參考文獻58-61
  • 致謝61-62
  • 攻讀碩士期間發(fā)表(含錄用)的學(xué)術(shù)論文62

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 吳玲達,謝毓湘,欒悉道,肖鵬;互聯(lián)網(wǎng)多媒體主題信息自動收集與處理系統(tǒng)的研制[J];計算機應(yīng)用研究;2005年05期

2 蔣凡,高俊波,張敏,王煦法;BBS中主題發(fā)現(xiàn)原型系統(tǒng)的設(shè)計與實現(xiàn)[J];計算機工程與應(yīng)用;2005年31期

3 周亦鵬;杜軍平;;基于時空情境模型的主題跟蹤[J];華南理工大學(xué)學(xué)報(自然科學(xué)版);2012年08期

4 陳雄;都云程;李渝勤;施水才;;基于頁面結(jié)構(gòu)分析的論壇主題信息定位方法研究[J];微計算機信息;2010年27期

5 何利益;陸國鋒;羅鵬;;動態(tài)新聞主題信息推薦系統(tǒng)設(shè)計[J];指揮信息系統(tǒng)與技術(shù);2013年04期

6 關(guān)慧芬;師軍;;基于本體的主題爬蟲技術(shù)研究[J];計算機仿真;2009年10期

7 張宇;宋巍;劉挺;李生;;基于URL主題的查詢分類方法[J];計算機研究與發(fā)展;2012年06期

8 歐健文,董守斌,蔡斌;模板化網(wǎng)頁主題信息的提取方法[J];清華大學(xué)學(xué)報(自然科學(xué)版);2005年S1期

9 呂聚旺;都云程;王弘蔚;施水才;;基于新型主題信息量化方法的Web主題信息提取研究[J];現(xiàn)代圖書情報技術(shù);2008年12期

10 朱夢麟;李光耀;周毅敏;;基于樹比較的Web頁面主題信息抽取[J];微型機與應(yīng)用;2011年19期

中國重要會議論文全文數(shù)據(jù)庫 前7條

1 吳晨;宋丹;薛德軍;師慶輝;;科技主題識別及表示[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年

2 熊方;王曉宇;鄭駿;周傲英;;ITED:一種基于鏈接的主題提取和主題發(fā)現(xiàn)系統(tǒng)[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2002年

3 王玉婷;杜亞軍;涂騰濤;;基于Web鏈接的主題爬行蟲初始URL的研究[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年

4 馮少卿;都云程;施水才;;基于模板的網(wǎng)頁主題信息抽取[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

5 王琦;唐世渭;楊冬青;王騰蛟;;基于DOM的網(wǎng)頁主題信息自動提取[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年

6 刁宇峰;王昊;林鴻飛;楊亮;;博客中重復(fù)評論發(fā)現(xiàn)[A];中國計算語言學(xué)研究前沿進展(2009-2011)[C];2011年

7 曹紅;袁津生;;多領(lǐng)域主題搜索引擎研究[A];第一屆全國Web信息系統(tǒng)及其應(yīng)用會議(WISA2004)論文集[C];2004年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條

1 吳永輝;面向?qū)I(yè)領(lǐng)域的網(wǎng)絡(luò)信息采集及主題檢測技術(shù)研究與應(yīng)用[D];哈爾濱工業(yè)大學(xué);2010年

2 薛利;面向證券應(yīng)用的WEB主題觀點挖掘若干關(guān)鍵問題研究[D];復(fù)旦大學(xué);2013年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 薛耀兵;科技文獻中的主題發(fā)現(xiàn)與趨勢預(yù)測[D];哈爾濱工業(yè)大學(xué);2013年

2 陳浩;自定義主題信息抽取的研究與應(yīng)用[D];大連理工大學(xué);2008年

3 郭程;面向多樣性檢索的子主題挖掘技術(shù)的研究[D];沈陽航空航天大學(xué);2014年

4 吳彥文;主題信息合理性、語境意義偏向性對漢語句子歧義消解的實驗研究[D];陜西師范大學(xué);2002年

5 戴興虎;基于主題的學(xué)術(shù)網(wǎng)絡(luò)構(gòu)建[D];浙江大學(xué);2013年

6 吳曉娜;基于特征、先驗和約束的主題建模算法[D];蘇州大學(xué);2014年

7 邸亮;基于主題模型的個性化信息推薦[D];北京工業(yè)大學(xué);2014年

8 亓?xí)郧?Web挖掘中的主題模型擴展[D];北京郵電大學(xué);2013年

9 徐楓;基于主題爬蟲的視頻教程庫的研究與設(shè)計[D];廣西大學(xué);2014年

10 徐西孟;基于OODA決策循環(huán)的主題發(fā)現(xiàn)技術(shù)的研究與設(shè)計[D];濟南大學(xué);2011年


  本文關(guān)鍵詞:面向多樣性檢索的子主題挖掘技術(shù)的研究,由筆耕文化傳播整理發(fā)布。



本文編號:384534

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/384534.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6a89b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
女同伦理国产精品久久久| 欧美日韩精品久久第一页| 色哟哟国产精品免费视频| 成人区人妻精品一区二区三区| 欧美激情视频一区二区三区| 久久国产精品熟女一区二区三区| 色婷婷视频国产一区视频| 日本高清视频在线播放| 精品欧美一区二区三久久| 国产丝袜极品黑色高跟鞋| 大屁股肥臀熟女一区二区视频 | 国产午夜精品久久福利| 午夜小视频成人免费看| 国产高清在线不卡一区| 国产日本欧美韩国在线| 最新日韩精品一推荐日韩精品| 国产午夜在线精品视频| 97人妻精品一区二区三区男同| 福利一区二区视频在线| 九九热在线视频精品免费| 福利在线午夜绝顶三级| 日本不卡一区视频欧美| 午夜福利黄片免费观看| 日韩精品一级片免费看| 一个人的久久精彩视频| 国产又粗又猛又爽又黄| 国产日韩精品激情在线观看| 99久久免费看国产精品| 欧美一区二区三区十区| 欧美日韩免费观看视频| 国产一区二区精品丝袜| 色婷婷亚洲精品综合网| 久久综合狠狠综合久久综合| 欧美激情中文字幕综合八区| 国产成人午夜在线视频| 欧美成人精品一区二区久久| 丰满少妇高潮一区二区| 日韩人妻中文字幕精品| 久久天堂夜夜一本婷婷| 国产精品欧美激情在线观看| 国产乱久久亚洲国产精品|