天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

改進后綴樹的中文檢索結(jié)果聚類研究

發(fā)布時間:2017-12-26 10:57

  本文關鍵詞:改進后綴樹的中文檢索結(jié)果聚類研究 出處:《計算機工程與應用》2014年21期  論文類型:期刊論文


  更多相關文章: 檢索結(jié)果聚類 后綴樹 聚類標簽 中文檢索 聚類


【摘要】:檢索結(jié)果聚類能夠幫助用戶快速定位需要查找的信息。注重進行中文文本聚類的同時生成高質(zhì)量的標簽,獲取搜索引擎返回的網(wǎng)頁標題和摘要,利用分詞工具對文本分詞,去除停用詞;統(tǒng)一構建一棵后綴樹,以詞語為單位插入后綴樹各節(jié)點,通過詞頻、詞長、詞性和位置幾項約束條件計算各節(jié)點詞語得分;合并基類取得分高的節(jié)點詞作標簽。實驗結(jié)果顯示該方法的聚類簇純度較高,提取的標簽準確且區(qū)分性較強,方便用戶使用。
【作者單位】: 北京林業(yè)大學信息學院;
【分類號】:TP391.3
【正文快照】: 1引言隨著網(wǎng)絡信息的爆炸式增長,人們在網(wǎng)上使用搜索引擎查找信息時,搜索引擎會按照一定的方法將所有相關網(wǎng)頁排序后呈現(xiàn)給用戶。目前,大家經(jīng)常使用的Google(http://www.google.com.hk/)、百度(http://www.baidu.com/)都是將結(jié)果以一定方式排列后呈現(xiàn)給用戶[1]。如果查詢詞的

【參考文獻】

相關期刊論文 前3條

1 劉文婷;滕奇志;;后綴樹聚類在專用搜索引擎中的應用研究與改進[J];成都信息工程學院學報;2010年03期

2 駱雄武;萬小軍;楊建武;吳於茜;;基于后綴樹的Web檢索結(jié)果聚類標簽生成方法[J];中文信息學報;2009年02期

3 張紅鷹;;基于模糊處理的中文文本關鍵詞提取算法[J];現(xiàn)代圖書情報技術;2009年05期

【共引文獻】

相關期刊論文 前8條

1 劉文婷;滕奇志;;后綴樹聚類在專用搜索引擎中的應用研究與改進[J];成都信息工程學院學報;2010年03期

2 趙俊杰;汪麗;王平水;;基于自動文摘的論文抄襲檢測研究(英文)[J];電腦與電信;2010年02期

3 劉德山;;一種改進的基于后綴樹模型搜索結(jié)果聚類算法[J];計算機科學;2011年11期

4 蘇沖;陳清才;王曉龍;孟憲軍;;基于最大頻繁項集的搜索引擎查詢結(jié)果聚類算法[J];中文信息學報;2010年02期

5 鄒志華;田生偉;禹龍;馮冠軍;;改進的維吾爾語Web文本后綴樹聚類[J];中文信息學報;2013年02期

6 楊春明;韓永國;;快速的領域文檔關鍵詞自動提取算法[J];計算機工程與設計;2011年06期

7 吳夙慧;成穎;鄭彥寧;潘云濤;;基于N元語法的英文學術文獻聚類標簽抽取算法[J];現(xiàn)代圖書情報技術;2011年Z1期

8 羅宏;陳黎;王亞強;朱洪波;韓國輝;于中華;;基于查詢相關性分析的檢索結(jié)果聚類算法[J];小型微型計算機系統(tǒng);2011年10期

相關博士學位論文 前1條

1 劉鈺峰;異構信息網(wǎng)絡檢索技術研究[D];湖南大學;2014年

相關碩士學位論文 前10條

1 范丹;Web檢索中的查詢擴展及結(jié)果聚類技術研究[D];遼寧師范大學;2010年

2 俞文明;Web中文文本聚類研究[D];杭州電子科技大學;2009年

3 劉文靜;基于標簽詞抽取的搜索結(jié)果聚類研究[D];北京郵電大學;2012年

4 馬文超;基于2度頻繁詞序列的文本聚類算法研究[D];河南大學;2009年

5 祁童;“九三學社”天津市委員會網(wǎng)站管理系統(tǒng)的設計與實現(xiàn)[D];華東師范大學;2009年

6 吳夙慧;基于引用分析的學術檢索系統(tǒng)改進研究[D];南京大學;2012年

7 國瑋瑋;基于網(wǎng)絡資源的未登錄詞擴展研究[D];安徽大學;2012年

8 余驍捷;新聞播報節(jié)目的內(nèi)容自動標注系統(tǒng)[D];清華大學;2011年

9 鞏玲玲;英語試題關鍵詞重要性評價算法研究[D];北方工業(yè)大學;2013年

10 毛新武;基于組合特征的中文新聞網(wǎng)頁關鍵詞提取研究[D];北京林業(yè)大學;2013年

【二級參考文獻】

相關期刊論文 前10條

1 馬張華,陳文廣;查詢優(yōu)化與動態(tài)自動聚類系統(tǒng)[J];大學圖書館學報;2005年03期

2 郭偉,唐曉君,劉萬軍;一種基于劃分的聚類算法分析與改進[J];遼寧工程技術大學學報;2004年06期

3 王燦輝;張敏;馬少平;黃宇;;基于相鄰詞的中文關鍵詞自動抽取[J];廣西師范大學學報(自然科學版);2007年02期

4 索紅光;劉玉樹;曹淑英;;一種基于詞匯鏈的關鍵詞抽取方法[J];中文信息學報;2006年06期

5 駱雄武;萬小軍;楊建武;吳於茜;;基于后綴樹的Web檢索結(jié)果聚類標簽生成方法[J];中文信息學報;2009年02期

6 靖培棟;田亮;;聚類在搜索引擎中的應用[J];情報理論與實踐;2006年04期

7 楊安生;;基于倒排表的中文全文檢索研究[J];情報探索;2009年07期

8 方清華;;信息檢索加權理論與技術:基于VSM模型的分析[J];情報雜志;2008年06期

9 張敏;耿煥同;王煦法;;一種利用BC方法的關鍵詞自動提取算法研究[J];小型微型計算機系統(tǒng);2007年01期

10 劉華;;基于文本分類中特征提取的領域詞語聚類[J];語言文字應用;2007年01期

【相似文獻】

相關期刊論文 前10條

1 曾本勝,廉玉忠,,李世取;后綴樹的平均高度[J];運籌與管理;1996年04期

2 黃影;;一種有效的后綴樹建立方法[J];電子科技;2013年10期

3 趙杰文;原嬌杰;;數(shù)據(jù)挖掘中后綴樹算法的應用研究[J];焦作大學學報;2007年03期

4 黃影;;一種有效的后綴樹建立方法[J];中國電子教育;2013年03期

5 喬百友,葛健,王國仁,韓東紅;并行后綴樹的構造及查詢算法[J];東北大學學報;2004年03期

6 彭靜;翟英;馮爽;;后綴樹算法在輿情聚類中的應用[J];河北科技大學學報;2012年01期

7 葛健;王國仁;于戈;;后綴樹的并行構造算法[J];計算機科學;2004年05期

8 曲文龍;楊炳儒;張克君;;基于廣義后綴樹的事件序列頻繁情節(jié)挖掘算法[J];北京科技大學學報;2006年05期

9 王秉政;蘇曉珂;張素智;;一種基于后綴樹的簡潔關聯(lián)規(guī)則挖掘有效剪枝方法[J];鄭州輕工業(yè)學院學報(自然科學版);2011年03期

10 董云耀;李笑;;基于后綴樹的知識點間關聯(lián)規(guī)則挖掘算法[J];杭州電子科技大學學報;2006年01期

相關會議論文 前1條

1 務孟慶;高軍;王騰蛟;楊冬青;;WD-STC:一種基于網(wǎng)絡詞典的WEB新聞文檔后綴樹聚類算法[A];全國網(wǎng)絡與信息安全技術研討會論文集(上冊)[C];2007年

相關碩士學位論文 前10條

1 郭海濤;用加強的后綴數(shù)組查找MUM[D];西安電子科技大學;2007年

2 王學;基因組中最大唯一匹配的查找算法研究[D];西安電子科技大學;2009年

3 王堅;基于后綴數(shù)組的滑動窗口匹配壓縮改進算法研究[D];華中科技大學;2012年

4 榮元媛;改進后綴樹的中文檢索結(jié)果聚類系統(tǒng)[D];北京林業(yè)大學;2013年

5 董麗霞;基因組比對中若干改進算法研究[D];西安電子科技大學;2009年

6 唐德昌;基于串核的蛋白質(zhì)分類算法的研究與實現(xiàn)[D];哈爾濱工業(yè)大學;2008年

7 張任文;生物序列索引結(jié)構的研究與實現(xiàn)[D];哈爾濱工業(yè)大學;2006年

8 張吉;基于后綴樹模型的流文本表示研究及其應用[D];中國科學院研究生院(計算技術研究所);2005年

9 趙麗紅;后綴數(shù)組在維、哈、柯搜索引擎中的應用[D];新疆大學;2012年

10 買買提依明·哈斯木;基于后綴樹的維吾爾文網(wǎng)頁聚類算法的設計與實現(xiàn)[D];新疆大學;2011年



本文編號:1336945

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1336945.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶786f5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com