天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

一種基于名詞短語的檢索結果多層聚類方法

發(fā)布時間:2018-07-23 17:52
【摘要】:對檢索結果聚類可以方便用戶快速瀏覽搜索引擎返回結果。為了提取主題表達能力和可讀性強的類別標簽,獲取高質量的聚類結果,提出基于名詞短語的檢索結果多層聚類方法:提取名詞短語作為候選類別標簽,根據(jù)候選類別標簽分布情況生成基礎類,再使用具有線性時間復雜度的一趟聚類算法對基礎類進行多層聚類。與基于命名實體的方法、STC和Lingo算法的對比實驗表明:提出方法在類別標簽的可讀性、有效性以及聚類性能上都優(yōu)于以上3種方法。
[Abstract]:Clustering the retrieval results can facilitate users to quickly browse the search engine to return the results. In order to extract category labels with strong expression ability and readability, and obtain high quality clustering results, a multilayer clustering method based on noun phrase retrieval results is proposed: noun phrases are extracted as candidate category labels. The basic classes are generated according to the distribution of candidate class labels, and then a one-trip clustering algorithm with linear time complexity is used to cluster the base classes. Compared with the named entity based method and Lingo algorithm, the proposed method is superior to the above three methods in terms of readability, validity and clustering performance.
【作者單位】: 廣東外語外貿大學信息學院;
【基金】:國家自然科學基金資助項目(60673191) 廣東省高等學校自然科學研究重點項目(06Z012) 廣東省自然科學基金資助項目(9151026005000002)
【分類號】:TP391.3

【參考文獻】

相關期刊論文 前1條

1 張清軍,朱才連;基于統(tǒng)計的中文文本主題自動提取研究[J];四川大學學報(工程科學版);2004年03期

【共引文獻】

相關期刊論文 前3條

1 張清軍,朱才連;基于LBS的中文自動文摘技術研究[J];四川大學學報(工程科學版);2004年04期

2 張清軍,朱才連,侯林山;信息抽取技術在LBS中的應用[J];四川大學學報(工程科學版);2005年01期

3 黃振晗;;基于文檔特征的Web主題文本提取[J];現(xiàn)代計算機(專業(yè)版);2009年08期

相關會議論文 前2條

1 孫宏綱;陸余良;;基于二元切分的互聯(lián)網(wǎng)新聞主題詞自動提取研究[A];第三屆全國信息檢索與內容安全學術會議論文集[C];2007年

2 秦鵬;李恒訓;張華平;劉金剛;;基于關鍵詞提取的搜索結果聚類研究[A];第五屆全國信息檢索學術會議論文集[C];2009年

相關碩士學位論文 前6條

1 王平;基于自組織特征映射的檢索結果聚類研究[D];哈爾濱工業(yè)大學;2009年

2 李琳;基于粗糙集和遺傳算法的聚類方法研究[D];廣西師范大學;2009年

3 康艷;中文圖書內容索引計算機編制的研究與系統(tǒng)實現(xiàn)[D];南京農(nóng)業(yè)大學;2008年

4 王世昆;中醫(yī)癥狀病機實體識別及其關系挖掘研究[D];廈門大學;2009年

5 史進玲;基于粒計算的決策表屬性約簡與規(guī)則提取研究[D];河南師范大學;2009年

6 萬濤;圖書館管理系統(tǒng)的設計與實現(xiàn)[D];吉林大學;2009年

【二級參考文獻】

相關期刊論文 前6條

1 薛翠芳,郭炳炎;漢語文本特征詞的抽取方法[J];情報學報;2000年03期

2 韓客松,王永成;一種用于主題提取的非線性加權方法[J];情報學報;2000年06期

3 韓客松,王永成;中文全文標引的主題詞標引和主題概念標引方法[J];情報學報;2001年02期

4 韓客松,王永成,滕偉;Web頁面中文文本主題的自動提取研究[J];情報學報;2001年02期

5 王志梅,張俊林,李秋山;Web檢索結果快速聚類方法的研究與實現(xiàn)[J];計算機工程與設計;2004年12期

6 于琨,糜仲春,蔡慶生;可應用于互聯(lián)網(wǎng)的自學習中文關鍵詞抽取算法[J];中國科學技術大學學報;2002年03期

【相似文獻】

相關期刊論文 前10條

1 門國尊;;用于信息檢索的文本聚類技術[J];今日科苑;2008年20期

2 蔡明德;鉤玄提要信息檢索學——《信息檢索系列教程》總序[J];大連民族學院學報;2005年02期

3 王寧;淺析信息檢索服務模式的轉變[J];圖書館學刊;2005年01期

4 李淑慧 ,張恩;漫談信息檢索的方式[J];山東檔案;2005年03期

5 張福泉;;信息檢索的黃金時代[J];中國計算機用戶;2006年05期

6 楊則正;信息檢索和交換的手段[J];管理科學文摘;1996年03期

7 黃浩耘;信息檢索中的科學美與信息檢索教學中的美育問題[J];四川師范學院學報(哲學社會科學版);2002年05期

8 劉濤,吳功宜,陳正;一種高效的用于文本聚類的無監(jiān)督特征選擇算法[J];計算機研究與發(fā)展;2005年03期

9 ;《農(nóng)業(yè)信息檢索指南》出版[J];圖書館學研究;1995年02期

10 蔡澤平;遠程信息檢索的網(wǎng)絡協(xié)調[J];中國信息導報;1997年09期

相關會議論文 前10條

1 崔安頎;岑榮偉;張敏;馬少平;;基于URL特征的動態(tài)頁面聚類[A];中國計算技術與語言問題研究——第七屆中文信息處理國際會議論文集[C];2007年

2 孫金立;李路路;董明強;;建立生物信息檢索教學網(wǎng)的研究[A];中華醫(yī)學會第十次全國醫(yī)學信息學術會議論文匯編[C];2004年

3 ;編者的話[A];第二屆全國信息檢索與內容安全學術會議(NCIRCS-2005)論文集[C];2005年

4 秦鵬;李恒訓;張華平;劉金剛;;基于關鍵詞提取的搜索結果聚類研究[A];第五屆全國信息檢索學術會議論文集[C];2009年

5 王敬成;;HNC農(nóng)村智能信息檢索系統(tǒng)[A];2006年首屆ICT大會信息、知識、智能及其轉換理論第一次高峰論壇會議論文集[C];2006年

6 陳志瑋;肖詩斌;施水才;王昕;;一種基于HTML位置信息的查詢擴展技術[A];第三屆學生計算語言學研討會論文集[C];2006年

7 李應興;付婷;李勇;;基于LUCENE的藏文信息檢索的研究與應用[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年

8 于志剛;楊金生;;農(nóng)業(yè)機械網(wǎng)絡書簽[A];第十三次全國農(nóng)機維修學術會議論文集[C];2007年

9 ;前言[A];第四屆全國信息檢索與內容安全學術會議論文集(下)[C];2008年

10 楊凝清;;信息時代的醫(yī)學信息教育模式初探[A];全面建設小康社會:中國科技工作者的歷史責任——中國科協(xié)2003年學術年會論文集(下)[C];2003年

相關重要報紙文章 前10條

1 希安;微軟試水信息檢索[N];經(jīng)濟日報;2004年

2 王丹紅;數(shù)學:為因特網(wǎng)建立秩序[N];科學時報;2009年

3 本報記者 潘永花;組件化平臺提升信息檢索效率[N];網(wǎng)絡世界;2003年

4 潘希;文本數(shù)據(jù)流聚類:在海量信息中挖掘真金[N];科學時報;2008年

5 劉光強;搜索個人、企業(yè)、垂直三大搜索新進展[N];中國計算機報;2007年

6 柏榮;國家973項目在因特網(wǎng)大規(guī)模信息檢索領域取得突破[N];中國高新技術產(chǎn)業(yè)導報;2003年

7 劉立新;信息社會技術前瞻[N];學習時報;2006年

8 微軟中國研究院 陳正 李明鏡 馬維英;互聯(lián)網(wǎng)上圖像信息檢索[N];計算機世界;2001年

9 常燕杰;商用搜索 須打智慧牌[N];中國計算機報;2006年

10 黃 浩;政府門戶網(wǎng)站應引進CRM意識[N];中國國門時報;2006年

相關博士學位論文 前10條

1 劉向威;NLP技術在中文信息檢索中的應用研究[D];天津大學;2005年

2 董道國;高維數(shù)據(jù)索引結構研究[D];復旦大學;2005年

3 郝立麗;漢語文本數(shù)據(jù)挖掘[D];吉林大學;2009年

4 劉云峰;基于潛在語義分析的中文概念檢索研究[D];華中科技大學;2005年

5 馬馬杜 ?ɡ;基于多智能體的流體動力行業(yè)虛擬聯(lián)盟信息檢索的研究[D];浙江大學;2002年

6 張毅波;史文結構化信息檢索系統(tǒng)的研究與實現(xiàn)[D];中國科學院研究生院(軟件研究所);2001年

7 王鑫印;無結構和半結構信息檢索相關技術研究[D];復旦大學;2007年

8 李廣建;個性化網(wǎng)絡信息檢索系統(tǒng)的研究與實現(xiàn)[D];中國科學院研究生院(文獻情報中心);2002年

9 邵虹;基于內容的醫(yī)學圖像檢索關鍵技術研究[D];東北大學;2005年

10 李文杰;基于本體的分布式知識庫系統(tǒng)研究[D];天津大學;2004年

相關碩士學位論文 前10條

1 楊文忠;基于近似網(wǎng)頁聚類算法的Web文本數(shù)據(jù)挖掘技術的研究與應用[D];湖南大學;2005年

2 金瑜;基于Web的光學專業(yè)數(shù)據(jù)庫的信息檢索[D];合肥工業(yè)大學;2004年

3 劉紅星;分布式系統(tǒng)中的文本信息檢索技術研究[D];清華大學;2004年

4 谷波;基于粗集模型的聚類方法及其在文獻過濾系統(tǒng)中的應用[D];山西大學;2004年

5 熊建國;對英漢名詞短語的統(tǒng)一解釋[D];中國人民解放軍外國語學院;2003年

6 王曉u&;基于代表點的數(shù)據(jù)和文本聚類新方法的研究[D];天津大學;2006年

7 黃曉倩;Z39.50客戶系統(tǒng)的設計與實現(xiàn)[D];華中師范大學;2001年

8 王智超;基于邊界距離的文本聚類方法研究[D];沈陽航空工業(yè)學院;2008年

9 劉揚;網(wǎng)絡環(huán)境下商務信息檢索研究[D];黑龍江大學;2003年

10 吳曾;文本主題切分技術和ROCCHIO模型在信息檢索中應用的研究[D];中國科學院研究生院(軟件研究所);2004年

,

本文編號:2140174

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2140174.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶58b0a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
好吊妞视频免费在线观看| 白白操白白在线免费观看| 欧美成人精品一区二区久久| 日韩偷拍精品一区二区三区| 国产精品午夜福利免费阅读| 久久综合亚洲精品蜜桃| 日韩中文字幕狠狠人妻| 亚洲欧美日韩国产综合在线 | 99少妇偷拍视频在线| 观看日韩精品在线视频| 办公室丝袜高跟秘书国产| 白白操白白在线免费观看| 中文文精品字幕一区二区 | 国产精品乱子伦一区二区三区| 九九热精品视频免费观看| 亚洲一区二区福利在线| 丰满的人妻一区二区三区| 制服丝袜美腿美女一区二区| 精品欧美一区二区三久久| 国产日韩欧美在线播放| 亚洲男人天堂网在线视频| 欧美日韩一区二区综合| 国产一区二区久久综合| 九九视频通过这里有精品| 欧美精品专区一区二区| 91日韩欧美在线视频| 日韩不卡一区二区在线| 东京热一二三区在线免| 美女黄色三级深夜福利| 日韩精品在线观看一区| 亚洲精品高清国产一线久久| 国产91人妻精品一区二区三区| 欧美乱妇日本乱码特黄大片| 很黄很污在线免费观看| 日本加勒比系列在线播放| 激情亚洲内射一区二区三区| 欧美性高清一区二区三区视频| 扒开腿狂躁女人爽出白浆av| 五月天丁香婷婷一区二区| 日本免费熟女一区二区三区| 美女激情免费在线观看|