一種基于名詞短語的檢索結果多層聚類方法
[Abstract]:Clustering the retrieval results can facilitate users to quickly browse the search engine to return the results. In order to extract category labels with strong expression ability and readability, and obtain high quality clustering results, a multilayer clustering method based on noun phrase retrieval results is proposed: noun phrases are extracted as candidate category labels. The basic classes are generated according to the distribution of candidate class labels, and then a one-trip clustering algorithm with linear time complexity is used to cluster the base classes. Compared with the named entity based method and Lingo algorithm, the proposed method is superior to the above three methods in terms of readability, validity and clustering performance.
【作者單位】: 廣東外語外貿大學信息學院;
【基金】:國家自然科學基金資助項目(60673191) 廣東省高等學校自然科學研究重點項目(06Z012) 廣東省自然科學基金資助項目(9151026005000002)
【分類號】:TP391.3
【參考文獻】
相關期刊論文 前1條
1 張清軍,朱才連;基于統(tǒng)計的中文文本主題自動提取研究[J];四川大學學報(工程科學版);2004年03期
【共引文獻】
相關期刊論文 前3條
1 張清軍,朱才連;基于LBS的中文自動文摘技術研究[J];四川大學學報(工程科學版);2004年04期
2 張清軍,朱才連,侯林山;信息抽取技術在LBS中的應用[J];四川大學學報(工程科學版);2005年01期
3 黃振晗;;基于文檔特征的Web主題文本提取[J];現(xiàn)代計算機(專業(yè)版);2009年08期
相關會議論文 前2條
1 孫宏綱;陸余良;;基于二元切分的互聯(lián)網(wǎng)新聞主題詞自動提取研究[A];第三屆全國信息檢索與內容安全學術會議論文集[C];2007年
2 秦鵬;李恒訓;張華平;劉金剛;;基于關鍵詞提取的搜索結果聚類研究[A];第五屆全國信息檢索學術會議論文集[C];2009年
相關碩士學位論文 前6條
1 王平;基于自組織特征映射的檢索結果聚類研究[D];哈爾濱工業(yè)大學;2009年
2 李琳;基于粗糙集和遺傳算法的聚類方法研究[D];廣西師范大學;2009年
3 康艷;中文圖書內容索引計算機編制的研究與系統(tǒng)實現(xiàn)[D];南京農(nóng)業(yè)大學;2008年
4 王世昆;中醫(yī)癥狀病機實體識別及其關系挖掘研究[D];廈門大學;2009年
5 史進玲;基于粒計算的決策表屬性約簡與規(guī)則提取研究[D];河南師范大學;2009年
6 萬濤;圖書館管理系統(tǒng)的設計與實現(xiàn)[D];吉林大學;2009年
【二級參考文獻】
相關期刊論文 前6條
1 薛翠芳,郭炳炎;漢語文本特征詞的抽取方法[J];情報學報;2000年03期
2 韓客松,王永成;一種用于主題提取的非線性加權方法[J];情報學報;2000年06期
3 韓客松,王永成;中文全文標引的主題詞標引和主題概念標引方法[J];情報學報;2001年02期
4 韓客松,王永成,滕偉;Web頁面中文文本主題的自動提取研究[J];情報學報;2001年02期
5 王志梅,張俊林,李秋山;Web檢索結果快速聚類方法的研究與實現(xiàn)[J];計算機工程與設計;2004年12期
6 于琨,糜仲春,蔡慶生;可應用于互聯(lián)網(wǎng)的自學習中文關鍵詞抽取算法[J];中國科學技術大學學報;2002年03期
【相似文獻】
相關期刊論文 前10條
1 門國尊;;用于信息檢索的文本聚類技術[J];今日科苑;2008年20期
2 蔡明德;鉤玄提要信息檢索學——《信息檢索系列教程》總序[J];大連民族學院學報;2005年02期
3 王寧;淺析信息檢索服務模式的轉變[J];圖書館學刊;2005年01期
4 李淑慧 ,張恩;漫談信息檢索的方式[J];山東檔案;2005年03期
5 張福泉;;信息檢索的黃金時代[J];中國計算機用戶;2006年05期
6 楊則正;信息檢索和交換的手段[J];管理科學文摘;1996年03期
7 黃浩耘;信息檢索中的科學美與信息檢索教學中的美育問題[J];四川師范學院學報(哲學社會科學版);2002年05期
8 劉濤,吳功宜,陳正;一種高效的用于文本聚類的無監(jiān)督特征選擇算法[J];計算機研究與發(fā)展;2005年03期
9 ;《農(nóng)業(yè)信息檢索指南》出版[J];圖書館學研究;1995年02期
10 蔡澤平;遠程信息檢索的網(wǎng)絡協(xié)調[J];中國信息導報;1997年09期
相關會議論文 前10條
1 崔安頎;岑榮偉;張敏;馬少平;;基于URL特征的動態(tài)頁面聚類[A];中國計算技術與語言問題研究——第七屆中文信息處理國際會議論文集[C];2007年
2 孫金立;李路路;董明強;;建立生物信息檢索教學網(wǎng)的研究[A];中華醫(yī)學會第十次全國醫(yī)學信息學術會議論文匯編[C];2004年
3 ;編者的話[A];第二屆全國信息檢索與內容安全學術會議(NCIRCS-2005)論文集[C];2005年
4 秦鵬;李恒訓;張華平;劉金剛;;基于關鍵詞提取的搜索結果聚類研究[A];第五屆全國信息檢索學術會議論文集[C];2009年
5 王敬成;;HNC農(nóng)村智能信息檢索系統(tǒng)[A];2006年首屆ICT大會信息、知識、智能及其轉換理論第一次高峰論壇會議論文集[C];2006年
6 陳志瑋;肖詩斌;施水才;王昕;;一種基于HTML位置信息的查詢擴展技術[A];第三屆學生計算語言學研討會論文集[C];2006年
7 李應興;付婷;李勇;;基于LUCENE的藏文信息檢索的研究與應用[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年
8 于志剛;楊金生;;農(nóng)業(yè)機械網(wǎng)絡書簽[A];第十三次全國農(nóng)機維修學術會議論文集[C];2007年
9 ;前言[A];第四屆全國信息檢索與內容安全學術會議論文集(下)[C];2008年
10 楊凝清;;信息時代的醫(yī)學信息教育模式初探[A];全面建設小康社會:中國科技工作者的歷史責任——中國科協(xié)2003年學術年會論文集(下)[C];2003年
相關重要報紙文章 前10條
1 希安;微軟試水信息檢索[N];經(jīng)濟日報;2004年
2 王丹紅;數(shù)學:為因特網(wǎng)建立秩序[N];科學時報;2009年
3 本報記者 潘永花;組件化平臺提升信息檢索效率[N];網(wǎng)絡世界;2003年
4 潘希;文本數(shù)據(jù)流聚類:在海量信息中挖掘真金[N];科學時報;2008年
5 劉光強;搜索個人、企業(yè)、垂直三大搜索新進展[N];中國計算機報;2007年
6 柏榮;國家973項目在因特網(wǎng)大規(guī)模信息檢索領域取得突破[N];中國高新技術產(chǎn)業(yè)導報;2003年
7 劉立新;信息社會技術前瞻[N];學習時報;2006年
8 微軟中國研究院 陳正 李明鏡 馬維英;互聯(lián)網(wǎng)上圖像信息檢索[N];計算機世界;2001年
9 常燕杰;商用搜索 須打智慧牌[N];中國計算機報;2006年
10 黃 浩;政府門戶網(wǎng)站應引進CRM意識[N];中國國門時報;2006年
相關博士學位論文 前10條
1 劉向威;NLP技術在中文信息檢索中的應用研究[D];天津大學;2005年
2 董道國;高維數(shù)據(jù)索引結構研究[D];復旦大學;2005年
3 郝立麗;漢語文本數(shù)據(jù)挖掘[D];吉林大學;2009年
4 劉云峰;基于潛在語義分析的中文概念檢索研究[D];華中科技大學;2005年
5 馬馬杜 ?ɡ;基于多智能體的流體動力行業(yè)虛擬聯(lián)盟信息檢索的研究[D];浙江大學;2002年
6 張毅波;史文結構化信息檢索系統(tǒng)的研究與實現(xiàn)[D];中國科學院研究生院(軟件研究所);2001年
7 王鑫印;無結構和半結構信息檢索相關技術研究[D];復旦大學;2007年
8 李廣建;個性化網(wǎng)絡信息檢索系統(tǒng)的研究與實現(xiàn)[D];中國科學院研究生院(文獻情報中心);2002年
9 邵虹;基于內容的醫(yī)學圖像檢索關鍵技術研究[D];東北大學;2005年
10 李文杰;基于本體的分布式知識庫系統(tǒng)研究[D];天津大學;2004年
相關碩士學位論文 前10條
1 楊文忠;基于近似網(wǎng)頁聚類算法的Web文本數(shù)據(jù)挖掘技術的研究與應用[D];湖南大學;2005年
2 金瑜;基于Web的光學專業(yè)數(shù)據(jù)庫的信息檢索[D];合肥工業(yè)大學;2004年
3 劉紅星;分布式系統(tǒng)中的文本信息檢索技術研究[D];清華大學;2004年
4 谷波;基于粗集模型的聚類方法及其在文獻過濾系統(tǒng)中的應用[D];山西大學;2004年
5 熊建國;對英漢名詞短語的統(tǒng)一解釋[D];中國人民解放軍外國語學院;2003年
6 王曉u&;基于代表點的數(shù)據(jù)和文本聚類新方法的研究[D];天津大學;2006年
7 黃曉倩;Z39.50客戶系統(tǒng)的設計與實現(xiàn)[D];華中師范大學;2001年
8 王智超;基于邊界距離的文本聚類方法研究[D];沈陽航空工業(yè)學院;2008年
9 劉揚;網(wǎng)絡環(huán)境下商務信息檢索研究[D];黑龍江大學;2003年
10 吳曾;文本主題切分技術和ROCCHIO模型在信息檢索中應用的研究[D];中國科學院研究生院(軟件研究所);2004年
,本文編號:2140174
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2140174.html