天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于ontology抽取優(yōu)化初始選擇的檢索結(jié)果聚類

發(fā)布時(shí)間:2018-11-18 11:18
【摘要】:本文針對(duì)互聯(lián)網(wǎng)的數(shù)據(jù)量的不斷增加,準(zhǔn)確搜索引擎的作用日益困難的問題,為了提高搜索引擎返回結(jié)果結(jié)構(gòu)化聚類的效果,讓信息的定位更迅速,本文采用基于標(biāo)簽的聚類算法,并使用自然語言處理技術(shù)中的依存句法分析和詞典資源,深度挖掘語義結(jié)構(gòu),提出基于優(yōu)化初始選擇的K均值聚類方法.本文深入分析K均值聚類算法特點(diǎn),并利用類別標(biāo)簽技術(shù)對(duì)該算法進(jìn)行有效改進(jìn).實(shí)驗(yàn)證明該算法不僅在效果上優(yōu)于一般聚類算法,對(duì)結(jié)果描述也有很大幫助,在效率上也得到很大提高.
[Abstract]:In order to improve the effect of structured clustering of the result returned by search engine and make the location of information more quickly, this paper aims at the increasing amount of data on the Internet and the increasingly difficult role of accurate search engine. In this paper, the tag-based clustering algorithm is used, and the dependency syntactic analysis and dictionary resources in the natural language processing technology are used to dig the semantic structure in depth, and a K-means clustering method based on the optimization of initial selection is proposed. In this paper, the characteristics of K-means clustering algorithm are analyzed, and the algorithm is improved by class label technology. Experiments show that this algorithm is not only better than the general clustering algorithm in effect, but also helpful to the description of the results and greatly improved in efficiency.
【作者單位】: 哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院信息檢索研究室;
【基金】:國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目(No.60435020) 國(guó)家自然科學(xué)基金面上項(xiàng)目(No.60503072)
【分類號(hào)】:TP391.3

【共引文獻(xiàn)】

相關(guān)期刊論文 前9條

1 張俐,李晶皎,胡明涵,姚天順;中文WordNet的研究及實(shí)現(xiàn)[J];東北大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年04期

2 盧志茂;劉挺;李生;;統(tǒng)計(jì)詞義消歧的研究進(jìn)展[J];電子學(xué)報(bào);2006年02期

3 李建華,王曉龍;中文人名自動(dòng)識(shí)別的一種有效方法[J];高技術(shù)通訊;2000年02期

4 趙巖;王曉龍;劉秉權(quán);關(guān)毅;;融合聚類觸發(fā)對(duì)特征的最大熵詞性標(biāo)注模型[J];計(jì)算機(jī)研究與發(fā)展;2006年02期

5 郭池 ,陳家駿 ,王啟祥;一種基于語料庫(kù)的詞義消歧策略[J];計(jì)算機(jī)工程與應(yīng)用;2003年35期

6 韓習(xí)武,趙鐵軍;基于子類的漢語動(dòng)詞SCF獲取回退[J];計(jì)算機(jī)工程與應(yīng)用;2005年30期

7 鄭澤芝,張永奎;《現(xiàn)代漢語語義詞典》管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2001年06期

8 張永奎,趙輒謙,白麗君,陳鑫卿;基于互聯(lián)網(wǎng)的中文問答系統(tǒng)[J];計(jì)算機(jī)工程;2003年15期

9 李云云;漢語下肢語義場(chǎng)的歷史演變[J];綿陽師范學(xué)院學(xué)報(bào);2004年01期

相關(guān)會(huì)議論文 前5條

1 徐海;;英、漢分類詞典編纂芻議[A];中國(guó)辭書學(xué)會(huì)雙語詞典專業(yè)委員會(huì)第四屆年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2001年

2 李月雷;師瑞峰;林麗冰;周一民;;漢語語句語義相似度的計(jì)算方法[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年

3 馬永騰;亢世勇;;新編同義詞詞林語義分類體系[A];第三屆學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2006年

4 馬永騰;亢世勇;;非典型成員的語義標(biāo)注策略和問題[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年

5 路斌;萬小軍;楊建武;陳曉鷗;;基于同義詞詞林的詞匯褒貶計(jì)算[A];中國(guó)計(jì)算技術(shù)與語言問題研究——第七屆中文信息處理國(guó)際會(huì)議論文集[C];2007年

相關(guān)博士學(xué)位論文 前5條

1 齊璇;漢語語義知識(shí)的表示及其在漢英機(jī)譯中的應(yīng)用[D];國(guó)防科學(xué)技術(shù)大學(xué);2002年

2 馬紅妹;漢英機(jī)器翻譯中漢語上下文語境的表示與應(yīng)用研究[D];中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué);2002年

3 曹海龍;基于詞匯化統(tǒng)計(jì)模型的漢語句法分析研究[D];哈爾濱工業(yè)大學(xué);2006年

4 李曉黎;WEB信息檢索與分類中的數(shù)據(jù)采掘研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2001年

5 何琳;古農(nóng)學(xué)本體的半自動(dòng)構(gòu)建及檢索研究[D];南京農(nóng)業(yè)大學(xué);2007年

相關(guān)碩士學(xué)位論文 前7條

1 江森卓;現(xiàn)代漢語上下關(guān)系時(shí)間詞語[D];華東師范大學(xué);2004年

2 楊宇娜;基于統(tǒng)計(jì)的中文詞義消歧技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2006年

3 曹南;顏色與動(dòng)物:文化內(nèi)涵與跨文化交際能力研究[D];遼寧師范大學(xué);2007年

4 于龍杰;新詞語在新聞?wù)Z體中的應(yīng)用研究[D];山東大學(xué);2007年

5 林進(jìn)展;試論漢語詞義系統(tǒng)的類別層級(jí)性及其實(shí)現(xiàn)[D];廈門大學(xué);2007年

6 賈曉東;漢語動(dòng)賓搭配識(shí)別研究[D];大連理工大學(xué);2008年

7 孟麗;現(xiàn)代漢語腿部動(dòng)詞研究[D];廣西師范大學(xué);2008年

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張蓉,申德榮,于戈;Ontology在異構(gòu)數(shù)據(jù)庫(kù)集成中的應(yīng)用[J];計(jì)算機(jī)工程;2004年24期

2 潘宇斌,陳躍新;基于Ontology的自然語言理解[J];計(jì)算技術(shù)與自動(dòng)化;2003年04期

3 常春;大型 Ontology構(gòu)建工具 KAON的使用和評(píng)價(jià)[J];現(xiàn)代圖書情報(bào)技術(shù);2004年08期

4 謝楓平;Ontology與信息檢索[J];龍巖師專學(xué)報(bào);2004年06期

5 王文俊,劉昕鵬,羅英偉,汪小林,許卓群;應(yīng)急事件Ontology語義模型及其應(yīng)用[J];計(jì)算機(jī)工程;2005年10期

6 黃國(guó)景,崔志明;基于Ontology的個(gè)性化元搜索引擎研究[J];微電子學(xué)與計(jì)算機(jī);2004年12期

7 蔣國(guó)瑞,趙書良;基于Multi-Agent和Ontology的技術(shù)性貿(mào)易壁壘預(yù)警預(yù)測(cè)系統(tǒng)設(shè)計(jì)[J];計(jì)算機(jī)工程與應(yīng)用;2004年27期

8 王曉東;王靖;;基于Ontology的語料庫(kù)系統(tǒng)[J];計(jì)算機(jī)應(yīng)用與軟件;2007年08期

9 李景;以語義互操作性為目標(biāo)的FOS(水產(chǎn)業(yè)ontology服務(wù))的開發(fā)研究[J];農(nóng)業(yè)圖書情報(bào)學(xué)刊;2003年05期

10 王洋,陳占偉;Ontology及掌紋識(shí)別ontology的構(gòu)建[J];商丘師范學(xué)院學(xué)報(bào);2003年05期

相關(guān)會(huì)議論文 前10條

1 王囡;王大玲;于戈;馬婷;;Ontology-Scalability:一種基于本體實(shí)現(xiàn)社會(huì)網(wǎng)絡(luò)可擴(kuò)展性的算法[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2007年

2 ;Web Information Extraction based on News Domain Ontology Theory[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年

3 ;A method for OWL Ontology Module Partition[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年

4 張亮;陳肇雄;黃河燕;張孝飛;;Ontology在智能信息檢索中的應(yīng)用[A];第二屆全國(guó)學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2004年

5 趙書城;高大慶;趙雅潔;;主題數(shù)字圖書館中基于Ontology的元數(shù)據(jù)建模研究[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年

6 周相兵;;基于Ontology的語義Web服務(wù)聚合自動(dòng)機(jī)研究及應(yīng)用[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年

7 姚文琳;王莉;王璀民;;基于Ontology的知識(shí)檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年

8 楊昆;王軍;彭雙云;;基于Ontology的空間信息互操作初步研究[A];中國(guó)地理信息系統(tǒng)協(xié)會(huì)第八屆年會(huì)論文集[C];2004年

9 駱雄武;萬小軍;楊建武;吳於茜;;基于后綴樹的Web檢索結(jié)果聚類標(biāo)簽生成方法[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

10 王建州;李廉;汪映海;;面向Ontology的電力信息系統(tǒng)的研究[A];2005年信息與通信領(lǐng)域博士后學(xué)術(shù)會(huì)議論文集[C];2005年

相關(guān)重要報(bào)紙文章 前4條

1 清華大學(xué) 陳丹 謝曉芹 蔡月茹;讓知識(shí)可以共享和重用[N];計(jì)算機(jī)世界;2002年

2 北京地稅個(gè)稅SOA項(xiàng)目組;讓SOA更智能[N];計(jì)算機(jī)世界;2009年

3 牛曉;計(jì)算機(jī)輔助創(chuàng)新[N];科技日?qǐng)?bào);2005年

4 陳禮明;計(jì)算機(jī)輔助創(chuàng)新[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2005年

相關(guān)博士學(xué)位論文 前7條

1 王曉東;基于Ontology知識(shí)庫(kù)系統(tǒng)建模與應(yīng)用研究[D];華東師范大學(xué);2003年

2 常春;Ontology在農(nóng)業(yè)信息管理中的構(gòu)建和轉(zhuǎn)化[D];中國(guó)農(nóng)業(yè)科學(xué)院;2004年

3 李曉燕;海量圖像語義分析和檢索技術(shù)研究[D];浙江大學(xué);2009年

4 Khalil Ahmed Saleh Al-mekhlafi;[D];大連理工大學(xué);2011年

5 馬馬杜 ?ɡ;基于多智能體的流體動(dòng)力行業(yè)虛擬聯(lián)盟信息檢索的研究[D];浙江大學(xué);2002年

6 劉勇;基于本體的家電領(lǐng)域功能知識(shí)表達(dá)研究[D];中國(guó)海洋大學(xué);2011年

7 王穎;本體匹配器的選擇與組合方法研究[D];哈爾濱工程大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 朱增霞;基于Ontology的虛擬社群知識(shí)庫(kù)構(gòu)建與應(yīng)用研究[D];山東理工大學(xué);2012年

2 陳蘭;基于ontology的信息抽取系統(tǒng)的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2004年

3 孟令謙;基于ontology的中文信息抽取系統(tǒng)的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2004年

4 劉藝琴;基于本體的Web非規(guī)范知識(shí)處理中信息抽取技術(shù)研究[D];昆明理工大學(xué);2005年

5 凌海云;基于語義網(wǎng)的智能搜索技術(shù)的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2004年

6 劉建軍;基于ontology的股票信息抽取系統(tǒng)的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2005年

7 馮茜;面向信息抽取的ontology設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2005年

8 孫靜;基于Ontology應(yīng)急救援決策支持系統(tǒng)研究及實(shí)現(xiàn)[D];四川大學(xué);2006年

9 李興隆;基于Ontology的文檔檢索[D];東北大學(xué);2005年

10 馬騰;基于ontology的信息抽取系統(tǒng)的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2006年

,

本文編號(hào):2339893

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2339893.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0ec18***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com