基于概念的網(wǎng)頁(yè)相似度處理算法研究
本文選題:相似網(wǎng)頁(yè) + 概念抽取。 參考:《計(jì)算機(jī)應(yīng)用》2006年12期
【摘要】:針對(duì)海量網(wǎng)頁(yè)信息,提出適于搜索引擎使用的網(wǎng)頁(yè)相似度處理算法。算法依據(jù)網(wǎng)頁(yè)抽象形成的概念,在倒排文檔基礎(chǔ)上建立相似度處理模型。該模型縮小了需要進(jìn)行相似度計(jì)算的網(wǎng)頁(yè)文檔范圍,節(jié)約大量時(shí)間和空間資源,為優(yōu)化相似度計(jì)算奠定了良好基礎(chǔ)。
[Abstract]:A web page similarity processing algorithm suitable for search engines is proposed for massive web page information. Based on the concept of web page abstraction, the algorithm builds a similarity processing model based on inverted documents. The model reduces the scope of web pages which need similarity calculation, saves a lot of time and space resources, and lays a good foundation for the optimization of similarity calculation.
【作者單位】: 西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院 西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院
【基金】:西北工業(yè)大學(xué)研究生創(chuàng)業(yè)種子基金資助項(xiàng)目(Z200644)
【分類號(hào)】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 谷俊;王昊;;基于領(lǐng)域中文文本的術(shù)語(yǔ)抽取方法研究[J];現(xiàn)代圖書情報(bào)技術(shù);2011年04期
2 熊平原;王毅;陳慶新;毛寧;;基于壓鑄模本體的領(lǐng)域概念自動(dòng)抽取方法研究[J];機(jī)械設(shè)計(jì)與制造;2011年07期
3 張海粟;馬大明;鄧智龍;;基于維基百科的語(yǔ)義知識(shí)庫(kù)及其構(gòu)建方法研究[J];計(jì)算機(jī)應(yīng)用研究;2011年08期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相關(guān)會(huì)議論文 前1條
1 馮淑芳;王素格;;面向觀點(diǎn)挖掘的汽車本體知識(shí)庫(kù)的構(gòu)建[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
相關(guān)博士學(xué)位論文 前4條
1 周子力;基于WordNet的本體構(gòu)建及其在安全領(lǐng)域應(yīng)用關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2009年
2 侯鑫;基于本體的設(shè)計(jì)重用技術(shù)研究及其在CAFD中的應(yīng)用[D];哈爾濱工業(yè)大學(xué);2010年
3 侯鑫;基于本體的設(shè)計(jì)重用技術(shù)研究及其在CAFD中的應(yīng)用[D];哈爾濱工業(yè)大學(xué);2010年
4 翟延冬;基于WordNet的短文本語(yǔ)義網(wǎng)挖掘算法研究[D];吉林大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 關(guān)鍵;面向中文文本本體學(xué)習(xí)概念抽取的研究[D];吉林大學(xué);2010年
2 程波波;基于文本的茶學(xué)本體學(xué)習(xí)方法研究[D];安徽農(nóng)業(yè)大學(xué);2010年
3 謝彩云;基于法律領(lǐng)域的本體學(xué)習(xí)方法的研究與應(yīng)用[D];南昌大學(xué);2012年
4 官瑩瑩;面向中文文本的本體學(xué)習(xí)方法研究[D];吉林大學(xué);2009年
5 鄭鵬;搜索引擎中的相似網(wǎng)頁(yè)探測(cè)算法研究[D];華中科技大學(xué);2008年
6 程英迅;基于軍事本體的智能檢索引擎研究[D];電子科技大學(xué);2010年
7 舒萬里;中文領(lǐng)域本體學(xué)習(xí)中概念和關(guān)系抽取的研究[D];重慶大學(xué);2012年
8 李倩;基于概念格的檢索系統(tǒng)中概念挖掘技術(shù)的研究[D];北京郵電大學(xué);2008年
9 王曉慶;基于框架語(yǔ)義的中文本體學(xué)習(xí)研究[D];中國(guó)海洋大學(xué);2008年
10 宋宣辰;基于統(tǒng)計(jì)與語(yǔ)義分析的多文檔自動(dòng)摘要研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年
,本文編號(hào):1831449
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1831449.html