天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

一種中文網(wǎng)頁自動分類方法的實現(xiàn)及應(yīng)用

發(fā)布時間:2018-12-23 21:09
【摘要】:為了有效地組織和分析海量的Web信息,文章應(yīng)用有指導(dǎo)的機器學(xué)習(xí)方法實現(xiàn)了一個中文網(wǎng)頁分類器,,并應(yīng)用該分類器在“天網(wǎng)”搜索引擎上實現(xiàn)了大規(guī)模中文網(wǎng)頁的目錄導(dǎo)航服務(wù)。實驗結(jié)果表明該分類器有較高的分類質(zhì)量,滿足了中文網(wǎng)頁自動分類的要求。
[Abstract]:In order to effectively organize and analyze the mass of Web information, a Chinese web page classifier is implemented by using the guided machine learning method. The classifier is used to realize the directory navigation service of large-scale Chinese web pages on Skynet search engine. The experimental results show that the classifier has high classification quality and meets the requirements of automatic classification of Chinese web pages.
【作者單位】: 北京大學(xué)計算機科學(xué)技術(shù)系 北京大學(xué)計算機科學(xué)技術(shù)系 北京大學(xué)計算機科學(xué)技術(shù)系
【基金】:國家“973”計劃重大基礎(chǔ)研究項目(G1999032706)
【分類號】:TP393.09

【共引文獻(xiàn)】

相關(guān)期刊論文 前5條

1 雷鳴,劉建國,王建勇,陳葆玨;一種基于詞典的搜索引擎系統(tǒng)動態(tài)更新模型[J];計算機研究與發(fā)展;2000年10期

2 周水庚,關(guān)佶紅,胡運發(fā),周傲英;一個無需詞典支持和切詞處理的中文文檔分類系統(tǒng)[J];計算機研究與發(fā)展;2001年07期

3 吳光遠(yuǎn),何丕廉,曹桂宏,聶頌;基于向量空間模型的詞共現(xiàn)研究及其在文本分類中的應(yīng)用[J];計算機應(yīng)用;2003年S1期

4 周水庚,關(guān)佶紅,俞紅奇,胡運發(fā);基于Ngram信息的中文文檔分類研究[J];中文信息學(xué)報;2001年01期

5 鄭小慎 ,何丕廉 ,陳治綱 ,任大同 ,吳克敏;基于凝聚點的文本動態(tài)聚類分析[J];微型機與應(yīng)用;2004年08期

相關(guān)博士學(xué)位論文 前2條

1 劉濤;現(xiàn)代信息檢索中的文本分類及圖像恢復(fù)研究[D];北京郵電大學(xué);2006年

2 賈自艷;Web信息智能獲取若干關(guān)鍵問題研究[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2004年

相關(guān)碩士學(xué)位論文 前5條

1 賈自艷;中文智能搜索引擎關(guān)鍵技術(shù)研究[D];北京工業(yè)大學(xué);2001年

2 楊斌;中文文本數(shù)據(jù)挖掘研究[D];湘潭大學(xué);2002年

3 鄒加棋;中文網(wǎng)頁自動分類關(guān)鍵技術(shù)研究[D];福州大學(xué);2006年

4 付裕;文本分類方案選擇方法及原型系統(tǒng)開發(fā)[D];大連理工大學(xué);2006年

5 陳海波;基于自動分詞的企業(yè)文檔搜索引擎設(shè)計與實現(xiàn)[D];西北工業(yè)大學(xué);2007年

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 傅向華;劉國;陳冬劍;;一種核心子集選擇訓(xùn)練的大規(guī)模中文網(wǎng)頁分類方法[J];小型微型計算機系統(tǒng);2011年08期

2 ;[J];;年期

3 ;[J];;年期

4 ;[J];;年期

5 ;[J];;年期

6 ;[J];;年期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

相關(guān)會議論文 前5條

1 張東娜;彭宏;吳鐵峰;;一種基于粗集與貝葉斯分類器的中文網(wǎng)頁分類方法[A];第一屆全國Web信息系統(tǒng)及其應(yīng)用會議(WISA2004)論文集[C];2004年

2 劉秉權(quán);王喻紅;葛冬梅;李佳;;基于結(jié)構(gòu)樹解析的網(wǎng)頁正文抽取方法[A];黑龍江省計算機學(xué)會2007年學(xué)術(shù)交流年會論文集[C];2007年

3 周國民;丘耘;鄭彥妍;曾枝連;樊景超;;基于SDD算法的特定網(wǎng)頁采集技術(shù)[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年

4 賈玉祥;昝紅英;范明;;基于概率模型的網(wǎng)頁相關(guān)度研究[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

5 樊景超;周國民;周義桃;;基于SDD改進算法的中文農(nóng)業(yè)搜索引擎的研究[A];農(nóng)業(yè)工程科技創(chuàng)新與建設(shè)現(xiàn)代農(nóng)業(yè)——2005年中國農(nóng)業(yè)工程學(xué)會學(xué)術(shù)年會論文集第三分冊[C];2005年

相關(guān)重要報紙文章 前10條

1 劉亭;在線保護你的系統(tǒng)[N];中國電腦教育報;2002年

2 本報記者 邊歆;五家值得關(guān)注的新興安全公司[N];網(wǎng)絡(luò)世界;2009年

3 ;為什么我搜索不到想要的內(nèi)容[N];中國電腦教育報;2003年

4 本版撰稿 飛豬;你所不知道的Google[N];中國計算機報;2005年

5 湖北 胡錦承;強力搜索軟件——中華搜索寶[N];電腦報;2001年

6 狗狗;這些Google的玩法,你知道嗎?[N];中國電腦教育報;2005年

7 江蘇 曹春華;更改Google的默認(rèn)搜索語言[N];電腦報;2003年

8 福建 林峰杰;指點迷津[N];電腦報;2004年

9 本報記者 邊歆;安全漏洞減少但更容易受攻擊[N];網(wǎng)絡(luò)世界;2008年

10 本報記者 胡英;網(wǎng)站數(shù)據(jù)中心需解決浪涌和擴展問題[N];計算機世界;2009年

相關(guān)碩士學(xué)位論文 前10條

1 劉嬌;排序?qū)W習(xí)中的中文網(wǎng)頁特征提取方法[D];哈爾濱工業(yè)大學(xué);2009年

2 王]];中文網(wǎng)頁自動分類的一種實現(xiàn)[D];大連理工大學(xué);2002年

3 孫學(xué)剛;面向奧運的中文網(wǎng)頁信息獲取方法的初步研究[D];清華大學(xué);2004年

4 楊芹;基于最大熵模型的中文網(wǎng)頁分類器設(shè)計和實現(xiàn)[D];蘇州大學(xué);2010年

5 郝麗維;中文網(wǎng)頁熱門主題獲取系統(tǒng)的研究與實現(xiàn)[D];河北大學(xué);2009年

6 于洪波;中文網(wǎng)頁自動采集與分類系統(tǒng)設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2010年

7 劉欣;基于結(jié)構(gòu)信息的中文網(wǎng)頁自動分類技術(shù)研究[D];南京航空航天大學(xué);2010年

8 谷峰;中文網(wǎng)頁層次分類研究[D];華僑大學(xué);2007年

9 任函;大規(guī)模中文網(wǎng)頁的自動分類研究[D];華中師范大學(xué);2006年

10 萬中英;基于投影尋蹤中文網(wǎng)頁自動分類[D];江西師范大學(xué);2004年



本文編號:2390264

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2390264.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3d9a4***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com