天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于SAE-LBP的網(wǎng)頁分類研究

發(fā)布時間:2017-12-11 00:04

  本文關(guān)鍵詞:基于SAE-LBP的網(wǎng)頁分類研究


  更多相關(guān)文章: SAE LBP 網(wǎng)頁分類 深度學(xué)習(xí) 神經(jīng)網(wǎng)絡(luò)


【摘要】:在網(wǎng)頁分類技術(shù)中,SVM、BP神經(jīng)網(wǎng)絡(luò)和Naive Bayes等傳統(tǒng)分類器主要采用了信息增益、互信息和最大熵等模型選取特征.隨著深度學(xué)習(xí)的發(fā)展,深層次地選取特征的方法正在被廣泛研究.結(jié)合稀疏自動編碼器(SAE)和LBP神經(jīng)網(wǎng)絡(luò),提出一種基于SAE-LBP的網(wǎng)頁分類器.根據(jù)網(wǎng)頁文本的半結(jié)構(gòu)化特征,改進(jìn)了文本特征表示的權(quán)重計算.針對網(wǎng)頁文本的稀疏性,采用SAE對網(wǎng)頁文本進(jìn)行特征選取.還提出一種基于學(xué)習(xí)率自動調(diào)整的LBP神經(jīng)網(wǎng)絡(luò),有效地降低了訓(xùn)練時間.實(shí)驗(yàn)表明,相對于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò),基于SAE-LBP的網(wǎng)頁分類器的分類正確率提升了5.19%,時間性能提升了83.86%.
【作者單位】: 中國科學(xué)技術(shù)大學(xué)計算機(jī)科學(xué)技術(shù)學(xué)院;中國科學(xué)技術(shù)大學(xué)安徽省計算與通信軟件重點(diǎn)實(shí)驗(yàn)室;中國科學(xué)技術(shù)大學(xué)先進(jìn)技術(shù)研究院;
【基金】:安徽省自然科學(xué)基金項目(1408085MKL06)資助
【分類號】:TP391.1;TP393.092
【正文快照】: 1引言隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)頁的數(shù)目呈現(xiàn)井噴狀增加,也預(yù)示著大數(shù)據(jù)時代的到來.雜亂、大量的網(wǎng)頁文本,不利于人們對信息的查找與過濾.為了方便對網(wǎng)頁文本的檢索與挖掘,對網(wǎng)頁文本的分類就顯得十分重要[1].針對網(wǎng)頁文本分類已有不少相關(guān)研究,文獻(xiàn)[2]中將網(wǎng)頁文本分類描述成文本

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 劉蓉;周建中;;一種網(wǎng)頁分類中基于圖的半指導(dǎo)學(xué)習(xí)算法[J];計算機(jī)應(yīng)用研究;2008年03期

2 湯亞玲;崔志明;;行為特征分析模式下的網(wǎng)頁分類技術(shù)研究[J];計算機(jī)工程;2012年20期

3 朱志寧;黃青松;;快速的中文網(wǎng)頁分類方法實(shí)現(xiàn)[J];山西電子技術(shù);2008年04期

4 王振宇;唐遠(yuǎn)華;郭力;;面向分層結(jié)構(gòu)的網(wǎng)頁分類與抓取[J];計算機(jī)工程與科學(xué);2012年11期

5 盛魁;;改進(jìn)的K-近鄰算法在中文網(wǎng)頁分類的應(yīng)用[J];佳木斯大學(xué)學(xué)報(自然科學(xué)版);2011年06期

6 陳勝榮;董守斌;;基于優(yōu)選鏈接的中文網(wǎng)頁分類方法研究[J];鄭州大學(xué)學(xué)報(理學(xué)版);2007年02期

7 劉艷民;;中文網(wǎng)頁分類方法的研究[J];微電子學(xué)與計算機(jī);2009年09期

8 和雪芳;李長河;石爭浩;;基于用戶反饋的相關(guān)度調(diào)整算法[J];山東農(nóng)業(yè)大學(xué)學(xué)報(自然科學(xué)版);2007年04期

9 孫玲芳;黎維良;;基于定題爬蟲的網(wǎng)頁分類的多級判定算法[J];科學(xué)技術(shù)與工程;2009年18期

10 蔣宗禮;時福林;;基于鏈接關(guān)系的網(wǎng)頁分類優(yōu)化算法[J];計算機(jī)與現(xiàn)代化;2014年05期

中國重要會議論文全文數(shù)據(jù)庫 前3條

1 李立宇;唐世渭;楊冬青;葉恒強(qiáng);王騰蛟;;COMMIX-Classifier—自動網(wǎng)頁分類系統(tǒng)[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2002年

2 劉艷民;;中文網(wǎng)頁分類方法的研究[A];2009年全國開放式分布與并行計算機(jī)學(xué)術(shù)會議論文集(下冊)[C];2009年

3 米曉芳;秦洋;王立宏;宋宜斌;;基于潛在語義差異的醫(yī)學(xué)網(wǎng)頁分類[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會通信與信息技術(shù)會議論文集(上冊)[C];2008年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 王晶;面向通信管理的電子政務(wù)系統(tǒng)及其網(wǎng)頁分類的研究與實(shí)現(xiàn)[D];上海交通大學(xué);2009年

2 張祥;一個網(wǎng)頁分類系統(tǒng)的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2013年

3 段昕;基于視覺特征中文網(wǎng)頁分類方法的研究[D];山東大學(xué);2007年

4 汪雷;基于文本挖掘的網(wǎng)頁分類系統(tǒng)研究與實(shí)現(xiàn)[D];武漢理工大學(xué);2013年

5 于成龍;中文網(wǎng)頁分類及存儲系統(tǒng)設(shè)計與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2007年

6 張q;基于半監(jiān)督的網(wǎng)頁分類[D];哈爾濱工業(yè)大學(xué);2013年

7 徐法艷;基于Web挖掘技術(shù)的網(wǎng)頁分類研究[D];揚(yáng)州大學(xué);2008年

8 干文敏;基于Web挖掘的中文網(wǎng)頁分類的研究與實(shí)現(xiàn)[D];南京航空航天大學(xué);2012年

9 龔暢;基于web挖掘技術(shù)的網(wǎng)頁分類研究[D];江南大學(xué);2009年

10 朱菊花;中文網(wǎng)頁分類技術(shù)的研究與實(shí)現(xiàn)[D];西南交通大學(xué);2008年

,

本文編號:1276382

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1276382.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9f0e8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com