天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

樸素貝葉斯算法的改進(jìn)與應(yīng)用

發(fā)布時(shí)間:2017-09-10 01:36

  本文關(guān)鍵詞:樸素貝葉斯算法的改進(jìn)與應(yīng)用


  更多相關(guān)文章: 樸素貝葉斯 下溢 核心關(guān)鍵詞 TFIDF 文本分類


【摘要】:樸素貝葉斯算法是分類算法中最經(jīng)典、最有影響的算法之一,但仍然存在一些不足之處。針對(duì)該算法中下溢問(wèn)題,對(duì)算法基本公式進(jìn)行了優(yōu)化改進(jìn)。針對(duì)NB算法中準(zhǔn)確率問(wèn)題,結(jié)合類別核心詞思想和改進(jìn)后的TFIDF算法,提出了一種基于類別核心詞和改進(jìn)型TFIDF的樸素貝葉斯CIT-NB算法。將改進(jìn)后的算法應(yīng)用于新聞數(shù)據(jù)集文本分類,實(shí)驗(yàn)結(jié)果表明,CIT-NB算法的分類性能明顯優(yōu)于原始樸素貝葉斯算法和基于TFIDF的分類算法。
【作者單位】: 河南理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;河南省普通高等學(xué)校礦山信息化研究重點(diǎn)實(shí)驗(yàn)室;
【關(guān)鍵詞】樸素貝葉斯 下溢 核心關(guān)鍵詞 TFIDF 文本分類
【基金】:河南省科技攻關(guān)項(xiàng)目(142402210435) 河南省高等學(xué)校礦山信息化重點(diǎn)學(xué)科開(kāi)放實(shí)驗(yàn)室開(kāi)放基金項(xiàng)目(ky2012-02)
【分類號(hào)】:TP18;TP391.1
【正文快照】: 文獻(xiàn)[i]指出分類問(wèn)題是數(shù)據(jù)挖掘領(lǐng)域研究和應(yīng)用最為廣泛的問(wèn)題之一^目前最常用的分類算法主要有貝葉斯算法、C4. 5決策樹(shù)算法、支持向量機(jī)算法(SVM,sUpP0rt vector machine)等。文獻(xiàn)[2]指出C4.5決策樹(shù)算法受到數(shù)據(jù)集中奇異數(shù)據(jù)的影響。文獻(xiàn)[3]指出SVM算法在訓(xùn)練大數(shù)據(jù)集時(shí)速

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條

1 曾青華;袁家斌;張?jiān)浦?;基于Hadoop的貝葉斯過(guò)濾MapReduce模型[J];計(jì)算機(jī)工程;2013年11期

2 邸鵬;段利國(guó);;一種新型樸素貝葉斯文本分類算法[J];數(shù)據(jù)采集與處理;2014年01期

【共引文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前5條

1 唐勇;;基于樸素貝葉斯算法對(duì)論壇文本分類的技術(shù)實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2014年32期

2 楊陽(yáng);張文生;;基于深度學(xué)習(xí)的圖像自動(dòng)標(biāo)注算法[J];數(shù)據(jù)采集與處理;2015年01期

3 吳斌;李冠辰;劉宇;張雷;王柏;;基于微博重復(fù)發(fā)送的垃圾用戶甄別[J];數(shù)據(jù)采集與處理;2015年01期

4 孫兵率;;一種基于MapReduce的頻繁項(xiàng)集挖掘算法[J];軟件導(dǎo)刊;2015年04期

5 柴丹煒;邵思思;張若昕;樂(lè)光學(xué);劉建生;;網(wǎng)絡(luò)輿論話題分類算法研究與實(shí)證分析[J];嘉興學(xué)院學(xué)報(bào);2014年06期

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條

1 蔣偉;基于Hadoop的電商商品文本分類研究與實(shí)現(xiàn)[D];武漢理工大學(xué);2014年

2 徐冉;基于文本挖掘的疾病輔助導(dǎo)診技術(shù)研究[D];北京郵電大學(xué);2015年

3 梁海龍;基于鄰域粗糙集的屬性約簡(jiǎn)和樣本約減算法研究及在文本分類中的應(yīng)用[D];太原理工大學(xué);2015年

【二級(jí)參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 王美珍;李芝棠;吳漢濤;;改進(jìn)的貝葉斯垃圾郵件過(guò)濾算法[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年08期

2 李維杰;徐勇;;簡(jiǎn)體中文垃圾郵件分類的實(shí)驗(yàn)設(shè)計(jì)及對(duì)比研究[J];計(jì)算機(jī)工程與應(yīng)用;2007年25期

3 鄧維斌;王國(guó)胤;洪智勇;;基于粗糙集的加權(quán)樸素貝葉斯郵件過(guò)濾方法[J];計(jì)算機(jī)科學(xué);2011年02期

4 鐘將;孫啟干;李靜;;基于歸一化向量的文本分類算法[J];計(jì)算機(jī)工程;2011年08期

5 王濤;裘國(guó)永;何聚厚;;新的基于最小風(fēng)險(xiǎn)的貝葉斯郵件過(guò)濾模型[J];計(jì)算機(jī)應(yīng)用研究;2008年04期

6 陳志賢;;垃圾郵件過(guò)濾技術(shù)研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2009年05期

7 趙世奇,張宇,劉挺,陳毅恒,黃永光,李生;基于類別特征域的文本分類特征選擇方法[J];中文信息學(xué)報(bào);2005年06期

8 劉叢山;李祥寶;楊煜普;;一種基于近鄰元分析的文本分類算法[J];計(jì)算機(jī)工程;2012年15期

9 呂國(guó)云;趙榮椿;張艷寧;樊養(yǎng)余;Sahli Hichem;;基于三音素動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)模型的大詞匯量連續(xù)語(yǔ)音識(shí)別[J];數(shù)據(jù)采集與處理;2009年01期

10 史岳鵬;朱顥東;;基于類別相關(guān)性和優(yōu)化的ID3特征選擇[J];數(shù)據(jù)采集與處理;2011年02期

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 賴英旭;楊震;;改進(jìn)貝葉斯算法在未知惡意軟件識(shí)別中的研究[J];北京工業(yè)大學(xué)學(xué)報(bào);2011年05期

2 陳凱星;陳建英;;一種改進(jìn)的基于樸素貝葉斯算法的垃圾短信過(guò)濾技術(shù)[J];福建電腦;2014年03期

3 李欣;;一種對(duì)貝葉斯算法的改進(jìn)算法分析[J];山東省農(nóng)業(yè)管理干部學(xué)院學(xué)報(bào);2011年05期

4 皮靖;邵雄凱;肖雅夫;;基于樸素貝葉斯算法的主題爬蟲(chóng)的研究[J];計(jì)算機(jī)與數(shù)字工程;2012年06期

5 楊忠強(qiáng);秦亮曦;;一種基于維規(guī)約的屬性加權(quán)樸素貝葉斯算法[J];信息技術(shù);2013年12期

6 丁岳偉;潘濤;;利用貝葉斯算法過(guò)濾報(bào)文內(nèi)容分析系統(tǒng)中的垃圾信息[J];上海理工大學(xué)學(xué)報(bào);2008年01期

7 李森;趙潔;;基于樸素貝葉斯算法的語(yǔ)言特征描述研究[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2012年05期

8 陳福志,史杏榮;基于改進(jìn)貝葉斯算法的信息安全模型[J];計(jì)算機(jī)工程;2003年20期

9 汪明;張征;;SQL Server 2008 R2貝葉斯算法研究[J];河北軟件職業(yè)技術(shù)學(xué)院學(xué)報(bào);2011年03期

10 文橋;王衛(wèi)平;;基于改進(jìn)貝葉斯算法的入侵檢測(cè)方法[J];計(jì)算機(jī)工程;2006年12期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前3條

1 顧蕊;;利用貝葉斯算法的目標(biāo)探測(cè)前跟蹤方法[A];第七屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2009年

2 許小林;唐文忠;;基于貝葉斯算法的垃圾郵件檢測(cè)中數(shù)據(jù)預(yù)處理技術(shù)的研究[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展——全國(guó)第17屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2006年

3 彭小明;辛陽(yáng);;基于增量貝葉斯算法的主題爬蟲(chóng)的設(shè)計(jì)與實(shí)現(xiàn)[A];第九屆中國(guó)通信學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2012年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 劉大雷;基于不確定貝葉斯算法在滑坡危險(xiǎn)性預(yù)測(cè)的應(yīng)用研究[D];江西理工大學(xué);2015年

2 楊忠強(qiáng);基于屬性加權(quán)和歸約的樸素貝葉斯算法研究[D];廣西大學(xué);2013年

3 Emmanuel Kayitaba 阿瑪尼;[D];中南大學(xué);2010年

4 孫源澤;樸素貝葉斯算法及其在電信客戶流失分析中的應(yīng)用研究[D];湖南大學(xué);2008年

5 朱強(qiáng);貝葉斯算法在智能終端信息過(guò)濾中的應(yīng)用研究[D];中南大學(xué);2013年

6 王剛剛;貝葉斯算法在人體生理狀態(tài)識(shí)別中的應(yīng)用[D];大連理工大學(xué);2008年

7 曾志中;基于貝葉斯算法的垃圾郵件過(guò)濾系統(tǒng)的分析與實(shí)現(xiàn)[D];北京郵電大學(xué);2009年

8 林士杰;ID3算法、樸素貝葉斯算法和BP神經(jīng)網(wǎng)絡(luò)算法的比較和分析研究[D];內(nèi)蒙古大學(xué);2013年

9 陳培;基于行為分析的惡意代碼識(shí)別系統(tǒng)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2010年

10 劉永昌;基于演化樸素貝葉斯的木馬檢測(cè)技術(shù)研究[D];華中科技大學(xué);2012年



本文編號(hào):823973

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/823973.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a8a89***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com