天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類碩士論文 >

文本分類系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2017-09-14 04:22

  本文關(guān)鍵詞:文本分類系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)


  更多相關(guān)文章: 文本分類 特征選擇 微粒子群算法 混沌擾動(dòng)模型 慣性權(quán)重


【摘要】:伴隨著信息時(shí)代的到來,互聯(lián)網(wǎng)迅速發(fā)展起來,大量文本信息也隨之產(chǎn)生,豐富的信息背后蘊(yùn)含著包括娛樂、農(nóng)業(yè)、軍事、經(jīng)濟(jì)等各領(lǐng)域的各種重要觀點(diǎn),巨大的價(jià)值亟待挖掘。因此如何更有效、更準(zhǔn)確的對(duì)大量文本信息進(jìn)行分析成為我們當(dāng)前亟待研究的問題。文本分類方法的出現(xiàn),幫助了人們更好更快地過濾垃圾信息、分析文本信息,從而將獲取的信息利用于生活的方方面面。本文研究?jī)?nèi)容為該項(xiàng)目中的文本分類系統(tǒng)搭建部分,通過將經(jīng)典的特征選擇方法、自主設(shè)計(jì)的特征選擇方法、經(jīng)典的文本分類方法嵌入到系統(tǒng)中,從而建立一套通用的、可擴(kuò)展的文本分類系統(tǒng)。使在文本分類各階段算法的設(shè)計(jì)使用中,節(jié)約資源、避免重復(fù)開發(fā),供上層應(yīng)用模塊靈活使用。本文完成的主要工作包括:(1)搭建可擴(kuò)展、便于交互的文本分類研究系統(tǒng),介紹并測(cè)試了系統(tǒng)的主要功能,驗(yàn)證本文改進(jìn)方法的效果,為文本分類方法研究者提供了一個(gè)可視化、易使用的系統(tǒng)。(2)對(duì)文本分類的主要流程及其所應(yīng)用到的方法進(jìn)行介紹,并著重對(duì)特征選擇方法以及文本分類方法的主要方法進(jìn)行了對(duì)比分析。(3)針對(duì)系統(tǒng)的特征選擇設(shè)計(jì)部分,本文提出一種基于改進(jìn)微粒子群算法的特征選擇方法(Feature Selection Based on Improved Particle Swarm Optimization Algorithm,簡(jiǎn)稱FS-IPSO)。針對(duì)標(biāo)準(zhǔn)PSO算法的不足,在傳統(tǒng)微粒子群算法基礎(chǔ)上,通過擾動(dòng)粒子初值、在迭代過程中隨機(jī)擾動(dòng)粒子位置,優(yōu)化傳統(tǒng)慣性權(quán)重三種方式,來避免粒子陷入局部最優(yōu),減少計(jì)算量,提高分類性能。
【關(guān)鍵詞】:文本分類 特征選擇 微粒子群算法 混沌擾動(dòng)模型 慣性權(quán)重
【學(xué)位授予單位】:中山大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1
【目錄】:
  • 摘要4-5
  • ABSTRACT5-9
  • 第1章 緒論9-13
  • 1.1 項(xiàng)目研究背景與意義9-10
  • 1.2 國(guó)內(nèi)外研究情況10-11
  • 1.3 論文主要工作11-12
  • 1.4 論文內(nèi)容組織12-13
  • 第2章 文本分類系統(tǒng)及相關(guān)技術(shù)研究13-30
  • 2.1 文本分類13-14
  • 2.2 文本預(yù)處理14-17
  • 2.3 特征選擇17-23
  • 2.4 特征權(quán)重計(jì)算23-25
  • 2.5 分類算法25-28
  • 2.6 文本分類系統(tǒng)28-30
  • 第3章 文本分類系統(tǒng)需求分析30-37
  • 3.1 系統(tǒng)目標(biāo)和范圍30-31
  • 3.2 系統(tǒng)功能需求31-35
  • 3.3 系統(tǒng)非功能需求35-36
  • 3.4 本章小結(jié)36-37
  • 第4章 系統(tǒng)模塊總體設(shè)計(jì)37-53
  • 4.1 系統(tǒng)架構(gòu)設(shè)計(jì)37-38
  • 4.2 表示模塊38-39
  • 4.3 用戶請(qǐng)求監(jiān)聽模塊設(shè)計(jì)39-41
  • 4.4 業(yè)務(wù)邏輯模塊設(shè)計(jì)41-51
  • 4.5 數(shù)據(jù)存儲(chǔ)子系統(tǒng)51-52
  • 4.6 本章小結(jié)52-53
  • 第5章 系統(tǒng)詳細(xì)設(shè)計(jì)與實(shí)現(xiàn)53-62
  • 5.1 用戶請(qǐng)求監(jiān)聽子系統(tǒng)設(shè)計(jì)53-54
  • 5.2 文本分類子系統(tǒng)詳細(xì)設(shè)計(jì)54-60
  • 5.3 數(shù)據(jù)存儲(chǔ)子系統(tǒng)60-61
  • 5.4 本章小結(jié)61-62
  • 第6章 系統(tǒng)部署與應(yīng)用62-74
  • 6.1 開發(fā)工具62
  • 6.2 系統(tǒng)功能展示62-67
  • 6.3 分類系統(tǒng)測(cè)試實(shí)驗(yàn)67-72
  • 6.4 本章小結(jié)72-74
  • 第7章 總結(jié)與展望74-76
  • 7.1 總結(jié)74-75
  • 7.2 展望75-76
  • 參考文獻(xiàn)76-79
  • 致謝79-80

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 孫霞;鄭慶華;;一種面向非平衡數(shù)據(jù)的鄰居詞特征選擇方法[J];小型微型計(jì)算機(jī)系統(tǒng);2008年12期

2 蔣盛益;鄭琪;張倩生;;基于聚類的特征選擇方法[J];電子學(xué)報(bào);2008年S1期

3 王加龍;朱顥東;;結(jié)合類別相關(guān)性和辨識(shí)集的特征選擇方法[J];微型機(jī)與應(yīng)用;2009年23期

4 朱顥東;周姝;鐘勇;;結(jié)合差別對(duì)象對(duì)集的綜合性特征選擇方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2010年03期

5 姜慧研;柴天佑;;基于可信間隔的特征選擇方法研究[J];控制與決策;2011年08期

6 姚旭;王曉丹;張玉璽;權(quán)文;;特征選擇方法綜述[J];控制與決策;2012年02期

7 王志昊;王中卿;李壽山;李培峰;;不平衡情感分類中的特征選擇方法研究[J];中文信息學(xué)報(bào);2013年04期

8 張玉紅;周全;胡學(xué)鋼;;面向跨領(lǐng)域情感分類的特征選擇方法[J];模式識(shí)別與人工智能;2013年11期

9 李敏;卡米力·木依丁;;特征選擇方法與算法的研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2013年12期

10 申清明;閆利軍;高建民;趙靜;;基于混沌搜索的特征選擇方法[J];兵工學(xué)報(bào);2013年12期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前6條

1 徐燕;王斌;李錦濤;孫春明;;知識(shí)增益:文本分類中一種新的特征選擇方法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

2 肖婷;唐雁;;文本分類中特征選擇方法及應(yīng)用[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年

3 徐燕;孫春明;王斌;李錦濤;;基于詞條頻率的特征選擇算法研究[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年

4 陳慶軒;鄭德權(quán);鄭博文;趙鐵軍;李生;;中文文本分類中基于文檔頻度分布的特征選擇方法[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2009年學(xué)術(shù)交流年會(huì)論文集[C];2010年

5 顧成杰;張順頤;劉凱;黃河;;基于粗糙集和禁忌搜索的特征選擇方法[A];江蘇省電子學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年

6 王秀娟;郭軍;鄭康鋒;;基于互信息可信度的特征選擇方法[A];2006通信理論與技術(shù)新進(jìn)展——第十一屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2006年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條

1 劉明霞;屬性學(xué)習(xí)若干重要問題的研究及應(yīng)用[D];南京航空航天大學(xué);2015年

2 毛勇;基于支持向量機(jī)的特征選擇方法的研究與應(yīng)用[D];浙江大學(xué);2006年

3 尹留志;關(guān)于非平衡數(shù)據(jù)特征問題的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年

4 裴志利;數(shù)據(jù)挖掘技術(shù)在文本分類和生物信息學(xué)中的應(yīng)用[D];吉林大學(xué);2008年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 曹晉;基于SVDD的特征選擇方法研究及其應(yīng)用[D];蘇州大學(xué);2015年

2 張強(qiáng);靜態(tài)圖像上的行人檢測(cè)方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2015年

3 張曉梅;基于融合特征的微博主客觀分類方法研究[D];山西大學(xué);2014年

4 王君;基于SVM-RFE的特征選擇方法研究[D];大連理工大學(xué);2015年

5 于海珠;面向文本聚類的特征選擇方法及應(yīng)用研究[D];大連理工大學(xué);2015年

6 趙世琛;文本分類中特征選擇方法研究[D];山西大學(xué);2014年

7 王丹;特征選擇算法研究及其在異常檢測(cè)中的應(yīng)用[D];電子科技大學(xué);2014年

8 林艷峰;中文文本分類特征選擇方法的研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2014年

9 盧志浩;基于GEP的kNN算法改進(jìn)研究[D];廣西師范學(xué)院;2015年

10 王立鵬;面向圖數(shù)據(jù)的特征選擇方法及其應(yīng)用研究[D];南京航空航天大學(xué);2015年

,

本文編號(hào):847847

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/847847.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5e272***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com