天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于集成學(xué)習(xí)的短文本主客觀分類研究

發(fā)布時間:2017-08-28 20:22

  本文關(guān)鍵詞:基于集成學(xué)習(xí)的短文本主客觀分類研究


  更多相關(guān)文章: 主客觀分類 集成學(xué)習(xí) 動態(tài)集成 Bagging


【摘要】:隨著信息化的進(jìn)一步發(fā)展,人們迫切需要一種能夠在短時間內(nèi)從海量文本中獲取有用知識的技術(shù)。為此,搜索引擎、自動摘要、意見挖掘、觀點句抽取等信息提取技術(shù)得到了飛速發(fā)展。主客觀分類作為文本分類中的基礎(chǔ)問題,也受到廣大研究者們的重視。傳統(tǒng)主客觀分類一般采用機(jī)器學(xué)習(xí)方法進(jìn)行訓(xùn)練和分類,但由于中文文本內(nèi)在的復(fù)雜性,使用傳統(tǒng)機(jī)器學(xué)習(xí)進(jìn)行主客觀分類的性能遇到了瓶頸。本文在主客觀分類中引入集成學(xué)習(xí)思想,將有利于提高分類器的泛化能力,同時也有助于改善分類的準(zhǔn)確性和穩(wěn)定性。本文使用集成學(xué)習(xí)方法解決主客觀分類問題,首先介紹了主客觀分類方法和集成學(xué)習(xí)相關(guān)理論知識,然后根據(jù)主客觀文本的基本特征進(jìn)行集成分類器的構(gòu)建工作,主要完成了以下的研究內(nèi)容:(1)收集和整理了主觀線索特征,引入主觀線索密度的概念,并描述了文本主觀線索密度的計算方法。在此基礎(chǔ)上,將文本依據(jù)主觀線索特征進(jìn)行劃分,并使用樸素貝葉斯分類器進(jìn)行主客觀分類工作。最后針對上述分類器提出了一種基于Bagging方法的集成化方案。實驗結(jié)果表明,基于主觀線索特征進(jìn)行主客觀分類的方法具有一定的效果,在集成學(xué)習(xí)環(huán)境下表現(xiàn)更佳。同時這種分類方法對新測試樣本具有良好的適應(yīng)性。(2)針對文本中的詞匯、詞性、語義依存等多類特征,本文將其融合后進(jìn)行主客觀分類。對各類特征進(jìn)行CHI值的計算并排序,確定各類特征的最優(yōu)特征維度。在融合實驗中,為了達(dá)到更好的效果,嘗試各種特征組合方式進(jìn)行實驗,并最終確定了較優(yōu)的特征組合方式。為了應(yīng)對復(fù)雜多變的主客觀分類問題,本文將動態(tài)集成學(xué)習(xí)引入到主客觀分類問題中,提出一種改進(jìn)的動態(tài)集成分類方法。這種方法能夠針對特定區(qū)域的分類樣本進(jìn)行基分類器的重選擇。實驗數(shù)據(jù)表明,與傳統(tǒng)主客觀分類方法比較,在使用動態(tài)集成學(xué)習(xí)方法后,分類效果較好,尤其是在準(zhǔn)確率指標(biāo)上有較大提升。
【關(guān)鍵詞】:主客觀分類 集成學(xué)習(xí) 動態(tài)集成 Bagging
【學(xué)位授予單位】:安徽工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1
【目錄】:
  • 摘要4-5
  • Abstract5-8
  • 第一章 緒論8-13
  • 1.1 研究背景及意義8-9
  • 1.2 主客觀分類研究現(xiàn)狀9-10
  • 1.3 集成學(xué)習(xí)研究現(xiàn)狀10-11
  • 1.4 本文研究內(nèi)容11
  • 1.5 論文組織結(jié)構(gòu)11-13
  • 第二章 相關(guān)理論概述13-25
  • 2.1 主客觀分類13-16
  • 2.1.1 主客觀分類問題描述13
  • 2.1.2 主客觀分類流程13-16
  • 2.2 文本分類方法16-18
  • 2.2.1 樸素貝葉斯分類器16-17
  • 2.2.2 支持向量機(jī)基分類器17-18
  • 2.2.3 KNN分類方法18
  • 2.3 集成學(xué)習(xí)理論基礎(chǔ)18-24
  • 2.3.1 集成學(xué)習(xí)的概念18-19
  • 2.3.2 集成學(xué)習(xí)的作用19-20
  • 2.3.3 集成學(xué)習(xí)的有效性原理20-21
  • 2.3.4 集成學(xué)習(xí)的主要算法21-24
  • 2.4 本章小結(jié)24-25
  • 第三章 基于主觀線索的集成主客觀分類25-36
  • 3.1 主觀線索特征25-27
  • 3.2 文本線索密度的計算27-28
  • 3.3 基于線索密度的集成主客觀分類28-32
  • 3.3.1 基于樸素貝葉斯的主客觀分類28-29
  • 3.3.2 樸素貝葉斯分類器集成29-32
  • 3.4 實驗結(jié)果與分析32-35
  • 3.4.1 實驗設(shè)置32-33
  • 3.4.2 結(jié)果分析33-35
  • 3.5 本章小結(jié)35-36
  • 第四章 基于融合特征的動態(tài)集成主客觀分類36-50
  • 4.1 主客觀分類特征36-38
  • 4.2 主客觀特征選擇38-40
  • 4.2.1 特征選擇流程38-39
  • 4.2.2 基于CHI統(tǒng)計量的特征選擇39-40
  • 4.3 動態(tài)集成主客觀分類器構(gòu)建40-46
  • 4.3.1 動態(tài)集成框架40-41
  • 4.3.2 兩類動態(tài)集成學(xué)習(xí)方法的比較41-43
  • 4.3.3 基于KNN和k-means的改進(jìn)動態(tài)集成學(xué)習(xí)43-46
  • 4.4 實驗結(jié)果與分析46-49
  • 4.4.1 實驗設(shè)置46
  • 4.4.2 結(jié)果分析46-49
  • 4.5 本章小結(jié)49-50
  • 第五章 總結(jié)與展望50-52
  • 5.1 總結(jié)50
  • 5.2 展望50-52
  • 參考文獻(xiàn)52-56
  • 在學(xué)研究成果56-57
  • 致謝57

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 袁漢寧;;雙層多示例集成學(xué)習(xí)[J];武漢理工大學(xué)學(xué)報(信息與管理工程版);2011年05期

2 俞揚;周志華;;集成學(xué)習(xí)中完全隨機(jī)學(xué)習(xí)策略研究[J];計算機(jī)工程;2006年17期

3 張滄生;崔麗娟;楊剛;倪志宏;;集成學(xué)習(xí)算法的比較研究[J];河北大學(xué)學(xué)報(自然科學(xué)版);2007年05期

4 陳凱;;基于聚類技術(shù)的集成學(xué)習(xí)差異性研究[J];南京工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報;2008年04期

5 李凱;崔麗娟;;集成學(xué)習(xí)算法的差異性及性能比較[J];計算機(jī)工程;2008年06期

6 潘志松;燕繼坤;;少數(shù)類的集成學(xué)習(xí)[J];南京航空航天大學(xué)學(xué)報;2009年04期

7 陳凱;馬景義;;一種選擇性SER-BagBoosting Trees集成學(xué)習(xí)研究[J];計算機(jī)科學(xué);2009年09期

8 陳全;趙文輝;李潔;江雨燕;;選擇性集成學(xué)習(xí)算法的研究[J];計算機(jī)技術(shù)與發(fā)展;2010年02期

9 張燕平;曹振田;趙姝;鄭堯軍;杜玲;竇蓉蓉;;一種新的決策樹選擇性集成學(xué)習(xí)方法[J];計算機(jī)工程與應(yīng)用;2010年17期

10 饒峰;;核機(jī)器集成學(xué)習(xí)算法的誤差分析[J];重慶文理學(xué)院學(xué)報(自然科學(xué)版);2010年04期

中國重要會議論文全文數(shù)據(jù)庫 前4條

1 關(guān)菁華;劉大有;賈海洋;;自適應(yīng)多分類器集成學(xué)習(xí)算法[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(二)[C];2008年

2 劉伍穎;王挺;;一種多過濾器集成學(xué)習(xí)垃圾郵件過濾方法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

3 葉紅云;倪志偉;陳恩紅;;一種混合型集成學(xué)習(xí)演化決策樹算法[A];2005年“數(shù)字安徽”博士科技論壇論文集[C];2005年

4 李燁;蔡云澤;許曉鳴;;基于支持向量機(jī)集成的故障診斷[A];第16屆中國過程控制學(xué)術(shù)年會暨第4屆全國故障診斷與安全性學(xué)術(shù)會議論文集[C];2005年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 阿里木·賽買提(Alim.Samat);基于集成學(xué)習(xí)的全極化SAR圖像分類研究[D];南京大學(xué);2015年

2 王永明;集成回歸問題若干關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2015年

3 常征;基于混合集成學(xué)習(xí)的眼部與四肢交互動作建模與識別[D];北京科技大學(xué);2016年

4 張春霞;集成學(xué)習(xí)中有關(guān)算法的研究[D];西安交通大學(xué);2010年

5 劉天羽;基于特征選擇技術(shù)的集成學(xué)習(xí)方法及其應(yīng)用研究[D];上海大學(xué);2007年

6 尹華;面向高維和不平衡數(shù)據(jù)分類的集成學(xué)習(xí)研究[D];武漢大學(xué);2012年

7 王清;集成學(xué)習(xí)中若干關(guān)鍵問題的研究[D];復(fù)旦大學(xué);2011年

8 方育柯;集成學(xué)習(xí)理論研究及其在個性化推薦中的應(yīng)用[D];電子科技大學(xué);2011年

9 侯勇;特征提取與集成學(xué)習(xí)算法的研究及應(yīng)用[D];北京科技大學(xué);2015年

10 李燁;基于支持向量機(jī)的集成學(xué)習(xí)研究[D];上海交通大學(xué);2007年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 高偉;基于半監(jiān)督集成學(xué)習(xí)的情感分類方法研究[D];蘇州大學(xué);2015年

2 宋文展;基于抽樣的集成進(jìn)化算法研究[D];廣西大學(xué);2015年

3 湯瑩;遷移與集成學(xué)習(xí)在文本分類中的應(yīng)用研究[D];江蘇科技大學(xué);2015年

4 劉政;基于知識元和集成學(xué)習(xí)的中文微博情感分析[D];大連理工大學(xué);2015年

5 丘橋云;結(jié)合文本傾向性分析的股評可信度計算研究[D];哈爾濱工業(yè)大學(xué);2014年

6 秦海;融合非標(biāo)記樣本選擇的集成學(xué)習(xí)研究[D];湘潭大學(xué);2015年

7 李想;基于多示例的集成學(xué)習(xí)理論與應(yīng)用研究[D];合肥工業(yè)大學(xué);2014年

8 李震宇;基于集成學(xué)習(xí)的數(shù)字圖像隱寫定量分析[D];解放軍信息工程大學(xué);2014年

9 王希玲;基于選擇性集成學(xué)習(xí)的網(wǎng)絡(luò)入侵檢測方法研究[D];青島科技大學(xué);2016年

10 陳范曙;基于信息整合的藥物相關(guān)信息挖掘方法研究[D];華東師范大學(xué);2016年



本文編號:749275

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/749275.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶51690***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com