基于動(dòng)詞特征的文本分類方法研究
發(fā)布時(shí)間:2021-04-19 13:52
隨著互聯(lián)網(wǎng)的快速發(fā)展,用戶在社交媒體和網(wǎng)絡(luò)購物平臺(tái)中產(chǎn)生了大量的數(shù)據(jù),文本作為這些數(shù)據(jù)的重要表現(xiàn)形式,從中提取有效信息與尋找信息熱點(diǎn)是現(xiàn)代自然語言處理研究的重要內(nèi)容。文本分類作為文本信息處理的基礎(chǔ)技術(shù)之一,一直是信息挖掘等領(lǐng)域的研究熱點(diǎn)。在文本分類任務(wù)中,文本特征的提取及處理方法直接影響最終分類系統(tǒng)的分類效果。通過使用群體智能、遷移學(xué)習(xí)等技術(shù)可以更好的對(duì)文本特征進(jìn)行識(shí)別和提取。本文提出了一種使用擴(kuò)展后的動(dòng)詞特征進(jìn)行分類的智能回歸分類方法和一種通過遷移學(xué)習(xí)使用其他領(lǐng)域知識(shí)對(duì)缺乏標(biāo)注的文本進(jìn)行分類的方法,創(chuàng)新點(diǎn)如下:1.在使用文本表達(dá)意見、態(tài)度時(shí),動(dòng)詞扮演了重要的角色。本文提出了一種通過依存句法分析提取核心動(dòng)詞作為特征并對(duì)動(dòng)詞特征進(jìn)行擴(kuò)展的方法。為了提高分類器的分類效果,該方法對(duì)文本中的動(dòng)詞特征進(jìn)行了擴(kuò)展,使用粒子群搜索算法從原始特征空間中尋找有效的特征映射函數(shù),再根據(jù)這些函數(shù)將原始特征從低維空間映射至易于分類的高維空間,進(jìn)而構(gòu)建更合理的特征表達(dá)。2.在對(duì)動(dòng)詞特征進(jìn)行擴(kuò)展后,特征維數(shù)較高,本文提出了智能回歸方法作為分類方法對(duì)擴(kuò)展后的動(dòng)詞特征進(jìn)行分類。該方法通過粒子群算法搜尋回歸模型的各個(gè)參...
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:68 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 研究目的
1.3 主要研究內(nèi)容與組織結(jié)構(gòu)
第二章 文本分類技術(shù)基礎(chǔ)
2.1 引言
2.2 文本分類的經(jīng)典機(jī)器學(xué)習(xí)方法
2.3 基于遷移學(xué)習(xí)的文本分類方法
2.4 基于深度學(xué)習(xí)的文本分類方法
2.5 詞性特征在文本分類中的提取與應(yīng)用
2.6 本章小結(jié)
第三章 基于智能回歸的文本分類方法
3.1 引言
3.2 構(gòu)建依存句法樹
3.3 動(dòng)詞特征
3.4 動(dòng)詞詞組的提取方法
3.5 使用動(dòng)詞特征進(jìn)行文本分類
3.6 實(shí)驗(yàn)與分析
3.7 本章小結(jié)
第四章 基于遷移學(xué)習(xí)的文本分類方法
4.1 文本特征提取和向量化
4.2 跨語言文本分類模型
4.3 樞紐詞為動(dòng)詞的跨語言文本分類模型
4.4 實(shí)驗(yàn)設(shè)置與結(jié)果分析
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
【參考文獻(xiàn)】:
期刊論文
[1]基于多特征的中文文本蘊(yùn)含識(shí)別[J]. 譚詠梅,王志浩. 北京郵電大學(xué)學(xué)報(bào). 2015(06)
[2]一種基于規(guī)則優(yōu)先級(jí)的詞性標(biāo)注方法[J]. 王廣正,王喜鳳. 安徽工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2008(04)
[3]基于分類規(guī)則樹的頻繁模式文本分類[J]. 陳曉云,陳袆,王雷,李榮陸,胡運(yùn)發(fā). 軟件學(xué)報(bào). 2006(05)
[4]《統(tǒng)計(jì)自然語言處理基礎(chǔ)》[J]. 中文信息學(xué)報(bào). 2005(03)
碩士論文
[1]英語動(dòng)詞語義中預(yù)設(shè)問題的研究[D]. 張婷婷.長春理工大學(xué) 2010
[2]基于最大熵模型的漢語詞性標(biāo)注研究[D]. 張磊.大連理工大學(xué) 2008
本文編號(hào):3147676
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:68 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 研究目的
1.3 主要研究內(nèi)容與組織結(jié)構(gòu)
第二章 文本分類技術(shù)基礎(chǔ)
2.1 引言
2.2 文本分類的經(jīng)典機(jī)器學(xué)習(xí)方法
2.3 基于遷移學(xué)習(xí)的文本分類方法
2.4 基于深度學(xué)習(xí)的文本分類方法
2.5 詞性特征在文本分類中的提取與應(yīng)用
2.6 本章小結(jié)
第三章 基于智能回歸的文本分類方法
3.1 引言
3.2 構(gòu)建依存句法樹
3.3 動(dòng)詞特征
3.4 動(dòng)詞詞組的提取方法
3.5 使用動(dòng)詞特征進(jìn)行文本分類
3.6 實(shí)驗(yàn)與分析
3.7 本章小結(jié)
第四章 基于遷移學(xué)習(xí)的文本分類方法
4.1 文本特征提取和向量化
4.2 跨語言文本分類模型
4.3 樞紐詞為動(dòng)詞的跨語言文本分類模型
4.4 實(shí)驗(yàn)設(shè)置與結(jié)果分析
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
【參考文獻(xiàn)】:
期刊論文
[1]基于多特征的中文文本蘊(yùn)含識(shí)別[J]. 譚詠梅,王志浩. 北京郵電大學(xué)學(xué)報(bào). 2015(06)
[2]一種基于規(guī)則優(yōu)先級(jí)的詞性標(biāo)注方法[J]. 王廣正,王喜鳳. 安徽工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2008(04)
[3]基于分類規(guī)則樹的頻繁模式文本分類[J]. 陳曉云,陳袆,王雷,李榮陸,胡運(yùn)發(fā). 軟件學(xué)報(bào). 2006(05)
[4]《統(tǒng)計(jì)自然語言處理基礎(chǔ)》[J]. 中文信息學(xué)報(bào). 2005(03)
碩士論文
[1]英語動(dòng)詞語義中預(yù)設(shè)問題的研究[D]. 張婷婷.長春理工大學(xué) 2010
[2]基于最大熵模型的漢語詞性標(biāo)注研究[D]. 張磊.大連理工大學(xué) 2008
本文編號(hào):3147676
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3147676.html
最近更新
教材專著