基于顯性語義方法的網(wǎng)絡(luò)新詞識(shí)別及其情感極性分析
發(fā)布時(shí)間:2023-05-12 21:15
隨著網(wǎng)絡(luò)信息通信的迅速發(fā)展,微博、微信等社交網(wǎng)絡(luò)上短文本形式的使用量激增。特別是在數(shù)據(jù)爆炸的時(shí)代背景下,社交網(wǎng)絡(luò)已然是網(wǎng)絡(luò)短文本形成和流傳的最大聚集地。在自然語言處理研究領(lǐng)域中,由于不能準(zhǔn)確識(shí)別這些互聯(lián)網(wǎng)新詞導(dǎo)致對(duì)于這類文本的分析理解困難,尤其是文本中的網(wǎng)絡(luò)新詞識(shí)別及其語義情感理解方面。缺乏新詞的解讀能力意味著無法理解用戶表達(dá)內(nèi)容,也無法進(jìn)行正確的輿論引導(dǎo),因此對(duì)于網(wǎng)絡(luò)新詞的識(shí)別、語義理解和情感分析研究意義重大。本文主要研究?jī)?nèi)容是社交網(wǎng)絡(luò)中的產(chǎn)生的新新詞匯識(shí)別及其情感極性分析。在短文本的情感識(shí)別研究中,詞語的情感傾向分析是判別短文本整體情感的關(guān)鍵。新詞以其通俗精簡(jiǎn)又有趣的表達(dá)能力而被互聯(lián)網(wǎng)用戶廣泛使用,然而在傳統(tǒng)的語料庫(kù)中沒有這些網(wǎng)絡(luò)新詞,因此傳統(tǒng)的情感分析方法對(duì)這類文本處理困難。處理情感分析的基礎(chǔ)是文本分詞準(zhǔn)確且單詞情感傾向識(shí)別無誤,微博這類社交網(wǎng)絡(luò)短文本中的網(wǎng)絡(luò)新詞又是影響分詞準(zhǔn)確度和理解準(zhǔn)確度的主要原因。為了克服傳統(tǒng)方法無法識(shí)別網(wǎng)絡(luò)新詞的缺點(diǎn),提出了一種融合網(wǎng)絡(luò)實(shí)體鏈接和顯性語義分析方法的網(wǎng)絡(luò)新詞識(shí)別方法。該方法以短語的粗粒度對(duì)原文進(jìn)行分詞,目的是盡可能保留原文的邏輯防止誤讀,分...
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題來源
1.2 課題研究的目的和意義
1.3 國(guó)內(nèi)外研究概況
1.4 論文的主要研究?jī)?nèi)容
1.5 論文結(jié)構(gòu)
第二章 相關(guān)概念與技術(shù)
2.1 網(wǎng)絡(luò)新詞概述
2.1.1 網(wǎng)絡(luò)新詞定義
2.1.2 網(wǎng)絡(luò)新詞識(shí)別難點(diǎn)
2.2 傳統(tǒng)詞語識(shí)別方法
2.2.1 基于字符串的詞語識(shí)別
2.2.2 基于語料庫(kù)的詞語識(shí)別
2.2.3 基于本體的詞語識(shí)別
2.3 情感分析相關(guān)理論
2.3.1 情感分析概述
2.3.2 情感極性識(shí)別方法概述
2.3.3 點(diǎn)互信息算法概述
第三章 基于顯性語義分析的網(wǎng)絡(luò)新詞識(shí)別方法
3.1 語料庫(kù)選擇
3.2 文本分詞
3.3 網(wǎng)絡(luò)知識(shí)圖譜識(shí)別語義
3.3.1 知識(shí)圖譜概述
3.3.2 分析知識(shí)圖譜提供的信息
3.4 顯性語義分析方法
3.4.1 改進(jìn)顯性語義分析算法
3.4.2 新詞識(shí)別系統(tǒng)流程
3.5 實(shí)驗(yàn)結(jié)果與分析
3.5.1 實(shí)驗(yàn)數(shù)據(jù)
3.5.2 實(shí)驗(yàn)結(jié)果評(píng)價(jià)方法
3.5.3 微博分詞實(shí)驗(yàn)
3.5.4 新詞識(shí)別準(zhǔn)確度實(shí)驗(yàn)
3.5.5 網(wǎng)絡(luò)新詞理解實(shí)驗(yàn)
3.6 本章小結(jié)
第四章 基于Word2Vec與 SO-PMI的情感極性分析
4.1 詞向量相關(guān)概念與理論
4.1.1 詞向量概念
4.1.2 神經(jīng)網(wǎng)絡(luò)語言模型
4.1.3 Word2Vec基本原理
4.2 融合w2v和 SO-PMI的情感識(shí)別方法
4.2.1 微博文本轉(zhuǎn)換詞向量
4.2.2 SO-PMI情感傾向點(diǎn)互信息
4.2.3 改進(jìn)的詞語情感極性分析
4.3 網(wǎng)絡(luò)新詞的情感極性分析系統(tǒng)
4.3.1 微博表情情感識(shí)別方法
4.3.2 新詞情感極性分析流程
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 實(shí)驗(yàn)結(jié)果評(píng)價(jià)方法
4.4.2 新詞情感識(shí)別實(shí)驗(yàn)
4.4.3 微博表情情感實(shí)驗(yàn)
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 論文總結(jié)
5.2 展望
參考文獻(xiàn)
作者在攻讀碩士學(xué)位期間公開發(fā)表的論文
作者在攻讀碩士學(xué)位期間所作的項(xiàng)目
致謝
本文編號(hào):3814648
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題來源
1.2 課題研究的目的和意義
1.3 國(guó)內(nèi)外研究概況
1.4 論文的主要研究?jī)?nèi)容
1.5 論文結(jié)構(gòu)
第二章 相關(guān)概念與技術(shù)
2.1 網(wǎng)絡(luò)新詞概述
2.1.1 網(wǎng)絡(luò)新詞定義
2.1.2 網(wǎng)絡(luò)新詞識(shí)別難點(diǎn)
2.2 傳統(tǒng)詞語識(shí)別方法
2.2.1 基于字符串的詞語識(shí)別
2.2.2 基于語料庫(kù)的詞語識(shí)別
2.2.3 基于本體的詞語識(shí)別
2.3 情感分析相關(guān)理論
2.3.1 情感分析概述
2.3.2 情感極性識(shí)別方法概述
2.3.3 點(diǎn)互信息算法概述
第三章 基于顯性語義分析的網(wǎng)絡(luò)新詞識(shí)別方法
3.1 語料庫(kù)選擇
3.2 文本分詞
3.3 網(wǎng)絡(luò)知識(shí)圖譜識(shí)別語義
3.3.1 知識(shí)圖譜概述
3.3.2 分析知識(shí)圖譜提供的信息
3.4 顯性語義分析方法
3.4.1 改進(jìn)顯性語義分析算法
3.4.2 新詞識(shí)別系統(tǒng)流程
3.5 實(shí)驗(yàn)結(jié)果與分析
3.5.1 實(shí)驗(yàn)數(shù)據(jù)
3.5.2 實(shí)驗(yàn)結(jié)果評(píng)價(jià)方法
3.5.3 微博分詞實(shí)驗(yàn)
3.5.4 新詞識(shí)別準(zhǔn)確度實(shí)驗(yàn)
3.5.5 網(wǎng)絡(luò)新詞理解實(shí)驗(yàn)
3.6 本章小結(jié)
第四章 基于Word2Vec與 SO-PMI的情感極性分析
4.1 詞向量相關(guān)概念與理論
4.1.1 詞向量概念
4.1.2 神經(jīng)網(wǎng)絡(luò)語言模型
4.1.3 Word2Vec基本原理
4.2 融合w2v和 SO-PMI的情感識(shí)別方法
4.2.1 微博文本轉(zhuǎn)換詞向量
4.2.2 SO-PMI情感傾向點(diǎn)互信息
4.2.3 改進(jìn)的詞語情感極性分析
4.3 網(wǎng)絡(luò)新詞的情感極性分析系統(tǒng)
4.3.1 微博表情情感識(shí)別方法
4.3.2 新詞情感極性分析流程
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 實(shí)驗(yàn)結(jié)果評(píng)價(jià)方法
4.4.2 新詞情感識(shí)別實(shí)驗(yàn)
4.4.3 微博表情情感實(shí)驗(yàn)
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 論文總結(jié)
5.2 展望
參考文獻(xiàn)
作者在攻讀碩士學(xué)位期間公開發(fā)表的論文
作者在攻讀碩士學(xué)位期間所作的項(xiàng)目
致謝
本文編號(hào):3814648
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3814648.html
最近更新
教材專著