文本挖掘中基于對比分析的潛在方面觀點算法研究
發(fā)布時間:2023-10-15 17:53
在全球信息化快速發(fā)展的今天,計算機和網(wǎng)絡技術(shù)的廣泛推廣和應用,直接導致了網(wǎng)絡中海量數(shù)據(jù)的涌現(xiàn),為了有效的從海量數(shù)據(jù)中獲取價值信息,數(shù)據(jù)挖掘技術(shù)得到了飛速的發(fā)展。其中,文本數(shù)據(jù)挖掘作為數(shù)據(jù)挖掘領(lǐng)域的重要分支,旨在分析網(wǎng)絡中蘊含豐富信息的文本數(shù)據(jù)。本文主要針對文本數(shù)據(jù)挖掘中的潛在方面觀點挖掘領(lǐng)域展開研究,在整理、總結(jié)相關(guān)歷史文獻的基礎上,發(fā)現(xiàn)過去在該領(lǐng)域的研究存在以下兩個問題,1.忽視用戶評論個性化問題,無法客觀的推斷方面評分。2.忽視用戶“潛臺詞”信息。為了解決上述兩個問題,本文采用對比挖掘的思想,利用用戶歷史文本數(shù)據(jù)分析用戶評論行為習慣,通過對比計算用戶“關(guān)注度”和“情感強度”兩個影響因素,將用戶習慣與特定的用戶評論進行對比,剔除用戶評論個性化影響,并同時發(fā)現(xiàn)用戶的“潛臺詞”信息。最終,在綜合考慮用戶評論個性化和用戶“潛臺詞”信息的基礎上,推斷方面權(quán)重、計算方面評分。本文實驗部分通過爬蟲技術(shù)獲取評論文本數(shù)據(jù),設計實現(xiàn)對比挖掘算法實驗。并對實驗結(jié)果分別從定性和定量的兩個測度進行驗證,說明算法可行性及效果。
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 文本數(shù)據(jù)挖掘
1.2.2 潛在方面觀點挖掘現(xiàn)狀
1.3 課題研究內(nèi)容
1.4 研究思路
1.5 研究論文組織結(jié)構(gòu)
1.6 本章小結(jié)
第二章 潛在方面觀點挖掘領(lǐng)域相關(guān)理論定義
2.1 相關(guān)符號定義
2.2 相關(guān)概念介紹與定義
2.2.1 方面關(guān)注度
2.2.2 情感詞敏感度
2.2.3 情感詞極性
2.2.4 情感強度
2.3 本章小結(jié)
第三章 算法設計
3.1 對比算法流程設計
3.2 方面識別與情感詞匹配
3.2.1 識別方面
3.2.2 發(fā)現(xiàn)與匹配情感詞
3.3 對比計算關(guān)注度
3.4 對比計算情感強度
3.5 方面權(quán)重向量化
3.6 方面評分優(yōu)化模型
3.7 本章小結(jié)
第四章 對比算法實現(xiàn)
4.1 數(shù)據(jù)獲取
4.1.1 技術(shù)介紹
4.1.2 設計實現(xiàn)
4.1.3 數(shù)據(jù)描述
4.2 數(shù)據(jù)存儲
4.3 數(shù)據(jù)分析
4.3.1 數(shù)據(jù)預處理
4.3.2 數(shù)據(jù)處理
4.3.3 結(jié)果展示
4.4 本章小結(jié)
第五章 算法有效性分析
5.1 定性分析
5.1.1 關(guān)注度
5.1.2 情感詞敏感度
5.1.3 情感強度
5.1.4 用戶“潛臺詞”分析
5.1.5 方面評分結(jié)果分析
5.2 定量分析
5.2.1 平均相關(guān)系數(shù)
5.2.2 客觀均方誤差
5.2.3 平均方面排序錯誤率
5.2.4 方面評分方差
5.3 本章小結(jié)
第六章 總結(jié)展望
致謝
參考文獻
攻讀學位期間參加科研情況及獲得的學術(shù)成果
本文編號:3854378
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 文本數(shù)據(jù)挖掘
1.2.2 潛在方面觀點挖掘現(xiàn)狀
1.3 課題研究內(nèi)容
1.4 研究思路
1.5 研究論文組織結(jié)構(gòu)
1.6 本章小結(jié)
第二章 潛在方面觀點挖掘領(lǐng)域相關(guān)理論定義
2.1 相關(guān)符號定義
2.2 相關(guān)概念介紹與定義
2.2.1 方面關(guān)注度
2.2.2 情感詞敏感度
2.2.3 情感詞極性
2.2.4 情感強度
2.3 本章小結(jié)
第三章 算法設計
3.1 對比算法流程設計
3.2 方面識別與情感詞匹配
3.2.1 識別方面
3.2.2 發(fā)現(xiàn)與匹配情感詞
3.3 對比計算關(guān)注度
3.4 對比計算情感強度
3.5 方面權(quán)重向量化
3.6 方面評分優(yōu)化模型
3.7 本章小結(jié)
第四章 對比算法實現(xiàn)
4.1 數(shù)據(jù)獲取
4.1.1 技術(shù)介紹
4.1.2 設計實現(xiàn)
4.1.3 數(shù)據(jù)描述
4.2 數(shù)據(jù)存儲
4.3 數(shù)據(jù)分析
4.3.1 數(shù)據(jù)預處理
4.3.2 數(shù)據(jù)處理
4.3.3 結(jié)果展示
4.4 本章小結(jié)
第五章 算法有效性分析
5.1 定性分析
5.1.1 關(guān)注度
5.1.2 情感詞敏感度
5.1.3 情感強度
5.1.4 用戶“潛臺詞”分析
5.1.5 方面評分結(jié)果分析
5.2 定量分析
5.2.1 平均相關(guān)系數(shù)
5.2.2 客觀均方誤差
5.2.3 平均方面排序錯誤率
5.2.4 方面評分方差
5.3 本章小結(jié)
第六章 總結(jié)展望
致謝
參考文獻
攻讀學位期間參加科研情況及獲得的學術(shù)成果
本文編號:3854378
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3854378.html
最近更新
教材專著