在線評論中產(chǎn)品屬性識別及其應(yīng)用研究
發(fā)布時間:2023-02-05 14:38
汽車行業(yè)用戶在線評論意見分析可以有效地獲取用戶偏好信息,這些信息不僅能夠為潛在的網(wǎng)絡(luò)用戶購物前提供依據(jù),降低購買風(fēng)險,還能夠幫助商家定位市場需求,做出合理的市場決策。近年來,在線評論已經(jīng)逐漸成為大眾關(guān)注的焦點,在線評論挖掘研究成為了學(xué)術(shù)界的熱點研究領(lǐng)域。目前,在線評論挖掘研究大都局限于粗粒度的情感分析方面,由于商品評論所表現(xiàn)出的整體情感極性的應(yīng)用范圍有限,因此,細粒度的在線評論文本意見挖掘研究,是商品評論文本挖掘亟待解決的問題。在線商品評論中的產(chǎn)品屬性反映了評論文本所表達的主題信息。針對在線評論信息存在數(shù)據(jù)量大、內(nèi)容結(jié)構(gòu)不規(guī)范且短句單句偏多等特征,所導(dǎo)致的細粒度文本意見挖掘研究中文本特征提取困難,且文本處理結(jié)果準(zhǔn)確率較低等問題,本文對在線商品評論中的產(chǎn)品屬性的識別及其在汽車用戶評論分析中的應(yīng)用進行研究,主要研究內(nèi)容如下:(1)基于分層特征條件隨機場模型的產(chǎn)品屬性抽取。針對在線短評論文本數(shù)據(jù)稀疏、領(lǐng)域差異性以及有效特征缺失等問題,研究在線商品評論中產(chǎn)品屬性抽取的影響因素,提取有效特征集;針對在線評論文本表述口語化,用詞不規(guī)范以及現(xiàn)有詞典的不完備性等特點,導(dǎo)致文本中的部分屬性詞被切分而無法...
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 課題來源
1.2 研究背景、目的與意義
1.3 相關(guān)領(lǐng)域國內(nèi)外研究現(xiàn)狀分析
1.3.1 文本情感傾向性分析研究
1.3.2 評論對象抽取研究
1.3.3 文本聚類與分類研究
1.4 本文主要研究內(nèi)容和組織結(jié)構(gòu)
1.4.1 研究內(nèi)容
1.4.2 論文組織結(jié)構(gòu)
第2章 基于 HF-CRFs 模型的產(chǎn)品屬性抽取
2.1 CRFs模型
2.2 產(chǎn)品屬性抽取方法
2.3 HF-CRFs 模型建模
2.3.1 特征選擇
2.3.2 構(gòu)建領(lǐng)域詞典
2.3.3 設(shè)計特征模板
2.3.4 定義分層特征函數(shù)
2.3.5 HF-CRFs 模型訓(xùn)練與測試
2.4 實驗與分析
2.4.1 實驗數(shù)據(jù)集
2.4.2 評價指標(biāo)
2.4.3 對比實驗
2.4.4 結(jié)果分析
2.5 本章小結(jié)
第3章 基于Word2vec 的產(chǎn)品屬性分類
3.1 相關(guān)理論基礎(chǔ)
3.1.1 支持向量機
3.1.2 文本表示模型
3.2 基于 Word2vec 的詞語級文本分類方法
3.2.1 產(chǎn)品屬性分類方法
3.2.2 構(gòu)建詞向量模型
3.2.3 構(gòu)建SVM分類器
3.2.4 基于詞向量的詞語級文本分類方法
3.3 實驗與分析
3.3.1 實驗數(shù)據(jù)集
3.3.2 評價指標(biāo)
3.3.3 結(jié)果分析
3.4 本章小結(jié)
第4章 產(chǎn)品屬性識別在汽車用戶評論分析中的應(yīng)用研究
4.1 需求分析
4.2 系統(tǒng)總體架構(gòu)
4.3 汽車用戶意見分析系統(tǒng)功能設(shè)計
4.3.1 數(shù)據(jù)采集模塊
4.3.2 數(shù)據(jù)預(yù)處理模塊
4.3.3 數(shù)據(jù)分析模塊
4.3.4 數(shù)據(jù)展示模塊
4.3.5 系統(tǒng)管理模塊
4.4 汽車用戶意見分析系統(tǒng)實現(xiàn)與驗證
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 全文工作總結(jié)
5.2 未來工作展望
致謝
參考文獻
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄
本文編號:3735148
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 課題來源
1.2 研究背景、目的與意義
1.3 相關(guān)領(lǐng)域國內(nèi)外研究現(xiàn)狀分析
1.3.1 文本情感傾向性分析研究
1.3.2 評論對象抽取研究
1.3.3 文本聚類與分類研究
1.4 本文主要研究內(nèi)容和組織結(jié)構(gòu)
1.4.1 研究內(nèi)容
1.4.2 論文組織結(jié)構(gòu)
第2章 基于 HF-CRFs 模型的產(chǎn)品屬性抽取
2.1 CRFs模型
2.2 產(chǎn)品屬性抽取方法
2.3 HF-CRFs 模型建模
2.3.1 特征選擇
2.3.2 構(gòu)建領(lǐng)域詞典
2.3.3 設(shè)計特征模板
2.3.4 定義分層特征函數(shù)
2.3.5 HF-CRFs 模型訓(xùn)練與測試
2.4 實驗與分析
2.4.1 實驗數(shù)據(jù)集
2.4.2 評價指標(biāo)
2.4.3 對比實驗
2.4.4 結(jié)果分析
2.5 本章小結(jié)
第3章 基于Word2vec 的產(chǎn)品屬性分類
3.1 相關(guān)理論基礎(chǔ)
3.1.1 支持向量機
3.1.2 文本表示模型
3.2 基于 Word2vec 的詞語級文本分類方法
3.2.1 產(chǎn)品屬性分類方法
3.2.2 構(gòu)建詞向量模型
3.2.3 構(gòu)建SVM分類器
3.2.4 基于詞向量的詞語級文本分類方法
3.3 實驗與分析
3.3.1 實驗數(shù)據(jù)集
3.3.2 評價指標(biāo)
3.3.3 結(jié)果分析
3.4 本章小結(jié)
第4章 產(chǎn)品屬性識別在汽車用戶評論分析中的應(yīng)用研究
4.1 需求分析
4.2 系統(tǒng)總體架構(gòu)
4.3 汽車用戶意見分析系統(tǒng)功能設(shè)計
4.3.1 數(shù)據(jù)采集模塊
4.3.2 數(shù)據(jù)預(yù)處理模塊
4.3.3 數(shù)據(jù)分析模塊
4.3.4 數(shù)據(jù)展示模塊
4.3.5 系統(tǒng)管理模塊
4.4 汽車用戶意見分析系統(tǒng)實現(xiàn)與驗證
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 全文工作總結(jié)
5.2 未來工作展望
致謝
參考文獻
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄
本文編號:3735148
本文鏈接:http://sikaile.net/jingjilunwen/gongyejingjilunwen/3735148.html
最近更新
教材專著