基于LDA主題模型的在線評(píng)論聚類(lèi)分析與推薦
發(fā)布時(shí)間:2021-11-24 15:28
隨著信息技術(shù)的發(fā)展,網(wǎng)購(gòu)平臺(tái)中涌現(xiàn)出海量的在線評(píng)論,其中蘊(yùn)含著豐富的產(chǎn)品信息,消費(fèi)者如何在海量的文本中快速查閱到自身感興趣的信息成為一個(gè)棘手的問(wèn)題。基于文本的聚類(lèi)方法是緩解該問(wèn)題的重要途徑,具有廣闊的應(yīng)用前景。電子商務(wù)環(huán)境下的在線評(píng)論具有質(zhì)量參差不齊、短文本特征稀疏、描述信息能力較弱等特點(diǎn),這造成文本的主題模糊和內(nèi)容混亂,制約了在線評(píng)論的應(yīng)用發(fā)展。而文本聚類(lèi)可以揭示文本內(nèi)容的一致性,從而發(fā)現(xiàn)同一類(lèi)別中所包含的共同信息,有助于在線評(píng)論的重新組織和二次應(yīng)用。為此,本文的重點(diǎn)研究?jī)?nèi)容為在線評(píng)論的聚類(lèi)分析和評(píng)論的推薦方法,旨在找出在線評(píng)論短文本中最合適的聚類(lèi)模型,同時(shí)通過(guò)選取重要評(píng)論和富有情感傾向的評(píng)論輔助消費(fèi)者更有效的獲取信息。本文的主要研究?jī)?nèi)容如下:1.針對(duì)傳統(tǒng)向量空間模型忽略深層次語(yǔ)義信息的問(wèn)題,提出使用LDA(Latent Dirichlet Allocation)主題模型進(jìn)行在線評(píng)論的向量化表示,并探究在.LDA模型下最合適的短文本聚類(lèi)方法。實(shí)驗(yàn)結(jié)果表明,通過(guò)LDA模型能準(zhǔn)確的捕獲評(píng)論中主題信息,使得聚類(lèi)結(jié)果更加合理。并且在各個(gè)聚類(lèi)算法中,基于圖分割的譜聚類(lèi)算法綜合表現(xiàn)最好。2.為提...
【文章來(lái)源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 主要研究?jī)?nèi)容與論文組織結(jié)構(gòu)
1.2.1 主要研究?jī)?nèi)容
1.2.2 論文組織結(jié)構(gòu)
1.3 本章小結(jié)
2 相關(guān)文獻(xiàn)綜述
2.1 電商環(huán)境下在線評(píng)論的相關(guān)研究綜述
2.1.1 在線評(píng)論的有用性分析
2.1.2 基于標(biāo)簽化的評(píng)論推薦
2.1.3 在線評(píng)論的情感值計(jì)算方法
2.1.4 在線評(píng)論中主題模型的應(yīng)用
2.1.5 在線評(píng)論中聚類(lèi)方法的應(yīng)用價(jià)值
2.2 本章小結(jié)
3 基于LDA主題模型的在線評(píng)論聚類(lèi)模型
3.1 文本表示模型
3.1.1 向量空間模型
3.1.2 主題模型
3.2 LDA主題模型相關(guān)工作
3.2.1 文本建模
3.2.2 LDA吉布斯采樣(Gibbs Sampling)
3.3 經(jīng)典的聚類(lèi)算法
3.3.1 K-means算法
3.3.2 DBSCAN算法
3.3.3 譜聚類(lèi)算法
3.3.4 經(jīng)典聚類(lèi)算法的分析與比較
3.4 基于LDA算法的聚類(lèi)模型構(gòu)建
3.5 實(shí)驗(yàn)與分析
3.5.1 實(shí)驗(yàn)數(shù)據(jù)集
3.5.2 評(píng)價(jià)指標(biāo)
3.5.3 實(shí)驗(yàn)結(jié)果分析
3.5.3.1 不同數(shù)據(jù)集上LDA算法的對(duì)比分析
3.5.3.2 不停數(shù)據(jù)集上K-means、DBCSAN及譜聚類(lèi)方法的效果比較
3.6 本章小結(jié)
4 在線評(píng)論復(fù)雜網(wǎng)絡(luò)的構(gòu)建及評(píng)論推薦
4.1 在線評(píng)論無(wú)向網(wǎng)絡(luò)模型構(gòu)建
4.2 在線評(píng)論節(jié)點(diǎn)重要度計(jì)算
4.2.1 基于度中心性的節(jié)點(diǎn)重要性計(jì)算
4.2.2 社區(qū)劃分下的節(jié)點(diǎn)重要度計(jì)算
4.3 實(shí)驗(yàn)與分析
4.3.1 復(fù)雜網(wǎng)絡(luò)統(tǒng)計(jì)性質(zhì)分析
4.3.2 評(píng)論推薦結(jié)果分析
4.4 本章小結(jié)
5 在線評(píng)論情感傾向性計(jì)算及評(píng)論推薦
5.1 文本情感計(jì)算方法簡(jiǎn)介
5.1.1 基于情感詞典的情感計(jì)算方法
5.1.2 無(wú)監(jiān)督情感計(jì)算方法
5.1.3 基于有監(jiān)督的文本情感計(jì)算方法
5.2 基于多特征融合與集成學(xué)習(xí)的文本情感計(jì)算
5.2.1 文本特征選擇
5.2.2 集成學(xué)習(xí)
5.3 實(shí)驗(yàn)與分析
5.3.1 實(shí)驗(yàn)數(shù)據(jù)集
5.3.2 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)
5.3.3 實(shí)驗(yàn)結(jié)果分析
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于DBSCAN算法的文本聚類(lèi)研究[J]. 鄒艷春. 軟件導(dǎo)刊. 2016(08)
[2]基于語(yǔ)義分析的評(píng)價(jià)對(duì)象-情感詞對(duì)抽取[J]. 江騰蛟,萬(wàn)常選,劉德喜,劉喜平,廖國(guó)瓊. 計(jì)算機(jī)學(xué)報(bào). 2017(03)
[3]在線評(píng)論對(duì)消費(fèi)者購(gòu)買(mǎi)意愿的影響——心理距離的中介作用[J]. 周梅華,李佩镅,牟宇鵬. 軟科學(xué). 2015(01)
[4]基于句法特征的評(píng)價(jià)對(duì)象抽取方法研究[J]. 戴敏,王榮洋,李壽山,朱珠,周?chē)?guó)棟. 中文信息學(xué)報(bào). 2014(04)
[5]在線負(fù)面評(píng)論對(duì)網(wǎng)絡(luò)消費(fèi)者購(gòu)買(mǎi)意愿的影響[J]. 寧連舉,孫韓. 技術(shù)經(jīng)濟(jì). 2014(03)
[6]基于LDA的網(wǎng)絡(luò)評(píng)論主題發(fā)現(xiàn)研究[J]. 阮光冊(cè). 情報(bào)雜志. 2014(03)
[7]文本聚類(lèi)算法綜述[J]. 史夢(mèng)潔. 現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版). 2014(03)
[8]文本譜聚類(lèi)算法研究[J]. 施曉篩,徐森,曹瑞. 電子設(shè)計(jì)工程. 2012(22)
[9]在線商品評(píng)論的效用分析研究[J]. 楊銘,祁巍,閆相斌,李一軍. 管理科學(xué)學(xué)報(bào). 2012(05)
[10]基于淺層句法特征的評(píng)價(jià)對(duì)象抽取研究[J]. 徐冰,趙鐵軍,王山雨,鄭德權(quán). 自動(dòng)化學(xué)報(bào). 2011(10)
博士論文
[1]基于產(chǎn)品評(píng)論的情感分析研究[D]. 李方濤.清華大學(xué) 2011
碩士論文
[1]基于主題模型的用戶(hù)興趣建模及在新聞推薦中的應(yīng)用[D]. 陳銘權(quán).華南理工大學(xué) 2015
[2]電子商務(wù)網(wǎng)站在線評(píng)論有用性研究[D]. 汪俊奎.西安電子科技大學(xué) 2014
本文編號(hào):3516254
【文章來(lái)源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 主要研究?jī)?nèi)容與論文組織結(jié)構(gòu)
1.2.1 主要研究?jī)?nèi)容
1.2.2 論文組織結(jié)構(gòu)
1.3 本章小結(jié)
2 相關(guān)文獻(xiàn)綜述
2.1 電商環(huán)境下在線評(píng)論的相關(guān)研究綜述
2.1.1 在線評(píng)論的有用性分析
2.1.2 基于標(biāo)簽化的評(píng)論推薦
2.1.3 在線評(píng)論的情感值計(jì)算方法
2.1.4 在線評(píng)論中主題模型的應(yīng)用
2.1.5 在線評(píng)論中聚類(lèi)方法的應(yīng)用價(jià)值
2.2 本章小結(jié)
3 基于LDA主題模型的在線評(píng)論聚類(lèi)模型
3.1 文本表示模型
3.1.1 向量空間模型
3.1.2 主題模型
3.2 LDA主題模型相關(guān)工作
3.2.1 文本建模
3.2.2 LDA吉布斯采樣(Gibbs Sampling)
3.3 經(jīng)典的聚類(lèi)算法
3.3.1 K-means算法
3.3.2 DBSCAN算法
3.3.3 譜聚類(lèi)算法
3.3.4 經(jīng)典聚類(lèi)算法的分析與比較
3.4 基于LDA算法的聚類(lèi)模型構(gòu)建
3.5 實(shí)驗(yàn)與分析
3.5.1 實(shí)驗(yàn)數(shù)據(jù)集
3.5.2 評(píng)價(jià)指標(biāo)
3.5.3 實(shí)驗(yàn)結(jié)果分析
3.5.3.1 不同數(shù)據(jù)集上LDA算法的對(duì)比分析
3.5.3.2 不停數(shù)據(jù)集上K-means、DBCSAN及譜聚類(lèi)方法的效果比較
3.6 本章小結(jié)
4 在線評(píng)論復(fù)雜網(wǎng)絡(luò)的構(gòu)建及評(píng)論推薦
4.1 在線評(píng)論無(wú)向網(wǎng)絡(luò)模型構(gòu)建
4.2 在線評(píng)論節(jié)點(diǎn)重要度計(jì)算
4.2.1 基于度中心性的節(jié)點(diǎn)重要性計(jì)算
4.2.2 社區(qū)劃分下的節(jié)點(diǎn)重要度計(jì)算
4.3 實(shí)驗(yàn)與分析
4.3.1 復(fù)雜網(wǎng)絡(luò)統(tǒng)計(jì)性質(zhì)分析
4.3.2 評(píng)論推薦結(jié)果分析
4.4 本章小結(jié)
5 在線評(píng)論情感傾向性計(jì)算及評(píng)論推薦
5.1 文本情感計(jì)算方法簡(jiǎn)介
5.1.1 基于情感詞典的情感計(jì)算方法
5.1.2 無(wú)監(jiān)督情感計(jì)算方法
5.1.3 基于有監(jiān)督的文本情感計(jì)算方法
5.2 基于多特征融合與集成學(xué)習(xí)的文本情感計(jì)算
5.2.1 文本特征選擇
5.2.2 集成學(xué)習(xí)
5.3 實(shí)驗(yàn)與分析
5.3.1 實(shí)驗(yàn)數(shù)據(jù)集
5.3.2 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)
5.3.3 實(shí)驗(yàn)結(jié)果分析
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于DBSCAN算法的文本聚類(lèi)研究[J]. 鄒艷春. 軟件導(dǎo)刊. 2016(08)
[2]基于語(yǔ)義分析的評(píng)價(jià)對(duì)象-情感詞對(duì)抽取[J]. 江騰蛟,萬(wàn)常選,劉德喜,劉喜平,廖國(guó)瓊. 計(jì)算機(jī)學(xué)報(bào). 2017(03)
[3]在線評(píng)論對(duì)消費(fèi)者購(gòu)買(mǎi)意愿的影響——心理距離的中介作用[J]. 周梅華,李佩镅,牟宇鵬. 軟科學(xué). 2015(01)
[4]基于句法特征的評(píng)價(jià)對(duì)象抽取方法研究[J]. 戴敏,王榮洋,李壽山,朱珠,周?chē)?guó)棟. 中文信息學(xué)報(bào). 2014(04)
[5]在線負(fù)面評(píng)論對(duì)網(wǎng)絡(luò)消費(fèi)者購(gòu)買(mǎi)意愿的影響[J]. 寧連舉,孫韓. 技術(shù)經(jīng)濟(jì). 2014(03)
[6]基于LDA的網(wǎng)絡(luò)評(píng)論主題發(fā)現(xiàn)研究[J]. 阮光冊(cè). 情報(bào)雜志. 2014(03)
[7]文本聚類(lèi)算法綜述[J]. 史夢(mèng)潔. 現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版). 2014(03)
[8]文本譜聚類(lèi)算法研究[J]. 施曉篩,徐森,曹瑞. 電子設(shè)計(jì)工程. 2012(22)
[9]在線商品評(píng)論的效用分析研究[J]. 楊銘,祁巍,閆相斌,李一軍. 管理科學(xué)學(xué)報(bào). 2012(05)
[10]基于淺層句法特征的評(píng)價(jià)對(duì)象抽取研究[J]. 徐冰,趙鐵軍,王山雨,鄭德權(quán). 自動(dòng)化學(xué)報(bào). 2011(10)
博士論文
[1]基于產(chǎn)品評(píng)論的情感分析研究[D]. 李方濤.清華大學(xué) 2011
碩士論文
[1]基于主題模型的用戶(hù)興趣建模及在新聞推薦中的應(yīng)用[D]. 陳銘權(quán).華南理工大學(xué) 2015
[2]電子商務(wù)網(wǎng)站在線評(píng)論有用性研究[D]. 汪俊奎.西安電子科技大學(xué) 2014
本文編號(hào):3516254
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3516254.html
最近更新
教材專(zhuān)著