互聯(lián)網(wǎng)評論文本觀點(diǎn)挖掘策略研究
發(fā)布時(shí)間:2021-03-02 07:21
互聯(lián)網(wǎng)時(shí)代,人們越來越多地在線購物、在線訂餐、在線預(yù)定酒店等等。國內(nèi)最大的電子商務(wù)網(wǎng)站阿里巴巴,其各款商品展示頁面通常都積累有成千上萬的購買者評論,國內(nèi)最大的生活服務(wù)類電商,如美團(tuán),則有龐大的外賣、美食的評論數(shù)據(jù),再者,像攜程這樣的線上OTA企業(yè)則有海量的酒店、旅游體驗(yàn)評價(jià)。如今,數(shù)據(jù)越來越成為各互聯(lián)網(wǎng)企業(yè)最寶貴的財(cái)富,據(jù)2016年CNNIC(中國互聯(lián)網(wǎng)絡(luò)信息中心)數(shù)據(jù)顯示,71.1%的用戶認(rèn)為產(chǎn)品評論是影響購買決策的最主要因素,而如此龐大的各類評論數(shù)據(jù),正是用來分析各類商品價(jià)值、商家品質(zhì)的絕好原材料。但是原始評論數(shù)據(jù)數(shù)量大、句式復(fù)雜、爭議性大,需要相應(yīng)方法,將其結(jié)構(gòu)化成觀點(diǎn)維度、觀點(diǎn)詞、情感類別三元組的形式,便于直觀的分析。本文分別從觀點(diǎn)抽取和評論文本情感傾向兩個(gè)子方向進(jìn)行研究,研究主要內(nèi)容及貢獻(xiàn)如下:(1)由硬匹配、軟匹配方法構(gòu)成的第一、二層觀點(diǎn)維度詞、觀點(diǎn)詞挖掘模塊!坝财ヅ洹敝傅氖窃u論句直接與種子詞典中候選詞進(jìn)行搜索,若評論句中存在種子詞典內(nèi)詞匯則挖掘成功;“軟匹配”指的是通過word2vec的方式,擴(kuò)充了種子詞典,若評論文本中出現(xiàn)了擴(kuò)充詞典的詞,則歸一至與其對應(yīng)的種子詞典的詞...
【文章來源】:南京大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1線性鏈條件隨機(jī)場??
的文本序列處理為等長的表示(輸出)向量,或者將表示向量合并、相加處理成??定長的表不(輸出)向量。??可以使用X來表示網(wǎng)絡(luò)輸入向量序列xu....,xn。如圖2.3左所示,將整個(gè)網(wǎng)??絡(luò)看成A,每個(gè)時(shí)刻t輸入向量為xt,并循環(huán)輸入上個(gè)時(shí)刻歷史信息,最終網(wǎng)絡(luò)??t時(shí)刻輸出ht,并在下一個(gè)時(shí)刻同樣的方式輸出h1+i。??ht?=?=?tanhCVK^/it,!?+?Wxhxt?+?b)?(公式?2.6)??除去網(wǎng)絡(luò)中的循環(huán)結(jié)構(gòu),該網(wǎng)絡(luò)很像一組全連接網(wǎng)絡(luò)。拆開這個(gè)網(wǎng)絡(luò),則可??以更清除地看出RNN與全連接網(wǎng)絡(luò)的不同之處。如圖2.3右,展幵之后可以發(fā)??現(xiàn)該網(wǎng)絡(luò)與序列地天然聯(lián)系,對此聯(lián)系可以用數(shù)學(xué)公式進(jìn)行表示。??yt?=?g(Vht)?(公式?2_7)??各參數(shù)說明如下:??Xt:?t時(shí)刻的輸入??St:?t時(shí)刻隱藏狀態(tài)??g:激活函數(shù),如tanh??U、V、W:網(wǎng)絡(luò)參數(shù)(RNN共享同一批網(wǎng)絡(luò)參數(shù))??15??
圖3.1獨(dú)熱向量??
【參考文獻(xiàn)】:
期刊論文
[1]基于LSTM深度神經(jīng)網(wǎng)絡(luò)的情感分析方法[J]. 伍行素,陳錦回. 上饒師范學(xué)院學(xué)報(bào). 2018(06)
[2]基于Logistic回歸模型的微博情感分析研究[J]. 馮軍軍,王海沛,賀曉春. 計(jì)算機(jī)與數(shù)字工程. 2018(09)
[3]基于遷移學(xué)習(xí)的分層注意力網(wǎng)絡(luò)情感分析算法[J]. 曲昭偉,王源,王曉茹. 計(jì)算機(jī)應(yīng)用. 2018(11)
[4]基于雙向LSTM語義強(qiáng)化的主題建模[J]. 彭敏,楊紹雄,朱佳暉. 中文信息學(xué)報(bào). 2018(04)
[5]移動(dòng)互聯(lián)網(wǎng)對電商行業(yè)的影響分析[J]. 劉揚(yáng). 產(chǎn)業(yè)與科技論壇. 2017(16)
[6]全國首例淘寶惡意刷單損害競爭對手商譽(yù)被判入罪[J]. 王羽. 上海企業(yè). 2017(02)
[7]分段卷積神經(jīng)網(wǎng)絡(luò)在文本情感分析中的應(yīng)用[J]. 杜昌順,黃磊. 計(jì)算機(jī)工程與科學(xué). 2017(01)
[8]基于深度表示學(xué)習(xí)和高斯過程遷移學(xué)習(xí)的情感分析方法[J]. 吳冬茵,桂林,陳釗,徐睿峰. 中文信息學(xué)報(bào). 2017(01)
[9]基于遷移學(xué)習(xí)微博情緒分類研究——以H7N9微博為例[J]. 周清清,章成志. 情報(bào)學(xué)報(bào). 2016 (04)
[10]特征觀點(diǎn)對購買意愿的影響:在線評論的情感分析方法[J]. 王偉,王洪偉. 系統(tǒng)工程理論與實(shí)踐. 2016(01)
博士論文
[1]基于分布式表示學(xué)習(xí)的文本情感分析[D]. 陳濤.哈爾濱工業(yè)大學(xué) 2018
[2]網(wǎng)絡(luò)傳媒中的情感詞語的強(qiáng)度量化研究[D]. 阿斯力別克(Assylbek Kutlumuratov).華南理工大學(xué) 2017
[3]觀點(diǎn)挖掘中評價(jià)對象抽取方法的研究[D]. 劉倩.東南大學(xué) 2016
[4]文本情感分析中關(guān)鍵問題的研究[D]. 李巖.北京郵電大學(xué) 2014
[5]WEB觀點(diǎn)挖掘中關(guān)鍵問題的研究[D]. 李思.北京郵電大學(xué) 2012
碩士論文
[1]基于深度學(xué)習(xí)的中文分詞模型應(yīng)用研究[D]. 解宇涵.重慶大學(xué) 2017
[2]面向電商評論細(xì)粒度觀點(diǎn)挖掘的拓展主題模型研究[D]. 鄭玉桂.浙江工商大學(xué) 2017
[3]基于云模型理論的LDA最大熵模型觀點(diǎn)挖掘研究[D]. 司琪.華中師范大學(xué) 2016
[4]評論文本情感分析算法的研究[D]. 袁磊.合肥工業(yè)大學(xué) 2016
[5]基于詞性與LDA主題模型的文本分類技術(shù)研究[D]. 張勇.安徽大學(xué) 2016
[6]基于字的分詞方法的研究與實(shí)現(xiàn)[D]. 游治勇.電子科技大學(xué) 2015
[7]基于句法分析和主題建模的細(xì)粒度觀點(diǎn)挖掘模型研究[D]. 王曉偉.浙江大學(xué) 2013
[8]基于Web的汽車產(chǎn)品評論觀點(diǎn)挖掘方法研究[D]. 宋曉雷.山西大學(xué) 2010
[9]中文詞性標(biāo)注的研究與實(shí)現(xiàn)[D]. 張衛(wèi).南京師范大學(xué) 2007
本文編號(hào):3058869
【文章來源】:南京大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1線性鏈條件隨機(jī)場??
的文本序列處理為等長的表示(輸出)向量,或者將表示向量合并、相加處理成??定長的表不(輸出)向量。??可以使用X來表示網(wǎng)絡(luò)輸入向量序列xu....,xn。如圖2.3左所示,將整個(gè)網(wǎng)??絡(luò)看成A,每個(gè)時(shí)刻t輸入向量為xt,并循環(huán)輸入上個(gè)時(shí)刻歷史信息,最終網(wǎng)絡(luò)??t時(shí)刻輸出ht,并在下一個(gè)時(shí)刻同樣的方式輸出h1+i。??ht?=?=?tanhCVK^/it,!?+?Wxhxt?+?b)?(公式?2.6)??除去網(wǎng)絡(luò)中的循環(huán)結(jié)構(gòu),該網(wǎng)絡(luò)很像一組全連接網(wǎng)絡(luò)。拆開這個(gè)網(wǎng)絡(luò),則可??以更清除地看出RNN與全連接網(wǎng)絡(luò)的不同之處。如圖2.3右,展幵之后可以發(fā)??現(xiàn)該網(wǎng)絡(luò)與序列地天然聯(lián)系,對此聯(lián)系可以用數(shù)學(xué)公式進(jìn)行表示。??yt?=?g(Vht)?(公式?2_7)??各參數(shù)說明如下:??Xt:?t時(shí)刻的輸入??St:?t時(shí)刻隱藏狀態(tài)??g:激活函數(shù),如tanh??U、V、W:網(wǎng)絡(luò)參數(shù)(RNN共享同一批網(wǎng)絡(luò)參數(shù))??15??
圖3.1獨(dú)熱向量??
【參考文獻(xiàn)】:
期刊論文
[1]基于LSTM深度神經(jīng)網(wǎng)絡(luò)的情感分析方法[J]. 伍行素,陳錦回. 上饒師范學(xué)院學(xué)報(bào). 2018(06)
[2]基于Logistic回歸模型的微博情感分析研究[J]. 馮軍軍,王海沛,賀曉春. 計(jì)算機(jī)與數(shù)字工程. 2018(09)
[3]基于遷移學(xué)習(xí)的分層注意力網(wǎng)絡(luò)情感分析算法[J]. 曲昭偉,王源,王曉茹. 計(jì)算機(jī)應(yīng)用. 2018(11)
[4]基于雙向LSTM語義強(qiáng)化的主題建模[J]. 彭敏,楊紹雄,朱佳暉. 中文信息學(xué)報(bào). 2018(04)
[5]移動(dòng)互聯(lián)網(wǎng)對電商行業(yè)的影響分析[J]. 劉揚(yáng). 產(chǎn)業(yè)與科技論壇. 2017(16)
[6]全國首例淘寶惡意刷單損害競爭對手商譽(yù)被判入罪[J]. 王羽. 上海企業(yè). 2017(02)
[7]分段卷積神經(jīng)網(wǎng)絡(luò)在文本情感分析中的應(yīng)用[J]. 杜昌順,黃磊. 計(jì)算機(jī)工程與科學(xué). 2017(01)
[8]基于深度表示學(xué)習(xí)和高斯過程遷移學(xué)習(xí)的情感分析方法[J]. 吳冬茵,桂林,陳釗,徐睿峰. 中文信息學(xué)報(bào). 2017(01)
[9]基于遷移學(xué)習(xí)微博情緒分類研究——以H7N9微博為例[J]. 周清清,章成志. 情報(bào)學(xué)報(bào). 2016 (04)
[10]特征觀點(diǎn)對購買意愿的影響:在線評論的情感分析方法[J]. 王偉,王洪偉. 系統(tǒng)工程理論與實(shí)踐. 2016(01)
博士論文
[1]基于分布式表示學(xué)習(xí)的文本情感分析[D]. 陳濤.哈爾濱工業(yè)大學(xué) 2018
[2]網(wǎng)絡(luò)傳媒中的情感詞語的強(qiáng)度量化研究[D]. 阿斯力別克(Assylbek Kutlumuratov).華南理工大學(xué) 2017
[3]觀點(diǎn)挖掘中評價(jià)對象抽取方法的研究[D]. 劉倩.東南大學(xué) 2016
[4]文本情感分析中關(guān)鍵問題的研究[D]. 李巖.北京郵電大學(xué) 2014
[5]WEB觀點(diǎn)挖掘中關(guān)鍵問題的研究[D]. 李思.北京郵電大學(xué) 2012
碩士論文
[1]基于深度學(xué)習(xí)的中文分詞模型應(yīng)用研究[D]. 解宇涵.重慶大學(xué) 2017
[2]面向電商評論細(xì)粒度觀點(diǎn)挖掘的拓展主題模型研究[D]. 鄭玉桂.浙江工商大學(xué) 2017
[3]基于云模型理論的LDA最大熵模型觀點(diǎn)挖掘研究[D]. 司琪.華中師范大學(xué) 2016
[4]評論文本情感分析算法的研究[D]. 袁磊.合肥工業(yè)大學(xué) 2016
[5]基于詞性與LDA主題模型的文本分類技術(shù)研究[D]. 張勇.安徽大學(xué) 2016
[6]基于字的分詞方法的研究與實(shí)現(xiàn)[D]. 游治勇.電子科技大學(xué) 2015
[7]基于句法分析和主題建模的細(xì)粒度觀點(diǎn)挖掘模型研究[D]. 王曉偉.浙江大學(xué) 2013
[8]基于Web的汽車產(chǎn)品評論觀點(diǎn)挖掘方法研究[D]. 宋曉雷.山西大學(xué) 2010
[9]中文詞性標(biāo)注的研究與實(shí)現(xiàn)[D]. 張衛(wèi).南京師范大學(xué) 2007
本文編號(hào):3058869
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3058869.html
最近更新
教材專著