基于DeepLearning4J的商品中文評(píng)論情感分類系統(tǒng)的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-06-22 10:46
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展和逐漸成熟,互聯(lián)網(wǎng)技術(shù)極大地改善了人們的生活方式。現(xiàn)在人們足不出戶也能通過電子商務(wù)平臺(tái)購買世界各地的東西,在購買商品的同時(shí),也可以對(duì)所購買商品進(jìn)行評(píng)價(jià)。有效處理分析這些評(píng)論數(shù)據(jù)對(duì)于指導(dǎo)商家改善商品以及幫助用戶快速做出決策都有極大的意義。因此,越來越多的研究人員展開了對(duì)商品評(píng)論進(jìn)行情感分類的研究。目前主流的情感分類研究方法主要分為基于規(guī)則的方法以及基于機(jī)器學(xué)習(xí)的方法。而在具體實(shí)現(xiàn)過程中,基于規(guī)則的方法無法處理不符合規(guī)范的文本,而傳統(tǒng)的機(jī)器學(xué)習(xí)方法需要定義大量情感詞典并且著重于人工特征的選取,具有一定的局限性。隨著深度學(xué)習(xí)的發(fā)展,越來越多的研究人員選擇使用深度學(xué)習(xí)相關(guān)技術(shù)進(jìn)行情感分類的研究,使用深度學(xué)習(xí)能有效提高分類的準(zhǔn)確率并且降低人工成本。但目前商品情感分類系統(tǒng)在結(jié)果展示方面,大多數(shù)都只是簡單展示分類結(jié)果以及語料的詞頻,而不能準(zhǔn)確將評(píng)論數(shù)據(jù)中用戶描述商品的觀點(diǎn)詞進(jìn)行提取及展示,F(xiàn)有很多流行的深度學(xué)習(xí)框架,如TensorFlow、Torch、Caffe、Theano等,這些框架基本都是基于Python或者C/C++開發(fā)的,而那些大量使用Java生態(tài)圈中開源項(xiàng)目進(jìn)行項(xiàng)...
【文章來源】:西南大學(xué)重慶市 211工程院校 教育部直屬院校
【文章頁數(shù)】:72 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
電子商務(wù)平臺(tái)評(píng)論數(shù)據(jù)示例
DeepLearning4J模型訓(xùn)練過程圖
西南大學(xué)工程碩士學(xué)位論文10圖2-2網(wǎng)絡(luò)爬蟲工作流程圖網(wǎng)絡(luò)爬蟲是傳統(tǒng)搜索引擎技術(shù)的一個(gè)重要組件,決定著整個(gè)系統(tǒng)的資源是否豐富,查詢結(jié)果是否全面。網(wǎng)絡(luò)爬蟲一般可分為以下幾個(gè)模塊[47]。·頁面下載負(fù)責(zé)下載互聯(lián)網(wǎng)中的網(wǎng)頁信息,這是網(wǎng)絡(luò)爬蟲的基礎(chǔ),只有先將html頁面下載后才能對(duì)其進(jìn)行進(jìn)一步處理。·鏈接提取對(duì)于已經(jīng)下載的頁面進(jìn)行解析,將其中符合進(jìn)一步爬取要求的URL鏈接提取出來,這是網(wǎng)絡(luò)爬蟲能夠進(jìn)行不間斷爬取的基本前提。·URL管理主要負(fù)責(zé)管理URL,包括對(duì)URL進(jìn)行過濾、去重以及隊(duì)列調(diào)度。·內(nèi)容分析和持久化負(fù)責(zé)將html頁面中所需要提取的文本數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)并對(duì)其進(jìn)行過濾和索引,然后存儲(chǔ)到本地以便進(jìn)行進(jìn)一步分析。2.2.2網(wǎng)絡(luò)爬蟲主流工具Selenium[48]是由thoughtWorks公司開發(fā)的Web自動(dòng)化測(cè)試工具。它像真實(shí)用
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)理論綜述與研究展望[J]. 張沛陽. 網(wǎng)絡(luò)安全技術(shù)與應(yīng)用. 2020(04)
[2]廣義文本情感分析綜述[J]. 楊開漠,吳明芬,陳濤. 計(jì)算機(jī)應(yīng)用. 2019(S2)
[3]中文文本分類方法綜述[J]. 于游,付鈺,吳曉平. 網(wǎng)絡(luò)與信息安全學(xué)報(bào). 2019(05)
[4]基于Self-Attention和Bi-LSTM的中文短文本情感分析[J]. 吳小華,陳莉,魏甜甜,范婷婷. 中文信息學(xué)報(bào). 2019(06)
[5]主題爬蟲技術(shù)研究綜述[J]. 潘曉英,陳柳,余慧敏,趙逸喆,肖康濘. 計(jì)算機(jī)應(yīng)用研究. 2020(04)
[6]基于深度學(xué)習(xí)的中文影評(píng)情感分析[J]. 周敬一,郭燕,丁友東. 上海大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(05)
[7]基于兩種LSTM結(jié)構(gòu)的文本情感分析[J]. 張玉環(huán),錢江. 軟件. 2018(01)
[8]基于混合卡方統(tǒng)計(jì)量與邏輯回歸的文本情感分析[J]. 李平,戴月明,王艷. 計(jì)算機(jī)工程. 2017(12)
[9]基于多注意力卷積神經(jīng)網(wǎng)絡(luò)的特定目標(biāo)情感分析[J]. 梁斌,劉全,徐進(jìn),周倩,章鵬. 計(jì)算機(jī)研究與發(fā)展. 2017(08)
[10]基于Selenium WebDriver的自動(dòng)交互式數(shù)據(jù)采集技術(shù)研究[J]. 侯志江. 圖書情報(bào)導(dǎo)刊. 2017(04)
博士論文
[1]情感詞典構(gòu)建方法及其應(yīng)用研究[D]. 鄧東.北京交通大學(xué) 2019
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的商品評(píng)論情感分析的研究[D]. 周泳東.南京郵電大學(xué) 2019
[2]文本表示算法的研究和應(yīng)用[D]. 李曉鵬.北京郵電大學(xué) 2016
本文編號(hào):3242697
【文章來源】:西南大學(xué)重慶市 211工程院校 教育部直屬院校
【文章頁數(shù)】:72 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
電子商務(wù)平臺(tái)評(píng)論數(shù)據(jù)示例
DeepLearning4J模型訓(xùn)練過程圖
西南大學(xué)工程碩士學(xué)位論文10圖2-2網(wǎng)絡(luò)爬蟲工作流程圖網(wǎng)絡(luò)爬蟲是傳統(tǒng)搜索引擎技術(shù)的一個(gè)重要組件,決定著整個(gè)系統(tǒng)的資源是否豐富,查詢結(jié)果是否全面。網(wǎng)絡(luò)爬蟲一般可分為以下幾個(gè)模塊[47]。·頁面下載負(fù)責(zé)下載互聯(lián)網(wǎng)中的網(wǎng)頁信息,這是網(wǎng)絡(luò)爬蟲的基礎(chǔ),只有先將html頁面下載后才能對(duì)其進(jìn)行進(jìn)一步處理。·鏈接提取對(duì)于已經(jīng)下載的頁面進(jìn)行解析,將其中符合進(jìn)一步爬取要求的URL鏈接提取出來,這是網(wǎng)絡(luò)爬蟲能夠進(jìn)行不間斷爬取的基本前提。·URL管理主要負(fù)責(zé)管理URL,包括對(duì)URL進(jìn)行過濾、去重以及隊(duì)列調(diào)度。·內(nèi)容分析和持久化負(fù)責(zé)將html頁面中所需要提取的文本數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)并對(duì)其進(jìn)行過濾和索引,然后存儲(chǔ)到本地以便進(jìn)行進(jìn)一步分析。2.2.2網(wǎng)絡(luò)爬蟲主流工具Selenium[48]是由thoughtWorks公司開發(fā)的Web自動(dòng)化測(cè)試工具。它像真實(shí)用
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)理論綜述與研究展望[J]. 張沛陽. 網(wǎng)絡(luò)安全技術(shù)與應(yīng)用. 2020(04)
[2]廣義文本情感分析綜述[J]. 楊開漠,吳明芬,陳濤. 計(jì)算機(jī)應(yīng)用. 2019(S2)
[3]中文文本分類方法綜述[J]. 于游,付鈺,吳曉平. 網(wǎng)絡(luò)與信息安全學(xué)報(bào). 2019(05)
[4]基于Self-Attention和Bi-LSTM的中文短文本情感分析[J]. 吳小華,陳莉,魏甜甜,范婷婷. 中文信息學(xué)報(bào). 2019(06)
[5]主題爬蟲技術(shù)研究綜述[J]. 潘曉英,陳柳,余慧敏,趙逸喆,肖康濘. 計(jì)算機(jī)應(yīng)用研究. 2020(04)
[6]基于深度學(xué)習(xí)的中文影評(píng)情感分析[J]. 周敬一,郭燕,丁友東. 上海大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(05)
[7]基于兩種LSTM結(jié)構(gòu)的文本情感分析[J]. 張玉環(huán),錢江. 軟件. 2018(01)
[8]基于混合卡方統(tǒng)計(jì)量與邏輯回歸的文本情感分析[J]. 李平,戴月明,王艷. 計(jì)算機(jī)工程. 2017(12)
[9]基于多注意力卷積神經(jīng)網(wǎng)絡(luò)的特定目標(biāo)情感分析[J]. 梁斌,劉全,徐進(jìn),周倩,章鵬. 計(jì)算機(jī)研究與發(fā)展. 2017(08)
[10]基于Selenium WebDriver的自動(dòng)交互式數(shù)據(jù)采集技術(shù)研究[J]. 侯志江. 圖書情報(bào)導(dǎo)刊. 2017(04)
博士論文
[1]情感詞典構(gòu)建方法及其應(yīng)用研究[D]. 鄧東.北京交通大學(xué) 2019
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的商品評(píng)論情感分析的研究[D]. 周泳東.南京郵電大學(xué) 2019
[2]文本表示算法的研究和應(yīng)用[D]. 李曉鵬.北京郵電大學(xué) 2016
本文編號(hào):3242697
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3242697.html
最近更新
教材專著