天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于深度學習的虛假評論識別方法研究

發(fā)布時間:2018-06-09 21:14

  本文選題:虛假評論識別 + 深度學習。 參考:《哈爾濱工業(yè)大學》2017年碩士論文


【摘要】:隨著互聯(lián)網(wǎng)和移動終端的發(fā)展,電子商務(wù)成為日常生活中不可或缺的部分,隨之而來的是商品信息、用戶評論數(shù)量的飛速增長。其中用戶的評論在電子商務(wù)中起到至關(guān)重要的作用,因為在網(wǎng)絡(luò)購物中用戶將商品評論作為衡量商品質(zhì)量的參考資源,會左右消費者的決定。所以出于利益商家會雇傭?qū)I(yè)寫手為自家商品撰寫好評或為競爭對手撰寫差評,對電子商務(wù)平臺的生態(tài)發(fā)展造成了嚴重的影響,F(xiàn)有研究表明,人工識別這類虛假評論的水平較低。為了有效識別這類評論,一些學者使用基于淺層、顯性語義特征的方法,取得了一定成果。而深度學習方法可以挖掘深層次的語義特征,在識別虛假評論任務(wù)上,本文將深度學習方法作為研究重點。本文研究內(nèi)容歸納為以下四點:(1)基于傳統(tǒng)模型方法的虛假評論識別。在傳統(tǒng)方法模型中采用了四種分類器,針對虛假評論語料的特點,提出文本特征、情感傾向性特征、心理學特征、句法相關(guān)特征四大類特征。采用了多模型投票策略,實驗效果超過基線方法。(2)半監(jiān)督學習算法擴充語料。針對虛假評論語料匱乏的情況,首先利用爬蟲程序爬取評論資源,然后采用一種半監(jiān)督學習算法,根據(jù)少量已標注的語料,從爬蟲數(shù)據(jù)集中抽取置信度高的點評加入語料庫。(3)基于深度學習模型的虛假評論識別。在虛假評論識別任務(wù)上,使用詞向量作為輸入,在LSTM、雙向LSTM與CNN模型上進行實驗,并嘗試上述模型的融合實驗。實驗結(jié)果表明CNN與LSTM混合模型的效果最佳,準確率較基線方法提升2個百分點。(4)融合Attention機制的虛假評論識別。本文實現(xiàn)了兩種Attention機制,分別為前饋式注意力模型和基于上下文的注意力模型。注意力機制對句子中單詞的重要性進行區(qū)分,利用注意力權(quán)重得到更加準確的句子表示。將注意力機制應(yīng)用在LSTM模型和LSTM與CNN的混合模型,進一步提升了準確率。
[Abstract]:With the development of the Internet and mobile terminals, e-commerce has become an indispensable part of daily life, followed by the rapid increase in the number of commodity information and user comments. Users' comments play an important role in electronic commerce, because in online shopping, users use commodity reviews as a reference resource to measure the quality of goods, which will influence consumers' decisions. Therefore, for the benefit of the business will hire professional writers for their own products to write praise or for competitors to write bad comments, e-commerce platform ecological development has a serious impact. Existing studies show that the level of manual identification of such false comments is low. In order to identify this kind of comment effectively, some scholars have made some achievements by using the method based on shallow and dominant semantic features. However, the deep learning method can mine the deep semantic features. In the task of identifying false comments, this paper focuses on the depth learning method. The research content of this paper is summarized as follows: 4 points: 1) false comment recognition based on traditional model method. Four kinds of classifiers are used in the traditional method model. According to the characteristics of false comment corpus, the text feature, emotional tendency feature, psychological feature and syntactic correlation feature are proposed. A multi-model voting strategy is adopted, and the experimental results exceed the baseline method. 2) the semi-supervised learning algorithm expands the corpus. In view of the shortage of false comment corpus, the crawler program is used to crawl the comment resource, and then a semi-supervised learning algorithm is adopted, according to a small number of tagged corpus. Extracted from reptile data sets, comments with high confidence are added to Corpus. 3) false comment recognition based on depth learning model. In the task of false comment recognition, we use word vector as input, experiment on LSTM, bidirectional LSTM and CNN model, and try the fusion experiment of the above model. The experimental results show that the mixed model of CNN and LSTM has the best effect, and the accuracy is 2% higher than the baseline method. In this paper, two kinds of Attention mechanisms are implemented, which are feedforward attention model and context-based attention model. The attention mechanism distinguishes the importance of the words in a sentence and uses the attention weight to obtain a more accurate sentence representation. The attention mechanism is applied to the LSTM model and the mixed model of LSTM and CNN, which further improves the accuracy.
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.1

【相似文獻】

相關(guān)期刊論文 前10條

1 李明;楊艷屏;占惠融;;基于局部聚類與圖方法的半監(jiān)督學習算法[J];自動化學報;2010年12期

2 楊南海;黃明明;赫然;王秀坤;;基于最大相關(guān)熵準則的魯棒半監(jiān)督學習算法[J];軟件學報;2012年02期

3 陳志民;薛月菊;楊敬鋒;葉志嬋;陳劍虹;;半監(jiān)督學習算法在農(nóng)用地分等中的應(yīng)用[J];計算機工程與設(shè)計;2008年23期

4 李凱;馬紅艷;楊楠;陳新勇;;半監(jiān)督學習算法的收斂性及其在人臉識別中的應(yīng)用[J];河北大學學報(自然科學版);2011年01期

5 繆志敏;胡谷雨;趙陸文;陳彥德;;一種基于支持向量數(shù)據(jù)描述的半監(jiān)督學習算法[J];解放軍理工大學學報(自然科學版);2010年01期

6 陳錦秀;姬東鴻;;基于圖的半監(jiān)督關(guān)系抽取[J];軟件學報;2008年11期

7 任亞峰;姬東鴻;尹蘭;;基于半監(jiān)督學習算法的虛假評論識別研究[J];四川大學學報(工程科學版);2014年03期

8 許震;沙朝鋒;王曉玲;周傲英;;基于KL距離的非平衡數(shù)據(jù)半監(jiān)督學習算法[J];計算機研究與發(fā)展;2010年01期

9 劉德山;孫麗;閆德勤;;一種基因數(shù)據(jù)分析的半監(jiān)督學習算法[J];微型機與應(yīng)用;2014年12期

10 王江;張惠源;李芳;張兵文;李鵬;;腦機接口中半監(jiān)督學習算法研究[J];電子測量技術(shù);2014年05期

相關(guān)會議論文 前10條

1 沈樂君;;基于混合模型的多目標實時跟蹤算法[A];2013體育計算機應(yīng)用論文集[C];2013年

2 紀琳;黃震宇;;中頻振動混合模型理論的應(yīng)用局限性分析[A];現(xiàn)代振動與噪聲技術(shù)(第九卷)[C];2011年

3 汪傳建;李曉光;王大玲;于戈;;一種基于混合模型的文本分類器的研究與實現(xiàn)[A];第二十一屆中國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2004年

4 付麗麗;王瑞芳;;我國籃球碩士學位論文的共詞聚類分析[A];第九屆全國體育科學大會論文摘要匯編(4)[C];2011年

5 崔玉平;董筱文;;教育經(jīng)濟與管理專業(yè)碩士學位論文的內(nèi)容分析[A];江蘇省高等教育學會教育經(jīng)濟研究委員會成立大會暨第一屆江蘇省教育經(jīng)濟學術(shù)年會論文集[C];2013年

6 鄭凱;;建立多維數(shù)據(jù)異常點識別方法的嘗試[A];第八屆全國體育科學大會論文摘要匯編(一)[C];2007年

7 張朋柱;韓崇昭;萬百五;;智能決策支持系統(tǒng)中的問題識別方法與實現(xiàn)[A];全國青年管理科學與系統(tǒng)科學論文集(第2卷)[C];1993年

8 劉麗蘭;劉宏昭;;時間序列模型的識別方法[A];制造技術(shù)自動化學術(shù)會議論文集[C];2004年

9 苗振偉;許勇;楊軍;;超聲波人臉識別方法研究[A];中國聲學學會2007年青年學術(shù)會議論文集(上)[C];2007年

10 徐斌;馬盡文;;一種柯西混合模型上梯度型BYY和諧學習算法[A];第十三屆全國信號處理學術(shù)年會(CCSP-2007)論文集[C];2007年

相關(guān)重要報紙文章 前10條

1 張瑩;360安全中心號召網(wǎng)友簽名要求CNN向中國人民道歉[N];中國新聞出版報;2008年

2 資深媒體人士 安替;謹記CNN遠不只是放國家形象廣告[N];東方早報;2010年

3 卞普易;韓國世界首個CNN咖啡館開業(yè)[N];中國食品安全報;2011年

4 孫浩;從CNN烏龍看傳統(tǒng)媒體的危與機[N];新華每日電訊;2013年

5 國際問題專家 華益聲;CNN淪為暴力恐怖幫兇[N];人民日報海外版;2013年

6 新華社記者 劉順 操風琴;中東CNN探訪“半島”電視臺[N];新華每日電訊;2002年

7 資深媒體人士 安替;CNN新聞全球化就是新聞美國化[N];東方早報;2009年

8 記者 劉倩;全球知名媒體CNN將全程報道論壇盛況[N];桂林日報;2012年

9 記者 姜微 陸文軍;CNN:中國驅(qū)動全球汽車產(chǎn)業(yè)[N];新華每日電訊;2009年

10 Julie Battilana Matthew Lee John Walker Cheryl Dorsey 翻譯 譚立立;營利與非營利組織的理想混合模型(下篇)[N];21世紀經(jīng)濟報道;2012年

相關(guān)博士學位論文 前10條

1 楊南海;魯棒半監(jiān)督學習算法及在生物統(tǒng)計中的應(yīng)用研究[D];大連理工大學;2015年

2 鄧超;基于“合作—參與”計算認知模型的半監(jiān)督學習算法研究與應(yīng)用[D];哈爾濱工業(yè)大學;2009年

3 熊杰;基于混合模型的腫瘤組學數(shù)據(jù)聚類研究[D];湖南師范大學;2016年

4 李斌;概率混合模型的研究及其應(yīng)用[D];復旦大學;2009年

5 王先文;基于偏斜t混合模型的流式數(shù)據(jù)細胞類群自動識別算法研究[D];中國人民解放軍軍事醫(yī)學科學院;2015年

6 李少亭;帶有輔助信息的混合模型及其應(yīng)用[D];東北師范大學;2014年

7 陳思寶;基于t-混合模型和擴展保局投影的聚類與降維方法研究[D];安徽大學;2006年

8 趙國騰;跨座式單軌交通軌道梁表面裂紋識別方法研究[D];重慶大學;2015年

9 徐訓;線性與非線性結(jié)構(gòu)動力荷載識別方法及實驗研究[D];哈爾濱工業(yè)大學;2015年

10 黃仕建;視頻序列中人體行為的低秩表達與識別方法研究[D];重慶大學;2015年

相關(guān)碩士學位論文 前10條

1 張恒;基于深度學習的虛假評論識別方法研究[D];哈爾濱工業(yè)大學;2017年

2 萬小強;短信自動分類系統(tǒng)的研究與實現(xiàn)[D];東華大學;2017年

3 李玉嬌;半監(jiān)督學習算法的魯棒性研究[D];華南理工大學;2016年

4 宿洪祿;結(jié)構(gòu)半監(jiān)督學習算法及其應(yīng)用研究[D];蘇州大學;2010年

5 占惠融;基于圖的半監(jiān)督學習算法研究[D];華中科技大學;2009年

6 魏征麗;基于圖半監(jiān)督學習算法的研究及應(yīng)用[D];西安電子科技大學;2012年

7 徐寒香;一種基于李群的半監(jiān)督學習算法及應(yīng)用研究[D];蘇州大學;2009年

8 徐培培;基于LNP的半監(jiān)督學習算法[D];西安電子科技大學;2009年

9 常瑜;基于Tri-training的半監(jiān)督學習算法研究[D];山西大學;2012年

10 王軼初;基于集成學習的半監(jiān)督學習算法研究[D];西安電子科技大學;2011年

,

本文編號:2000851

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2000851.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶825d8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com