天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 經濟論文 > 電子商務論文 >

面向評論的文本傾向性分析中關鍵問題的研究

發(fā)布時間:2018-06-14 12:54

  本文選題:文本傾向 + 特征聚類; 參考:《北京化工大學》2016年碩士論文


【摘要】:如今,我國電子商務已經極其普遍,淘寶、京東等大型購物網站已經占據了大部分市場。面對大量產品評論,企業(yè)為了獲取商業(yè)收益以及消費者更好地做出購買決策,需要了解用戶對產品的態(tài)度、觀點。利用人力去標注文本情感,費力費時,因此需利用計算機實現自動分析文本的情感傾向,這種技術稱為文本傾向性分析。如今,該技術取得了很多研究成果。本文的研究重點為對現有的文本傾向性分析方法中存在的關鍵問題進行探索。在基于機器學習的文本傾向性分析中,重點研究由于訓練、測試文本不在同一個領域引起的準確率低的問題。針對文本分類中特征降維環(huán)節(jié),提出一種基于通用領域框架的特征聚類算法。針對基于加權SimRank跨領域文本傾向性方法中,存在的兩個領域特征對齊時,在共現加權時未能考慮近義詞的問題,提出將基于通用領域框架的特征聚類應用于該方法。實驗表明,在保證了準確率的前提下,節(jié)省了內存空間,緩解了數據稀疏問題。在基于語義的文本傾向性分析中,重點研究詞語傾向性計算問題。針對常用的詞語傾向計算方法中,存在過于依賴知識庫以及不能準確挖掘語義關系問題,本文提出一種基于詞向量的領域情感詞傾向性計算方法。該方法面向對象為領域情感詞,即在特定領域下經常出現且具有明顯情感的詞語;贕oogle的word2vec工具,其通過神經網絡進行學習得到詞向量,將向量之間余弦距離作為詞的相近程度度量方式,衡量詞語與基準詞相近程度,進而判斷其傾向性。實驗表明該方法有領域適應性,且準確率高。
[Abstract]:Nowadays, e-commerce in China has been extremely common, Taobao, JingDong and other large shopping sites have occupied most of the market. In the face of a large number of product reviews, enterprises need to understand the attitudes and viewpoints of customers in order to obtain business profits and make better purchase decisions. It is difficult and time-consuming to use manpower to label text emotion, so it is necessary to use computer to realize automatic analysis of text emotional tendency. This technique is called text orientation analysis. Today, the technology has made a lot of research results. The research focus of this paper is to explore the key problems in the existing text orientation analysis methods. In text orientation analysis based on machine learning, this paper focuses on the problem of low accuracy caused by the fact that the test text is not in the same domain because of training. A feature clustering algorithm based on general domain framework is proposed for feature dimensionality reduction in text classification. In the weighted SimRank cross-domain text orientation method, when the two domain features are aligned, the synonyms are not considered when they are weighted together, so the feature clustering based on the general domain framework is applied to this method. Experiments show that the memory space is saved and the problem of data sparsity is alleviated. In semantic-based text orientation analysis, the emphasis is placed on word orientation calculation. In order to solve the problem of relying too much on the knowledge base and not mining the semantic relation accurately in the common methods of word tendency calculation, this paper proposes a method for calculating the tendency of domain affective words based on word vector. This method is object oriented for domain affective words, that is, words that often appear in specific fields and have obvious emotions. Based on the word2vec tool, the word vector is obtained by using neural network. The cosine distance between the vectors is regarded as the measure of the degree of similarity between the words, and the similarity between the words and the reference words is measured, and then the tendency of the word is judged. Experiments show that the method is domain adaptive and has high accuracy.
【學位授予單位】:北京化工大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1

【相似文獻】

相關期刊論文 前10條

1 劉建毅;王菁華;王樅;;文本網絡表示研究與應用[J];中國科技論文在線;2007年10期

2 吳思竹;張智雄;錢慶;;基于語言網絡的文本表示模型研究[J];情報科學;2013年12期

3 于屏方;杜家利;;文本排歧語義圖式的自動獲取與選擇[J];計算機工程與應用;2007年31期

4 陳燕敏;樓喜中;;一種基于集聚確定文本意向結構的方法[J];微計算機信息;2010年18期

5 袁鼎榮;鐘寧;張師超;;文本信息處理研究述評[J];計算機科學;2011年02期

6 林鴻飛,戰(zhàn)學剛,姚天順;文本層次分析與文本瀏覽[J];中文信息學報;1999年04期

7 姚天f ;“自然語言多語種文本生成系統(tǒng)”在上海交通大學研制成功[J];中文信息學報;1999年04期

8 石晶;;文本分割綜述[J];計算機工程與應用;2006年35期

9 劉紅紅;安海忠;高湘昀;;基于文本復雜網絡的內容結構特征分析[J];現代圖書情報技術;2011年01期

10 張曉龍,,姚天順;基于文本句法的文本生成模型[J];武漢鋼鐵學院學報;1995年01期

相關會議論文 前6條

1 楊艷;李巍;玄萍;;數字圖書館中基于Ontology的文本模型[A];黑龍江省計算機學會2009年學術交流年會論文集[C];2010年

2 唐云廷;;基于TSBT(Text Structure Binary Tree)的文本結構的自動分析[A];第三屆全國信息檢索與內容安全學術會議論文集[C];2007年

3 海麗且木·艾沙;維尼拉·木沙江;;Web文本分類及其維、哈、柯多文種信息檢索中的應用研究[A];少數民族青年自然語言處理技術研究與進展——第三屆全國少數民族青年自然語言信息處理、第二屆全國多語言知識庫建設聯合學術研討會論文集[C];2010年

4 劉玲;周經野;羅慧慧;;基于XML的文本規(guī)劃方法[A];2005年全國理論計算機科學學術年會論文集[C];2005年

5 蘇貴洋 ;李建華 ;馬穎華;;XML統(tǒng)一文本自動處理描述接口[A];NCIRCS2004第一屆全國信息檢索與內容安全學術會議論文集[C];2004年

6 揭春雨;劉曉月;冼景炬;衛(wèi)真道;;從網絡獲取香港法律雙語語料庫[A];全國第八屆計算語言學聯合學術會議(JSCL-2005)論文集[C];2005年

相關博士學位論文 前10條

1 方瑩;面向熱點新聞話題的文本處理技術研究[D];北京理工大學;2015年

2 鳳麗洲;文本分類關鍵技術及應用研究[D];吉林大學;2015年

3 李巖;基于深度學習的短文本分析與計算方法研究[D];北京科技大學;2016年

4 程齊凱;學術文本的詞匯功能識別[D];武漢大學;2015年

5 劉赫;文本分類中若干問題研究[D];吉林大學;2009年

6 賴彥;新聞話語對話性的文本分析與闡釋[D];南京師范大學;2011年

7 鐘茂生;基于內容相關度計算的文本結構分析方法研究[D];上海交通大學;2010年

8 廖一星;文本分類及其特征降維研究[D];浙江大學;2012年

9 單建芳;面向事件的文本表示研究[D];上海大學;2012年

10 孫巧榆;復雜背景圖像的文本信息提取研究[D];華東師范大學;2012年

相關碩士學位論文 前10條

1 江長柱;用戶咨詢文本的語義相似度計算方法研究[D];江蘇科技大學;2015年

2 李欣;基于維度判別的文本情感聚類方法研究[D];山西大學;2015年

3 黃志鋒;中職語文教學“反文本”傾向探究[D];寧波大學;2015年

4 李麗娜;基于BIM的建設項目文本信息集成管理研究[D];大連理工大學;2015年

5 葛文鎮(zhèn);面向微博的短文本多分類研究[D];寧波大學;2015年

6 郭蘇穎;文本難度對高職高專生閱讀理解的影響研究[D];閩南師范大學;2015年

7 袁媛;基于半監(jiān)督學習的短文本分類研究[D];西北師范大學;2015年

8 劉茜茜;病理鏡檢文本的結構化處理系統(tǒng)設計與實現[D];東華大學;2016年

9 高士林;圖像中的文本定位技術研究[D];解放軍信息工程大學;2014年

10 肖誠求;自然場景圖像中文本提取技術研究[D];解放軍信息工程大學;2015年



本文編號:2017457

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/2017457.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶53aa8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com