基于意見挖掘的網絡評論動態(tài)分析方法
發(fā)布時間:2017-04-03 02:01
本文關鍵詞:基于意見挖掘的網絡評論動態(tài)分析方法,由筆耕文化傳播整理發(fā)布。
【摘要】:近年來,各種基于互聯(lián)網及移動終端的技術發(fā)展使得商業(yè)數據不斷信息化并向互聯(lián)網終端匯集。通過數據挖掘,能夠將網絡商品交易數據充分利用,提供商業(yè)決策的關鍵信息。近來,數據挖掘技術在電商推薦系統(tǒng)、客戶關系管理系統(tǒng)等應用中有著相當廣泛的應用,也是越來越多管理者采取的新型而高效的業(yè)務處理方式。數據挖掘和商務智能結合數據統(tǒng)計分析處理、數據集成、有效信息轉化等方法對商品交易數據、用戶反饋數據進行搜集,利用相應的機器學習、統(tǒng)計分析和關聯(lián)規(guī)則等技術對數據進行處理,并根據分析結果了解產品的銷售信息,確定用戶的反饋意見以及用戶的觀點和情感變化,從而提高市場占有率,提升對市場的響應速度。 當代電商業(yè)務發(fā)展與數據挖掘的研究著重于將網絡商業(yè)數據轉換成為對業(yè)務有用的知識。同時,不斷改進數據挖掘的算法,設計出針對具體應用的信息處理系統(tǒng),得出準確的挖掘結果來表征商業(yè)數據中的隱藏知識,也是近年來數據挖掘的熱點。 與此同時,互聯(lián)網也成為人們發(fā)布與分享意見、觀點的一個重要媒介,意見挖掘技術也廣泛地被研究和應用到這些信息資源上。而隨著互聯(lián)網及移動互聯(lián)的飛速發(fā)展,網絡交易、評論數據呈爆炸式增長之勢。面對如此海量、繁雜及不斷更新、動態(tài)變化的網絡信息資源,傳統(tǒng)的文本挖掘技術顯然已經不能滿足互聯(lián)網動態(tài)內容的高維度、大數據、動態(tài)更新處理的要求。 對此,本文以商業(yè)領域需求為背景,提出了一種基于意見挖掘的網絡評論動態(tài)分析方法。這種方法不僅能夠對大量的網絡評論數據行進動態(tài)更新處理,同時能夠對用戶評論文本進行分解歸類,識別用戶在不同時間段內對產品相關屬性的關注程度,并且自動歸納出用戶對于相關屬性的情感傾向,得到產品待宣傳和改進的屬性。同時,能夠動態(tài)更新挖掘結果,最終將挖掘結果清晰地展示給管理者,使他們了解人們對某個事物的關注熱點及看法態(tài)度,便于更好地制定商業(yè)決策。 本文以時間窗口模型和文本特征提取技術為理論指導。歸納提取產品屬性,并對相應屬性的情感傾向進行分類總結。實驗結果表明本文的方法在動態(tài)分析上非常有效。該算法不僅能給出較為準確的分類結果,同時能夠動態(tài)地反映用戶觀點的變化,自動識別出值得關注的產品特征信息。
【關鍵詞】:意見挖掘 網絡評論 文本特征 情感傾向
【學位授予單位】:中國科學技術大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP391.1
【目錄】:
- 摘要5-6
- ABSTRACT6-11
- 第一章 緒論11-19
- 1.1 研究背景及意義11-13
- 1.1.1 研究背景11-12
- 1.1.2 研究意義12-13
- 1.2 研究現(xiàn)狀13-16
- 1.2.1 國內研究現(xiàn)狀13-14
- 1.2.2 國外研究現(xiàn)狀14-16
- 1.3 論文主要工作和結構安排16-19
- 1.3.1 論文主要工作16-17
- 1.3.2 論文結構安排17-19
- 第二章 文本挖掘技術簡介19-29
- 2.1 文本挖掘概述19-21
- 2.1.1 文本挖掘基本概念19
- 2.1.2 文本挖掘流程19-20
- 2.1.3 文本挖掘技術分類20-21
- 2.2 文本預處理21-24
- 2.2.1 特征選擇21-23
- 2.2.2 文本表示23-24
- 2.3 文本分類算法24-27
- 2.3.1 簡單向量距離分類算法24
- 2.3.2 K近鄰算法24-25
- 2.3.3 樸素貝葉斯算法25-26
- 2.3.4 支持向量機(Support Vector Machine)26-27
- 2.4 文本聚類算法27-28
- 2.4.1 文本聚類概述27
- 2.4.2 k-means算法27-28
- 2.4.3 層次聚類方法28
- 2.5 本章小結28-29
- 第三章 意見挖掘與動態(tài)網絡環(huán)境29-35
- 3.1 意見挖掘的概念與任務29-30
- 3.2 意見挖掘步驟與意義30-32
- 3.2.1 意見挖掘具體步驟30-31
- 3.2.2 意見挖掘的意義31-32
- 3.3 動態(tài)網絡環(huán)境下的意見挖掘32-34
- 3.3.1 網絡評論的特殊性32-33
- 3.3.2 意見挖掘技術在動態(tài)網絡環(huán)境下的特征33-34
- 3.4 本章小結34-35
- 第四章 網絡評論動態(tài)分析方法35-49
- 4.1 方法概述35-37
- 4.1.1 總體框架36
- 4.1.2 模塊介紹36-37
- 4.2 評論文本的采集37
- 4.3 評論文本的預處理37-39
- 4.3.1 文本的合并及分割38
- 4.3.2 文本分詞及詞性標注38-39
- 4.4 評論文本的特征提取及情感傾向分類39-41
- 4.4.1 頻繁詞匯的識別39-40
- 4.4.2 緊湊型檢驗和冗余檢驗40
- 4.4.3 產品特征-情感傾向組合提取40-41
- 4.5 評論文本的動態(tài)分析41-47
- 4.5.1 參數和定義41-44
- 4.5.2 動態(tài)意見分析算法及步驟44-47
- 4.6 本章小結47-49
- 第五章 實驗與分析49-57
- 5.1 數據來源49
- 5.2 特征提取分析49-50
- 5.3 意見演變分析50-55
- 5.4 本章小結55-57
- 第六章 總結與展望57-59
- 6.1 總結57
- 6.2 展望57-59
- 參考文獻59-63
- 致謝63-65
- 在讀期間發(fā)表的學術論文與取得的其他研究成果65
【參考文獻】
中國期刊全文數據庫 前8條
1 婁德成;姚天f ;;漢語句子語義極性分析和觀點抽取方法的研究[J];計算機應用;2006年11期
2 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語義傾向計算[J];中文信息學報;2006年01期
3 徐琳宏;林鴻飛;楊志豪;;基于語義理解的文本傾向性識別機制[J];中文信息學報;2007年01期
4 姚天f ;婁德成;;漢語語句主題語義傾向分析方法的研究[J];中文信息學報;2007年05期
5 徐琳宏;林鴻飛;趙晶;;情感語料庫的構建和分析[J];中文信息學報;2008年01期
6 姚天f ;程希文;徐飛玉;漢思·烏思克爾特;王睿;;文本意見挖掘綜述[J];中文信息學報;2008年03期
7 劉全升;姚天f ;黃高輝;劉軍;宋鴻彥;;漢語意見型主觀性文本類型體系的研究[J];中文信息學報;2008年06期
8 劉永丹,曾海泉,李榮陸,胡運發(fā);基于語義分析的傾向性文本過濾[J];通信學報;2004年07期
本文關鍵詞:基于意見挖掘的網絡評論動態(tài)分析方法,由筆耕文化傳播整理發(fā)布。
,本文編號:283499
本文鏈接:http://sikaile.net/guanlilunwen/kehuguanxiguanli/283499.html