基于意見挖掘的網(wǎng)絡(luò)評論動態(tài)分析方法
發(fā)布時間:2017-04-03 02:01
本文關(guān)鍵詞:基于意見挖掘的網(wǎng)絡(luò)評論動態(tài)分析方法,由筆耕文化傳播整理發(fā)布。
【摘要】:近年來,各種基于互聯(lián)網(wǎng)及移動終端的技術(shù)發(fā)展使得商業(yè)數(shù)據(jù)不斷信息化并向互聯(lián)網(wǎng)終端匯集。通過數(shù)據(jù)挖掘,能夠?qū)⒕W(wǎng)絡(luò)商品交易數(shù)據(jù)充分利用,提供商業(yè)決策的關(guān)鍵信息。近來,數(shù)據(jù)挖掘技術(shù)在電商推薦系統(tǒng)、客戶關(guān)系管理系統(tǒng)等應(yīng)用中有著相當(dāng)廣泛的應(yīng)用,也是越來越多管理者采取的新型而高效的業(yè)務(wù)處理方式。數(shù)據(jù)挖掘和商務(wù)智能結(jié)合數(shù)據(jù)統(tǒng)計分析處理、數(shù)據(jù)集成、有效信息轉(zhuǎn)化等方法對商品交易數(shù)據(jù)、用戶反饋數(shù)據(jù)進行搜集,利用相應(yīng)的機器學(xué)習(xí)、統(tǒng)計分析和關(guān)聯(lián)規(guī)則等技術(shù)對數(shù)據(jù)進行處理,并根據(jù)分析結(jié)果了解產(chǎn)品的銷售信息,確定用戶的反饋意見以及用戶的觀點和情感變化,從而提高市場占有率,提升對市場的響應(yīng)速度。 當(dāng)代電商業(yè)務(wù)發(fā)展與數(shù)據(jù)挖掘的研究著重于將網(wǎng)絡(luò)商業(yè)數(shù)據(jù)轉(zhuǎn)換成為對業(yè)務(wù)有用的知識。同時,不斷改進數(shù)據(jù)挖掘的算法,設(shè)計出針對具體應(yīng)用的信息處理系統(tǒng),得出準(zhǔn)確的挖掘結(jié)果來表征商業(yè)數(shù)據(jù)中的隱藏知識,也是近年來數(shù)據(jù)挖掘的熱點。 與此同時,互聯(lián)網(wǎng)也成為人們發(fā)布與分享意見、觀點的一個重要媒介,意見挖掘技術(shù)也廣泛地被研究和應(yīng)用到這些信息資源上。而隨著互聯(lián)網(wǎng)及移動互聯(lián)的飛速發(fā)展,網(wǎng)絡(luò)交易、評論數(shù)據(jù)呈爆炸式增長之勢。面對如此海量、繁雜及不斷更新、動態(tài)變化的網(wǎng)絡(luò)信息資源,傳統(tǒng)的文本挖掘技術(shù)顯然已經(jīng)不能滿足互聯(lián)網(wǎng)動態(tài)內(nèi)容的高維度、大數(shù)據(jù)、動態(tài)更新處理的要求。 對此,本文以商業(yè)領(lǐng)域需求為背景,提出了一種基于意見挖掘的網(wǎng)絡(luò)評論動態(tài)分析方法。這種方法不僅能夠?qū)Υ罅康木W(wǎng)絡(luò)評論數(shù)據(jù)行進動態(tài)更新處理,同時能夠?qū)τ脩粼u論文本進行分解歸類,識別用戶在不同時間段內(nèi)對產(chǎn)品相關(guān)屬性的關(guān)注程度,并且自動歸納出用戶對于相關(guān)屬性的情感傾向,得到產(chǎn)品待宣傳和改進的屬性。同時,能夠動態(tài)更新挖掘結(jié)果,最終將挖掘結(jié)果清晰地展示給管理者,使他們了解人們對某個事物的關(guān)注熱點及看法態(tài)度,便于更好地制定商業(yè)決策。 本文以時間窗口模型和文本特征提取技術(shù)為理論指導(dǎo)。歸納提取產(chǎn)品屬性,并對相應(yīng)屬性的情感傾向進行分類總結(jié)。實驗結(jié)果表明本文的方法在動態(tài)分析上非常有效。該算法不僅能給出較為準(zhǔn)確的分類結(jié)果,同時能夠動態(tài)地反映用戶觀點的變化,自動識別出值得關(guān)注的產(chǎn)品特征信息。
【關(guān)鍵詞】:意見挖掘 網(wǎng)絡(luò)評論 文本特征 情感傾向
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.1
【目錄】:
- 摘要5-6
- ABSTRACT6-11
- 第一章 緒論11-19
- 1.1 研究背景及意義11-13
- 1.1.1 研究背景11-12
- 1.1.2 研究意義12-13
- 1.2 研究現(xiàn)狀13-16
- 1.2.1 國內(nèi)研究現(xiàn)狀13-14
- 1.2.2 國外研究現(xiàn)狀14-16
- 1.3 論文主要工作和結(jié)構(gòu)安排16-19
- 1.3.1 論文主要工作16-17
- 1.3.2 論文結(jié)構(gòu)安排17-19
- 第二章 文本挖掘技術(shù)簡介19-29
- 2.1 文本挖掘概述19-21
- 2.1.1 文本挖掘基本概念19
- 2.1.2 文本挖掘流程19-20
- 2.1.3 文本挖掘技術(shù)分類20-21
- 2.2 文本預(yù)處理21-24
- 2.2.1 特征選擇21-23
- 2.2.2 文本表示23-24
- 2.3 文本分類算法24-27
- 2.3.1 簡單向量距離分類算法24
- 2.3.2 K近鄰算法24-25
- 2.3.3 樸素貝葉斯算法25-26
- 2.3.4 支持向量機(Support Vector Machine)26-27
- 2.4 文本聚類算法27-28
- 2.4.1 文本聚類概述27
- 2.4.2 k-means算法27-28
- 2.4.3 層次聚類方法28
- 2.5 本章小結(jié)28-29
- 第三章 意見挖掘與動態(tài)網(wǎng)絡(luò)環(huán)境29-35
- 3.1 意見挖掘的概念與任務(wù)29-30
- 3.2 意見挖掘步驟與意義30-32
- 3.2.1 意見挖掘具體步驟30-31
- 3.2.2 意見挖掘的意義31-32
- 3.3 動態(tài)網(wǎng)絡(luò)環(huán)境下的意見挖掘32-34
- 3.3.1 網(wǎng)絡(luò)評論的特殊性32-33
- 3.3.2 意見挖掘技術(shù)在動態(tài)網(wǎng)絡(luò)環(huán)境下的特征33-34
- 3.4 本章小結(jié)34-35
- 第四章 網(wǎng)絡(luò)評論動態(tài)分析方法35-49
- 4.1 方法概述35-37
- 4.1.1 總體框架36
- 4.1.2 模塊介紹36-37
- 4.2 評論文本的采集37
- 4.3 評論文本的預(yù)處理37-39
- 4.3.1 文本的合并及分割38
- 4.3.2 文本分詞及詞性標(biāo)注38-39
- 4.4 評論文本的特征提取及情感傾向分類39-41
- 4.4.1 頻繁詞匯的識別39-40
- 4.4.2 緊湊型檢驗和冗余檢驗40
- 4.4.3 產(chǎn)品特征-情感傾向組合提取40-41
- 4.5 評論文本的動態(tài)分析41-47
- 4.5.1 參數(shù)和定義41-44
- 4.5.2 動態(tài)意見分析算法及步驟44-47
- 4.6 本章小結(jié)47-49
- 第五章 實驗與分析49-57
- 5.1 數(shù)據(jù)來源49
- 5.2 特征提取分析49-50
- 5.3 意見演變分析50-55
- 5.4 本章小結(jié)55-57
- 第六章 總結(jié)與展望57-59
- 6.1 總結(jié)57
- 6.2 展望57-59
- 參考文獻59-63
- 致謝63-65
- 在讀期間發(fā)表的學(xué)術(shù)論文與取得的其他研究成果65
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前8條
1 婁德成;姚天f ;;漢語句子語義極性分析和觀點抽取方法的研究[J];計算機應(yīng)用;2006年11期
2 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語義傾向計算[J];中文信息學(xué)報;2006年01期
3 徐琳宏;林鴻飛;楊志豪;;基于語義理解的文本傾向性識別機制[J];中文信息學(xué)報;2007年01期
4 姚天f ;婁德成;;漢語語句主題語義傾向分析方法的研究[J];中文信息學(xué)報;2007年05期
5 徐琳宏;林鴻飛;趙晶;;情感語料庫的構(gòu)建和分析[J];中文信息學(xué)報;2008年01期
6 姚天f ;程希文;徐飛玉;漢思·烏思克爾特;王睿;;文本意見挖掘綜述[J];中文信息學(xué)報;2008年03期
7 劉全升;姚天f ;黃高輝;劉軍;宋鴻彥;;漢語意見型主觀性文本類型體系的研究[J];中文信息學(xué)報;2008年06期
8 劉永丹,曾海泉,李榮陸,胡運發(fā);基于語義分析的傾向性文本過濾[J];通信學(xué)報;2004年07期
本文關(guān)鍵詞:基于意見挖掘的網(wǎng)絡(luò)評論動態(tài)分析方法,由筆耕文化傳播整理發(fā)布。
,本文編號:283499
本文鏈接:http://sikaile.net/guanlilunwen/kehuguanxiguanli/283499.html
最近更新
教材專著