基于復(fù)雜網(wǎng)絡(luò)的在線評(píng)論主題社區(qū)發(fā)現(xiàn)
發(fā)布時(shí)間:2023-12-12 20:12
隨著互聯(lián)網(wǎng)的飛速發(fā)展,網(wǎng)絡(luò)用戶的數(shù)量也在急劇攀升,從而導(dǎo)致了網(wǎng)絡(luò)上的數(shù)據(jù)特別是電子商務(wù)平臺(tái)評(píng)論數(shù)據(jù)的指數(shù)級(jí)增長(zhǎng),企業(yè)和消費(fèi)者已經(jīng)無(wú)法滿足通過(guò)手工進(jìn)行篩選獲取信息,急需對(duì)在線評(píng)論進(jìn)行快速的主題挖掘,對(duì)用戶進(jìn)行有效的社區(qū)劃分。通過(guò)在線評(píng)論主題社區(qū)發(fā)現(xiàn),能為消費(fèi)者的購(gòu)買行為提供決策信息,同時(shí)也為商家改進(jìn)產(chǎn)品、精準(zhǔn)定位消費(fèi)人群提供技術(shù)支持。而傳統(tǒng)的在線評(píng)論挖掘手段往往是基于統(tǒng)計(jì)學(xué)的方法,忽略了在線評(píng)論之間語(yǔ)義關(guān)聯(lián)信息,導(dǎo)致挖掘精度不高、處理效率低下等問(wèn)題。近年來(lái),復(fù)雜網(wǎng)絡(luò)理論和實(shí)踐的研究都越來(lái)越成熟,語(yǔ)言也被證實(shí)具有“小世界”的特性,越來(lái)越多的學(xué)者也開(kāi)始將復(fù)雜網(wǎng)絡(luò)的理論應(yīng)用到自然語(yǔ)言處理中。為解決傳統(tǒng)在線評(píng)論挖掘方法中語(yǔ)義關(guān)聯(lián)信息缺失的問(wèn)題,本文將復(fù)雜網(wǎng)絡(luò)理論引入到在線評(píng)論主題社區(qū)發(fā)現(xiàn)的研究中。本文的主要內(nèi)容是在線評(píng)論網(wǎng)絡(luò)的構(gòu)建與針對(duì)在線評(píng)論網(wǎng)絡(luò)進(jìn)行的主題社區(qū)發(fā)現(xiàn),論文的主要工作體現(xiàn)在以下幾個(gè)方面:首先對(duì)復(fù)雜網(wǎng)絡(luò)及其在語(yǔ)言處理方面應(yīng)用的相關(guān)理論、文本表示和特征選擇的理論、社區(qū)發(fā)現(xiàn)算法的理論進(jìn)行系統(tǒng)的闡述,基于復(fù)雜網(wǎng)絡(luò)文本表示模型構(gòu)造單條在線評(píng)論復(fù)雜網(wǎng)絡(luò),并采用基于復(fù)雜網(wǎng)絡(luò)的特征選擇算法對(duì)單條在...
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號(hào)對(duì)照表
縮略語(yǔ)對(duì)照表
第一章 緒論
1.1 研究背景
1.2 研究意義
1.3 國(guó)內(nèi)外研究現(xiàn)狀
1.3.1 在線評(píng)論挖掘研究現(xiàn)狀
1.3.2 文本表示研究現(xiàn)狀
1.3.3 文本特征選擇研究現(xiàn)狀
1.3.4 社區(qū)發(fā)現(xiàn)算法研究現(xiàn)狀
1.4 論文主要工作和研究方法
1.5 論文組織結(jié)構(gòu)與框架
第二章 相關(guān)理論研究
2.1 語(yǔ)言復(fù)雜網(wǎng)絡(luò)相關(guān)理論
2.1.1 語(yǔ)言復(fù)雜網(wǎng)絡(luò)的小世界特性
2.1.2 語(yǔ)言復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)統(tǒng)計(jì)特性
2.2 文本表示理論
2.3 文本特征選擇理論
2.4 社區(qū)定義與社區(qū)發(fā)現(xiàn)算法
2.4.1 社區(qū)定義
2.4.2 經(jīng)典社區(qū)發(fā)現(xiàn)算法介紹
2.5 本章小結(jié)
第三章 構(gòu)建在線評(píng)論網(wǎng)絡(luò)
3.1 構(gòu)建單條在線評(píng)論復(fù)雜網(wǎng)絡(luò)
3.2 詞語(yǔ)間語(yǔ)義相關(guān)關(guān)系量化
3.3 基于復(fù)雜網(wǎng)絡(luò)的特征選擇算法
3.4 基于最大公共子圖的文本相似度計(jì)算
3.4.1 基本原理
3.4.2 最大公共子圖的提取
3.4.3 文本相似度量化
3.5 在線評(píng)論網(wǎng)絡(luò)構(gòu)建流程
3.6 本章小結(jié)
第四章 在線評(píng)論網(wǎng)絡(luò)主題社區(qū)發(fā)現(xiàn)
4.1 在線評(píng)論網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)特征
4.2 主題社區(qū)發(fā)現(xiàn)算法優(yōu)化
4.2.1 LFM算法概述
4.2.2 LFM算法優(yōu)化
4.2.3 LFMS算法實(shí)現(xiàn)步驟
4.3 在線評(píng)論網(wǎng)絡(luò)主題社區(qū)發(fā)現(xiàn)流程
4.4 本章小結(jié)
第五章 實(shí)驗(yàn)及結(jié)果分析
5.1 實(shí)驗(yàn)設(shè)計(jì)
5.1.1 實(shí)驗(yàn)方案
5.1.2 評(píng)價(jià)指標(biāo)
5.2 實(shí)驗(yàn)結(jié)果與分析
5.2.1 閾值μ的確定
5.2.2 在線評(píng)論網(wǎng)絡(luò)的全局統(tǒng)計(jì)數(shù)據(jù)分析
5.2.3 主題社區(qū)發(fā)現(xiàn)效果對(duì)比
第六章 總結(jié)與展望
參考文獻(xiàn)
致謝
作者簡(jiǎn)介
本文編號(hào):3873565
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號(hào)對(duì)照表
縮略語(yǔ)對(duì)照表
第一章 緒論
1.1 研究背景
1.2 研究意義
1.3 國(guó)內(nèi)外研究現(xiàn)狀
1.3.1 在線評(píng)論挖掘研究現(xiàn)狀
1.3.2 文本表示研究現(xiàn)狀
1.3.3 文本特征選擇研究現(xiàn)狀
1.3.4 社區(qū)發(fā)現(xiàn)算法研究現(xiàn)狀
1.4 論文主要工作和研究方法
1.5 論文組織結(jié)構(gòu)與框架
第二章 相關(guān)理論研究
2.1 語(yǔ)言復(fù)雜網(wǎng)絡(luò)相關(guān)理論
2.1.1 語(yǔ)言復(fù)雜網(wǎng)絡(luò)的小世界特性
2.1.2 語(yǔ)言復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)統(tǒng)計(jì)特性
2.2 文本表示理論
2.3 文本特征選擇理論
2.4 社區(qū)定義與社區(qū)發(fā)現(xiàn)算法
2.4.1 社區(qū)定義
2.4.2 經(jīng)典社區(qū)發(fā)現(xiàn)算法介紹
2.5 本章小結(jié)
第三章 構(gòu)建在線評(píng)論網(wǎng)絡(luò)
3.1 構(gòu)建單條在線評(píng)論復(fù)雜網(wǎng)絡(luò)
3.2 詞語(yǔ)間語(yǔ)義相關(guān)關(guān)系量化
3.3 基于復(fù)雜網(wǎng)絡(luò)的特征選擇算法
3.4 基于最大公共子圖的文本相似度計(jì)算
3.4.1 基本原理
3.4.2 最大公共子圖的提取
3.4.3 文本相似度量化
3.5 在線評(píng)論網(wǎng)絡(luò)構(gòu)建流程
3.6 本章小結(jié)
第四章 在線評(píng)論網(wǎng)絡(luò)主題社區(qū)發(fā)現(xiàn)
4.1 在線評(píng)論網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)特征
4.2 主題社區(qū)發(fā)現(xiàn)算法優(yōu)化
4.2.1 LFM算法概述
4.2.2 LFM算法優(yōu)化
4.2.3 LFMS算法實(shí)現(xiàn)步驟
4.3 在線評(píng)論網(wǎng)絡(luò)主題社區(qū)發(fā)現(xiàn)流程
4.4 本章小結(jié)
第五章 實(shí)驗(yàn)及結(jié)果分析
5.1 實(shí)驗(yàn)設(shè)計(jì)
5.1.1 實(shí)驗(yàn)方案
5.1.2 評(píng)價(jià)指標(biāo)
5.2 實(shí)驗(yàn)結(jié)果與分析
5.2.1 閾值μ的確定
5.2.2 在線評(píng)論網(wǎng)絡(luò)的全局統(tǒng)計(jì)數(shù)據(jù)分析
5.2.3 主題社區(qū)發(fā)現(xiàn)效果對(duì)比
第六章 總結(jié)與展望
參考文獻(xiàn)
致謝
作者簡(jiǎn)介
本文編號(hào):3873565
本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/3873565.html
最近更新
教材專著