基于“特征降維”文本復(fù)雜網(wǎng)絡(luò)的話題跟蹤算法研究
發(fā)布時間:2023-03-07 18:01
隨著移動互聯(lián)網(wǎng)技術(shù)的不斷迭代,移動互聯(lián)網(wǎng)業(yè)務(wù)增長勢頭迅猛,其對人們的日常生活產(chǎn)生了巨大的影響。在移動社交領(lǐng)域,以微博、微信、今日頭條為代表的應(yīng)用程序,發(fā)揮著重要的連接作用,實現(xiàn)了人與人之間,人與信息之間的高效聯(lián)動。精準的內(nèi)容推送也是其增強用戶對平臺粘性的重要保障。在大數(shù)據(jù)背景下,如何快速精準的捕獲到所關(guān)注的社會熱點信息,成為網(wǎng)絡(luò)輿情發(fā)展的核心問題。因此,話題跟蹤技術(shù)應(yīng)運而生,其旨在實現(xiàn)對以信息流形式呈現(xiàn)的新聞資訊中已知話題的動態(tài)跟蹤,滲透在各類輿情分析系統(tǒng)之中。本文首先從當下實際問題出發(fā),明確了課題的研究背景,解決的主要問題,進而明確了研究意義。然后對話題跟蹤技術(shù)、文本復(fù)雜網(wǎng)絡(luò)以及特征選擇模型等基礎(chǔ)理論進行深入研究與歸納總結(jié),理清話題跟蹤技術(shù)國內(nèi)外當前的研究現(xiàn)狀以及文本復(fù)雜網(wǎng)絡(luò)處理網(wǎng)絡(luò)話題文本語料時亟待解決的瓶頸問題。有針對性地提出了一種“特征降維”文本復(fù)雜網(wǎng)絡(luò)的話題表示模型,解決了傳統(tǒng)詞同現(xiàn)文本復(fù)雜網(wǎng)絡(luò)處理大規(guī)模語料庫時的高維性和稀疏性問題,并提出了針對網(wǎng)絡(luò)話題的自動進化算法,可以實現(xiàn)對熱門話題下海量文本語義的高效精準表達。在基于文本復(fù)雜網(wǎng)絡(luò)的話題跟蹤算法研究中,綜合考慮語義網(wǎng)絡(luò)的結(jié)...
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 選題背景及研究意義
1.1.1 選題背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 文本復(fù)雜網(wǎng)絡(luò)研究現(xiàn)狀
1.2.2 特征選擇模型研究現(xiàn)狀
1.2.3 話題跟蹤技術(shù)國內(nèi)外研究現(xiàn)狀
1.2.4 研究現(xiàn)狀小結(jié)
1.3 研究內(nèi)容及技術(shù)路線
1.3.1 研究內(nèi)容
1.3.2 技術(shù)路線
1.4 主要工作及創(chuàng)新點
第二章 相關(guān)理論基礎(chǔ)
2.1 復(fù)雜網(wǎng)絡(luò)相關(guān)理論
2.1.1 復(fù)雜網(wǎng)絡(luò)簡介
2.1.2 常見的復(fù)雜網(wǎng)絡(luò)模型
2.1.3 復(fù)雜網(wǎng)絡(luò)基本性質(zhì)
2.2 話題跟蹤技術(shù)
2.2.1 話題跟蹤技術(shù)研究框架
2.2.2 建立話題/報道模型
2.2.3 相似度計算方法
2.2.4 閾值比較
2.3 本章小結(jié)
第三章 “特征降維”文本復(fù)雜網(wǎng)絡(luò)話題表示模型構(gòu)建
3.1 語料特點分析
3.2 “特征降維”文本復(fù)雜網(wǎng)絡(luò)模型自動生成算法設(shè)計
3.2.1 特征詞條的提出
3.2.2 特征詞條抽取與“特征降維”文本復(fù)雜網(wǎng)絡(luò)生成
3.2.3 網(wǎng)絡(luò)權(quán)重生成
3.3 文本復(fù)雜網(wǎng)絡(luò)話題表示模型進化的算法設(shè)計
3.4 本章小結(jié)
第四章 基于“特征降維”文本復(fù)雜網(wǎng)絡(luò)的話題跟蹤算法設(shè)計
4.1 話題模型建立
4.2 報道模型建立
4.3 文本相似度算法設(shè)計
4.3.1 simhash算法原理簡介
4.3.2 基于simhash算法的文本相似度計算
4.4 話題跟蹤算法整體流程
4.5 本章小結(jié)
第五章 實驗設(shè)計與結(jié)果分析
5.1 實驗環(huán)境
5.2 實驗數(shù)據(jù)
5.2.1 數(shù)據(jù)的獲取
5.2.2 數(shù)據(jù)存儲
5.2.3 數(shù)據(jù)預(yù)處理
5.3 基于“特征降維”文本復(fù)雜網(wǎng)絡(luò)模型的話題特征發(fā)現(xiàn)實驗
5.3.1 實驗基本思路
5.3.2 微博話題模型的生成與進化
5.3.3 話題語義表達效果分析
5.4 “特征降維”文本復(fù)雜網(wǎng)絡(luò)模型指導(dǎo)下的話題跟蹤實驗
5.4.1 實驗基本思路
5.4.2 實驗過程與重要參數(shù)設(shè)定
5.4.3 話題跟蹤效果分析
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
致謝
在學(xué)期間的研究成果及發(fā)表的學(xué)術(shù)論文
本文編號:3757627
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 選題背景及研究意義
1.1.1 選題背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 文本復(fù)雜網(wǎng)絡(luò)研究現(xiàn)狀
1.2.2 特征選擇模型研究現(xiàn)狀
1.2.3 話題跟蹤技術(shù)國內(nèi)外研究現(xiàn)狀
1.2.4 研究現(xiàn)狀小結(jié)
1.3 研究內(nèi)容及技術(shù)路線
1.3.1 研究內(nèi)容
1.3.2 技術(shù)路線
1.4 主要工作及創(chuàng)新點
第二章 相關(guān)理論基礎(chǔ)
2.1 復(fù)雜網(wǎng)絡(luò)相關(guān)理論
2.1.1 復(fù)雜網(wǎng)絡(luò)簡介
2.1.2 常見的復(fù)雜網(wǎng)絡(luò)模型
2.1.3 復(fù)雜網(wǎng)絡(luò)基本性質(zhì)
2.2 話題跟蹤技術(shù)
2.2.1 話題跟蹤技術(shù)研究框架
2.2.2 建立話題/報道模型
2.2.3 相似度計算方法
2.2.4 閾值比較
2.3 本章小結(jié)
第三章 “特征降維”文本復(fù)雜網(wǎng)絡(luò)話題表示模型構(gòu)建
3.1 語料特點分析
3.2 “特征降維”文本復(fù)雜網(wǎng)絡(luò)模型自動生成算法設(shè)計
3.2.1 特征詞條的提出
3.2.2 特征詞條抽取與“特征降維”文本復(fù)雜網(wǎng)絡(luò)生成
3.2.3 網(wǎng)絡(luò)權(quán)重生成
3.3 文本復(fù)雜網(wǎng)絡(luò)話題表示模型進化的算法設(shè)計
3.4 本章小結(jié)
第四章 基于“特征降維”文本復(fù)雜網(wǎng)絡(luò)的話題跟蹤算法設(shè)計
4.1 話題模型建立
4.2 報道模型建立
4.3 文本相似度算法設(shè)計
4.3.1 simhash算法原理簡介
4.3.2 基于simhash算法的文本相似度計算
4.4 話題跟蹤算法整體流程
4.5 本章小結(jié)
第五章 實驗設(shè)計與結(jié)果分析
5.1 實驗環(huán)境
5.2 實驗數(shù)據(jù)
5.2.1 數(shù)據(jù)的獲取
5.2.2 數(shù)據(jù)存儲
5.2.3 數(shù)據(jù)預(yù)處理
5.3 基于“特征降維”文本復(fù)雜網(wǎng)絡(luò)模型的話題特征發(fā)現(xiàn)實驗
5.3.1 實驗基本思路
5.3.2 微博話題模型的生成與進化
5.3.3 話題語義表達效果分析
5.4 “特征降維”文本復(fù)雜網(wǎng)絡(luò)模型指導(dǎo)下的話題跟蹤實驗
5.4.1 實驗基本思路
5.4.2 實驗過程與重要參數(shù)設(shè)定
5.4.3 話題跟蹤效果分析
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
致謝
在學(xué)期間的研究成果及發(fā)表的學(xué)術(shù)論文
本文編號:3757627
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3757627.html
最近更新
教材專著