《經(jīng)濟(jì)研究》折射中國經(jīng)濟(jì)發(fā)展——對《經(jīng)濟(jì)研究》刊載文章的文本挖掘與統(tǒng)計(jì)分析
發(fā)布時(shí)間:2024-06-04 03:33
學(xué)術(shù)研究的重要環(huán)節(jié)之一是文獻(xiàn)學(xué)習(xí)。作為學(xué)術(shù)文獻(xiàn)的重要載體,學(xué)術(shù)期刊在大數(shù)據(jù)時(shí)代,積極轉(zhuǎn)變學(xué)術(shù)交流的模式,創(chuàng)辦了學(xué)術(shù)期刊官方網(wǎng)站。一方面,學(xué)術(shù)期刊官方網(wǎng)站的建立,將零散的文獻(xiàn)資源系統(tǒng)化,使其以Web文本的形式呈現(xiàn),提高了文獻(xiàn)的綜合利用價(jià)值;另一方面,網(wǎng)站的建立縮短了學(xué)術(shù)文獻(xiàn)的發(fā)表周期,使學(xué)術(shù)文獻(xiàn)發(fā)表數(shù)量劇增、知識與信息更是膨脹式增長,這無疑對學(xué)者快速準(zhǔn)確獲取有用的知識帶來了挑戰(zhàn)。文本挖掘技術(shù)的適時(shí)興起讓各界學(xué)者看到了充分發(fā)現(xiàn)學(xué)術(shù)文獻(xiàn)潛在知識的可能性。然而,Web挖掘技術(shù)尚在發(fā)展階段,仍無法全面系統(tǒng)地提煉文獻(xiàn)信息。目前,阻礙學(xué)術(shù)文獻(xiàn)文本信息的深層次挖掘和精準(zhǔn)利用的因素有以下幾點(diǎn):文檔主題生成模型存在主題閾值設(shè)定和主題漂移等問題;傳統(tǒng)文本聚類算法在處理數(shù)據(jù)時(shí)存在著對初始值的依賴性較強(qiáng)、易獲得局部最優(yōu)的弊端;前人對學(xué)術(shù)期刊的核心作者群分析大都從作者發(fā)文數(shù)量角度進(jìn)行,對其發(fā)展過程中形成的合作群體,以及群體間合作關(guān)系的研究較少。針對上述問題,本文在前期研究基礎(chǔ)上著重探討如何從大量短文本中發(fā)現(xiàn)主題并進(jìn)行演化分析,提出一種改進(jìn)的主題演化模型,解決單個(gè)主題演化分析方法中主題數(shù)目不確定和主題漂移的問題。此...
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 引言
1.1 論文的研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 文獻(xiàn)綜述
1.2.1 文本挖掘
1.2.2 《經(jīng)濟(jì)研究》的文本挖掘
1.2.3 文獻(xiàn)評述
1.3 研究方法與創(chuàng)新點(diǎn)
1.3.1 研究方法
1.3.2 創(chuàng)新點(diǎn)
1.4 研究內(nèi)容及研究框架
1.4.1 研究內(nèi)容
1.4.2 研究框架
2 文本建模相關(guān)理論與基礎(chǔ)技術(shù)概述
2.1 《經(jīng)濟(jì)研究》Web文本挖掘概述
2.1.1 Web文本挖掘定義
2.1.2 網(wǎng)絡(luò)版《經(jīng)濟(jì)研究》數(shù)據(jù)結(jié)構(gòu)特點(diǎn)
2.1.3 《經(jīng)濟(jì)研究》Web文本挖掘的過程
2.2 《經(jīng)濟(jì)研究》中文分詞概述
2.2.1 中文分詞的介紹
2.2.2 中文分詞的方法
2.2.3 《經(jīng)濟(jì)研究》中文分詞工具
2.2.4 《經(jīng)濟(jì)研究》中文分詞的歧義處理
2.3 《經(jīng)濟(jì)研究》文本特征提取
2.4 LDA-AP主題模型
2.4.1 LDA算法
2.4.2 AP聚類算法
2.4.3 LDA-AP主題演化模型
3 基于《經(jīng)濟(jì)研究》文本挖掘的實(shí)現(xiàn)與結(jié)果分析
3.1 樣本選擇與數(shù)據(jù)處理
3.1.1 《經(jīng)濟(jì)研究》文本數(shù)據(jù)采集
3.1.2 文本預(yù)處理
3.2 《經(jīng)濟(jì)研究》的歷史階段回顧與內(nèi)容分析
3.3 《經(jīng)濟(jì)研究》主題的演化分析
3.3.1 主題建模
3.3.2 主題內(nèi)容聚類演化結(jié)果與分析
3.3.3 主題強(qiáng)度的結(jié)果與分析
3.4 核心作者群以及作者研究領(lǐng)域分析
3.4.1 高產(chǎn)作者群
3.4.2 外在合作關(guān)系分析
3.4.3 潛在合作關(guān)系分析
3.4.4 核心作者群
3.4.5 核心作者群研究領(lǐng)域分析
4 總結(jié)與展望
4.1 研究結(jié)論
4.2 研究展望
參考文獻(xiàn)
后記
本文編號:3988804
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 引言
1.1 論文的研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 文獻(xiàn)綜述
1.2.1 文本挖掘
1.2.2 《經(jīng)濟(jì)研究》的文本挖掘
1.2.3 文獻(xiàn)評述
1.3 研究方法與創(chuàng)新點(diǎn)
1.3.1 研究方法
1.3.2 創(chuàng)新點(diǎn)
1.4 研究內(nèi)容及研究框架
1.4.1 研究內(nèi)容
1.4.2 研究框架
2 文本建模相關(guān)理論與基礎(chǔ)技術(shù)概述
2.1 《經(jīng)濟(jì)研究》Web文本挖掘概述
2.1.1 Web文本挖掘定義
2.1.2 網(wǎng)絡(luò)版《經(jīng)濟(jì)研究》數(shù)據(jù)結(jié)構(gòu)特點(diǎn)
2.1.3 《經(jīng)濟(jì)研究》Web文本挖掘的過程
2.2 《經(jīng)濟(jì)研究》中文分詞概述
2.2.1 中文分詞的介紹
2.2.2 中文分詞的方法
2.2.3 《經(jīng)濟(jì)研究》中文分詞工具
2.2.4 《經(jīng)濟(jì)研究》中文分詞的歧義處理
2.3 《經(jīng)濟(jì)研究》文本特征提取
2.4 LDA-AP主題模型
2.4.1 LDA算法
2.4.2 AP聚類算法
2.4.3 LDA-AP主題演化模型
3 基于《經(jīng)濟(jì)研究》文本挖掘的實(shí)現(xiàn)與結(jié)果分析
3.1 樣本選擇與數(shù)據(jù)處理
3.1.1 《經(jīng)濟(jì)研究》文本數(shù)據(jù)采集
3.1.2 文本預(yù)處理
3.2 《經(jīng)濟(jì)研究》的歷史階段回顧與內(nèi)容分析
3.3 《經(jīng)濟(jì)研究》主題的演化分析
3.3.1 主題建模
3.3.2 主題內(nèi)容聚類演化結(jié)果與分析
3.3.3 主題強(qiáng)度的結(jié)果與分析
3.4 核心作者群以及作者研究領(lǐng)域分析
3.4.1 高產(chǎn)作者群
3.4.2 外在合作關(guān)系分析
3.4.3 潛在合作關(guān)系分析
3.4.4 核心作者群
3.4.5 核心作者群研究領(lǐng)域分析
4 總結(jié)與展望
4.1 研究結(jié)論
4.2 研究展望
參考文獻(xiàn)
后記
本文編號:3988804
本文鏈接:http://sikaile.net/jingjilunwen/shijiejingjilunwen/3988804.html
最近更新
教材專著