基于共被引耦合與LDA模型的研究前沿識別方法優(yōu)化研究
發(fā)布時間:2024-03-19 03:19
研究前沿(Research Front)是科學研究中最新、最具前瞻性和引領性的研究方向,其作為科技創(chuàng)新的突破口和新生長點,備受關注,尤其是在《國家創(chuàng)新驅動發(fā)展戰(zhàn)略綱要》全面實施以來。面對科技創(chuàng)新發(fā)展新趨勢,研究如何及早、準確識別研究前沿,預測未來方向和重點,對更好服務國家科技宏觀決策、合理配置科技資源、幫助科研工作者及時把握科學研究動態(tài),均具有重要意義。當前,研究前沿識別主要有基于引用、基于內(nèi)容以及二者結合的方法體系。相對而言,以引用分析為基礎輔以內(nèi)容分析的混合識別方法是現(xiàn)階段研究前沿識別研究的熱點,較常見的是將共被引分析、引文耦合與文本內(nèi)容分析相結合,但結合主要聚焦在文獻聚類與類簇描述層面,在聚類基礎即信息域上并沒有擴展,在內(nèi)容語義分析方面還較淺表,識別出的研究前沿的“前瞻價值”和“學術準確性”常被質(zhì)疑。鑒于此,為了更吻合科學家專業(yè)視野中的“研究前沿”,本文嘗試從識別信息域(聚類基礎)和識別語義深度兩個層面對引用-內(nèi)容相結合的研究前沿識別方法進行優(yōu)化,基于多種學術引用關系研究構建更新穎、更高學術關聯(lián)、更好覆蓋度的研究前沿域,利用LDA主題模型從文本內(nèi)容語義層面直接進行研究前沿識別,全...
【文章頁數(shù)】:139 頁
【學位級別】:博士
【文章目錄】:
摘要
abstract
第1章 引言
1.1 研究背景
1.2 問題的提出
1.3 研究目標和意義
1.3.1 研究目標
1.3.2 研究意義
1.4 研究內(nèi)容
1.4.1 主要研究內(nèi)容概述
1.4.2 擬解決的關鍵問題
1.5 研究方法與技術路線
1.5.1 研究方法
1.5.2 技術路線
1.6 論文的組織結構
1.7 本章小結
第2章 相關理論與方法
2.1 引用關系網(wǎng)絡
2.1.1 直接引用網(wǎng)絡
2.1.2 共被引網(wǎng)絡
2.1.3 文獻耦合網(wǎng)絡
2.2 主題模型
2.2.1 LDA主題模型
2.2.2 PhraseLDA主題模型
2.3 研究前沿及其識別方法
2.3.1 發(fā)展演進
2.3.2 內(nèi)涵特征
2.3.3 識別方法
2.3.4 識別方法優(yōu)化路徑分析
2.4 本章小結
第3章 研究前沿識別信息域構建
3.1 構建原則與思路
3.1.1 構建原則
3.1.2 構建思路
3.2 構建過程
3.3 構建結果
3.3.1 基本描述
3.3.2 特征分析
3.4 本章小結
第4章 基于PhraseLDA的主題抽取
4.1 語料庫構建
4.1.1 語料選取
4.1.2 語料預處理
4.2 PhraseLDA模型參數(shù)設置
4.2.1 頻繁短語挖掘參數(shù)
4.2.2 主題抽取相關參數(shù)
4.3 主題抽取流程
4.4 本章小結
第5章 基于“引用-內(nèi)容”的研究前沿識別
5.1 量值計算與指標解析
5.1.1 量值計算
5.1.2 指標解析
5.2 識別效果分析與評價
5.2.1 專家評價法
5.2.2 對比評價法
5.3 本章小結
第6章 “共被引耦合-LDA法”實證研究
6.1 免疫學研究前沿識別信息域構建
6.1.1 領域高被引文獻獲取
6.1.2 領域高共被引文獻集合生成
6.1.3 共被引-施引文獻集合生成
6.1.4 高耦合施引文獻集合生成
6.1.5 共被引耦合文獻網(wǎng)絡生成
6.1.6 共被引耦合文獻網(wǎng)絡特征分析
6.2 基于PhraseLDA的免疫學研究主題抽取
6.2.1 語料庫構建
6.2.2 數(shù)據(jù)預處理
6.2.3 研究主題抽取
6.3 基于“引用-內(nèi)容”的免疫學研究前沿識別
6.4 方法評價
6.4.1 專家評價法
6.4.2 對比評價法
6.5 本章小結
第7章 總結與展望
7.1 研究總結
7.2 主要創(chuàng)新貢獻
7.3 研究局限性
7.4 研究展望
參考文獻
附錄1 停用詞表
附錄2 研究前沿評價表
附錄3 ESI免疫學研究前沿Top30
附錄4 研究前沿識別程序代碼
致謝
作者簡歷及攻讀學位期間發(fā)表的學術論文與研究成果
本文編號:3932243
【文章頁數(shù)】:139 頁
【學位級別】:博士
【文章目錄】:
摘要
abstract
第1章 引言
1.1 研究背景
1.2 問題的提出
1.3 研究目標和意義
1.3.1 研究目標
1.3.2 研究意義
1.4 研究內(nèi)容
1.4.1 主要研究內(nèi)容概述
1.4.2 擬解決的關鍵問題
1.5 研究方法與技術路線
1.5.1 研究方法
1.5.2 技術路線
1.6 論文的組織結構
1.7 本章小結
第2章 相關理論與方法
2.1 引用關系網(wǎng)絡
2.1.1 直接引用網(wǎng)絡
2.1.2 共被引網(wǎng)絡
2.1.3 文獻耦合網(wǎng)絡
2.2 主題模型
2.2.1 LDA主題模型
2.2.2 PhraseLDA主題模型
2.3 研究前沿及其識別方法
2.3.1 發(fā)展演進
2.3.2 內(nèi)涵特征
2.3.3 識別方法
2.3.4 識別方法優(yōu)化路徑分析
2.4 本章小結
第3章 研究前沿識別信息域構建
3.1 構建原則與思路
3.1.1 構建原則
3.1.2 構建思路
3.2 構建過程
3.3 構建結果
3.3.1 基本描述
3.3.2 特征分析
3.4 本章小結
第4章 基于PhraseLDA的主題抽取
4.1 語料庫構建
4.1.1 語料選取
4.1.2 語料預處理
4.2 PhraseLDA模型參數(shù)設置
4.2.1 頻繁短語挖掘參數(shù)
4.2.2 主題抽取相關參數(shù)
4.3 主題抽取流程
4.4 本章小結
第5章 基于“引用-內(nèi)容”的研究前沿識別
5.1 量值計算與指標解析
5.1.1 量值計算
5.1.2 指標解析
5.2 識別效果分析與評價
5.2.1 專家評價法
5.2.2 對比評價法
5.3 本章小結
第6章 “共被引耦合-LDA法”實證研究
6.1 免疫學研究前沿識別信息域構建
6.1.1 領域高被引文獻獲取
6.1.2 領域高共被引文獻集合生成
6.1.3 共被引-施引文獻集合生成
6.1.4 高耦合施引文獻集合生成
6.1.5 共被引耦合文獻網(wǎng)絡生成
6.1.6 共被引耦合文獻網(wǎng)絡特征分析
6.2 基于PhraseLDA的免疫學研究主題抽取
6.2.1 語料庫構建
6.2.2 數(shù)據(jù)預處理
6.2.3 研究主題抽取
6.3 基于“引用-內(nèi)容”的免疫學研究前沿識別
6.4 方法評價
6.4.1 專家評價法
6.4.2 對比評價法
6.5 本章小結
第7章 總結與展望
7.1 研究總結
7.2 主要創(chuàng)新貢獻
7.3 研究局限性
7.4 研究展望
參考文獻
附錄1 停用詞表
附錄2 研究前沿評價表
附錄3 ESI免疫學研究前沿Top30
附錄4 研究前沿識別程序代碼
致謝
作者簡歷及攻讀學位期間發(fā)表的學術論文與研究成果
本文編號:3932243
本文鏈接:http://sikaile.net/tushudanganlunwen/3932243.html