基于Bi-LSTM-CRF模型的知識單元挖掘及流動模式研究
發(fā)布時間:2024-06-05 03:37
知識單元是指包含知識信息的微觀粒子,是知識信息的載體,同時也是知識在細(xì)粒度上的體現(xiàn),在社會文明發(fā)展的過程中發(fā)揮著不可或缺的作用。引用語境是施引者在引用文獻(xiàn)時的一種描述性文字,包含施引者的引用動機、情感和目的等。建立科學(xué)、合理、高效的機器學(xué)習(xí)模型,提取引用語境中的知識單元并對其進(jìn)行流動模式研究,可以幫助學(xué)者有效了解知識和技術(shù)的更新和發(fā)展,為學(xué)者在其研究領(lǐng)域提供方向和思路有著重要的實際意義。為了解決尚未有公開的引用語境中知識單元數(shù)據(jù)集的問題,本文針對生物醫(yī)學(xué)領(lǐng)域,選取了Pub Med網(wǎng)站上2008年到2018年按比例抽取的1000篇文本數(shù)據(jù),提取了引用語境等信息并對知識單元進(jìn)行了標(biāo)注,構(gòu)建一套較為完善的數(shù)據(jù)集。同時提取了數(shù)據(jù)的一般語義特征、字符特征、大小寫特征、基于詞向量的布朗聚類特征,構(gòu)建了Bi-LSTM-CRF的知識單元挖掘模型,并通過實驗對CRF模型和Bi-LSTM-CRF模型進(jìn)行對比分析。實驗結(jié)果表明,Bi-LSTM-CRF模型的識別效果要好,在三個評價指標(biāo)的數(shù)值上都要高于CRF模型,其精確度為0.7618,召回率為0.7099,1值為0.7349,在
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景及意義
1.2 研究內(nèi)容
1.3 研究方法與技術(shù)路線
1.4 特色與創(chuàng)新之處
2 國內(nèi)外文獻(xiàn)述評
2.1 知識單元抽取方面的研究
2.1.1 基于模式匹配
2.1.2 基于機器學(xué)習(xí)
2.1.3 基于深度學(xué)習(xí)
2.2 知識流動模式的研究
2.2.1 文獻(xiàn)領(lǐng)域的知識流動
2.2.2 專利領(lǐng)域的知識流動
3 基于引用語境的數(shù)據(jù)集構(gòu)建及標(biāo)注
3.1 數(shù)據(jù)獲取及預(yù)處理
3.2 數(shù)據(jù)庫統(tǒng)計與描述
3.3 知識單元劃分和數(shù)據(jù)標(biāo)注
3.3.1 知識單元劃分
3.3.2 數(shù)據(jù)標(biāo)注
3.4 本章小結(jié)
4 基于Bi-LSTM-CRF模型的知識單元挖掘
4.1 相關(guān)理論技術(shù)的介紹
4.1.1 詞向量層
4.1.2 CRF模型
4.1.3 LSTM模型
4.2 Bi-LSTM-CRF模型的構(gòu)建
4.2.1 Bi-LSTM-CRF模型
4.2.2 特征提取
4.2.3 評測標(biāo)準(zhǔn)
4.3 實驗及結(jié)果分析
4.3.1 實驗數(shù)據(jù)集
4.3.2 實驗及結(jié)果分析
4.3.3 對比分析
4.4 本章小結(jié)
5 知識單元的流動模式分析
5.1 異構(gòu)信息網(wǎng)絡(luò)
5.1.1 異構(gòu)信息網(wǎng)絡(luò)基本概念
5.1.2 異構(gòu)網(wǎng)絡(luò)分析及其應(yīng)用
5.2 知識單元的流動模式
5.2.1 宏觀層面的知識單元流動模式
5.2.2 微觀層面的知識單元流動模式
5.3 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
個人簡介
導(dǎo)師簡介
致謝
本文編號:3989593
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景及意義
1.2 研究內(nèi)容
1.3 研究方法與技術(shù)路線
1.4 特色與創(chuàng)新之處
2 國內(nèi)外文獻(xiàn)述評
2.1 知識單元抽取方面的研究
2.1.1 基于模式匹配
2.1.2 基于機器學(xué)習(xí)
2.1.3 基于深度學(xué)習(xí)
2.2 知識流動模式的研究
2.2.1 文獻(xiàn)領(lǐng)域的知識流動
2.2.2 專利領(lǐng)域的知識流動
3 基于引用語境的數(shù)據(jù)集構(gòu)建及標(biāo)注
3.1 數(shù)據(jù)獲取及預(yù)處理
3.2 數(shù)據(jù)庫統(tǒng)計與描述
3.3 知識單元劃分和數(shù)據(jù)標(biāo)注
3.3.1 知識單元劃分
3.3.2 數(shù)據(jù)標(biāo)注
3.4 本章小結(jié)
4 基于Bi-LSTM-CRF模型的知識單元挖掘
4.1 相關(guān)理論技術(shù)的介紹
4.1.1 詞向量層
4.1.2 CRF模型
4.1.3 LSTM模型
4.2 Bi-LSTM-CRF模型的構(gòu)建
4.2.1 Bi-LSTM-CRF模型
4.2.2 特征提取
4.2.3 評測標(biāo)準(zhǔn)
4.3 實驗及結(jié)果分析
4.3.1 實驗數(shù)據(jù)集
4.3.2 實驗及結(jié)果分析
4.3.3 對比分析
4.4 本章小結(jié)
5 知識單元的流動模式分析
5.1 異構(gòu)信息網(wǎng)絡(luò)
5.1.1 異構(gòu)信息網(wǎng)絡(luò)基本概念
5.1.2 異構(gòu)網(wǎng)絡(luò)分析及其應(yīng)用
5.2 知識單元的流動模式
5.2.1 宏觀層面的知識單元流動模式
5.2.2 微觀層面的知識單元流動模式
5.3 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
個人簡介
導(dǎo)師簡介
致謝
本文編號:3989593
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3989593.html
最近更新
教材專著