基于Bi-LSTM-CRF模型的知識(shí)單元挖掘及流動(dòng)模式研究
發(fā)布時(shí)間:2024-06-05 03:37
知識(shí)單元是指包含知識(shí)信息的微觀粒子,是知識(shí)信息的載體,同時(shí)也是知識(shí)在細(xì)粒度上的體現(xiàn),在社會(huì)文明發(fā)展的過(guò)程中發(fā)揮著不可或缺的作用。引用語(yǔ)境是施引者在引用文獻(xiàn)時(shí)的一種描述性文字,包含施引者的引用動(dòng)機(jī)、情感和目的等。建立科學(xué)、合理、高效的機(jī)器學(xué)習(xí)模型,提取引用語(yǔ)境中的知識(shí)單元并對(duì)其進(jìn)行流動(dòng)模式研究,可以幫助學(xué)者有效了解知識(shí)和技術(shù)的更新和發(fā)展,為學(xué)者在其研究領(lǐng)域提供方向和思路有著重要的實(shí)際意義。為了解決尚未有公開(kāi)的引用語(yǔ)境中知識(shí)單元數(shù)據(jù)集的問(wèn)題,本文針對(duì)生物醫(yī)學(xué)領(lǐng)域,選取了Pub Med網(wǎng)站上2008年到2018年按比例抽取的1000篇文本數(shù)據(jù),提取了引用語(yǔ)境等信息并對(duì)知識(shí)單元進(jìn)行了標(biāo)注,構(gòu)建一套較為完善的數(shù)據(jù)集。同時(shí)提取了數(shù)據(jù)的一般語(yǔ)義特征、字符特征、大小寫特征、基于詞向量的布朗聚類特征,構(gòu)建了Bi-LSTM-CRF的知識(shí)單元挖掘模型,并通過(guò)實(shí)驗(yàn)對(duì)CRF模型和Bi-LSTM-CRF模型進(jìn)行對(duì)比分析。實(shí)驗(yàn)結(jié)果表明,Bi-LSTM-CRF模型的識(shí)別效果要好,在三個(gè)評(píng)價(jià)指標(biāo)的數(shù)值上都要高于CRF模型,其精確度為0.7618,召回率為0.7099,1值為0.7349,在
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景及意義
1.2 研究?jī)?nèi)容
1.3 研究方法與技術(shù)路線
1.4 特色與創(chuàng)新之處
2 國(guó)內(nèi)外文獻(xiàn)述評(píng)
2.1 知識(shí)單元抽取方面的研究
2.1.1 基于模式匹配
2.1.2 基于機(jī)器學(xué)習(xí)
2.1.3 基于深度學(xué)習(xí)
2.2 知識(shí)流動(dòng)模式的研究
2.2.1 文獻(xiàn)領(lǐng)域的知識(shí)流動(dòng)
2.2.2 專利領(lǐng)域的知識(shí)流動(dòng)
3 基于引用語(yǔ)境的數(shù)據(jù)集構(gòu)建及標(biāo)注
3.1 數(shù)據(jù)獲取及預(yù)處理
3.2 數(shù)據(jù)庫(kù)統(tǒng)計(jì)與描述
3.3 知識(shí)單元?jiǎng)澐趾蛿?shù)據(jù)標(biāo)注
3.3.1 知識(shí)單元?jiǎng)澐?br> 3.3.2 數(shù)據(jù)標(biāo)注
3.4 本章小結(jié)
4 基于Bi-LSTM-CRF模型的知識(shí)單元挖掘
4.1 相關(guān)理論技術(shù)的介紹
4.1.1 詞向量層
4.1.2 CRF模型
4.1.3 LSTM模型
4.2 Bi-LSTM-CRF模型的構(gòu)建
4.2.1 Bi-LSTM-CRF模型
4.2.2 特征提取
4.2.3 評(píng)測(cè)標(biāo)準(zhǔn)
4.3 實(shí)驗(yàn)及結(jié)果分析
4.3.1 實(shí)驗(yàn)數(shù)據(jù)集
4.3.2 實(shí)驗(yàn)及結(jié)果分析
4.3.3 對(duì)比分析
4.4 本章小結(jié)
5 知識(shí)單元的流動(dòng)模式分析
5.1 異構(gòu)信息網(wǎng)絡(luò)
5.1.1 異構(gòu)信息網(wǎng)絡(luò)基本概念
5.1.2 異構(gòu)網(wǎng)絡(luò)分析及其應(yīng)用
5.2 知識(shí)單元的流動(dòng)模式
5.2.1 宏觀層面的知識(shí)單元流動(dòng)模式
5.2.2 微觀層面的知識(shí)單元流動(dòng)模式
5.3 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
個(gè)人簡(jiǎn)介
導(dǎo)師簡(jiǎn)介
致謝
本文編號(hào):3989593
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景及意義
1.2 研究?jī)?nèi)容
1.3 研究方法與技術(shù)路線
1.4 特色與創(chuàng)新之處
2 國(guó)內(nèi)外文獻(xiàn)述評(píng)
2.1 知識(shí)單元抽取方面的研究
2.1.1 基于模式匹配
2.1.2 基于機(jī)器學(xué)習(xí)
2.1.3 基于深度學(xué)習(xí)
2.2 知識(shí)流動(dòng)模式的研究
2.2.1 文獻(xiàn)領(lǐng)域的知識(shí)流動(dòng)
2.2.2 專利領(lǐng)域的知識(shí)流動(dòng)
3 基于引用語(yǔ)境的數(shù)據(jù)集構(gòu)建及標(biāo)注
3.1 數(shù)據(jù)獲取及預(yù)處理
3.2 數(shù)據(jù)庫(kù)統(tǒng)計(jì)與描述
3.3 知識(shí)單元?jiǎng)澐趾蛿?shù)據(jù)標(biāo)注
3.3.1 知識(shí)單元?jiǎng)澐?br> 3.3.2 數(shù)據(jù)標(biāo)注
3.4 本章小結(jié)
4 基于Bi-LSTM-CRF模型的知識(shí)單元挖掘
4.1 相關(guān)理論技術(shù)的介紹
4.1.1 詞向量層
4.1.2 CRF模型
4.1.3 LSTM模型
4.2 Bi-LSTM-CRF模型的構(gòu)建
4.2.1 Bi-LSTM-CRF模型
4.2.2 特征提取
4.2.3 評(píng)測(cè)標(biāo)準(zhǔn)
4.3 實(shí)驗(yàn)及結(jié)果分析
4.3.1 實(shí)驗(yàn)數(shù)據(jù)集
4.3.2 實(shí)驗(yàn)及結(jié)果分析
4.3.3 對(duì)比分析
4.4 本章小結(jié)
5 知識(shí)單元的流動(dòng)模式分析
5.1 異構(gòu)信息網(wǎng)絡(luò)
5.1.1 異構(gòu)信息網(wǎng)絡(luò)基本概念
5.1.2 異構(gòu)網(wǎng)絡(luò)分析及其應(yīng)用
5.2 知識(shí)單元的流動(dòng)模式
5.2.1 宏觀層面的知識(shí)單元流動(dòng)模式
5.2.2 微觀層面的知識(shí)單元流動(dòng)模式
5.3 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
個(gè)人簡(jiǎn)介
導(dǎo)師簡(jiǎn)介
致謝
本文編號(hào):3989593
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3989593.html
最近更新
教材專著