基于詞嵌入的本體對(duì)齊研究
發(fā)布時(shí)間:2022-07-14 10:59
計(jì)算機(jī)網(wǎng)絡(luò)的迅速發(fā)展導(dǎo)致數(shù)據(jù)產(chǎn)生爆炸式的增長(zhǎng),知識(shí)圖譜為這些網(wǎng)絡(luò)上異構(gòu)、海量、動(dòng)態(tài)數(shù)據(jù)的表示、組織、管理和利用提供了一種高效的方式,提高了網(wǎng)絡(luò)的智能化水平。本體是從客觀世界中抽象出來(lái)的概念模型,包含概念以及概念之間的關(guān)系,是對(duì)知識(shí)的抽象和對(duì)某個(gè)領(lǐng)域之中的概念及其之間關(guān)系的形式化表達(dá)。構(gòu)建本體的目的是描述領(lǐng)域知識(shí),領(lǐng)域中存在的并行本體開(kāi)發(fā)現(xiàn)象提出了本體對(duì)齊的需求。本體對(duì)齊以本體作為輸入,以對(duì)齊結(jié)果作為輸出,確定不同本體中語(yǔ)義相關(guān)的實(shí)體之間的對(duì)應(yīng)關(guān)系,是語(yǔ)義網(wǎng)互操作性的關(guān)鍵促成因素。隨著表示學(xué)習(xí)技術(shù)在自然語(yǔ)言處理領(lǐng)域的發(fā)展與成熟,專(zhuān)家學(xué)者開(kāi)始嘗試將其應(yīng)用于本體對(duì)齊問(wèn)題。與原有的特征提取方法相比,表示學(xué)習(xí)技術(shù)存在一定優(yōu)勢(shì),使用大量相關(guān)語(yǔ)料預(yù)訓(xùn)練得到的詞嵌入能夠表示單詞內(nèi)在的語(yǔ)義信息,識(shí)別字面表示不同而語(yǔ)義相同的單詞。但是由于詞嵌入的生成依靠單詞的上下文,這導(dǎo)致詞嵌入存在無(wú)法準(zhǔn)確區(qū)分語(yǔ)義相似性與描述相關(guān)性。為了解決這一問(wèn)題,本文結(jié)合本體對(duì)齊的具體任務(wù),使用SCBOW模型和Knowledge distillation模型對(duì)詞嵌入進(jìn)行改進(jìn),利用改進(jìn)后的詞嵌入獲取實(shí)體嵌入,從而計(jì)算兩個(gè)實(shí)體的相似度,...
【文章頁(yè)數(shù)】:53 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題來(lái)源
1.2 課題背景
1.3 研究意義
1.4 國(guó)內(nèi)外研究現(xiàn)狀
1.5 本文主要內(nèi)容
1.6 本文結(jié)構(gòu)安排
第2章 本體對(duì)齊相關(guān)技術(shù)與模型
2.1 問(wèn)題描述
2.2 相似度計(jì)算技術(shù)
2.2.1 字符串相似度
2.2.2 向量相似度
2.3 詞嵌入技術(shù)
2.3.1 one-hot編碼
2.3.2 word2vec
2.4 詞嵌入改進(jìn)技術(shù)
2.4.1 Siamese CBOW模型
2.4.2 知識(shí)蒸餾
2.4.3 降噪自動(dòng)編碼器
2.5 知識(shí)圖譜嵌入技術(shù)
2.6 本章小結(jié)
第3章 數(shù)據(jù)處理與本體對(duì)齊模型
3.1 本體簡(jiǎn)介
3.2 數(shù)據(jù)處理
3.2.1 UMLS本體數(shù)據(jù)獲取
3.2.2 精準(zhǔn)醫(yī)學(xué)本體數(shù)據(jù)獲取
3.3 本體對(duì)齊模型
3.3.1 SCBOW+Knowledge distillation模型
3.3.2 實(shí)體匹配算法
3.3.3 本體對(duì)齊任務(wù)中的改進(jìn)DAE
3.3.4 加入結(jié)構(gòu)信息的本體對(duì)齊模型
3.4 本章小結(jié)
第4章 實(shí)驗(yàn)設(shè)置與結(jié)果分析
4.1 數(shù)據(jù)集
4.2 模型參數(shù)設(shè)置
4.3 評(píng)價(jià)指標(biāo)
4.4 實(shí)驗(yàn)結(jié)果分析
4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
本文編號(hào):3661000
【文章頁(yè)數(shù)】:53 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題來(lái)源
1.2 課題背景
1.3 研究意義
1.4 國(guó)內(nèi)外研究現(xiàn)狀
1.5 本文主要內(nèi)容
1.6 本文結(jié)構(gòu)安排
第2章 本體對(duì)齊相關(guān)技術(shù)與模型
2.1 問(wèn)題描述
2.2 相似度計(jì)算技術(shù)
2.2.1 字符串相似度
2.2.2 向量相似度
2.3 詞嵌入技術(shù)
2.3.1 one-hot編碼
2.3.2 word2vec
2.4 詞嵌入改進(jìn)技術(shù)
2.4.1 Siamese CBOW模型
2.4.2 知識(shí)蒸餾
2.4.3 降噪自動(dòng)編碼器
2.5 知識(shí)圖譜嵌入技術(shù)
2.6 本章小結(jié)
第3章 數(shù)據(jù)處理與本體對(duì)齊模型
3.1 本體簡(jiǎn)介
3.2 數(shù)據(jù)處理
3.2.1 UMLS本體數(shù)據(jù)獲取
3.2.2 精準(zhǔn)醫(yī)學(xué)本體數(shù)據(jù)獲取
3.3 本體對(duì)齊模型
3.3.1 SCBOW+Knowledge distillation模型
3.3.2 實(shí)體匹配算法
3.3.3 本體對(duì)齊任務(wù)中的改進(jìn)DAE
3.3.4 加入結(jié)構(gòu)信息的本體對(duì)齊模型
3.4 本章小結(jié)
第4章 實(shí)驗(yàn)設(shè)置與結(jié)果分析
4.1 數(shù)據(jù)集
4.2 模型參數(shù)設(shè)置
4.3 評(píng)價(jià)指標(biāo)
4.4 實(shí)驗(yàn)結(jié)果分析
4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
本文編號(hào):3661000
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3661000.html
最近更新
教材專(zhuān)著