互聯(lián)網(wǎng)人物摘要知識(shí)圖譜構(gòu)建方法研究
發(fā)布時(shí)間:2021-02-18 08:40
知識(shí)圖譜構(gòu)建主要研究如何從互聯(lián)網(wǎng)公開(kāi)網(wǎng)頁(yè)中識(shí)別指定人物的相關(guān)信息,并根據(jù)信息構(gòu)建結(jié)構(gòu)化的人物摘要知識(shí)圖譜。構(gòu)建過(guò)程包括從一般網(wǎng)頁(yè)中抽取人物信息和根據(jù)人物摘要本體模型從信息中抽取人物的知識(shí)三元組。目前并不缺乏本體建模的理論研究,但是在具體應(yīng)用中缺少指導(dǎo)性規(guī)范,特別是人物摘要本體構(gòu)建過(guò)程中涉及的多元關(guān)系建模,人物本體建模的質(zhì)量參差不齊。由于互聯(lián)網(wǎng)網(wǎng)頁(yè)的網(wǎng)頁(yè)種類和內(nèi)容類型繁多,現(xiàn)有的模板匹配和正文抽取算法都不能直接用于從返回的異構(gòu)網(wǎng)頁(yè)中抽取與人物相關(guān)的信息,從互聯(lián)網(wǎng)中獲取知識(shí)需要解決從一般網(wǎng)頁(yè)抽取人物相關(guān)信息的問(wèn)題。目前深度學(xué)習(xí)逐漸成為知識(shí)抽取的主流算法,然而深度學(xué)習(xí)抽取領(lǐng)域知識(shí)三元組的主要難點(diǎn)在于缺乏標(biāo)記樣本無(wú)法訓(xùn)練網(wǎng)絡(luò),特別是多元關(guān)系的抽取;ヂ(lián)網(wǎng)人名檢索得到的網(wǎng)頁(yè)可能對(duì)應(yīng)現(xiàn)實(shí)中多個(gè)不同的實(shí)體,為了避免不同實(shí)體之間信息的相互干擾需要進(jìn)行人名消歧。現(xiàn)有的消歧算法主要依賴于文本層次聚類,不同人名聚類采用的相似閾值和合并策略并不完全相同,導(dǎo)致實(shí)驗(yàn)效果并不理想。綜上所述,本文的主要研究從人物摘要本體模型構(gòu)建,互聯(lián)網(wǎng)人物信息抽取,人物屬性和關(guān)系抽取,人名消歧四個(gè)方面展開(kāi)研究:本體模型建模方法研究。...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:128 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 本體建模方法研究現(xiàn)狀
1.2.2 網(wǎng)頁(yè)信息抽取研究現(xiàn)狀
1.2.3 文本關(guān)系抽取研究現(xiàn)狀
1.2.4 網(wǎng)頁(yè)重名人物消歧研究現(xiàn)狀
1.3 本文的主要研究?jī)?nèi)容和創(chuàng)新點(diǎn)
1.3.1 主要研究?jī)?nèi)容
1.3.2 主要?jiǎng)?chuàng)新點(diǎn)
1.4 論文的組織結(jié)構(gòu)
第2章 人物摘要本體模型構(gòu)建與評(píng)估
2.1 引言
2.2 一種人物本體多元關(guān)系定義規(guī)范
2.2.1 人物本體多元關(guān)系分析
2.2.2 通用實(shí)體多元關(guān)系定義
2.2.3 可重用多元關(guān)系定義方法
2.3 人物摘要本體兼容設(shè)計(jì)模式
2.4 基于層次分析的本體模型評(píng)估
2.4.1 本體模型評(píng)估指標(biāo)構(gòu)建
2.4.2 本體評(píng)估質(zhì)量度量標(biāo)準(zhǔn)
2.4.3 本體模型質(zhì)量評(píng)估計(jì)算
2.5 本章小結(jié)
第3章 互聯(lián)網(wǎng)人物信息抽取算法
3.1 引言
3.2 基于序列塊的網(wǎng)頁(yè)表示模型
3.2.1 網(wǎng)頁(yè)序列塊模型生成方法
3.2.2 網(wǎng)頁(yè)人物信息序列塊表示
3.3 基于循環(huán)網(wǎng)絡(luò)的人物信息抽取算法
3.3.1 長(zhǎng)短時(shí)記憶循環(huán)網(wǎng)絡(luò)
3.3.2 人物信息抽取網(wǎng)絡(luò)結(jié)構(gòu)
3.4 實(shí)驗(yàn)結(jié)果及分析
3.4.1 實(shí)驗(yàn)數(shù)據(jù)預(yù)處理
3.4.2 模型訓(xùn)練與參數(shù)優(yōu)化
3.4.3 人物信息抽取結(jié)果分析
3.5 本章小結(jié)
第4章 人物本體屬性和多元關(guān)系抽取
4.1 引言
4.2 人物屬性抽取算法
4.2.1 人物屬性抽取問(wèn)題定義
4.2.2 基于注意力模型的人物屬性抽取算法
4.3 基于自監(jiān)督的多元關(guān)系標(biāo)記算法
4.3.1 多元關(guān)系標(biāo)記問(wèn)題定義
4.3.2 深度學(xué)習(xí)自監(jiān)督性分析
4.3.3 基于自監(jiān)督的樣本標(biāo)記算法流程
4.4 實(shí)驗(yàn)結(jié)果及分析
4.4.1 屬性抽取實(shí)驗(yàn)結(jié)果及分析
4.4.2 多元關(guān)系標(biāo)記仿真實(shí)驗(yàn)結(jié)果及分析
4.4.3 人物摘要多元關(guān)系標(biāo)記實(shí)驗(yàn)結(jié)果及分析
4.5 本章小結(jié)
第5章 網(wǎng)絡(luò)重名人物信息消歧算法
5.1 引言
5.2 網(wǎng)絡(luò)人名消歧問(wèn)題定義
5.3 包含文本主題的無(wú)閾值人名消歧方法
5.3.1 豐富網(wǎng)頁(yè)主題特征的消歧向量構(gòu)建
5.3.2 狄利克雷過(guò)程人名消歧算法
5.3.3 變分推斷模型求解
5.3.4 算法參數(shù)及評(píng)價(jià)指標(biāo)
5.4 實(shí)驗(yàn)結(jié)果及分析
5.4.1 網(wǎng)頁(yè)主題特征抽取實(shí)驗(yàn)及分析
5.4.2 人名消歧實(shí)驗(yàn)結(jié)果及分析
5.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀博士學(xué)位期間發(fā)表的論文及其他成果
致謝
個(gè)人簡(jiǎn)歷
【參考文獻(xiàn)】:
期刊論文
[1]從文本中構(gòu)建領(lǐng)域本體技術(shù)綜述[J]. 任飛亮,沈繼坤,孫賓賓,朱靖波. 計(jì)算機(jī)學(xué)報(bào). 2019(03)
[2]基于核函數(shù)中文關(guān)系自動(dòng)抽取系統(tǒng)的實(shí)現(xiàn)[J]. 劉克彬,李芳,劉磊,韓穎. 計(jì)算機(jī)研究與發(fā)展. 2007(08)
[3]基于統(tǒng)計(jì)的網(wǎng)頁(yè)正文信息抽取方法的研究[J]. 孫承杰,關(guān)毅. 中文信息學(xué)報(bào). 2004(05)
[4]Ontology方法學(xué)綜述[J]. 楊秋芬,陳躍新. 計(jì)算機(jī)應(yīng)用研究. 2002(04)
本文編號(hào):3039324
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:128 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 本體建模方法研究現(xiàn)狀
1.2.2 網(wǎng)頁(yè)信息抽取研究現(xiàn)狀
1.2.3 文本關(guān)系抽取研究現(xiàn)狀
1.2.4 網(wǎng)頁(yè)重名人物消歧研究現(xiàn)狀
1.3 本文的主要研究?jī)?nèi)容和創(chuàng)新點(diǎn)
1.3.1 主要研究?jī)?nèi)容
1.3.2 主要?jiǎng)?chuàng)新點(diǎn)
1.4 論文的組織結(jié)構(gòu)
第2章 人物摘要本體模型構(gòu)建與評(píng)估
2.1 引言
2.2 一種人物本體多元關(guān)系定義規(guī)范
2.2.1 人物本體多元關(guān)系分析
2.2.2 通用實(shí)體多元關(guān)系定義
2.2.3 可重用多元關(guān)系定義方法
2.3 人物摘要本體兼容設(shè)計(jì)模式
2.4 基于層次分析的本體模型評(píng)估
2.4.1 本體模型評(píng)估指標(biāo)構(gòu)建
2.4.2 本體評(píng)估質(zhì)量度量標(biāo)準(zhǔn)
2.4.3 本體模型質(zhì)量評(píng)估計(jì)算
2.5 本章小結(jié)
第3章 互聯(lián)網(wǎng)人物信息抽取算法
3.1 引言
3.2 基于序列塊的網(wǎng)頁(yè)表示模型
3.2.1 網(wǎng)頁(yè)序列塊模型生成方法
3.2.2 網(wǎng)頁(yè)人物信息序列塊表示
3.3 基于循環(huán)網(wǎng)絡(luò)的人物信息抽取算法
3.3.1 長(zhǎng)短時(shí)記憶循環(huán)網(wǎng)絡(luò)
3.3.2 人物信息抽取網(wǎng)絡(luò)結(jié)構(gòu)
3.4 實(shí)驗(yàn)結(jié)果及分析
3.4.1 實(shí)驗(yàn)數(shù)據(jù)預(yù)處理
3.4.2 模型訓(xùn)練與參數(shù)優(yōu)化
3.4.3 人物信息抽取結(jié)果分析
3.5 本章小結(jié)
第4章 人物本體屬性和多元關(guān)系抽取
4.1 引言
4.2 人物屬性抽取算法
4.2.1 人物屬性抽取問(wèn)題定義
4.2.2 基于注意力模型的人物屬性抽取算法
4.3 基于自監(jiān)督的多元關(guān)系標(biāo)記算法
4.3.1 多元關(guān)系標(biāo)記問(wèn)題定義
4.3.2 深度學(xué)習(xí)自監(jiān)督性分析
4.3.3 基于自監(jiān)督的樣本標(biāo)記算法流程
4.4 實(shí)驗(yàn)結(jié)果及分析
4.4.1 屬性抽取實(shí)驗(yàn)結(jié)果及分析
4.4.2 多元關(guān)系標(biāo)記仿真實(shí)驗(yàn)結(jié)果及分析
4.4.3 人物摘要多元關(guān)系標(biāo)記實(shí)驗(yàn)結(jié)果及分析
4.5 本章小結(jié)
第5章 網(wǎng)絡(luò)重名人物信息消歧算法
5.1 引言
5.2 網(wǎng)絡(luò)人名消歧問(wèn)題定義
5.3 包含文本主題的無(wú)閾值人名消歧方法
5.3.1 豐富網(wǎng)頁(yè)主題特征的消歧向量構(gòu)建
5.3.2 狄利克雷過(guò)程人名消歧算法
5.3.3 變分推斷模型求解
5.3.4 算法參數(shù)及評(píng)價(jià)指標(biāo)
5.4 實(shí)驗(yàn)結(jié)果及分析
5.4.1 網(wǎng)頁(yè)主題特征抽取實(shí)驗(yàn)及分析
5.4.2 人名消歧實(shí)驗(yàn)結(jié)果及分析
5.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀博士學(xué)位期間發(fā)表的論文及其他成果
致謝
個(gè)人簡(jiǎn)歷
【參考文獻(xiàn)】:
期刊論文
[1]從文本中構(gòu)建領(lǐng)域本體技術(shù)綜述[J]. 任飛亮,沈繼坤,孫賓賓,朱靖波. 計(jì)算機(jī)學(xué)報(bào). 2019(03)
[2]基于核函數(shù)中文關(guān)系自動(dòng)抽取系統(tǒng)的實(shí)現(xiàn)[J]. 劉克彬,李芳,劉磊,韓穎. 計(jì)算機(jī)研究與發(fā)展. 2007(08)
[3]基于統(tǒng)計(jì)的網(wǎng)頁(yè)正文信息抽取方法的研究[J]. 孫承杰,關(guān)毅. 中文信息學(xué)報(bào). 2004(05)
[4]Ontology方法學(xué)綜述[J]. 楊秋芬,陳躍新. 計(jì)算機(jī)應(yīng)用研究. 2002(04)
本文編號(hào):3039324
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3039324.html
最近更新
教材專著