面向文獻著者的跨文本指代消解研究
發(fā)布時間:2023-09-02 12:55
在科學研究領域,通過文獻著者搜索相關信息是學術信息檢索的主要方式。然而,在各類文獻管理系統(tǒng)中,文獻著者的跨文本指代現(xiàn)象非常嚴重,給學術信息檢索帶來了諸多困難。例如:如何消除不同文獻之間的同名作者歧義性問題,即:重名消歧;如何消除不同文獻之間的作者指代不統(tǒng)一問題,即:多名聚合。在解決重名消歧問題時,已有方法主要通過作者合作關系、作者主頁、郵箱等信息對重名作者進行分類。由于作者的郵箱和主頁信息很難獲取,如何在這些信息未知的情況下,準確的劃分文獻著者類別,是重名消歧需要解決的核心問題。此外,文獻著者名字的表示形式多樣,甚至存在未知形式的名字變體。因此,如何在名字變體未知的情況下,實現(xiàn)多名聚合是跨文本指代消解所面臨的又一問題。針對上述問題,本文的主要研究內(nèi)容如下:(1)提出了基于網(wǎng)絡表示學習的重名消歧算法。該方法可以在作者郵箱、主頁等信息不可獲取,以及作者具體類別個數(shù)未知的情況下,解決文獻著者重名消歧問題。首先,利用待消歧作者的多階合作者及論文-作者關系,構(gòu)建論文-論文網(wǎng)絡。其次,通過圖網(wǎng)絡學習得到論文的特征向量表示。最后,利用論文之間的關系網(wǎng)絡,實現(xiàn)文獻著者的重名消歧。(2)提出了基于特征相...
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 本文組織結(jié)構(gòu)
第2章 相關工作及算法綜述
2.1 跨文本指代消解簡介
2.2 網(wǎng)絡表示學習簡介
2.3 重名消歧的相關研究
2.3.1 基于特征聚類方式的重名消歧
2.3.2 基于樹方式的重名消歧
2.3.3 基于圖方式的重名消歧
2.3.4 其他
2.4 多名聚合的相關研究
2.5 本章小結(jié)
第3章 基于網(wǎng)絡表示學習的重名消歧算法
3.1 基本思想
3.2 問題定義
3.2.1 基本定義
3.2.2 重名消歧任務定義
3.3 模型框架
3.3.1 模型定義
3.3.2 模型優(yōu)化
3.4 聚類
3.4.1 AP聚類算法
3.4.2 DBSCAN算法
3.5 實驗結(jié)果與分析
3.5.1 數(shù)據(jù)集
3.5.2 對比算法
3.5.3 實驗設置
3.5.4 實驗結(jié)果
3.6 本章小結(jié)
第4章 面向文獻著者的多名聚合算法
4.1 基本思想
4.2 問題定義
4.3 基于特征相似度的多名聚合算法
4.3.1 構(gòu)建作者名字變體
4.3.2 構(gòu)建論文關鍵詞
4.3.3 關鍵詞相似度計算
4.3.4 作者相似度計算
4.3.5 期刊相似度計算
4.4 基于監(jiān)督學習的多名聚合算法
4.4.1 構(gòu)建名人庫
4.4.2 論文標題匹配
4.4.3 BLEU算法
4.4.4 論文作者匹配
4.4.5 人工標注
4.5 實驗結(jié)果與分析
4.5.1 數(shù)據(jù)集
4.5.2 對比算法
4.5.3 實驗設置
4.5.4 實驗結(jié)果
4.6 本章小結(jié)
第5章 跨文本指代消解算法的應用
5.1 學術頭條
5.2 基于網(wǎng)絡表示學習的重名消歧算法的應用
5.3 基于特征相似度的多名聚合算法的應用
5.4 本章小結(jié)
第6章 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻
作者簡介及科研成果
致謝
本文編號:3845241
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 本文組織結(jié)構(gòu)
第2章 相關工作及算法綜述
2.1 跨文本指代消解簡介
2.2 網(wǎng)絡表示學習簡介
2.3 重名消歧的相關研究
2.3.1 基于特征聚類方式的重名消歧
2.3.2 基于樹方式的重名消歧
2.3.3 基于圖方式的重名消歧
2.3.4 其他
2.4 多名聚合的相關研究
2.5 本章小結(jié)
第3章 基于網(wǎng)絡表示學習的重名消歧算法
3.1 基本思想
3.2 問題定義
3.2.1 基本定義
3.2.2 重名消歧任務定義
3.3 模型框架
3.3.1 模型定義
3.3.2 模型優(yōu)化
3.4 聚類
3.4.1 AP聚類算法
3.4.2 DBSCAN算法
3.5 實驗結(jié)果與分析
3.5.1 數(shù)據(jù)集
3.5.2 對比算法
3.5.3 實驗設置
3.5.4 實驗結(jié)果
3.6 本章小結(jié)
第4章 面向文獻著者的多名聚合算法
4.1 基本思想
4.2 問題定義
4.3 基于特征相似度的多名聚合算法
4.3.1 構(gòu)建作者名字變體
4.3.2 構(gòu)建論文關鍵詞
4.3.3 關鍵詞相似度計算
4.3.4 作者相似度計算
4.3.5 期刊相似度計算
4.4 基于監(jiān)督學習的多名聚合算法
4.4.1 構(gòu)建名人庫
4.4.2 論文標題匹配
4.4.3 BLEU算法
4.4.4 論文作者匹配
4.4.5 人工標注
4.5 實驗結(jié)果與分析
4.5.1 數(shù)據(jù)集
4.5.2 對比算法
4.5.3 實驗設置
4.5.4 實驗結(jié)果
4.6 本章小結(jié)
第5章 跨文本指代消解算法的應用
5.1 學術頭條
5.2 基于網(wǎng)絡表示學習的重名消歧算法的應用
5.3 基于特征相似度的多名聚合算法的應用
5.4 本章小結(jié)
第6章 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻
作者簡介及科研成果
致謝
本文編號:3845241
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3845241.html
最近更新
教材專著