基于概念圖的文本跨語(yǔ)言信息檢索技術(shù)研究
發(fā)布時(shí)間:2023-02-12 18:30
傳統(tǒng)的文本跨語(yǔ)言信息檢索方法主要依賴(lài)于翻譯技術(shù),通過(guò)對(duì)源文本的翻譯,在另一種語(yǔ)言環(huán)境中進(jìn)行信息檢索。近年來(lái),基于語(yǔ)義的文本處理方法在很多自然語(yǔ)言處理領(lǐng)域中表現(xiàn)優(yōu)秀。對(duì)此,本文研究了一種基于語(yǔ)義的文本跨語(yǔ)言信息檢索的技術(shù),本技術(shù)基于文本概念圖實(shí)現(xiàn)跨語(yǔ)言檢索,其中包括雙語(yǔ)概念圖的構(gòu)建、雙語(yǔ)概念圖的向量化表示與檢索。概念圖的構(gòu)建部分是對(duì)文本全文進(jìn)行形式化表示,可以在大大壓縮文本大小的情況下對(duì)文本中的重要信息進(jìn)行保留。先利用融合Attention機(jī)制的LSTM網(wǎng)絡(luò),構(gòu)造生成式摘要模型,對(duì)長(zhǎng)文本進(jìn)行自動(dòng)摘要。該模型對(duì)全文中重要的概念和關(guān)系進(jìn)行初步過(guò)濾。對(duì)摘要中的概念和關(guān)系進(jìn)行簡(jiǎn)要的句法詞性標(biāo)注后,通過(guò)關(guān)系建立概念間鏈接,再通過(guò)邊的擴(kuò)展和融合方法對(duì)次重要關(guān)系進(jìn)行消除,引入間接關(guān)系并保留重要關(guān)系,生成概念間的拓?fù)鋱D結(jié)構(gòu)。雙語(yǔ)概念圖的向量化表示與檢索部分是對(duì)概念圖進(jìn)行向量空間嵌入,生成概念圖在向量空間中的圖級(jí)別標(biāo)簽,進(jìn)而進(jìn)行相似檢索。通過(guò)對(duì)圖結(jié)構(gòu)和內(nèi)容的融合嵌入,相似的跨語(yǔ)言概念圖在嵌入后也表現(xiàn)為相似。本文提出了概念圖的跨語(yǔ)言信息檢索框架CG-CLIR框架,該框架融合了概念圖中的上下文節(jié)點(diǎn)關(guān)系信息與概...
【文章頁(yè)數(shù)】:82 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 課題背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 跨語(yǔ)言信息檢索
1.2.2 文本概念圖應(yīng)用
1.2.3 研究現(xiàn)狀存在問(wèn)題
1.3 論文研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)理論及技術(shù)
2.1 文本摘要抽取相關(guān)技術(shù)
2.1.1 抽取式文本摘要
2.1.2 生成式文本摘要
2.1.3 摘要評(píng)價(jià)技術(shù)
2.2 文本概念圖相關(guān)技術(shù)
2.3 文本相似度計(jì)算相關(guān)技術(shù)
2.3.1 Word2Vec工具
2.3.2 Bi-LSTM技術(shù)
2.4 本章小結(jié)
第3章 基于神經(jīng)網(wǎng)絡(luò)的概念圖構(gòu)建技術(shù)
3.1 引言
3.2 生成式摘要模型構(gòu)建
3.2.1 模型概述
3.2.2 雙語(yǔ)語(yǔ)料庫(kù)處理
3.2.3 自動(dòng)摘要Encoder-Decoder模型設(shè)計(jì)
3.2.4 參數(shù)推斷
3.3 融合語(yǔ)法樹(shù)的概念圖構(gòu)造
3.3.1 關(guān)鍵實(shí)體識(shí)別
3.3.2 屬性發(fā)現(xiàn)與附加
3.3.3 基于Bi-LSTM的概念圖構(gòu)建
3.4 實(shí)驗(yàn)與分析
3.4.1 實(shí)驗(yàn)語(yǔ)料處理
3.4.2 自動(dòng)摘要實(shí)驗(yàn)及結(jié)果分析
3.4.3 概念圖構(gòu)建實(shí)驗(yàn)及結(jié)果分析
3.5 本章小結(jié)
第4章 跨語(yǔ)言相似度評(píng)估框架CG-CLIR
4.1 引言
4.2 CG-CLIR框架介紹
4.3 基于Skip-Gram的概念圖邊表示
4.3.1 文本預(yù)處理
4.3.2 概念圖邊語(yǔ)義嵌入
4.4 融合邊信息的高階語(yǔ)義嵌入及相似度計(jì)算
4.4.1 基于LSTM的圖級(jí)別語(yǔ)義嵌入
4.4.2 基于圖嵌入的相似度計(jì)算
4.5 實(shí)驗(yàn)設(shè)計(jì)與分析
4.5.1 雙語(yǔ)語(yǔ)料處理
4.5.2 圖中關(guān)系嵌入表示效果分析
4.5.3 單語(yǔ)語(yǔ)料與雙語(yǔ)語(yǔ)料實(shí)驗(yàn)分析
4.5.4 跨語(yǔ)言信息檢索實(shí)驗(yàn)結(jié)果
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文和取得的科研成果
致謝
本文編號(hào):3741603
【文章頁(yè)數(shù)】:82 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 課題背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 跨語(yǔ)言信息檢索
1.2.2 文本概念圖應(yīng)用
1.2.3 研究現(xiàn)狀存在問(wèn)題
1.3 論文研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)理論及技術(shù)
2.1 文本摘要抽取相關(guān)技術(shù)
2.1.1 抽取式文本摘要
2.1.2 生成式文本摘要
2.1.3 摘要評(píng)價(jià)技術(shù)
2.2 文本概念圖相關(guān)技術(shù)
2.3 文本相似度計(jì)算相關(guān)技術(shù)
2.3.1 Word2Vec工具
2.3.2 Bi-LSTM技術(shù)
2.4 本章小結(jié)
第3章 基于神經(jīng)網(wǎng)絡(luò)的概念圖構(gòu)建技術(shù)
3.1 引言
3.2 生成式摘要模型構(gòu)建
3.2.1 模型概述
3.2.2 雙語(yǔ)語(yǔ)料庫(kù)處理
3.2.3 自動(dòng)摘要Encoder-Decoder模型設(shè)計(jì)
3.2.4 參數(shù)推斷
3.3 融合語(yǔ)法樹(shù)的概念圖構(gòu)造
3.3.1 關(guān)鍵實(shí)體識(shí)別
3.3.2 屬性發(fā)現(xiàn)與附加
3.3.3 基于Bi-LSTM的概念圖構(gòu)建
3.4 實(shí)驗(yàn)與分析
3.4.1 實(shí)驗(yàn)語(yǔ)料處理
3.4.2 自動(dòng)摘要實(shí)驗(yàn)及結(jié)果分析
3.4.3 概念圖構(gòu)建實(shí)驗(yàn)及結(jié)果分析
3.5 本章小結(jié)
第4章 跨語(yǔ)言相似度評(píng)估框架CG-CLIR
4.1 引言
4.2 CG-CLIR框架介紹
4.3 基于Skip-Gram的概念圖邊表示
4.3.1 文本預(yù)處理
4.3.2 概念圖邊語(yǔ)義嵌入
4.4 融合邊信息的高階語(yǔ)義嵌入及相似度計(jì)算
4.4.1 基于LSTM的圖級(jí)別語(yǔ)義嵌入
4.4.2 基于圖嵌入的相似度計(jì)算
4.5 實(shí)驗(yàn)設(shè)計(jì)與分析
4.5.1 雙語(yǔ)語(yǔ)料處理
4.5.2 圖中關(guān)系嵌入表示效果分析
4.5.3 單語(yǔ)語(yǔ)料與雙語(yǔ)語(yǔ)料實(shí)驗(yàn)分析
4.5.4 跨語(yǔ)言信息檢索實(shí)驗(yàn)結(jié)果
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文和取得的科研成果
致謝
本文編號(hào):3741603
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3741603.html
最近更新
教材專(zhuān)著