天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于多源異構(gòu)數(shù)據(jù)的中文旅游知識(shí)圖譜構(gòu)建方法研究

發(fā)布時(shí)間:2023-08-29 20:33
  在大數(shù)據(jù)時(shí)代背景下,互聯(lián)網(wǎng)的信息數(shù)量呈現(xiàn)指數(shù)式的增長趨勢,如何從這些海量數(shù)據(jù)中高效并準(zhǔn)確地挖掘出有用的信息已經(jīng)成為了信息檢索的研究熱點(diǎn)之一。知識(shí)圖譜(Knowledge Graph)以圖結(jié)構(gòu)的形式描述存在于真實(shí)世界中的實(shí)體與實(shí)體間關(guān)系,并通過大數(shù)據(jù)提煉出知識(shí)庫,能夠?qū)?shù)據(jù)進(jìn)行智能地組織和整合,是為搜索引擎提供精準(zhǔn)答案的技術(shù)基礎(chǔ)。知識(shí)圖譜的構(gòu)建研究在海量互聯(lián)網(wǎng)知識(shí)的識(shí)抽取以及知識(shí)組織管理上體現(xiàn)了重要的應(yīng)用價(jià)值。目前存在的知識(shí)圖譜多為面向全領(lǐng)域的通用知識(shí)圖譜,強(qiáng)調(diào)知識(shí)的廣度,但是缺乏對(duì)實(shí)體知識(shí)深層次的挖掘。并且針對(duì)性較強(qiáng)的領(lǐng)域知識(shí)圖譜,尤其是旅游領(lǐng)域的知識(shí)圖譜研究很少且起步較晚,且沒有較好的構(gòu)建以及表示方法。已經(jīng)構(gòu)建好的旅游知識(shí)圖譜,大都僅基于百科知識(shí)進(jìn)行構(gòu)建,導(dǎo)致知識(shí)較單一,尚不具有擴(kuò)展性,適用性較差。針對(duì)這些問題,本文研究從多源異構(gòu)數(shù)據(jù)中構(gòu)建中文旅游領(lǐng)域知識(shí)圖譜并探索其應(yīng)用。本文研究內(nèi)容包括:旅游知識(shí)圖譜的數(shù)據(jù)來源分析,并對(duì)不同來源數(shù)據(jù)進(jìn)行知識(shí)抽取、多源異構(gòu)數(shù)據(jù)的實(shí)體對(duì)齊,以及旅游知識(shí)圖譜的應(yīng)用研究三部分,具體介紹如下:(1)為了構(gòu)建出一個(gè)高質(zhì)量的旅游知識(shí)圖譜,本文首先針對(duì)互聯(lián)網(wǎng)中的各...

【文章頁數(shù)】:71 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 研究背景和意義
    1.2 知識(shí)圖譜相關(guān)研究現(xiàn)狀
        1.2.1 知識(shí)圖譜研究現(xiàn)狀
        1.2.2 知識(shí)抽取研究現(xiàn)狀
        1.2.3 實(shí)體對(duì)齊研究現(xiàn)狀
    1.3 研究內(nèi)容
    1.4 論文組織結(jié)構(gòu)
第2章 多源異構(gòu)的中文旅游知識(shí)抽取
    2.1 知識(shí)來源分析
    2.2 基于百科站點(diǎn)的知識(shí)抽取
        2.2.1 基于百科頁面的半結(jié)構(gòu)化知識(shí)抽取
        2.2.2 基于百科頁面的非結(jié)構(gòu)化知識(shí)抽取
    2.3 基于垂直網(wǎng)站知識(shí)抽取
    2.4 基于CRF和候選句的屬性擴(kuò)充
        2.4.1 基于infobox構(gòu)建屬性詞表
        2.4.2 候選句選擇
        2.4.3 基于CRF和候選句的實(shí)體屬性值抽取
        2.4.4 實(shí)驗(yàn)及實(shí)驗(yàn)結(jié)果分析
    2.5 本章小結(jié)
第3章 知識(shí)圖譜中的知識(shí)融合
    3.1 知識(shí)圖譜中的實(shí)體對(duì)齊
    3.2 基于神經(jīng)網(wǎng)絡(luò)的詞向量表示技術(shù)
        3.2.1 Skip-gram模型和CBOW模型
        3.2.2 Directional Skip-Gram(DSG)模型
        3.2.3 基于BERT模型的詞向量表示技術(shù)
    3.3 基于BERT的實(shí)體對(duì)齊實(shí)驗(yàn)
    3.4 本章小結(jié)
第4章 基于旅游領(lǐng)域知識(shí)圖譜的應(yīng)用
    4.1 旅游知識(shí)圖譜的知識(shí)庫整理與存儲(chǔ)
    4.2 基于旅游領(lǐng)域知識(shí)圖譜的搜索應(yīng)用
        4.2.1 基于關(guān)鍵字模式匹配
        4.2.2 關(guān)鍵詞同義詞典構(gòu)建
        4.2.3 基于模式匹配和旅游知識(shí)庫的搜索
    4.3 中文旅游知識(shí)圖譜的可視化系統(tǒng)
    4.4 本章總結(jié)
第5章 總結(jié)和展望
    5.1 全文總結(jié)
    5.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間研究成果



本文編號(hào):3844237

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3844237.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶27d7f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com