天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 教育論文 > 課堂教學(xué)論文 >

EVSR:一種用于提取并可視化文本類學(xué)習(xí)資源中語義關(guān)系的技術(shù)框架

發(fā)布時間:2021-03-11 11:44
  文本信息抽取指的是在具有指定實(shí)體類別的文本實(shí)例中找出目標(biāo)實(shí)體和語義關(guān)系的過程。雖然知識抽取在自然語言處理領(lǐng)域獲得了長足的發(fā)展,并已有一些知識抽取工具或系統(tǒng)可用于關(guān)系抽取,但是大多數(shù)工具和系統(tǒng)抽取的結(jié)果由于不滿足領(lǐng)域知識約束而缺乏可用性。現(xiàn)有的知識抽取系統(tǒng)無法直接應(yīng)用于教育領(lǐng)域的知識圖自動生成。因此本文提出了一個用于提取并可視化文本類學(xué)習(xí)資源中認(rèn)知價值語義關(guān)系的技術(shù)框架EVSR,它是由帶條件隨機(jī)場層的雙向長短期記憶神經(jīng)網(wǎng)絡(luò)(Bidirectional Long Short-Term Memory,BiLSTM-CRF)和分段卷積神經(jīng)網(wǎng)絡(luò)(Piecewise Convolutional Neural Networks,PCNN)實(shí)現(xiàn)的。在EVSR中,BiLSTM-CRF模型用于提取語義實(shí)體,PCNN模型用于識別語義關(guān)系。本文還實(shí)現(xiàn)了EVSR的原型系統(tǒng),系統(tǒng)可以識別出文本類學(xué)習(xí)資源中的語義關(guān)系實(shí)體對。語義關(guān)系實(shí)體對經(jīng)過合并、推理等操作可以生成一個語義鏈網(wǎng)絡(luò)(Sematic Link Network,SLN)。最后SLN可以以概念圖的形式可視化。本文還在準(zhǔn)確率,適應(yīng)性等方面將這兩個模型與前期研... 

【文章來源】:四川師范大學(xué)四川省

【文章頁數(shù)】:64 頁

【學(xué)位級別】:碩士

【部分圖文】:

EVSR:一種用于提取并可視化文本類學(xué)習(xí)資源中語義關(guān)系的技術(shù)框架


知識表征在各個領(lǐng)域的含義[39]

概念,實(shí)體,語義關(guān)系,文本


關(guān)系,其含義是指存在自然語言文本中,對學(xué)生的學(xué)習(xí)、認(rèn)知具有幫助的信息。體現(xiàn)在文本中是一些相關(guān)的知識點(diǎn)、概念、概念的定義、解釋說明、舉例等,這些語義關(guān)系有助于培養(yǎng)學(xué)生的知識整合能力。知識抽取和可視化的基礎(chǔ)是通過文本中的一些線索(如關(guān)鍵詞“包括”、“定義”、“代表著”、“指的是”、“例如”等)找到這些具有認(rèn)知價值的信息,并且提取出來,形成結(jié)構(gòu)化的資源,如一個語義鏈接的形式<語義節(jié)點(diǎn)1,關(guān)系,語義節(jié)點(diǎn)2>,其中語義節(jié)點(diǎn)可以是一個概念或是與概念相關(guān)的文本文本片段,本文將其稱為虛擬概念實(shí)體。如圖2.2可以抽取出實(shí)例關(guān)系的SLN<‘例如:inti,j,k’,exampleof,變量表>。圖2.2虛擬概念實(shí)體[47]本文的前期研究在線學(xué)習(xí)資源構(gòu)建模型[47]中,為不同的學(xué)習(xí)場景構(gòu)建不同種類的資源關(guān)系,但是在實(shí)際分析過程中存在語義關(guān)系定義不明確,虛擬概念實(shí)體識別困難,判斷實(shí)體間關(guān)系困難的問題,因此本文在已有的語義關(guān)系的基礎(chǔ)上,更加明確了語義關(guān)系的定義,擴(kuò)展了語義關(guān)系的種類,使得標(biāo)注和機(jī)器識別都能夠更加準(zhǔn)確和清楚。根據(jù)關(guān)系的有向性,本文將語義關(guān)系分為5個雙向相等關(guān)系和14個雙向不等關(guān)系,語義關(guān)系的含義如表2.1所示:

結(jié)構(gòu)圖,技術(shù)框架,可視,結(jié)構(gòu)圖


3知識抽取和可視化技術(shù)框架EVSR153知識抽取和可視化技術(shù)框架EVSR3.1EVSR技術(shù)框架結(jié)構(gòu)與概述本文的研究目的在于提出一個知識抽取和可視化技術(shù)框架EVSR,并進(jìn)行實(shí)例系統(tǒng)開發(fā)。EVSR框架的結(jié)構(gòu)如圖3.1所示,框架從下到上依次是原子層、語義鏈網(wǎng)絡(luò)層和展示層。最底層是原子層,主要由兩個知識抽取模塊構(gòu)成,分別是語義實(shí)體識別模塊和語義關(guān)系識別模塊。在語義實(shí)體識別模塊,本文使用經(jīng)過標(biāo)注和向量化的文本數(shù)據(jù)來訓(xùn)練一個BiLSTM-CRF神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)語義實(shí)體抽取的功能。語義關(guān)系識別模塊主要包括一個PCNN神經(jīng)網(wǎng)絡(luò)模型,用于抽取文本中語義關(guān)系對。語義鏈網(wǎng)絡(luò)層是一個虛擬概念層,數(shù)據(jù)庫查詢的結(jié)果和底層模型的識別結(jié)果都需要合并且生成一個語義鏈網(wǎng)絡(luò)后,再由前端頁面可視化。展示層包括交互界面和數(shù)據(jù)庫,交互界面為用戶提供服務(wù)和交互,數(shù)據(jù)庫中用于存放語義實(shí)體和語義實(shí)體對之間的關(guān)系,形成知識庫。圖3.1知識可視化技術(shù)框架EVSR結(jié)構(gòu)圖3.2語義實(shí)體識別模塊語義實(shí)體識別模塊的主要功能有兩個,一是訓(xùn)練一個語義實(shí)體識別神經(jīng)網(wǎng)絡(luò)模型BiLSTM-CRF,二是利用BiLSTM-CRF模型識別文本中的語義實(shí)體。模塊的輸入為非結(jié)構(gòu)化的自然語言文本,輸出是語義實(shí)體。

【參考文獻(xiàn)】:
期刊論文
[1]關(guān)系抽取綜述[J]. 謝德鵬,常青.  計算機(jī)應(yīng)用研究. 2020(07)
[2]面向中文開放領(lǐng)域的多元實(shí)體關(guān)系抽取研究[J]. 姚賢明,甘健侯,徐堅.  智能系統(tǒng)學(xué)報. 2019(03)
[3]基于數(shù)學(xué)教學(xué)的知識圖譜構(gòu)建[J]. 戈其平,鐘艷如.  計算機(jī)技術(shù)與發(fā)展. 2019(03)
[4]《機(jī)器學(xué)習(xí)》[J]. 周志華.  航空港. 2018(02)
[5]基于深度學(xué)習(xí)的中文實(shí)體關(guān)系抽取方法[J]. 孫紫陽,顧君忠,楊靜.  計算機(jī)工程. 2018(09)
[6]可演化的個人知識圖建構(gòu)及認(rèn)知評估模型研究[J]. 趙德芳,朱夢夢,楊娟.  現(xiàn)代遠(yuǎn)程教育研究. 2017(02)
[7]文本蘊(yùn)含關(guān)系識別與知識獲取研究進(jìn)展及展望[J]. 郭茂盛,張宇,劉挺.  計算機(jī)學(xué)報. 2017(04)
[8]基于依存分析的開放式中文實(shí)體關(guān)系抽取方法[J]. 李明耀,楊靜.  計算機(jī)工程. 2016(06)
[9]面向中文自然語言文檔的自動知識抽取方法[J]. 車海燕,馮鐵,張家晨,陳偉,李大利.  計算機(jī)研究與發(fā)展. 2013(04)
[10]知識可視化在計算機(jī)教學(xué)中的應(yīng)用[J]. 姜世華,陳新紅,梁鵬.  東北農(nóng)業(yè)大學(xué)學(xué)報(社會科學(xué)版). 2012(02)

碩士論文
[1]自規(guī)律學(xué)習(xí)平臺中基于語義鏈網(wǎng)絡(luò)的知識可視化研究[D]. 趙德芳.四川師范大學(xué) 2019
[2]“概念圖教學(xué)策略”在高中生物學(xué)教學(xué)中的實(shí)踐研究[D]. 趙映紅.四川師范大學(xué) 2018
[3]在線學(xué)習(xí)系統(tǒng)中知識構(gòu)建及應(yīng)用研究[D]. 朱夢夢.四川師范大學(xué) 2018
[4]學(xué)科知識的可視化技術(shù)研究與實(shí)現(xiàn)[D]. 張亞龍.電子科技大學(xué) 2016



本文編號:3076401

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jiaoyulunwen/ktjx/3076401.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶264a8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com