面向在線學習的輔助問答系統(tǒng)的設計與實現(xiàn)
發(fā)布時間:2021-07-07 20:17
互聯(lián)網(wǎng)的迅速發(fā)展促進了教育領域的信息化改革進程,通過各類學習平臺,學習者能輕易訪問豐富的數(shù)字資源,但“知識迷航”的現(xiàn)象也愈發(fā)普遍,不僅用戶無法定位所需知識內容,平臺往往也缺乏充分整合和利用教育大數(shù)據(jù)的手段。相比搜索引擎的檢索能力,輔助問答系統(tǒng)是提高知識獲取精準度的有力方法。本文針對在線學習的常見場景,從解決知識檢索和增強學習者交互體驗的角度出發(fā),結合自然語言處理的基本模型,提出面向在線學習的輔助問答模型,并基于該模型設計和實現(xiàn)對應的問答系統(tǒng),論文的主要工作如下:(1)分析在線學習場景的知識問答類型,通過網(wǎng)絡數(shù)據(jù)和開放語料庫抽取教育領域相關的問答對,使用分詞、詞嵌入等多種自然語言處理技術,從中識別出實體和關系形成三元組,并利用實體對齊和消歧的方法融合多來源的知識資源,構建出以RDF為表示方式的知識庫。(2)分別對知識查詢和引導學習者進行教學任務兩種應用場景,設計模型結構和訓練方案,驗證其有效性。對于面向知識查詢的問答模型,采取基于seq2seq結構的淺層神經(jīng)網(wǎng)絡,并綜合語義解析和搜索排序的結果來返回答案。對于面向教學任務的問答模型,則采用規(guī)則主導的有限狀態(tài)機,人工定義用例與邊界限制,為更...
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【部分圖文】:
圖2.5帶URI標識的三元組??
?碩士學位論文??MASTER'S?THESIS??-?A??15’??杳詢圖Q??B?— ̄ ̄"C-}?一??子__?o?'???識庫圖Pj?j?/?\W??(a)?(b)??圖2.6?(a)圖查詢步驟分解(b)子圖同構??與數(shù)據(jù)庫的SQL類似,知識庫中用結構化查詢語言SPARQL為用戶提供訪問??接口。SPARQL以三元組為基本操作單位,包括了補全、刪除、查詢等多種操作,??三元組含有以“??”開頭標識的變量,比如<?university,location,Beijing〉用來詢??問北京有哪些大學,而多個三元組可組成基本圖模式來表示更加復雜和具體的查詢??需求,比如<??university,location,?Beijing?>,<??university,?establish,?1950?>組合查??詢北京的哪些大學是1950年成立的。本文只介紹查詢方法中的SELECT語句。??SELECT語句由四部分組成,分別是選擇變量,數(shù)據(jù)來源,WHERE圖模式和修飾??符,如公式2.1。??SELECT?vl?v2?...?[FROM?dataset]WHERE?pattern?[modifier]?(公式?2.1)??變量指查詢的目標,對應在圖模式中出現(xiàn)的變量。數(shù)據(jù)來源默認省略,??在單個知識庫中不用指明。WHERE子句則為變量提供約束,查詢的結果需要符合??圖模式。圖模式可以是三元組,另一類則通過FILTER關鍵字。修飾符是可選項用??于對查詢結果進行排序操作OERDER,限制結果數(shù)量操作LIMIT等。??2.2.3實體識別??知識圖譜中的實體是描述知識概念的單位,在語言上有不同形式的體現(xiàn),實體
序列標注方法,將文本分為Begin,hside’?0thei■三??個部分,分別代表實體的開始,實體的其余部分,以及不屬于實體的部分。每句用??于訓練的文本被標注出實體與非實體,即有監(jiān)督機器學習來訓練命名實體識別方法。??比如“蘇(B)軾⑴出(〇)生(〇)于(0)眉(B)山⑴”,實體帶上B或者??I的標簽,實體之外則是〇。將CRF與神經(jīng)網(wǎng)絡結合當前NER比較流行的做法’比??如BiLSTM-CRF,引入神經(jīng)網(wǎng)絡既可以將離散的詞匯映射到地位空間,并且還可以??關聯(lián)詞語自身的前后語義,如圖2.7。??辦?,'?SC?出/?生/<?于乂?.?"?^?八山,U-?Embeds??^?^?^?/X?^?X?Cn?/;??…挪,^二t ̄??繼?,:丨報\?'\°y?〈°〉-挪、??圖2.7?Bi-LSTM實體識別??該模型輸入為詞向量,通過word2vec獲得。雙向LSTM分別迪過正向和反向結構??處理詞的兩側對應的向量,然后進行向量連接。最后由CRF層判斷條件概率分布給??14??
【參考文獻】:
期刊論文
[1]基于TF-IDF算法的文本信息提取[J]. 于韜,王洪巖. 科技視界. 2018(16)
[2]教育大數(shù)據(jù)整合:現(xiàn)狀、問題、架構與實現(xiàn)策略[J]. 李振,周東岱,劉娜. 圖書館學研究. 2017(20)
[3]深層網(wǎng)絡中的梯度消失現(xiàn)象[J]. 周祥全,張津. 科技展望. 2017(27)
[4]新建構主義:網(wǎng)絡時代的學習理論[J]. 王竹立. 遠程教育雜志. 2011(02)
[5]信息過載問題研究述評[J]. 藺豐奇,劉益. 情報理論與實踐. 2007(05)
本文編號:3270301
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【部分圖文】:
圖2.5帶URI標識的三元組??
?碩士學位論文??MASTER'S?THESIS??-?A??15’??杳詢圖Q??B?— ̄ ̄"C-}?一??子__?o?'???識庫圖Pj?j?/?\W??(a)?(b)??圖2.6?(a)圖查詢步驟分解(b)子圖同構??與數(shù)據(jù)庫的SQL類似,知識庫中用結構化查詢語言SPARQL為用戶提供訪問??接口。SPARQL以三元組為基本操作單位,包括了補全、刪除、查詢等多種操作,??三元組含有以“??”開頭標識的變量,比如<?university,location,Beijing〉用來詢??問北京有哪些大學,而多個三元組可組成基本圖模式來表示更加復雜和具體的查詢??需求,比如<??university,location,?Beijing?>,<??university,?establish,?1950?>組合查??詢北京的哪些大學是1950年成立的。本文只介紹查詢方法中的SELECT語句。??SELECT語句由四部分組成,分別是選擇變量,數(shù)據(jù)來源,WHERE圖模式和修飾??符,如公式2.1。??SELECT?vl?v2?...?[FROM?dataset]WHERE?pattern?[modifier]?(公式?2.1)??變量指查詢的目標,對應在圖模式中出現(xiàn)的變量。數(shù)據(jù)來源默認省略,??在單個知識庫中不用指明。WHERE子句則為變量提供約束,查詢的結果需要符合??圖模式。圖模式可以是三元組,另一類則通過FILTER關鍵字。修飾符是可選項用??于對查詢結果進行排序操作OERDER,限制結果數(shù)量操作LIMIT等。??2.2.3實體識別??知識圖譜中的實體是描述知識概念的單位,在語言上有不同形式的體現(xiàn),實體
序列標注方法,將文本分為Begin,hside’?0thei■三??個部分,分別代表實體的開始,實體的其余部分,以及不屬于實體的部分。每句用??于訓練的文本被標注出實體與非實體,即有監(jiān)督機器學習來訓練命名實體識別方法。??比如“蘇(B)軾⑴出(〇)生(〇)于(0)眉(B)山⑴”,實體帶上B或者??I的標簽,實體之外則是〇。將CRF與神經(jīng)網(wǎng)絡結合當前NER比較流行的做法’比??如BiLSTM-CRF,引入神經(jīng)網(wǎng)絡既可以將離散的詞匯映射到地位空間,并且還可以??關聯(lián)詞語自身的前后語義,如圖2.7。??辦?,'?SC?出/?生/<?于乂?.?"?^?八山,U-?Embeds??^?^?^?/X?^?X?Cn?/;??…挪,^二t ̄??繼?,:丨報\?'\°y?〈°〉-挪、??圖2.7?Bi-LSTM實體識別??該模型輸入為詞向量,通過word2vec獲得。雙向LSTM分別迪過正向和反向結構??處理詞的兩側對應的向量,然后進行向量連接。最后由CRF層判斷條件概率分布給??14??
【參考文獻】:
期刊論文
[1]基于TF-IDF算法的文本信息提取[J]. 于韜,王洪巖. 科技視界. 2018(16)
[2]教育大數(shù)據(jù)整合:現(xiàn)狀、問題、架構與實現(xiàn)策略[J]. 李振,周東岱,劉娜. 圖書館學研究. 2017(20)
[3]深層網(wǎng)絡中的梯度消失現(xiàn)象[J]. 周祥全,張津. 科技展望. 2017(27)
[4]新建構主義:網(wǎng)絡時代的學習理論[J]. 王竹立. 遠程教育雜志. 2011(02)
[5]信息過載問題研究述評[J]. 藺豐奇,劉益. 情報理論與實踐. 2007(05)
本文編號:3270301
本文鏈接:http://sikaile.net/jiaoyulunwen/ktjx/3270301.html
教材專著