基于開放知識圖譜的金屬材料領(lǐng)域問答系統(tǒng)研究
發(fā)布時間:2021-06-01 08:05
目前,問答已經(jīng)被應(yīng)用于很多特定的領(lǐng)域,比如醫(yī)藥領(lǐng)域和地理領(lǐng)域等。隨著開放知識圖譜中實體和關(guān)系的不斷豐富,開放知識圖譜可以為領(lǐng)域問答提供更豐富的信息。然而,基于開放知識圖譜的領(lǐng)域信息查詢?nèi)悦媾R一些挑戰(zhàn),其中的數(shù)據(jù)未指明其所屬的領(lǐng)域,而且用戶的自然語言查詢和知識圖譜中的數(shù)據(jù)在結(jié)構(gòu)上不一致。本文提出了一種基于開放知識圖譜的特定領(lǐng)域問答研究方法,該方法設(shè)計了一系列邏輯規(guī)則將用戶問題的語義解析結(jié)果轉(zhuǎn)化為問題三元組;再根據(jù)WordNet和Microsoft Concept Graph對問題三元組中的概念進行多語義角度的擴展;基于概念的語義擴展結(jié)果實現(xiàn)問題三元組的語義擴展;再將擴展后的問題三元組和開放知識圖譜中的領(lǐng)域數(shù)據(jù)建立匹配關(guān)系。本課題所做的主要貢獻如下:1)設(shè)計邏輯規(guī)則將問題轉(zhuǎn)化為結(jié)構(gòu)化表示。使用自然語言處理工具Stanford Parser和Stanford CoreNLP對用戶問題進行解析,再根據(jù)所設(shè)計的規(guī)則將解析結(jié)果整合為三元組表示,從而實現(xiàn)問題的結(jié)構(gòu)化表示。2)設(shè)計語義查詢擴展策略和擴展結(jié)果過濾策略以進行查詢擴展。基于WordNet和Microsoft Concept Graph對問題...
【文章來源】:河北科技大學(xué)河北省
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于知識圖譜的領(lǐng)域問答流程圖
10規(guī)則(Rules)將依存關(guān)系轉(zhuǎn)化為問題三元組(Question Triple)。圖3-1 基于規(guī)則的問題結(jié)構(gòu)化表示方法圖3.2 相關(guān)概念描述使用Stanford CoreNLP解析一個自然語言句子可以得到該句子中所包含詞的標記信息,如:POS標記,Lemma標記和NER標記等。在本課題中,所使用的NER標記有:LOCATION、PERSON、ORGANIZATION和DATE,它們分別表示位置名稱、人物名稱、組織機構(gòu)名稱和日期,具體介紹如附錄A表1所示。所用到的POS標記有:表示名詞的NN、NNS、NNP和NNPS等;表示動詞的VB、VBD、VBP、VBZ等;表示形容詞的JJ等、表示疑問詞的WDT和WP等;表示連詞的CC等;表示數(shù)詞的CD等;表示限定詞的DT;表示介詞的IN、TO等,具體介紹如附錄A表2所示。對于問題“Whichiron bridge is constructed by Squire Whipple?”,其語義標記如圖3-2所示。
形容詞的JJ等、表示疑問詞的WDT和WP等;表示連詞的CC等;表示數(shù)詞的CD等;表示限定詞的DT;表示介詞的IN、TO等,具體介紹如附錄A表2所示。對于問題“Whichiron bridge is constructed by Squire Whipple?”,其語義標記如圖3-2所示。圖3-2 對問題中的詞進行語義標記
【參考文獻】:
期刊論文
[1]基于向量空間模型結(jié)合語義的文本相似度算法[J]. 馮高磊,高嵩峰. 現(xiàn)代電子技術(shù). 2018(11)
[2]基于知網(wǎng)與詞林的詞語語義相似度計算[J]. 朱新華,馬潤聰,孫柳,陳宏朝. 中文信息學(xué)報. 2016(04)
[3]基于抽取規(guī)則和本體映射的領(lǐng)域XML語義集成[J]. 李華昱,張培穎,肖晗. 河北科技大學(xué)學(xué)報. 2016(04)
[4]基于用戶興趣的多屬性效用算法的研究[J]. 勾智楠. 河北工業(yè)科技. 2012(02)
[5]基于語義相似度的數(shù)據(jù)庫自適應(yīng)查詢松弛方法[J]. 孟祥福,嚴麗,馬宗民,張富,王星. 計算機學(xué)報. 2011(05)
本文編號:3210003
【文章來源】:河北科技大學(xué)河北省
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于知識圖譜的領(lǐng)域問答流程圖
10規(guī)則(Rules)將依存關(guān)系轉(zhuǎn)化為問題三元組(Question Triple)。圖3-1 基于規(guī)則的問題結(jié)構(gòu)化表示方法圖3.2 相關(guān)概念描述使用Stanford CoreNLP解析一個自然語言句子可以得到該句子中所包含詞的標記信息,如:POS標記,Lemma標記和NER標記等。在本課題中,所使用的NER標記有:LOCATION、PERSON、ORGANIZATION和DATE,它們分別表示位置名稱、人物名稱、組織機構(gòu)名稱和日期,具體介紹如附錄A表1所示。所用到的POS標記有:表示名詞的NN、NNS、NNP和NNPS等;表示動詞的VB、VBD、VBP、VBZ等;表示形容詞的JJ等、表示疑問詞的WDT和WP等;表示連詞的CC等;表示數(shù)詞的CD等;表示限定詞的DT;表示介詞的IN、TO等,具體介紹如附錄A表2所示。對于問題“Whichiron bridge is constructed by Squire Whipple?”,其語義標記如圖3-2所示。
形容詞的JJ等、表示疑問詞的WDT和WP等;表示連詞的CC等;表示數(shù)詞的CD等;表示限定詞的DT;表示介詞的IN、TO等,具體介紹如附錄A表2所示。對于問題“Whichiron bridge is constructed by Squire Whipple?”,其語義標記如圖3-2所示。圖3-2 對問題中的詞進行語義標記
【參考文獻】:
期刊論文
[1]基于向量空間模型結(jié)合語義的文本相似度算法[J]. 馮高磊,高嵩峰. 現(xiàn)代電子技術(shù). 2018(11)
[2]基于知網(wǎng)與詞林的詞語語義相似度計算[J]. 朱新華,馬潤聰,孫柳,陳宏朝. 中文信息學(xué)報. 2016(04)
[3]基于抽取規(guī)則和本體映射的領(lǐng)域XML語義集成[J]. 李華昱,張培穎,肖晗. 河北科技大學(xué)學(xué)報. 2016(04)
[4]基于用戶興趣的多屬性效用算法的研究[J]. 勾智楠. 河北工業(yè)科技. 2012(02)
[5]基于語義相似度的數(shù)據(jù)庫自適應(yīng)查詢松弛方法[J]. 孟祥福,嚴麗,馬宗民,張富,王星. 計算機學(xué)報. 2011(05)
本文編號:3210003
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3210003.html
最近更新
教材專著