基于知識(shí)圖譜的問答系統(tǒng)研究與應(yīng)用
發(fā)布時(shí)間:2021-11-19 04:47
基于知識(shí)圖譜的問答系統(tǒng)(knowledge base question answering, KBQA)目前已成為自然語言處理中的熱門研究領(lǐng)域。問答系統(tǒng)的應(yīng)用涉及諸多領(lǐng)域,如醫(yī)藥、電力、交通等各個(gè)方面。由此可見,問答系統(tǒng)已成為社會(huì)生產(chǎn)發(fā)展中必不可少的一項(xiàng)技術(shù)。該文聚焦于國內(nèi)外針對(duì)知識(shí)圖譜的問答系統(tǒng)的研究與應(yīng)用,對(duì)其進(jìn)行分析梳理,總結(jié)了知識(shí)圖譜、知識(shí)庫以及問答系統(tǒng)的歷史、發(fā)展及應(yīng)用等相關(guān)知識(shí),以及現(xiàn)有基于知識(shí)圖譜的問答系統(tǒng)構(gòu)建的三類方法,分別為基于模板匹配的方法、基于語義解析的方法以及基于向量建模的方法,探究了深度學(xué)習(xí)對(duì)傳統(tǒng)問答系統(tǒng)效果的影響。最后,對(duì)基于知識(shí)圖譜的問答系統(tǒng)技術(shù)的未來以及發(fā)展進(jìn)行展望。研究表明:隨著人工智能的蓬勃發(fā)展,問答系統(tǒng)存在的技術(shù)難題不斷得到解決,將知識(shí)圖譜和深度學(xué)習(xí)技術(shù)應(yīng)用于傳統(tǒng)問答系統(tǒng)以提升問答效果已成為大勢所趨。
【文章來源】:計(jì)算機(jī)技術(shù)與發(fā)展. 2021,31(10)
【文章頁數(shù)】:7 頁
【部分圖文】:
基于模板匹配方法的具體流程
淺層解析的第一步簡單理解就是對(duì)語句的分詞、清洗等操作。使用傳統(tǒng)的LSTM+CRF方法,或是調(diào)用現(xiàn)成的jieba分詞庫都可以實(shí)現(xiàn)分詞的目的。根據(jù)句子的語法將句子結(jié)構(gòu)解析出來,最終形成的實(shí)際上是一棵語法解析樹,如圖2所示。語法解析的方法主要是上下文無關(guān)法、考慮詞匯的上下文無關(guān)語法以及基于概率分布的上下文無關(guān)語法等。這些算法大多針對(duì)英文語料,對(duì)中文語料的適應(yīng)性并不足。王鵬等人[24]根據(jù)中文的結(jié)構(gòu)特點(diǎn),發(fā)現(xiàn)想要在中文領(lǐng)域取得較好的效果,必須考慮中文特性輔助其他算法以提升準(zhǔn)確率。國內(nèi)很多學(xué)者都在其基礎(chǔ)上針對(duì)中文語料進(jìn)行優(yōu)化,林穎等人[25]提出句法結(jié)構(gòu)共現(xiàn),引入上下文信息的方法改進(jìn)基于概率分布的上下文無關(guān)語法,突破了中文庫規(guī)模小的局限性。
淺層次的解析是將句子分離、解析,而深層次的解析著重點(diǎn)轉(zhuǎn)移到了單詞的含義或是句子的含義上面。其中需要用到的技術(shù)有語義角色標(biāo)注技術(shù)與語義依存解析技術(shù),如圖3所示。語義角色標(biāo)注的實(shí)質(zhì),是將問題中的實(shí)體等與知識(shí)圖譜中的實(shí)體,關(guān)系及屬性相匹配,將單純的語句轉(zhuǎn)化為一句帶有相應(yīng)角色的標(biāo)注。針對(duì)語義角色標(biāo)注技術(shù),國內(nèi)學(xué)者做了大量研究。劉懷軍等人[26]針對(duì)中文的特點(diǎn),提出了更有效的新的特征及特征組合。丁金濤等人[27]隨后發(fā)現(xiàn)特征及特征組合并不是越多效果越好,效果取決于特征的組合,從而進(jìn)行了優(yōu)化特征優(yōu)化組合的方法研究,且取得了較好的效果。
【參考文獻(xiàn)】:
期刊論文
[1]面向水利信息資源的智能問答系統(tǒng)構(gòu)建與應(yīng)用[J]. 張紫璇,陸佳民,姜笑,馮鈞. 計(jì)算機(jī)與現(xiàn)代化. 2020(03)
[2]基于BERT的常見作物病害問答系統(tǒng)問句分類[J]. 楊國峰,楊勇. 計(jì)算機(jī)應(yīng)用. 2020(06)
[3]面向微博用戶的消費(fèi)意圖識(shí)別算法[J]. 賈云龍,韓東紅,林海原,王國仁,夏利. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2020(01)
[4]融合領(lǐng)域特征知識(shí)圖譜的電網(wǎng)客服問答系統(tǒng)[J]. 譚剛,陳聿,彭云竹. 計(jì)算機(jī)工程與應(yīng)用. 2020(03)
[5]基于知識(shí)圖譜的原發(fā)性肝癌知識(shí)問答系統(tǒng)[J]. 曹明宇,李青青,楊志豪,王磊,張音,林鴻飛,王健. 中文信息學(xué)報(bào). 2019(06)
[6]基于LSTM-CRF命名實(shí)體識(shí)別技術(shù)的研究與應(yīng)用[J]. 張聰品,方滔,劉昱良. 計(jì)算機(jī)技術(shù)與發(fā)展. 2019(02)
[7]問答中的問句意圖識(shí)別和約束條件分析[J]. 孫鑫,王厚峰. 中文信息學(xué)報(bào). 2017(06)
[8]基于中文知識(shí)圖譜的電商領(lǐng)域問答系統(tǒng)[J]. 杜澤宇,楊燕,賀樑. 計(jì)算機(jī)應(yīng)用與軟件. 2017(05)
[9]基于依存句法分析的復(fù)合事實(shí)型問句分解方法[J]. 劉雄,張宇,張偉男,劉挺. 中文信息學(xué)報(bào). 2017(03)
[10]知識(shí)圖譜研究進(jìn)展[J]. 漆桂林,高桓,吳天星. 情報(bào)工程. 2017(01)
本文編號(hào):3504320
【文章來源】:計(jì)算機(jī)技術(shù)與發(fā)展. 2021,31(10)
【文章頁數(shù)】:7 頁
【部分圖文】:
基于模板匹配方法的具體流程
淺層解析的第一步簡單理解就是對(duì)語句的分詞、清洗等操作。使用傳統(tǒng)的LSTM+CRF方法,或是調(diào)用現(xiàn)成的jieba分詞庫都可以實(shí)現(xiàn)分詞的目的。根據(jù)句子的語法將句子結(jié)構(gòu)解析出來,最終形成的實(shí)際上是一棵語法解析樹,如圖2所示。語法解析的方法主要是上下文無關(guān)法、考慮詞匯的上下文無關(guān)語法以及基于概率分布的上下文無關(guān)語法等。這些算法大多針對(duì)英文語料,對(duì)中文語料的適應(yīng)性并不足。王鵬等人[24]根據(jù)中文的結(jié)構(gòu)特點(diǎn),發(fā)現(xiàn)想要在中文領(lǐng)域取得較好的效果,必須考慮中文特性輔助其他算法以提升準(zhǔn)確率。國內(nèi)很多學(xué)者都在其基礎(chǔ)上針對(duì)中文語料進(jìn)行優(yōu)化,林穎等人[25]提出句法結(jié)構(gòu)共現(xiàn),引入上下文信息的方法改進(jìn)基于概率分布的上下文無關(guān)語法,突破了中文庫規(guī)模小的局限性。
淺層次的解析是將句子分離、解析,而深層次的解析著重點(diǎn)轉(zhuǎn)移到了單詞的含義或是句子的含義上面。其中需要用到的技術(shù)有語義角色標(biāo)注技術(shù)與語義依存解析技術(shù),如圖3所示。語義角色標(biāo)注的實(shí)質(zhì),是將問題中的實(shí)體等與知識(shí)圖譜中的實(shí)體,關(guān)系及屬性相匹配,將單純的語句轉(zhuǎn)化為一句帶有相應(yīng)角色的標(biāo)注。針對(duì)語義角色標(biāo)注技術(shù),國內(nèi)學(xué)者做了大量研究。劉懷軍等人[26]針對(duì)中文的特點(diǎn),提出了更有效的新的特征及特征組合。丁金濤等人[27]隨后發(fā)現(xiàn)特征及特征組合并不是越多效果越好,效果取決于特征的組合,從而進(jìn)行了優(yōu)化特征優(yōu)化組合的方法研究,且取得了較好的效果。
【參考文獻(xiàn)】:
期刊論文
[1]面向水利信息資源的智能問答系統(tǒng)構(gòu)建與應(yīng)用[J]. 張紫璇,陸佳民,姜笑,馮鈞. 計(jì)算機(jī)與現(xiàn)代化. 2020(03)
[2]基于BERT的常見作物病害問答系統(tǒng)問句分類[J]. 楊國峰,楊勇. 計(jì)算機(jī)應(yīng)用. 2020(06)
[3]面向微博用戶的消費(fèi)意圖識(shí)別算法[J]. 賈云龍,韓東紅,林海原,王國仁,夏利. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2020(01)
[4]融合領(lǐng)域特征知識(shí)圖譜的電網(wǎng)客服問答系統(tǒng)[J]. 譚剛,陳聿,彭云竹. 計(jì)算機(jī)工程與應(yīng)用. 2020(03)
[5]基于知識(shí)圖譜的原發(fā)性肝癌知識(shí)問答系統(tǒng)[J]. 曹明宇,李青青,楊志豪,王磊,張音,林鴻飛,王健. 中文信息學(xué)報(bào). 2019(06)
[6]基于LSTM-CRF命名實(shí)體識(shí)別技術(shù)的研究與應(yīng)用[J]. 張聰品,方滔,劉昱良. 計(jì)算機(jī)技術(shù)與發(fā)展. 2019(02)
[7]問答中的問句意圖識(shí)別和約束條件分析[J]. 孫鑫,王厚峰. 中文信息學(xué)報(bào). 2017(06)
[8]基于中文知識(shí)圖譜的電商領(lǐng)域問答系統(tǒng)[J]. 杜澤宇,楊燕,賀樑. 計(jì)算機(jī)應(yīng)用與軟件. 2017(05)
[9]基于依存句法分析的復(fù)合事實(shí)型問句分解方法[J]. 劉雄,張宇,張偉男,劉挺. 中文信息學(xué)報(bào). 2017(03)
[10]知識(shí)圖譜研究進(jìn)展[J]. 漆桂林,高桓,吳天星. 情報(bào)工程. 2017(01)
本文編號(hào):3504320
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3504320.html
最近更新
教材專著