基于知識(shí)圖譜的問(wèn)答系統(tǒng)問(wèn)句理解方法研究
發(fā)布時(shí)間:2021-08-19 23:26
從互聯(lián)網(wǎng)的海量數(shù)據(jù)中獲取信息已經(jīng)成為人們的基本需要。由于搜索引擎不能直接得到所需的答案,因此本文對(duì)基于知識(shí)圖譜的問(wèn)答系統(tǒng)進(jìn)行研究,旨在提出可以理解用戶(hù)以自然語(yǔ)言提出的問(wèn)句,并返回一個(gè)簡(jiǎn)潔答案的模型。在知識(shí)圖譜中,知識(shí)以三元組<實(shí)體,關(guān)系,實(shí)體>的方式進(jìn)行存儲(chǔ),因此基于知識(shí)圖譜的問(wèn)答系統(tǒng)主要解決由三元組構(gòu)成的事實(shí)類(lèi)問(wèn)題。在問(wèn)答系統(tǒng)中,準(zhǔn)確理解用戶(hù)問(wèn)句,需要理解多樣化的自然語(yǔ)言表述,這是本文的研究重點(diǎn)。根據(jù)問(wèn)句信息的不同層次,本文將對(duì)問(wèn)句的理解分為宏觀(guān)和微觀(guān)兩個(gè)部分。宏觀(guān)理解從句子層面進(jìn)行,微觀(guān)理解則從實(shí)體層面和關(guān)系層面來(lái)開(kāi)展。具體工作主要有:1.本文提出一個(gè)基于膠囊網(wǎng)絡(luò)的問(wèn)句分類(lèi)模型(Cap-net)。該模型能夠結(jié)合雙向LSTM和注意力機(jī)制,再加上膠囊網(wǎng)絡(luò),提取問(wèn)句更多的特征。然后根據(jù)需要,將問(wèn)句按照用戶(hù)意圖或者答案類(lèi)型進(jìn)行分類(lèi)。2.本文提出一個(gè)基于語(yǔ)義相似性的實(shí)體鏈接和關(guān)系檢測(cè)模型。該模型使用卷積神經(jīng)網(wǎng)絡(luò),對(duì)問(wèn)句和知識(shí)圖譜中的實(shí)體與關(guān)系進(jìn)行向量化表示。在實(shí)體鏈接任務(wù)中,本文提出,將問(wèn)句中識(shí)別出來(lái)的實(shí)體表述,通過(guò)實(shí)體-表述映射表,得到候選實(shí)體。然后通過(guò)本文提出基于語(yǔ)義相似性的...
【文章來(lái)源】:西華大學(xué)四川省
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
CBOW模型
圖 2.2 知識(shí)圖譜示例Fig. 2.2 Knowledge Graph example圖 2.2 所示,當(dāng)用戶(hù)在知識(shí)圖譜中查找實(shí)體“西華大學(xué)”,可以得到它的所在辦時(shí)間、簡(jiǎn)稱(chēng)和類(lèi)別等信息。得到所在城市“成都”,可以在網(wǎng)絡(luò)中繼續(xù)查找關(guān)信息。這極大加快了檢索信息的速度。。15 年,杜亞軍等人對(duì)微博知識(shí)圖譜構(gòu)建方法進(jìn)行了研究[46],將其分為實(shí)體提取、知識(shí)圖譜建立幾部分。從現(xiàn)實(shí)世界非結(jié)構(gòu)化數(shù)據(jù)中,提取出了實(shí)體和關(guān)系將其組合為知識(shí)三元組。本文的研究實(shí)質(zhì)上是在已有知識(shí)三元組的基礎(chǔ)上,將到對(duì)應(yīng)知識(shí)圖譜實(shí)體和關(guān)系上,得到能回答問(wèn)句的三元組,也就得到了答案。義相似性模型文利用語(yǔ)義相似性模型來(lái)完成實(shí)體鏈接及關(guān)系檢測(cè)任務(wù)。計(jì)算文本相似度主要語(yǔ)法和句法結(jié)構(gòu)、基于語(yǔ)料庫(kù)的方法。于語(yǔ)法和句法結(jié)構(gòu)的文本語(yǔ)義相似性模型,通過(guò)對(duì)文本的語(yǔ)法分析,將其語(yǔ)法度與詞組語(yǔ)義相似度相結(jié)合,能夠計(jì)算不同詞組順序?qū)ξ谋镜挠绊懀玫赜?jì)
基于知識(shí)圖譜的問(wèn)句理解方法研究3.2 問(wèn)句分類(lèi)模型結(jié)構(gòu)深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型是使用不帶有方向的標(biāo)量來(lái)表示句子,雖然近年來(lái)基于深度學(xué)習(xí)的方法在問(wèn)句分類(lèi)上有了許多成果。但是由于語(yǔ)言表達(dá)的復(fù)雜性,使用標(biāo)量來(lái)表達(dá)問(wèn)句具有一定的局限性。針對(duì)這一問(wèn)題,結(jié)合問(wèn)句分類(lèi)的特點(diǎn),本文提出了一種基于膠囊網(wǎng)絡(luò)(Capsule network)的問(wèn)句分類(lèi)模型(Cap-net)。膠囊網(wǎng)絡(luò)[50]能夠?qū)?biāo)量轉(zhuǎn)化為帶有位置信息的矢量,更好地表示問(wèn)句中的語(yǔ)義等信息。本文采用自然語(yǔ)言處理中常用的雙向 LSTM(Bi-LSTM),將問(wèn)句轉(zhuǎn)化成標(biāo)量,再傳入膠囊網(wǎng)絡(luò)中轉(zhuǎn)化成矢量,進(jìn)行本文的問(wèn)句分類(lèi)研究。同時(shí),由于問(wèn)句中不同詞對(duì)于分類(lèi)任務(wù)貢獻(xiàn)不同,這里引入詞級(jí)別的注意力機(jī)制,使分類(lèi)模型能夠更關(guān)注對(duì)分類(lèi)任務(wù)貢獻(xiàn)大的詞。
【參考文獻(xiàn)】:
期刊論文
[1]一種基于特征加權(quán)的文本相似度計(jì)算算法[J]. 邱先標(biāo),陳笑蓉. 貴州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(01)
[2]基于中文知識(shí)圖譜的電商領(lǐng)域問(wèn)答系統(tǒng)[J]. 杜澤宇,楊燕,賀樑. 計(jì)算機(jī)應(yīng)用與軟件. 2017(05)
[3]CLEQS——基于知識(shí)圖譜構(gòu)建的跨語(yǔ)言實(shí)體查詢(xún)系統(tǒng)[J]. 蘇永浩,張馳,程文亮,錢(qián)衛(wèi)寧. 計(jì)算機(jī)應(yīng)用. 2016(S1)
[4]中文短文本語(yǔ)法語(yǔ)義相似度算法[J]. 廖志芳,周?chē)?guó)恩,李俊鋒,劉飛,蔡飛. 湖南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(02)
[5]融合知識(shí)圖譜的查詢(xún)擴(kuò)展模型及其穩(wěn)定性研究[J]. 郝林雪,張鵬,宋大為,候越先. 計(jì)算機(jī)科學(xué)與探索. 2017(01)
[6]一種面向多源知識(shí)圖譜的樣例查詢(xún)方法[J]. 湯楠,申德榮,寇月,聶鐵錚. 計(jì)算機(jī)研究與發(fā)展. 2015(S1)
[7]基于本體的航空領(lǐng)域問(wèn)答系統(tǒng)[J]. 張克亮,李偉剛,王慧蘭. 中文信息學(xué)報(bào). 2015(04)
[8]微博知識(shí)圖譜構(gòu)建方法研究[J]. 杜亞軍,吳越. 西華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(01)
[9]實(shí)體鏈指技術(shù)研究進(jìn)展[J]. 郭宇航,秦兵,劉挺,李生. 智能計(jì)算機(jī)與應(yīng)用. 2014(05)
[10]基于主動(dòng)學(xué)習(xí)的中文問(wèn)題分類(lèi)數(shù)據(jù)集構(gòu)建[J]. 邱錫鵬,繆有棟,黃萱菁. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2012(05)
碩士論文
[1]基于深度學(xué)習(xí)的中文實(shí)體關(guān)系抽取方法研究[D]. 唐敏.西南交通大學(xué) 2018
[2]基于信息抽取的英文問(wèn)句意圖分類(lèi)[D]. 鐘世敏.西華大學(xué) 2018
[3]基于序列短文本的事件分類(lèi)和話(huà)題追蹤[D]. 賀立言.西華大學(xué) 2018
[4]Web信息抽取中的若干關(guān)鍵問(wèn)題研究[D]. 于永波.中國(guó)科學(xué)技術(shù)大學(xué) 2015
[5]基于潛在語(yǔ)義分析的學(xué)科知識(shí)圖譜構(gòu)建[D]. 孫小欣.華中師范大學(xué) 2013
本文編號(hào):3352338
【文章來(lái)源】:西華大學(xué)四川省
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
CBOW模型
圖 2.2 知識(shí)圖譜示例Fig. 2.2 Knowledge Graph example圖 2.2 所示,當(dāng)用戶(hù)在知識(shí)圖譜中查找實(shí)體“西華大學(xué)”,可以得到它的所在辦時(shí)間、簡(jiǎn)稱(chēng)和類(lèi)別等信息。得到所在城市“成都”,可以在網(wǎng)絡(luò)中繼續(xù)查找關(guān)信息。這極大加快了檢索信息的速度。。15 年,杜亞軍等人對(duì)微博知識(shí)圖譜構(gòu)建方法進(jìn)行了研究[46],將其分為實(shí)體提取、知識(shí)圖譜建立幾部分。從現(xiàn)實(shí)世界非結(jié)構(gòu)化數(shù)據(jù)中,提取出了實(shí)體和關(guān)系將其組合為知識(shí)三元組。本文的研究實(shí)質(zhì)上是在已有知識(shí)三元組的基礎(chǔ)上,將到對(duì)應(yīng)知識(shí)圖譜實(shí)體和關(guān)系上,得到能回答問(wèn)句的三元組,也就得到了答案。義相似性模型文利用語(yǔ)義相似性模型來(lái)完成實(shí)體鏈接及關(guān)系檢測(cè)任務(wù)。計(jì)算文本相似度主要語(yǔ)法和句法結(jié)構(gòu)、基于語(yǔ)料庫(kù)的方法。于語(yǔ)法和句法結(jié)構(gòu)的文本語(yǔ)義相似性模型,通過(guò)對(duì)文本的語(yǔ)法分析,將其語(yǔ)法度與詞組語(yǔ)義相似度相結(jié)合,能夠計(jì)算不同詞組順序?qū)ξ谋镜挠绊懀玫赜?jì)
基于知識(shí)圖譜的問(wèn)句理解方法研究3.2 問(wèn)句分類(lèi)模型結(jié)構(gòu)深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型是使用不帶有方向的標(biāo)量來(lái)表示句子,雖然近年來(lái)基于深度學(xué)習(xí)的方法在問(wèn)句分類(lèi)上有了許多成果。但是由于語(yǔ)言表達(dá)的復(fù)雜性,使用標(biāo)量來(lái)表達(dá)問(wèn)句具有一定的局限性。針對(duì)這一問(wèn)題,結(jié)合問(wèn)句分類(lèi)的特點(diǎn),本文提出了一種基于膠囊網(wǎng)絡(luò)(Capsule network)的問(wèn)句分類(lèi)模型(Cap-net)。膠囊網(wǎng)絡(luò)[50]能夠?qū)?biāo)量轉(zhuǎn)化為帶有位置信息的矢量,更好地表示問(wèn)句中的語(yǔ)義等信息。本文采用自然語(yǔ)言處理中常用的雙向 LSTM(Bi-LSTM),將問(wèn)句轉(zhuǎn)化成標(biāo)量,再傳入膠囊網(wǎng)絡(luò)中轉(zhuǎn)化成矢量,進(jìn)行本文的問(wèn)句分類(lèi)研究。同時(shí),由于問(wèn)句中不同詞對(duì)于分類(lèi)任務(wù)貢獻(xiàn)不同,這里引入詞級(jí)別的注意力機(jī)制,使分類(lèi)模型能夠更關(guān)注對(duì)分類(lèi)任務(wù)貢獻(xiàn)大的詞。
【參考文獻(xiàn)】:
期刊論文
[1]一種基于特征加權(quán)的文本相似度計(jì)算算法[J]. 邱先標(biāo),陳笑蓉. 貴州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(01)
[2]基于中文知識(shí)圖譜的電商領(lǐng)域問(wèn)答系統(tǒng)[J]. 杜澤宇,楊燕,賀樑. 計(jì)算機(jī)應(yīng)用與軟件. 2017(05)
[3]CLEQS——基于知識(shí)圖譜構(gòu)建的跨語(yǔ)言實(shí)體查詢(xún)系統(tǒng)[J]. 蘇永浩,張馳,程文亮,錢(qián)衛(wèi)寧. 計(jì)算機(jī)應(yīng)用. 2016(S1)
[4]中文短文本語(yǔ)法語(yǔ)義相似度算法[J]. 廖志芳,周?chē)?guó)恩,李俊鋒,劉飛,蔡飛. 湖南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(02)
[5]融合知識(shí)圖譜的查詢(xún)擴(kuò)展模型及其穩(wěn)定性研究[J]. 郝林雪,張鵬,宋大為,候越先. 計(jì)算機(jī)科學(xué)與探索. 2017(01)
[6]一種面向多源知識(shí)圖譜的樣例查詢(xún)方法[J]. 湯楠,申德榮,寇月,聶鐵錚. 計(jì)算機(jī)研究與發(fā)展. 2015(S1)
[7]基于本體的航空領(lǐng)域問(wèn)答系統(tǒng)[J]. 張克亮,李偉剛,王慧蘭. 中文信息學(xué)報(bào). 2015(04)
[8]微博知識(shí)圖譜構(gòu)建方法研究[J]. 杜亞軍,吳越. 西華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(01)
[9]實(shí)體鏈指技術(shù)研究進(jìn)展[J]. 郭宇航,秦兵,劉挺,李生. 智能計(jì)算機(jī)與應(yīng)用. 2014(05)
[10]基于主動(dòng)學(xué)習(xí)的中文問(wèn)題分類(lèi)數(shù)據(jù)集構(gòu)建[J]. 邱錫鵬,繆有棟,黃萱菁. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2012(05)
碩士論文
[1]基于深度學(xué)習(xí)的中文實(shí)體關(guān)系抽取方法研究[D]. 唐敏.西南交通大學(xué) 2018
[2]基于信息抽取的英文問(wèn)句意圖分類(lèi)[D]. 鐘世敏.西華大學(xué) 2018
[3]基于序列短文本的事件分類(lèi)和話(huà)題追蹤[D]. 賀立言.西華大學(xué) 2018
[4]Web信息抽取中的若干關(guān)鍵問(wèn)題研究[D]. 于永波.中國(guó)科學(xué)技術(shù)大學(xué) 2015
[5]基于潛在語(yǔ)義分析的學(xué)科知識(shí)圖譜構(gòu)建[D]. 孫小欣.華中師范大學(xué) 2013
本文編號(hào):3352338
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3352338.html
最近更新
教材專(zhuān)著