基于CNN的輕量級(jí)問答系統(tǒng)算法研究
【文章頁數(shù)】:56 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-2改進(jìn)的結(jié)構(gòu)化問答系統(tǒng)
于關(guān)鍵詞技術(shù)數(shù)據(jù)形式的問答系統(tǒng)對(duì)于語句要求具有多種表達(dá)方式,為了解決這一問題,基于一個(gè)或多個(gè)關(guān)鍵詞可以代表整個(gè)語句的對(duì)關(guān)鍵詞進(jìn)行檢索,這樣可以解決結(jié)構(gòu)技術(shù)的方式有兩種:第一種是在結(jié)構(gòu)化工標(biāo)注和抽取,進(jìn)行信息檢索時(shí)也會(huì)出現(xiàn)行篩選,顯然這種方式耗時(shí)又費(fèi)力;第練,訓(xùn)練過程中會(huì)過濾掉停用....
圖2-3關(guān)鍵詞問答系統(tǒng)結(jié)構(gòu)圖
圖2-3關(guān)鍵詞問答系統(tǒng)結(jié)構(gòu)圖優(yōu)點(diǎn):以關(guān)鍵詞來代替整個(gè)語句的語義可以加快系統(tǒng)的運(yùn)行效率也解決了結(jié)構(gòu)化問答的笨重問題;使用以詞袋模型為基礎(chǔ)的形式可以直接對(duì)語句進(jìn)行關(guān)鍵詞抽取,并且解結(jié)構(gòu)化問答系統(tǒng)人工標(biāo)注的的問題。缺點(diǎn):詞袋模型使基于概率統(tǒng)計(jì)的,所有的詞匯和語句并沒有象現(xiàn)實(shí)生活中的....
圖2-4語義問答系統(tǒng)結(jié)構(gòu)圖
圖2-4語義問答系統(tǒng)結(jié)構(gòu)圖點(diǎn):語義問答系統(tǒng)在準(zhǔn)確率方面比關(guān)鍵詞問答系統(tǒng)高很多;關(guān)鍵詞問答系統(tǒng)采用存儲(chǔ)詞匯和語句,語義問答系統(tǒng)采用分布式稠密向量存儲(chǔ)詞匯或語句,這樣可以要的空間浪費(fèi)也可以提升運(yùn)算效率;語義問答系統(tǒng)可以兼容關(guān)鍵詞問答系統(tǒng)。點(diǎn):語義問答系統(tǒng)的訓(xùn)練時(shí)間會(huì)更長(zhǎng);目前語義....
圖2-5LSA奇異值分解示意圖
圖2-5LSA奇異值分解示意圖是詞袋模型的延伸,既可以使用詞袋模型直接訓(xùn)練LSA,也上訓(xùn)練LSA。一般來說直接使用TF-IDF模型來訓(xùn)練LSA得到,本文采用2.1小節(jié)生成TF-IDF模型進(jìn)行LSA生成,使用models.LsiModel()函數(shù)生....
本文編號(hào):3923268
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3923268.html