基于CNN的輕量級(jí)問(wèn)答系統(tǒng)算法研究
【文章頁(yè)數(shù)】:56 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-2改進(jìn)的結(jié)構(gòu)化問(wèn)答系統(tǒng)
于關(guān)鍵詞技術(shù)數(shù)據(jù)形式的問(wèn)答系統(tǒng)對(duì)于語(yǔ)句要求具有多種表達(dá)方式,為了解決這一問(wèn)題,基于一個(gè)或多個(gè)關(guān)鍵詞可以代表整個(gè)語(yǔ)句的對(duì)關(guān)鍵詞進(jìn)行檢索,這樣可以解決結(jié)構(gòu)技術(shù)的方式有兩種:第一種是在結(jié)構(gòu)化工標(biāo)注和抽取,進(jìn)行信息檢索時(shí)也會(huì)出現(xiàn)行篩選,顯然這種方式耗時(shí)又費(fèi)力;第練,訓(xùn)練過(guò)程中會(huì)過(guò)濾掉停用....
圖2-3關(guān)鍵詞問(wèn)答系統(tǒng)結(jié)構(gòu)圖
圖2-3關(guān)鍵詞問(wèn)答系統(tǒng)結(jié)構(gòu)圖優(yōu)點(diǎn):以關(guān)鍵詞來(lái)代替整個(gè)語(yǔ)句的語(yǔ)義可以加快系統(tǒng)的運(yùn)行效率也解決了結(jié)構(gòu)化問(wèn)答的笨重問(wèn)題;使用以詞袋模型為基礎(chǔ)的形式可以直接對(duì)語(yǔ)句進(jìn)行關(guān)鍵詞抽取,并且解結(jié)構(gòu)化問(wèn)答系統(tǒng)人工標(biāo)注的的問(wèn)題。缺點(diǎn):詞袋模型使基于概率統(tǒng)計(jì)的,所有的詞匯和語(yǔ)句并沒(méi)有象現(xiàn)實(shí)生活中的....
圖2-4語(yǔ)義問(wèn)答系統(tǒng)結(jié)構(gòu)圖
圖2-4語(yǔ)義問(wèn)答系統(tǒng)結(jié)構(gòu)圖點(diǎn):語(yǔ)義問(wèn)答系統(tǒng)在準(zhǔn)確率方面比關(guān)鍵詞問(wèn)答系統(tǒng)高很多;關(guān)鍵詞問(wèn)答系統(tǒng)采用存儲(chǔ)詞匯和語(yǔ)句,語(yǔ)義問(wèn)答系統(tǒng)采用分布式稠密向量存儲(chǔ)詞匯或語(yǔ)句,這樣可以要的空間浪費(fèi)也可以提升運(yùn)算效率;語(yǔ)義問(wèn)答系統(tǒng)可以兼容關(guān)鍵詞問(wèn)答系統(tǒng)。點(diǎn):語(yǔ)義問(wèn)答系統(tǒng)的訓(xùn)練時(shí)間會(huì)更長(zhǎng);目前語(yǔ)義....
圖2-5LSA奇異值分解示意圖
圖2-5LSA奇異值分解示意圖是詞袋模型的延伸,既可以使用詞袋模型直接訓(xùn)練LSA,也上訓(xùn)練LSA。一般來(lái)說(shuō)直接使用TF-IDF模型來(lái)訓(xùn)練LSA得到,本文采用2.1小節(jié)生成TF-IDF模型進(jìn)行LSA生成,使用models.LsiModel()函數(shù)生....
本文編號(hào):3923268
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3923268.html