天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向“校園百事通”的藏文問(wèn)題分類(lèi)研究

發(fā)布時(shí)間:2020-11-21 13:13
   當(dāng)前問(wèn)答系統(tǒng)已經(jīng)成為廣大院校和研究機(jī)構(gòu)的一個(gè)研究熱點(diǎn),而研究問(wèn)題分類(lèi)是做好問(wèn)答系統(tǒng)的前提。如今中文問(wèn)題分類(lèi)的研究已經(jīng)趨于成熟,對(duì)于藏文問(wèn)題分類(lèi)的研究則寥寥無(wú)幾。本文選擇西北民族大學(xué)這個(gè)特定領(lǐng)域,研究民族院校問(wèn)答系統(tǒng)中藏文問(wèn)題分析模塊中的問(wèn)題分類(lèi)。本文首先分析了藏文問(wèn)句與普通文本的區(qū)別以及藏文問(wèn)句的特點(diǎn),然后結(jié)合問(wèn)題集的特點(diǎn)對(duì)現(xiàn)有的語(yǔ)料進(jìn)行分類(lèi)。由于本文所使用的語(yǔ)料是來(lái)自西北民族大學(xué)的藏文校園問(wèn)題集,考慮到本文的語(yǔ)料較小,且問(wèn)句較短,特征較少,若將類(lèi)別劃分的太細(xì)則導(dǎo)致特征無(wú)法識(shí)別,類(lèi)與類(lèi)之間區(qū)分度降低。文章將全部問(wèn)題共劃分為四大類(lèi)。這四大類(lèi)分別為學(xué)校概況、教育教學(xué)、民大文化和服務(wù)保障。將語(yǔ)料整理完成之后就是對(duì)語(yǔ)料進(jìn)行預(yù)處理,文章采用了西北民族大學(xué)祁坤鈺老師的藏文分詞系統(tǒng)進(jìn)行分詞處理。其次本文在問(wèn)題文本表示方面選擇了詞向量表示方法,用word2vec技術(shù)中Skip-gram模型將問(wèn)題文本轉(zhuǎn)化為低維且稠密的詞向量。該方法可以解決因維數(shù)稀疏造成的維數(shù)災(zāi)難問(wèn)題,同時(shí)也可以用來(lái)衡量詞與詞之間的相似性。問(wèn)題文本轉(zhuǎn)化為詞向量表達(dá)形式后,將每條問(wèn)題以二維矩陣的形式輸入到卷積神經(jīng)網(wǎng)絡(luò)模型中去。文章根據(jù)問(wèn)題集的特點(diǎn)和大小將卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)設(shè)計(jì)為一個(gè)輸入層、一個(gè)卷積層、一個(gè)池化層和一個(gè)全連接層。在CNN模型中用卷積層和池化層提取問(wèn)句特征,最后用softmax分類(lèi)器完成問(wèn)句分類(lèi)的工作。為了證明卷積神經(jīng)網(wǎng)絡(luò)對(duì)藏文問(wèn)題分類(lèi)的效果,文章將其與機(jī)器學(xué)習(xí)中樸素貝葉斯和KNN分類(lèi)方法進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果表明,卷積神經(jīng)網(wǎng)絡(luò)模型的分類(lèi)效果優(yōu)于機(jī)器學(xué)習(xí),對(duì)藏文問(wèn)題分類(lèi)具有良好的效果。
【學(xué)位單位】:西北民族大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類(lèi)】:H214;TP391.1
【部分圖文】:

網(wǎng)絡(luò)結(jié)構(gòu)圖,局部連接,平移不變性,感受野


4.2 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)其實(shí)是一種前饋神經(jīng)網(wǎng)絡(luò),是通過(guò)生物學(xué)中的感受野機(jī)制所出的。具有局部連接、權(quán)值共享和子采樣的特點(diǎn),這三個(gè)特點(diǎn)使得模型參數(shù)少,并具有平移不變性。卷積神經(jīng)網(wǎng)絡(luò) CNN的網(wǎng)絡(luò)結(jié)構(gòu)如圖 2.1 所示。

語(yǔ)料,搜集與整理,問(wèn)題集,藏文


圖 3.1 中文版問(wèn)題語(yǔ)料本文是先搜集與整理的中文版問(wèn)題集,然后本文將中文版的問(wèn)題語(yǔ)料藏文版,其藏文版的問(wèn)題集格式如圖 3.2所示。圖 3.2 藏文版問(wèn)題語(yǔ)料由于本文主要是研究藏文版西北民族大學(xué)的校園問(wèn)題集,屬于特定領(lǐng)

搜集與整理,語(yǔ)料,問(wèn)題集,藏文


藏文版問(wèn)題語(yǔ)料由于本文主要是研究藏文版西北民族大學(xué)的校園問(wèn)題集,屬于特定領(lǐng)域問(wèn)
【參考文獻(xiàn)】

相關(guān)期刊論文 前8條

1 柔特;;藏文問(wèn)答系統(tǒng)中問(wèn)句的分類(lèi)方法研究[J];計(jì)算機(jī)工程與科學(xué);2015年07期

2 熊富林;鄧怡豪;唐曉晟;;Word2vec的核心架構(gòu)及其應(yīng)用[J];南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版);2015年01期

3 周練;;Word2vec的工作原理及應(yīng)用探究[J];科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì);2015年02期

4 袁曉潔;師建興;寧華;于士濤;;問(wèn)題分類(lèi)中基于句法和語(yǔ)義信息的特征選擇[J];計(jì)算機(jī)工程與應(yīng)用;2008年33期

5 祁坤鈺;;信息處理用藏文自動(dòng)分詞研究[J];西北民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2006年04期

6 格桑央京;;漢語(yǔ)藏語(yǔ)疑問(wèn)句對(duì)比[J];西北民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2006年02期

7 文勖;張宇;劉挺;馬金山;;基于句法結(jié)構(gòu)分析的中文問(wèn)題分類(lèi)[J];中文信息學(xué)報(bào);2006年02期

8 張宇,劉挺,文勖;基于改進(jìn)貝葉斯模型的問(wèn)題分類(lèi)[J];中文信息學(xué)報(bào);2005年02期


相關(guān)博士學(xué)位論文 前2條

1 焦志成;基于卷積神經(jīng)網(wǎng)絡(luò)的生物醫(yī)學(xué)信號(hào)分類(lèi)與重構(gòu)[D];西安電子科技大學(xué);2018年

2 周小強(qiáng);基于深度學(xué)習(xí)的交互式問(wèn)答技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2017年


相關(guān)碩士學(xué)位論文 前10條

1 齊凱凡;基于卷積神經(jīng)網(wǎng)絡(luò)的新聞文本分類(lèi)問(wèn)題研究[D];西安理工大學(xué);2018年

2 程穎濤;基于深度學(xué)習(xí)的自然語(yǔ)言處理中問(wèn)題分析的研究[D];西安郵電大學(xué);2018年

3 李鴻宇;養(yǎng)老保險(xiǎn)領(lǐng)域問(wèn)答系統(tǒng)關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2018年

4 張倩;問(wèn)句分類(lèi)方法及其在問(wèn)答系統(tǒng)中的應(yīng)用研究[D];鄭州大學(xué);2018年

5 劉洋;基于深度學(xué)習(xí)的問(wèn)題分類(lèi)組合模型研究[D];華中師范大學(xué);2018年

6 高森;農(nóng)業(yè)問(wèn)答系統(tǒng)中問(wèn)題分類(lèi)和相似度計(jì)算的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2018年

7 崔霞霞;基于機(jī)器學(xué)習(xí)的分類(lèi)問(wèn)題研究[D];中北大學(xué);2018年

8 謝文杰;基于卷積神經(jīng)網(wǎng)絡(luò)的問(wèn)句分類(lèi)研究[D];安徽大學(xué);2018年

9 王前;基于卷積神經(jīng)網(wǎng)絡(luò)的中文問(wèn)句分類(lèi)方法研究[D];昆明理工大學(xué);2018年

10 王子木;基于語(yǔ)義網(wǎng)的站內(nèi)搜索引擎模塊的研究與實(shí)現(xiàn)[D];華北電力大學(xué);2018年



本文編號(hào):2893051

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/2893051.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)59345***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com