天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 文藝論文 > 語言學(xué)論文 >

面向“校園百事通”的藏文問題分類研究

發(fā)布時(shí)間:2020-11-21 13:13
   當(dāng)前問答系統(tǒng)已經(jīng)成為廣大院校和研究機(jī)構(gòu)的一個(gè)研究熱點(diǎn),而研究問題分類是做好問答系統(tǒng)的前提。如今中文問題分類的研究已經(jīng)趨于成熟,對(duì)于藏文問題分類的研究則寥寥無幾。本文選擇西北民族大學(xué)這個(gè)特定領(lǐng)域,研究民族院校問答系統(tǒng)中藏文問題分析模塊中的問題分類。本文首先分析了藏文問句與普通文本的區(qū)別以及藏文問句的特點(diǎn),然后結(jié)合問題集的特點(diǎn)對(duì)現(xiàn)有的語料進(jìn)行分類。由于本文所使用的語料是來自西北民族大學(xué)的藏文校園問題集,考慮到本文的語料較小,且問句較短,特征較少,若將類別劃分的太細(xì)則導(dǎo)致特征無法識(shí)別,類與類之間區(qū)分度降低。文章將全部問題共劃分為四大類。這四大類分別為學(xué)校概況、教育教學(xué)、民大文化和服務(wù)保障。將語料整理完成之后就是對(duì)語料進(jìn)行預(yù)處理,文章采用了西北民族大學(xué)祁坤鈺老師的藏文分詞系統(tǒng)進(jìn)行分詞處理。其次本文在問題文本表示方面選擇了詞向量表示方法,用word2vec技術(shù)中Skip-gram模型將問題文本轉(zhuǎn)化為低維且稠密的詞向量。該方法可以解決因維數(shù)稀疏造成的維數(shù)災(zāi)難問題,同時(shí)也可以用來衡量詞與詞之間的相似性。問題文本轉(zhuǎn)化為詞向量表達(dá)形式后,將每條問題以二維矩陣的形式輸入到卷積神經(jīng)網(wǎng)絡(luò)模型中去。文章根據(jù)問題集的特點(diǎn)和大小將卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)設(shè)計(jì)為一個(gè)輸入層、一個(gè)卷積層、一個(gè)池化層和一個(gè)全連接層。在CNN模型中用卷積層和池化層提取問句特征,最后用softmax分類器完成問句分類的工作。為了證明卷積神經(jīng)網(wǎng)絡(luò)對(duì)藏文問題分類的效果,文章將其與機(jī)器學(xué)習(xí)中樸素貝葉斯和KNN分類方法進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果表明,卷積神經(jīng)網(wǎng)絡(luò)模型的分類效果優(yōu)于機(jī)器學(xué)習(xí),對(duì)藏文問題分類具有良好的效果。
【學(xué)位單位】:西北民族大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:H214;TP391.1
【部分圖文】:

網(wǎng)絡(luò)結(jié)構(gòu)圖,局部連接,平移不變性,感受野


4.2 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)其實(shí)是一種前饋神經(jīng)網(wǎng)絡(luò),是通過生物學(xué)中的感受野機(jī)制所出的。具有局部連接、權(quán)值共享和子采樣的特點(diǎn),這三個(gè)特點(diǎn)使得模型參數(shù)少,并具有平移不變性。卷積神經(jīng)網(wǎng)絡(luò) CNN的網(wǎng)絡(luò)結(jié)構(gòu)如圖 2.1 所示。

語料,搜集與整理,問題集,藏文


圖 3.1 中文版問題語料本文是先搜集與整理的中文版問題集,然后本文將中文版的問題語料藏文版,其藏文版的問題集格式如圖 3.2所示。圖 3.2 藏文版問題語料由于本文主要是研究藏文版西北民族大學(xué)的校園問題集,屬于特定領(lǐng)

搜集與整理,語料,問題集,藏文


藏文版問題語料由于本文主要是研究藏文版西北民族大學(xué)的校園問題集,屬于特定領(lǐng)域問
【參考文獻(xiàn)】

相關(guān)期刊論文 前8條

1 柔特;;藏文問答系統(tǒng)中問句的分類方法研究[J];計(jì)算機(jī)工程與科學(xué);2015年07期

2 熊富林;鄧怡豪;唐曉晟;;Word2vec的核心架構(gòu)及其應(yīng)用[J];南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版);2015年01期

3 周練;;Word2vec的工作原理及應(yīng)用探究[J];科技情報(bào)開發(fā)與經(jīng)濟(jì);2015年02期

4 袁曉潔;師建興;寧華;于士濤;;問題分類中基于句法和語義信息的特征選擇[J];計(jì)算機(jī)工程與應(yīng)用;2008年33期

5 祁坤鈺;;信息處理用藏文自動(dòng)分詞研究[J];西北民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2006年04期

6 格桑央京;;漢語藏語疑問句對(duì)比[J];西北民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2006年02期

7 文勖;張宇;劉挺;馬金山;;基于句法結(jié)構(gòu)分析的中文問題分類[J];中文信息學(xué)報(bào);2006年02期

8 張宇,劉挺,文勖;基于改進(jìn)貝葉斯模型的問題分類[J];中文信息學(xué)報(bào);2005年02期


相關(guān)博士學(xué)位論文 前2條

1 焦志成;基于卷積神經(jīng)網(wǎng)絡(luò)的生物醫(yī)學(xué)信號(hào)分類與重構(gòu)[D];西安電子科技大學(xué);2018年

2 周小強(qiáng);基于深度學(xué)習(xí)的交互式問答技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2017年


相關(guān)碩士學(xué)位論文 前10條

1 齊凱凡;基于卷積神經(jīng)網(wǎng)絡(luò)的新聞文本分類問題研究[D];西安理工大學(xué);2018年

2 程穎濤;基于深度學(xué)習(xí)的自然語言處理中問題分析的研究[D];西安郵電大學(xué);2018年

3 李鴻宇;養(yǎng)老保險(xiǎn)領(lǐng)域問答系統(tǒng)關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2018年

4 張倩;問句分類方法及其在問答系統(tǒng)中的應(yīng)用研究[D];鄭州大學(xué);2018年

5 劉洋;基于深度學(xué)習(xí)的問題分類組合模型研究[D];華中師范大學(xué);2018年

6 高森;農(nóng)業(yè)問答系統(tǒng)中問題分類和相似度計(jì)算的研究[D];中國科學(xué)技術(shù)大學(xué);2018年

7 崔霞霞;基于機(jī)器學(xué)習(xí)的分類問題研究[D];中北大學(xué);2018年

8 謝文杰;基于卷積神經(jīng)網(wǎng)絡(luò)的問句分類研究[D];安徽大學(xué);2018年

9 王前;基于卷積神經(jīng)網(wǎng)絡(luò)的中文問句分類方法研究[D];昆明理工大學(xué);2018年

10 王子木;基于語義網(wǎng)的站內(nèi)搜索引擎模塊的研究與實(shí)現(xiàn)[D];華北電力大學(xué);2018年



本文編號(hào):2893051

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/2893051.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶59345***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
人妻亚洲一区二区三区| 国产欧美日产中文一区| 亚洲av一区二区三区精品| 欧美在线观看视频三区| 国产综合一区二区三区av | 91精品日本在线视频| 国产又粗又长又爽又猛的视频| 国产成人精品资源在线观看| 国产精品欧美激情在线| 亚洲专区中文字幕在线| 亚洲熟女熟妇乱色一区| 欧美亚洲91在线视频| 不卡视频免费一区二区三区| 久久一区内射污污内射亚洲 | 午夜精品国产一区在线观看| 久久碰国产一区二区三区| 狠色婷婷久久一区二区三区| 九九视频通过这里有精品| 九九热精品视频免费在线播放| 国产欧美日韩视频91| 国产一区二区三中文字幕| 午夜国产精品福利在线观看| 亚洲中文字幕熟女丝袜久久| 欧美又大又黄刺激视频| 日韩精品区欧美在线一区| 在线观看视频成人午夜| 日韩毛片视频免费观看| 亚洲天堂一区在线播放| 午夜精品国产精品久久久| 午夜精品一区二区av| 偷拍洗澡一区二区三区| 九九九热视频免费观看| 亚洲一区二区三区三州| 91天堂免费在线观看| 东北女人的逼操的舒服吗| 中文字幕日韩一区二区不卡 | 精品人妻久久一品二品三品| 亚洲一区二区三区四区性色av | 欧美美女视频在线免费看| 伊人天堂午夜精品草草网| 久久婷婷综合色拍亚洲|