天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 文藝論文 > 語言學論文 >

面向“校園百事通”的藏文問題分類研究

發(fā)布時間:2020-11-21 13:13
   當前問答系統(tǒng)已經(jīng)成為廣大院校和研究機構(gòu)的一個研究熱點,而研究問題分類是做好問答系統(tǒng)的前提。如今中文問題分類的研究已經(jīng)趨于成熟,對于藏文問題分類的研究則寥寥無幾。本文選擇西北民族大學這個特定領(lǐng)域,研究民族院校問答系統(tǒng)中藏文問題分析模塊中的問題分類。本文首先分析了藏文問句與普通文本的區(qū)別以及藏文問句的特點,然后結(jié)合問題集的特點對現(xiàn)有的語料進行分類。由于本文所使用的語料是來自西北民族大學的藏文校園問題集,考慮到本文的語料較小,且問句較短,特征較少,若將類別劃分的太細則導致特征無法識別,類與類之間區(qū)分度降低。文章將全部問題共劃分為四大類。這四大類分別為學校概況、教育教學、民大文化和服務(wù)保障。將語料整理完成之后就是對語料進行預(yù)處理,文章采用了西北民族大學祁坤鈺老師的藏文分詞系統(tǒng)進行分詞處理。其次本文在問題文本表示方面選擇了詞向量表示方法,用word2vec技術(shù)中Skip-gram模型將問題文本轉(zhuǎn)化為低維且稠密的詞向量。該方法可以解決因維數(shù)稀疏造成的維數(shù)災(zāi)難問題,同時也可以用來衡量詞與詞之間的相似性。問題文本轉(zhuǎn)化為詞向量表達形式后,將每條問題以二維矩陣的形式輸入到卷積神經(jīng)網(wǎng)絡(luò)模型中去。文章根據(jù)問題集的特點和大小將卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)設(shè)計為一個輸入層、一個卷積層、一個池化層和一個全連接層。在CNN模型中用卷積層和池化層提取問句特征,最后用softmax分類器完成問句分類的工作。為了證明卷積神經(jīng)網(wǎng)絡(luò)對藏文問題分類的效果,文章將其與機器學習中樸素貝葉斯和KNN分類方法進行了對比。實驗結(jié)果表明,卷積神經(jīng)網(wǎng)絡(luò)模型的分類效果優(yōu)于機器學習,對藏文問題分類具有良好的效果。
【學位單位】:西北民族大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:H214;TP391.1
【部分圖文】:

網(wǎng)絡(luò)結(jié)構(gòu)圖,局部連接,平移不變性,感受野


4.2 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)其實是一種前饋神經(jīng)網(wǎng)絡(luò),是通過生物學中的感受野機制所出的。具有局部連接、權(quán)值共享和子采樣的特點,這三個特點使得模型參數(shù)少,并具有平移不變性。卷積神經(jīng)網(wǎng)絡(luò) CNN的網(wǎng)絡(luò)結(jié)構(gòu)如圖 2.1 所示。

語料,搜集與整理,問題集,藏文


圖 3.1 中文版問題語料本文是先搜集與整理的中文版問題集,然后本文將中文版的問題語料藏文版,其藏文版的問題集格式如圖 3.2所示。圖 3.2 藏文版問題語料由于本文主要是研究藏文版西北民族大學的校園問題集,屬于特定領(lǐng)

搜集與整理,語料,問題集,藏文


藏文版問題語料由于本文主要是研究藏文版西北民族大學的校園問題集,屬于特定領(lǐng)域問
【參考文獻】

相關(guān)期刊論文 前8條

1 柔特;;藏文問答系統(tǒng)中問句的分類方法研究[J];計算機工程與科學;2015年07期

2 熊富林;鄧怡豪;唐曉晟;;Word2vec的核心架構(gòu)及其應(yīng)用[J];南京師范大學學報(工程技術(shù)版);2015年01期

3 周練;;Word2vec的工作原理及應(yīng)用探究[J];科技情報開發(fā)與經(jīng)濟;2015年02期

4 袁曉潔;師建興;寧華;于士濤;;問題分類中基于句法和語義信息的特征選擇[J];計算機工程與應(yīng)用;2008年33期

5 祁坤鈺;;信息處理用藏文自動分詞研究[J];西北民族大學學報(哲學社會科學版);2006年04期

6 格桑央京;;漢語藏語疑問句對比[J];西北民族大學學報(哲學社會科學版);2006年02期

7 文勖;張宇;劉挺;馬金山;;基于句法結(jié)構(gòu)分析的中文問題分類[J];中文信息學報;2006年02期

8 張宇,劉挺,文勖;基于改進貝葉斯模型的問題分類[J];中文信息學報;2005年02期


相關(guān)博士學位論文 前2條

1 焦志成;基于卷積神經(jīng)網(wǎng)絡(luò)的生物醫(yī)學信號分類與重構(gòu)[D];西安電子科技大學;2018年

2 周小強;基于深度學習的交互式問答技術(shù)研究[D];哈爾濱工業(yè)大學;2017年


相關(guān)碩士學位論文 前10條

1 齊凱凡;基于卷積神經(jīng)網(wǎng)絡(luò)的新聞文本分類問題研究[D];西安理工大學;2018年

2 程穎濤;基于深度學習的自然語言處理中問題分析的研究[D];西安郵電大學;2018年

3 李鴻宇;養(yǎng)老保險領(lǐng)域問答系統(tǒng)關(guān)鍵技術(shù)研究[D];哈爾濱工程大學;2018年

4 張倩;問句分類方法及其在問答系統(tǒng)中的應(yīng)用研究[D];鄭州大學;2018年

5 劉洋;基于深度學習的問題分類組合模型研究[D];華中師范大學;2018年

6 高森;農(nóng)業(yè)問答系統(tǒng)中問題分類和相似度計算的研究[D];中國科學技術(shù)大學;2018年

7 崔霞霞;基于機器學習的分類問題研究[D];中北大學;2018年

8 謝文杰;基于卷積神經(jīng)網(wǎng)絡(luò)的問句分類研究[D];安徽大學;2018年

9 王前;基于卷積神經(jīng)網(wǎng)絡(luò)的中文問句分類方法研究[D];昆明理工大學;2018年

10 王子木;基于語義網(wǎng)的站內(nèi)搜索引擎模塊的研究與實現(xiàn)[D];華北電力大學;2018年



本文編號:2893051

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/2893051.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶59345***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
日韩美成人免费在线视频| 欧美日韩精品视频在线| 日本一二三区不卡免费| 日韩精品中文字幕亚洲| 日本人妻精品中文字幕不卡乱码 | 欧美日韩精品人妻二区三区| 夫妻性生活黄色录像视频| 欧洲一区二区三区蜜桃| 日本免费一本一二区三区| 丰满人妻熟妇乱又伦精另类视频| 欧美一区二区三区性视频| 大香蕉网国产在线观看av| 激情爱爱一区二区三区| 婷婷伊人综合中文字幕| 日韩欧美一区二区黄色| 欧美人妻盗摄日韩偷拍| 国产午夜福利不卡片在线观看| 日韩欧美在线看一卡一卡| 欧美精品激情视频一区| 国产亚洲系列91精品| 日韩毛片视频免费观看| 日韩一区二区三区在线日| 国产欧美一区二区久久| 丝袜破了有美女肉体免费观看 | 91偷拍与自偷拍精品| 久久99爱爱视频视频| 日本一本不卡免费视频| 我想看亚洲一级黄色录像| 久热99中文字幕视频在线| 成人午夜视频精品一区| 麻豆印象传媒在线观看| 老熟妇2久久国内精品| 日韩人妻毛片中文字幕| 国产91麻豆精品成人区| 91人妻久久精品一区二区三区| 人人爽夜夜爽夜夜爽精品视频| 亚洲欧美日韩国产自拍| 亚洲品质一区二区三区| 国产精品一区二区视频大全| 国产人妻精品区一区二区三区 | 欧美日韩国产一级91|