基于神經(jīng)網(wǎng)絡(luò)的藏語分詞與詞性標(biāo)注研究
發(fā)布時間:2024-01-19 08:09
藏語信息技術(shù)的發(fā)展對藏語的科學(xué)研究,學(xué)科教育,以及藏族百姓生活都有著十分重要的作用和影響。隨著信息技術(shù)多年的發(fā)展與進(jìn)步,藏語信息技術(shù)中的語言學(xué)研究也取得了一定的成果。作為藏語信息技術(shù)語言學(xué)研究的基礎(chǔ)和關(guān)鍵任務(wù),藏語分詞和詞性標(biāo)注對后續(xù)句法分析,文本分類,情感分類等自然語言處理任務(wù)有著直接的影響。使用傳統(tǒng)的統(tǒng)計模型完成藏語分詞和詞性標(biāo)注雖然可以取得較好的效果,但是人工構(gòu)建特征會影響其在大規(guī)模數(shù)據(jù)集中的普適性。隨著神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,運(yùn)用神經(jīng)網(wǎng)絡(luò)算法在自然語言處理領(lǐng)域進(jìn)行研究已成為趨勢。神經(jīng)網(wǎng)絡(luò)算法以其具有的信息分布存儲、并行處理以及自學(xué)習(xí)能力等優(yōu)點(diǎn)在自動提取序列特征,訓(xùn)練擬合大規(guī)模數(shù)據(jù),以及充分利用GPU等硬件性能方面有著很強(qiáng)的優(yōu)勢。本文基于神經(jīng)網(wǎng)絡(luò)相關(guān)的算法,針對藏語分詞和詞性標(biāo)注完成了以下工作:第一,在雙向長短期記憶網(wǎng)絡(luò)模型中引入卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)和膨脹卷積迭代(Iterated Dilated CNN,IDCNN)算法對藏語進(jìn)行分詞并取得了良好的效果。通過不同算法框架對比驗證了IDCNN作為特征提取器相比CNN可以提取...
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
本文編號:3879937
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
本文編號:3879937
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3879937.html
最近更新
教材專著