天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于ALBERT的藏文預(yù)訓(xùn)練模型及其應(yīng)用

發(fā)布時間:2024-03-15 18:46
  在自然語言處理領(lǐng)域,預(yù)訓(xùn)練和微調(diào)的模型訓(xùn)練方法是一種可以在未標記數(shù)據(jù)集上訓(xùn)練預(yù)訓(xùn)練模型,然后在標記數(shù)據(jù)集上對預(yù)訓(xùn)練模型進行微調(diào)的方法。該方法極大的減少了對于標記數(shù)據(jù)集的需求,同時為下游任務(wù)節(jié)省了大量的時間和計算資源。借助預(yù)訓(xùn)練模型,人類在多項自然語言處理任務(wù)中均取得了重大突破。藏文預(yù)訓(xùn)練模型的研究不僅可以有效地應(yīng)對藏文標記數(shù)據(jù)集缺少的問題,還可以促進藏文自然語言處理研究的進一步發(fā)展。目前,針對藏語言的預(yù)訓(xùn)練模型研究尚處于探索階段,但其對藏文自然語言處理研究有著重要的理論意義和廣泛的應(yīng)用價值。為此,本文開展了藏文預(yù)訓(xùn)練模型的相關(guān)研究,主要包括以下內(nèi)容:1、針對目前藏文沒有公開數(shù)據(jù)集的問題,本文在西北民族大學(xué)多拉教授提供的語料庫基礎(chǔ)上通過爬蟲工具搜集了西藏人民網(wǎng)、青海藏語網(wǎng)絡(luò)廣播電臺官網(wǎng)、青海省人民政府網(wǎng)等網(wǎng)站的藏文語料文本作為預(yù)訓(xùn)練模型的訓(xùn)練數(shù)據(jù)集,同時搜集了中國藏族網(wǎng)通網(wǎng)的數(shù)據(jù)制作了藏文文本分類數(shù)據(jù)集以及藏文摘要提取數(shù)據(jù)集。2、針對藏文標記數(shù)據(jù)集不足的問題,本文訓(xùn)練了藏文ALBERT預(yù)訓(xùn)練模型以減少下游任務(wù)對標記數(shù)據(jù)集的需求,該預(yù)訓(xùn)練模型在掩詞預(yù)測任務(wù)中精度達到74%,在句子順序預(yù)測任...

【文章頁數(shù)】:70 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖2-1音節(jié)結(jié)構(gòu)示意圖

圖2-1音節(jié)結(jié)構(gòu)示意圖

蘭州大學(xué)碩士學(xué)位論文基于ALBERT的藏文預(yù)訓(xùn)練模型及其應(yīng)用8第二章相關(guān)理論和技術(shù)概述2.1藏文的文本信息處理特點藏文語法主要由“文法根本三十頌”和“字性組織法”組成,前者主要描述了藏文音節(jié)拼寫結(jié)構(gòu)、格助詞和各類虛詞的用法,后者描述了以動詞為中心的形態(tài)變化、時態(tài)變化、施受關(guān)系、能....


圖2-2Transformer模型結(jié)構(gòu)

圖2-2Transformer模型結(jié)構(gòu)

蘭州大學(xué)碩士學(xué)位論文基于ALBERT的藏文預(yù)訓(xùn)練模型及其應(yīng)用13的抽象。在自然語言處理領(lǐng)域RNN可以提取句子中單詞的位置信息,從而使得在序列生成時序列中的子串符合規(guī)則。Transformer是一次性輸入文本數(shù)據(jù)不存在前后關(guān)系,因此丟失了單詞的位置信息。為了在Transformer....


圖2-3Encoder的第一層網(wǎng)絡(luò)模型結(jié)構(gòu)

圖2-3Encoder的第一層網(wǎng)絡(luò)模型結(jié)構(gòu)

蘭州大學(xué)碩士學(xué)位論文基于ALBERT的藏文預(yù)訓(xùn)練模型及其應(yīng)用14Encoder中包含多個相同的網(wǎng)絡(luò)層,每個網(wǎng)絡(luò)層中間包含兩個子網(wǎng)絡(luò)層(Sublayer),圖2-3所示的是Encoder中第一層網(wǎng)絡(luò)的結(jié)構(gòu)。第一個子網(wǎng)絡(luò)層使用多頭自注意力機制,其輸入是語料文本經(jīng)過Embedding層....


圖2-4Decoder第一層網(wǎng)絡(luò)模型結(jié)構(gòu)

圖2-4Decoder第一層網(wǎng)絡(luò)模型結(jié)構(gòu)

蘭州大學(xué)碩士學(xué)位論文基于ALBERT的藏文預(yù)訓(xùn)練模型及其應(yīng)用15圖2-4Decoder第一層網(wǎng)絡(luò)模型結(jié)構(gòu)2.4相關(guān)優(yōu)化器介紹深度學(xué)習(xí)中有多種優(yōu)化器用來尋找模型的最優(yōu)解,在BERT中所使用的是AdamW優(yōu)化器,但由于AdamW在大批次下會導(dǎo)致性能下降,因此GoogleBrain提出....



本文編號:3928709

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3928709.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ac061***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com