天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 文藝論文 > 語言藝術(shù)論文 >

對(duì)外漢語看圖說話題自動(dòng)評(píng)分模型的構(gòu)建研究

發(fā)布時(shí)間:2020-09-19 08:44
   本研究以HSKK(中級(jí))中的看圖說話題為例,借助先進(jìn)的智能語音和自然語言處理等技術(shù)提取能夠有效評(píng)估看圖說話題的評(píng)分特征,通過回歸分析來構(gòu)建看圖說話題目的自動(dòng)評(píng)分模型并驗(yàn)證其有效性。首先,對(duì)看圖說話題的題型特點(diǎn)、考查要求和評(píng)分標(biāo)準(zhǔn)進(jìn)行分析,將看圖說話題自動(dòng)評(píng)分的評(píng)分特征分為內(nèi)容相關(guān)性、表達(dá)流利性和語法準(zhǔn)確性三個(gè)方面。內(nèi)容相關(guān)性方面的特征包括關(guān)鍵詞覆蓋率和語量,表達(dá)流利性方面的特征包括發(fā)音得分、停頓頻率以及重復(fù)和糾正次數(shù),語法準(zhǔn)確性特征是語法錯(cuò)誤數(shù)。其次,運(yùn)用了先進(jìn)的智能語音技術(shù)和自然語言處理技術(shù)提取評(píng)分特征。在計(jì)算關(guān)鍵詞覆蓋率時(shí)運(yùn)用了騰訊AI的關(guān)鍵詞檢索技術(shù),通過式子kcr=m/n計(jì)算關(guān)鍵詞覆蓋率。在計(jì)算語量時(shí),運(yùn)用騰訊AI的長語音識(shí)別技術(shù)將應(yīng)試者的答題語音轉(zhuǎn)換成文字,然后對(duì)轉(zhuǎn)換后的文字進(jìn)行適當(dāng)?shù)男?duì),最后統(tǒng)計(jì)字?jǐn)?shù)從而得到應(yīng)試者的語量。在獲取應(yīng)試者的發(fā)音標(biāo)準(zhǔn)程度時(shí),生成參考文本的步驟與計(jì)算語量時(shí)相同,最后采用科大訊飛的語音評(píng)測(cè)技術(shù)獲得應(yīng)試者的發(fā)音得分。在計(jì)算停頓頻率時(shí),首先利用基于短時(shí)能量和過零率雙門限的端點(diǎn)檢測(cè)技術(shù)將答題語音中有聲段和靜音段切分出來,接著統(tǒng)計(jì)靜音段的個(gè)數(shù)(首尾的停頓除外)和發(fā)音總時(shí)長,最后用每分鐘的停頓次數(shù)來表示停頓頻率。由于口語中的重復(fù)和糾正現(xiàn)象比較復(fù)雜,重復(fù)和糾正次數(shù)主要通過人工標(biāo)記的方式的獲取。在獲得語法錯(cuò)誤時(shí),采取的是將語音轉(zhuǎn)換成文字,然后在對(duì)文本進(jìn)行語法錯(cuò)誤檢測(cè)的方法,用到的主要技術(shù)是“小紅筆”文本自動(dòng)校對(duì)技術(shù)。最后,構(gòu)建評(píng)分模型。首先收集了70條答題語音數(shù)據(jù),并將其隨機(jī)分成兩組:構(gòu)建組(50條)和檢驗(yàn)組(20條)。在構(gòu)建組的數(shù)據(jù)基礎(chǔ)上,將三位評(píng)分員的平均分作為因變量,提取出來評(píng)分特征作為自變量,采用多元逐步線性回歸分析方法進(jìn)行回歸分析,最終進(jìn)入回歸方程的評(píng)分特征有四個(gè):關(guān)鍵詞覆蓋率(kcr)、語量(nwords)、重復(fù)和糾正次數(shù)(rac)、語法錯(cuò)誤數(shù)(nge),得到的看圖說話題的評(píng)分模型如下:score=2.52+8.223*kcr+0.073*nwords-0.903*rac-0.397*nge評(píng)分模型構(gòu)建完成之后,在檢驗(yàn)組上進(jìn)行評(píng)分模型的性能測(cè)試,得到預(yù)測(cè)分?jǐn)?shù)與原始分?jǐn)?shù)的整體相關(guān)性大小為0.832,一致率和相鄰一致率分別為70%和100%,驗(yàn)證了本研究提取的評(píng)分特征和構(gòu)建的評(píng)分模型的有效性。
【學(xué)位單位】:南京師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:H195
【部分圖文】:

對(duì)外漢語看圖說話題自動(dòng)評(píng)分模型的構(gòu)建研究


圖3.1邋HSKK邋(級(jí))

關(guān)鍵詞檢索,基本架構(gòu),語音,索引庫


逡逑要位置,整個(gè)關(guān)鍵詞檢索過程如圖4.1所示,分為識(shí)別和檢索兩個(gè)階段。第一階逡逑段,把待檢索語音送入大詞匯量連續(xù)語音識(shí)別引擎中進(jìn)行語音形式到文字形式的逡逑轉(zhuǎn)換,但語音識(shí)別難以達(dá)到100%的正確率,因此通常會(huì)針對(duì)不能完全確定的的逡逑詞生成若干個(gè)假設(shè),并在此基礎(chǔ)上建立倒排索引構(gòu)成索引庫,提高檢索效率;第逡逑二階段,利用文本搜索技術(shù)在上述索引庫中進(jìn)行檢索,來確定指定關(guān)鍵詞是否出逡逑現(xiàn),同時(shí)給出關(guān)鍵的置信度和時(shí)間信息。[841逡逑^^邋邐邋邐逡逑語音文邐?語音識(shí)別邋'——?索引建立逡逑榿庫邐丨邐丨逡逑V邐J逡逑^邐、逡逑索引庫逡逑%煎邋五義瞎丶叔危薰丶仕閹鰨蘩彌瞇挪舛儒危拮鈧蘸蜓″義襄五邋危懾謂腥啡襄未踟時(shí)礤義賢跡矗庇鏌艄丶始燜饗低車幕炯芄瑰義媳狙繡巢捎玫撓鏌艄丶始燜骷際跏翹諮叮霖瞥齙墓丶始燜骷際,该技辶x鮮醪捎玫氖且暈謀咀魑淙牖詿蟠駛懔苛鏌羰侗鸕姆椒,覄谛微信AI的伭x嫌颰吋際

本文編號(hào):2822296

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/2822296.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fd411***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com