語音識別對神經(jīng)網(wǎng)絡(luò)機(jī)器口譯質(zhì)量影響的實(shí)證研究
發(fā)布時間:2021-08-13 01:18
2016年,谷歌發(fā)布神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng)以來,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯在口譯上的應(yīng)用愈發(fā)廣泛,然而神經(jīng)網(wǎng)絡(luò)機(jī)器口譯的實(shí)證研究仍然較少,且主要使用計算機(jī)科學(xué)側(cè)重算法、建模的評價標(biāo)準(zhǔn),較為抽象且不具有語言學(xué)意義;即使涉及口譯質(zhì)量評估,往往只進(jìn)行文本翻譯評估,很少涉及語音識別和翻譯的全環(huán)節(jié)口譯質(zhì)量研究、語音識別環(huán)節(jié)對口譯質(zhì)量影響的研究。因此,本文以能源與科技為口譯主題,以谷歌、搜狗、百度和訊飛的語音識別及翻譯系統(tǒng)為工具,針對語音識別文本及原文文本的翻譯結(jié)果開展了對照試驗(yàn)。本文從譯員的角度出發(fā),使用具有語言學(xué)意義的口譯質(zhì)量評價標(biāo)準(zhǔn)代替?zhèn)鹘y(tǒng)的機(jī)器翻譯質(zhì)量評估方法,通過材料分級來細(xì)化實(shí)驗(yàn)結(jié)果,旨在研究語音識別環(huán)節(jié)對神經(jīng)網(wǎng)絡(luò)機(jī)器口譯質(zhì)量的影響,并就語音識別策略提出改進(jìn)建議。本文通過實(shí)證研究發(fā)現(xiàn),語音識別環(huán)節(jié)對神經(jīng)網(wǎng)絡(luò)口譯質(zhì)量產(chǎn)生了負(fù)面影響,表現(xiàn)為三個方面:其一,術(shù)語、專有名詞的語音識別錯誤率偏高,導(dǎo)致較多錯譯、漏譯。其二,語音識別結(jié)果未過濾口語冗余,導(dǎo)致譯文表達(dá)欠流暢甚至出現(xiàn)錯譯。其三,標(biāo)點(diǎn)符號識別有誤、名詞和數(shù)字表達(dá)不規(guī)范,導(dǎo)致譯文出現(xiàn)語法錯誤甚至錯譯。據(jù)此,本文對神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的語音識別策略提出了改進(jìn)...
【文章來源】:北京外國語大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:132 頁
【學(xué)位級別】:碩士
【部分圖文】:
語音識別文本與原文文本的譯文得分情況變化(中英)
本文編號:3339447
【文章來源】:北京外國語大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:132 頁
【學(xué)位級別】:碩士
【部分圖文】:
語音識別文本與原文文本的譯文得分情況變化(中英)
本文編號:3339447
本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/3339447.html
最近更新
教材專著