天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于語(yǔ)種識(shí)別系統(tǒng)的語(yǔ)言距離關(guān)系研究

發(fā)布時(shí)間:2018-04-12 08:54

  本文選題:語(yǔ)言距離關(guān)系 + 語(yǔ)種識(shí)別; 參考:《浙江大學(xué)》2016年碩士論文


【摘要】:本文主要的研究?jī)?nèi)容為使用語(yǔ)音數(shù)據(jù)來(lái)研究語(yǔ)言之間的距離關(guān)系。對(duì)于語(yǔ)言距離關(guān)系的定義,語(yǔ)言學(xué)家通過(guò)語(yǔ)言是否同源以及語(yǔ)言之間發(fā)音、字詞、語(yǔ)法規(guī)則的對(duì)應(yīng)關(guān)系來(lái)研究語(yǔ)言之間的距離關(guān)系,最終生成語(yǔ)言譜系樹(shù)來(lái)反映語(yǔ)言的從屬關(guān)系,這屬于定性研究;經(jīng)濟(jì)學(xué)家將語(yǔ)言之間的距離定義為母語(yǔ)為一種語(yǔ)言的人學(xué)習(xí)其他語(yǔ)言的難易程度,這屬于定量研究。不論是在文化還是經(jīng)濟(jì)領(lǐng)域,語(yǔ)言距離關(guān)系的研究都具有一定的應(yīng)用價(jià)值。本文通過(guò)語(yǔ)種識(shí)別系統(tǒng)的輸出——識(shí)別率來(lái)定義語(yǔ)言之間的距離關(guān)系,其中最關(guān)鍵的就是語(yǔ)種識(shí)別系統(tǒng)的搭建,它直接關(guān)系到語(yǔ)言之間距離關(guān)系的可靠程度。語(yǔ)種識(shí)別系統(tǒng)的搭建主要包括特征提取和模型訓(xùn)練兩部分。在特征提取部分,本文先提取輸入語(yǔ)音信號(hào)的56種聲學(xué)特征以及它們的一階、二階差分值,然后使用39種統(tǒng)計(jì)函數(shù)來(lái)描述這些聲學(xué)特征,最終生成6552維特征向量;在模型訓(xùn)練部分,本文采用區(qū)分性建模方法——Gentle AdaBoost算法。最后將語(yǔ)言距離矩陣映射到二維平面,生成語(yǔ)言關(guān)系圖,直觀的反映了語(yǔ)言之間的距離關(guān)系。本文的主要研究成果包括:(1)本文使用語(yǔ)音數(shù)據(jù)來(lái)研究語(yǔ)言之間的距離關(guān)系。通過(guò)語(yǔ)種識(shí)別系統(tǒng)的輸出——識(shí)別率來(lái)定義語(yǔ)言之間的距離,并將本文得到的語(yǔ)言距離與之前語(yǔ)言學(xué)家和經(jīng)濟(jì)學(xué)家的研究成果作比較,實(shí)驗(yàn)表明本文的距離度量方法與之前的研究成果較為一致。(2)在語(yǔ)種識(shí)別系統(tǒng)的搭建中,采用一種全新的方法提取輸入語(yǔ)音信號(hào)的特征,該方法與以往的方法最大的不同在于,一個(gè)輸入語(yǔ)音樣本對(duì)應(yīng)一個(gè)特征向量,而不再是每一幀都對(duì)應(yīng)一個(gè)特征向量。然后采用Gentle AdaBoost算法訓(xùn)練語(yǔ)言模型,在OGI數(shù)據(jù)庫(kù)和NIST LRE15數(shù)據(jù)庫(kù)上進(jìn)行語(yǔ)種識(shí)別系統(tǒng)的性能測(cè)試,實(shí)驗(yàn)表明本文的語(yǔ)種識(shí)別系統(tǒng)性能要優(yōu)于傳統(tǒng)的基于GMM的語(yǔ)種識(shí)別系統(tǒng);(3)將得到的語(yǔ)言距離矩陣映射到二維平面,生成語(yǔ)言關(guān)系圖。在OGI數(shù)據(jù)庫(kù)和NIST LRE15兩個(gè)數(shù)據(jù)庫(kù)上進(jìn)行實(shí)驗(yàn),驗(yàn)證了本文所使用的語(yǔ)言距離研究方法在不同的數(shù)據(jù)庫(kù)上的一致性。
[Abstract]:The main research content of this paper is to use speech data to study the distance relationship between languages.As to the definition of language distance relation, linguists study the distance relationship between languages by means of the homology of language and the correspondence of pronunciation, words and grammar rules between languages.Finally, a language tree is generated to reflect the subordination of language, which is a qualitative study; the distance between languages is defined by economists as the degree of difficulty for native speakers to learn other languages, which is a quantitative study.The study of language distance relation has certain application value both in culture and economy.In this paper, the distance relationship between languages is defined by the output-recognition rate of the language recognition system, and the most important one is the construction of the language recognition system, which is directly related to the reliability of the distance relationship between languages.Language recognition system consists of feature extraction and model training.In the part of feature extraction, we first extract 56 acoustic features of the input speech signal and their first-order and second-order differences, then use 39 statistical functions to describe these acoustic features, and finally generate 6552 dimensional feature vectors.In the part of model training, this paper adopts the discriminative modeling method-Gentle AdaBoost algorithm.Finally, the language distance matrix is mapped to the two-dimensional plane, and the language relation graph is generated, which directly reflects the distance relationship between languages.The main research results of this paper include: 1) this paper uses speech data to study the distance relationship between languages.The distance between languages is defined by the output-recognition rate of the language recognition system, and the language distance obtained in this paper is compared with the previous research results of linguists and economists.The experimental results show that the distance measurement method in this paper is consistent with previous research results. In the language recognition system, a new method is used to extract the features of the input speech signal. The biggest difference between this method and the previous methods is that,An input speech sample corresponds to a feature vector instead of a feature vector for each frame.Then the language model is trained by Gentle AdaBoost algorithm, and the performance of language recognition system is tested on OGI database and NIST LRE15 database.The experimental results show that the performance of the language recognition system in this paper is better than that of the traditional language recognition system based on GMM. The language distance matrix is mapped to the two-dimensional plane and the language relation graph is generated.Experiments on two databases, OGI database and NIST LRE15 database, have been carried out to verify the consistency of the language distance research methods used in this paper on different databases.
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.34

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 清晨;計(jì)算機(jī)耳紋識(shí)別系統(tǒng)問(wèn)世[J];知識(shí)就是力量;2004年05期

2 張穎,夏莉,王剛;計(jì)算機(jī)輔助印鑒識(shí)別系統(tǒng)的設(shè)計(jì)[J];鄭州工業(yè)高等?茖W(xué)校學(xué)報(bào);2002年04期

3 ;“華夏天眼”面像識(shí)別系統(tǒng)技術(shù)演示會(huì)在京召開(kāi)[J];中國(guó)防偽報(bào)道;2002年04期

4 惠智敏;;電信卡生產(chǎn)線的重要組成部分——卡號(hào)及密碼掃描與識(shí)別系統(tǒng)[J];金卡工程;2002年10期

5 義軒;漢王證照識(shí)別系統(tǒng)助力電信業(yè)務(wù)管理[J];通信世界;2004年12期

6 劉啟誠(chéng);;“證照識(shí)別系統(tǒng)”將助力手機(jī)實(shí)名制[J];通信世界;2006年20期

7 ;清華大學(xué)人臉綜合識(shí)別系統(tǒng)全面進(jìn)入應(yīng)用推廣階段[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年04期

8 周襄楠;;清華大學(xué)人臉綜合識(shí)別系統(tǒng)全面應(yīng)用推廣[J];中小企業(yè)科技;2006年04期

9 ;富士通推出新手掌靜脈紋路識(shí)別系統(tǒng)[J];中國(guó)安防產(chǎn)品信息;2006年04期

10 趙斌;;文字板螺釘自動(dòng)緊固機(jī)視像識(shí)別系統(tǒng)的改造[J];自動(dòng)化博覽;2006年04期

相關(guān)會(huì)議論文 前10條

1 何偉方;;音聲識(shí)別系統(tǒng)[A];第一屆全國(guó)語(yǔ)言識(shí)別學(xué)術(shù)報(bào)告與展示會(huì)論文集[C];1990年

2 廖樹(shù)宏;;建立朵麗新農(nóng)村識(shí)別系統(tǒng)的新時(shí)代意義[A];第六屆海峽兩岸休閑農(nóng)業(yè)發(fā)展學(xué)術(shù)研討會(huì)論文集[C];2008年

3 馬少平;姜哲;;大型古籍《四庫(kù)全書(shū)》識(shí)別系統(tǒng)[A];面向21世紀(jì)的科技進(jìn)步與社會(huì)經(jīng)濟(jì)發(fā)展(上冊(cè))[C];1999年

4 李文宏;;海關(guān)卡口集裝箱識(shí)別系統(tǒng)的應(yīng)用[A];天津市電視技術(shù)研究會(huì)2013年年會(huì)論文集[C];2013年

5 趙杰煜;王小權(quán);;復(fù)雜運(yùn)動(dòng)目標(biāo)的學(xué)習(xí)與識(shí)別[A];中國(guó)圖象圖形學(xué)會(huì)第十屆全國(guó)圖像圖形學(xué)術(shù)會(huì)議(CIG’2001)和第一屆全國(guó)虛擬現(xiàn)實(shí)技術(shù)研討會(huì)(CVR’2001)論文集[C];2001年

6 王永恒;賈焰;楊樹(shù)強(qiáng);;面向漢語(yǔ)短文的話題識(shí)別系統(tǒng)研究[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年

7 孫南;張慶;代銳;韋穗;;集成人臉檢測(cè)和性別識(shí)別系統(tǒng)[A];第十五屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年

8 徐檉;周明安;李天鑫;薄鑫旭;李是良;;戰(zhàn)爭(zhēng)遺留爆炸物識(shí)別系統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì)[A];中國(guó)爆破新技術(shù)Ⅲ[C];2012年

9 王晶;姚鴻勛;姜峰;;中國(guó)手語(yǔ)徒手識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)'2005論文集(下冊(cè))[C];2005年

10 蘇光大;尚焱;嚴(yán)超;謝炳龍;張翠萍;楊淑蘭;;計(jì)算機(jī)人像組合查詢識(shí)別系統(tǒng)[A];中國(guó)圖象圖形科學(xué)技術(shù)新進(jìn)展——第九屆全國(guó)圖象圖形科技大會(huì)論文集[C];1998年

相關(guān)重要報(bào)紙文章 前10條

1 江蘇 耿達(dá);一種新穎電子識(shí)別系統(tǒng)[N];電子報(bào);2007年

2 記者 王嶸;山西推出二代證快捷識(shí)別系統(tǒng)[N];人民公安報(bào);2010年

3 童杭麗;杭州要建立城市識(shí)別系統(tǒng)[N];科技日?qǐng)?bào);2007年

4 娜仁圖雅;我區(qū)參與研制的少數(shù)民族文字識(shí)別系統(tǒng)通過(guò)鑒定[N];內(nèi)蒙古日?qǐng)?bào)(漢);2007年

5 實(shí)習(xí)記者 張曉東;第四屆北京發(fā)明創(chuàng)新大賽頒獎(jiǎng)“手掌識(shí)別系統(tǒng)”獲特等獎(jiǎng)[N];北京商報(bào);2010年

6 錢麗花;統(tǒng)一平臺(tái)的多民族文字文檔識(shí)別系統(tǒng)研制成功[N];中國(guó)民族報(bào);2007年

7 早報(bào)記者 韓曉蓉 實(shí)習(xí)生 徐文娟;“人臉”可成為萬(wàn)能“通行證”[N];東方早報(bào);2012年

8 陳卓;打造自己的面容識(shí)別系統(tǒng)[N];中國(guó)電腦教育報(bào);2005年

9 朱和平;空防空管一體化監(jiān)視識(shí)別系統(tǒng)[N];解放軍報(bào);2005年

10 周襄楠 李江濤;清華大學(xué)人臉綜合識(shí)別系統(tǒng)全面應(yīng)用推廣[N];大眾科技報(bào);2006年

相關(guān)博士學(xué)位論文 前2條

1 王春立;面向大詞匯量的連續(xù)中國(guó)手語(yǔ)識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D];大連理工大學(xué);2003年

2 項(xiàng)冬冬;關(guān)于動(dòng)態(tài)隱患識(shí)別系統(tǒng)的研究[D];華東師范大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 史宏博;嵌入式煙霧監(jiān)控與識(shí)別系統(tǒng)[D];上海師范大學(xué);2015年

2 陳銀;基于掃描筆的發(fā)票識(shí)別系統(tǒng)設(shè)計(jì)[D];電子科技大學(xué);2014年

3 劉陳馨;基于顯著性檢測(cè)的Logo識(shí)別系統(tǒng)[D];大連理工大學(xué);2015年

4 屠舒妍;面向移動(dòng)終端的病蟲(chóng)草害識(shí)別系統(tǒng)研究[D];中國(guó)科學(xué)院大學(xué)(工程管理與信息技術(shù)學(xué)院);2015年

5 石禮奇;基于EPON架構(gòu)的高清抓拍識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];蘇州大學(xué);2015年

6 劉玉松;基于智能手機(jī)的自動(dòng)車標(biāo)識(shí)別系統(tǒng)[D];上海交通大學(xué);2015年

7 吳杰;可修改與編輯的草圖識(shí)別系統(tǒng)[D];上海交通大學(xué);2015年

8 胡云;基于紅外熱成像技術(shù)的礦井火災(zāi)識(shí)別系統(tǒng)研究[D];安徽理工大學(xué);2016年

9 張延濤;基于FPGA的盲道識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];東北大學(xué);2014年

10 胡小芳;基于Hadoop的人體寄生蟲(chóng)蟲(chóng)卵識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D];江蘇大學(xué);2016年

,

本文編號(hào):1739044

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1739044.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶99121***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com