基于小型陣列MIC的聲源定位系統(tǒng)設(shè)計與實現(xiàn)
發(fā)布時間:2020-05-01 19:41
【摘要】:近年來,隨著人工智能的發(fā)展,機器人智能化得到更近一步的推進,服務(wù)型機器人越來越多的介入到人們的生活當中。為了讓機器人能夠更好地應(yīng)對復(fù)雜的工作環(huán)境,機器人需要能夠?qū)崟r獲取環(huán)境中的信息并進行及時處理,其中聲音是要獲取的關(guān)鍵信息,而對聲源進行定位是機器人應(yīng)對周圍環(huán)境的一種關(guān)鍵算法;趯嶒炇椰F(xiàn)有機器人項目,本文設(shè)計一款基于小型麥克風(fēng)陣列的聲源定位系統(tǒng)來解決機器人對聲源進行定位的問題。本文通過介紹三種經(jīng)典的基于麥克風(fēng)陣列的定位方法,分析其工作原理、適用領(lǐng)域及各自的優(yōu)缺點,并結(jié)合機器人項目的需求,最終選擇出可控波束形成技術(shù)與相位變換(PHAse Transform,PHAT)加權(quán)系數(shù)相結(jié)合的SRP-PHAT(Steered Response Power with PHAse Transform)聲源定位方法作為本論文的參考實現(xiàn)方案。通過實驗發(fā)現(xiàn),SRP-PHAT聲源定位方法定位時間較長,并不滿足機器人平臺實時性定位的需要,而問題主要在于SRP-PHAT定位方法中的聲源搜索方法性能較低,因此本文采用粒子群算法對傳統(tǒng)聲源搜索方法進行改進,通過仿真實驗對比驗證了粒子群算法改進聲源搜索方法的有效性。最后設(shè)計了麥克風(fēng)陣列,構(gòu)建了基于xCore-200平臺的基礎(chǔ)硬件環(huán)境,在此基礎(chǔ)上實現(xiàn)了傳統(tǒng)搜索方法及粒子群算法改進的搜索方法,并通過實驗分析這兩種方法在水平二維空間上的方位角精度和距離精度以及定位的實時性。實驗結(jié)果表明,基于xCore-200所實現(xiàn)的定位系統(tǒng),方位角估計成功率基本都在90%以上,平均誤差可以控制在5°以內(nèi);距離估計略差,平均估計成功率約為80%,平均誤差約為0.25m;在時間開銷方面,平均單次定位時間為525.23ms。相比較傳統(tǒng)網(wǎng)格搜索方法,改進后的方法保證了定位系統(tǒng)的精度,并將定位時間縮短了20.48%。
【圖文】:
泛的應(yīng)用場景。圖 1-2 與某合作公司共同研發(fā)的智能服務(wù)機器人原型機此外,本人所在實驗室與眾多機器人公司合作研發(fā)機器人,如圖1-2 為與某合作公司共同研發(fā)的智能服務(wù)機器人原型機,本論文則致力于解決麥克風(fēng)陣列安裝困難和嵌入式低速設(shè)備進行實時定位的問題,改善項目當中機器人與人之間的交互體驗,故而本論文以少量麥克風(fēng)構(gòu)建小型陣列,,并以此為基礎(chǔ)設(shè)計實現(xiàn)一個適用于機器人平臺的聲源定位系統(tǒng)。由于機器人平臺運算性能較低,而又對定位精度有一定的要求,這就要求所采用的算法在保證定位效果的情況下盡可能的縮短定位時間,同時保證定位的精確性和實時性兩方面的性能。研究意義本文針對智能服務(wù)型機器人平臺,設(shè)計并實現(xiàn)了基于小型麥克風(fēng)陣列的聲源定位系統(tǒng),主要具有以下幾點意義:(1) 構(gòu)建適用于智能服務(wù)型機器人平臺的小型麥克風(fēng)陣列,擴大麥克風(fēng)陣列的應(yīng)用場景。
a) 某一幀音頻信號 圖 3-2 音頻為了獲得較為平穩(wěn)的音頻信號,需要對整體的波形圖。分幀通常采用重疊分段的方法,分段是的過渡較為平滑,保持語音信號特征的連續(xù)性,設(shè)定為 10~40ms,重疊率通常在 50%~100%范圍32ms,采樣率為 32kHz,因此一個音頻幀中具有50%,即幀移為 512 個采樣點。最常用的分幀方常將這個過程稱為加窗,而滑動窗口函數(shù)稱為窗漢寧窗、三角窗和布萊克曼窗[13]等,其中矩形窗長度的音頻片段即為采用了矩形窗,這種方式的計也采用矩形窗。
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TN912.3;TP242
本文編號:2646989
【圖文】:
泛的應(yīng)用場景。圖 1-2 與某合作公司共同研發(fā)的智能服務(wù)機器人原型機此外,本人所在實驗室與眾多機器人公司合作研發(fā)機器人,如圖1-2 為與某合作公司共同研發(fā)的智能服務(wù)機器人原型機,本論文則致力于解決麥克風(fēng)陣列安裝困難和嵌入式低速設(shè)備進行實時定位的問題,改善項目當中機器人與人之間的交互體驗,故而本論文以少量麥克風(fēng)構(gòu)建小型陣列,,并以此為基礎(chǔ)設(shè)計實現(xiàn)一個適用于機器人平臺的聲源定位系統(tǒng)。由于機器人平臺運算性能較低,而又對定位精度有一定的要求,這就要求所采用的算法在保證定位效果的情況下盡可能的縮短定位時間,同時保證定位的精確性和實時性兩方面的性能。研究意義本文針對智能服務(wù)型機器人平臺,設(shè)計并實現(xiàn)了基于小型麥克風(fēng)陣列的聲源定位系統(tǒng),主要具有以下幾點意義:(1) 構(gòu)建適用于智能服務(wù)型機器人平臺的小型麥克風(fēng)陣列,擴大麥克風(fēng)陣列的應(yīng)用場景。
a) 某一幀音頻信號 圖 3-2 音頻為了獲得較為平穩(wěn)的音頻信號,需要對整體的波形圖。分幀通常采用重疊分段的方法,分段是的過渡較為平滑,保持語音信號特征的連續(xù)性,設(shè)定為 10~40ms,重疊率通常在 50%~100%范圍32ms,采樣率為 32kHz,因此一個音頻幀中具有50%,即幀移為 512 個采樣點。最常用的分幀方常將這個過程稱為加窗,而滑動窗口函數(shù)稱為窗漢寧窗、三角窗和布萊克曼窗[13]等,其中矩形窗長度的音頻片段即為采用了矩形窗,這種方式的計也采用矩形窗。
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TN912.3;TP242
【參考文獻】
相關(guān)期刊論文 前4條
1 張婷婷;陳靜;;我國老人護理服務(wù)機器人的應(yīng)用探析[J];管理觀察;2014年10期
2 徐勤奇;楊鵬;;基于正四面體陣列的聲源定位算法及誤差分析[J];計算機仿真;2013年07期
3 嚴素清,黃冰;傳聲器陣列的聲源定位研究[J];電聲技術(shù);2004年12期
4 馬曉紅,陸曉燕,殷福亮;改進的互功率譜相位時延估計方法[J];電子與信息學(xué)報;2004年01期
本文編號:2646989
本文鏈接:http://sikaile.net/kejilunwen/wltx/2646989.html
最近更新
教材專著