基于長時間可穿戴社交數(shù)據(jù)集的語音分割方法的研究
發(fā)布時間:2020-09-18 18:45
隨著工作和學環(huán)境壓力的增加,心理健康問題已經成為當前社會研究的主要課題。通常研究人員通過使用社交感知行為來分析心理健康狀態(tài)。社交感知信號通常包括語音信號,行為信號,心理感知信號等。其中語音信號由于包含豐富的情感和社交信息,是可靠的身心健康評估特征。在本文中,使用所提出的可穿戴設備進行了為期四周的長期監(jiān)測實驗研究。在完全自然的情況下分析具有分段的語音-社交特征。我們設計了用于基于極少特征語音分割的遷移學習模型算法。對經典的深度學習VGG-net網(wǎng)絡進行修改,加入殘差學習單元,以加深網(wǎng)絡的深度,通過修改卷積核的大小,改變感受野大小。通過在TUT Acoustic Scenes數(shù)據(jù)集上訓練模型,并在該模型上學習基本聲學場景特征,基于模型的遷移算法,僅用四個可穿戴語音社交特征(能量、熵、亮度、共振峰)將模型遷移到長時間社交數(shù)據(jù)集。所獲得的結果顯示使用可穿戴長期語音社交數(shù)據(jù)集在無約束的自然情況下對語音場景可以進行有效的分割。對于長期社交語音監(jiān)控,本文主要研究內容包括:1)基于長期語音-社交特征分析設計可穿戴智能設備來評估心理健康。該分析能夠以有說服力的方式處理語音信號?陀^地使用有限的四個語音-社交特征信號(能量、熵、亮度、共振峰)進行分析,避免直接記錄語音,以保護個人隱私和減少計算復雜度。以大學生作為研究對象,設計了長達一個月的心理健康監(jiān)測實驗,用于評估他們的身心健康狀況。2)將基于模型的遷移學習算法應用于語音分割領域,并通過基于模型的遷移學習模型研究提高對語音分割的精度。通過加入殘差學習單元以增加網(wǎng)絡結構的深度,提供網(wǎng)絡的泛化能力。并通過改變卷積核的大小以調整感受野的大小。使得網(wǎng)絡在少數(shù)特征(能量、熵、亮度、共振峰)的數(shù)據(jù)集上可以收斂。最終通過對基于模型的遷移學習模型的研究,以解決傳統(tǒng)算法中經常發(fā)生的訓練樣本不足的問題。3)最后,建立分段語音-社交特征與焦慮(自閉癥)水平狀態(tài)之間的相互關系,用于協(xié)助研究大學生的心理健康狀況。
【學位單位】:電子科技大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:R749;TN912.3
【部分圖文】:
可穿戴設備和基于 PC 端的語音分割算法是為了通過可穿戴設備(可穿戴手環(huán))構建一個有限主設計的可穿戴手環(huán)在自閉癥實驗(該實驗設計的細)的中收集被測試者(電子科技大學在校學生)的、共振峰),采集到語音社交特征會被保存在 SDK月的長時間可穿戴社交數(shù)據(jù)集,其中自閉癥實驗設詳細介紹?纱┐髟O備(可穿戴手環(huán))主要用在自閉收集,每個受測試者被要求佩戴為期四周的時間,每語音特征數(shù)據(jù)集。通過 PC 端自主設計的基于模型遷語音數(shù)據(jù)集進行有效分割,構建出語音-社交特征關系,以方便研究大學生的心理健康狀況。的社交感知平臺以及特征描述的社交感知平臺
越高遷移過程學習到的有用知識越多,在設計網(wǎng)絡結構數(shù)。從改進 VGG 網(wǎng)絡結構,基于模型的遷移學習算法和評估基于模型遷移學習語音分割算法。其中在改進 VGG 網(wǎng)絡改進的細節(jié)部分以及相應的理論依據(jù),基于模型的遷移中模型/參數(shù)遷移學習模型的部分的補充,進一步詳細介程中用到的技巧,評估與分析中將介紹模型評估的指標以。VGG 網(wǎng)絡結構經網(wǎng)絡中一般是通過常用的算子來構建出基本的網(wǎng)絡結構理的網(wǎng)絡層被稱為輸入層主要包括白化、歸一化和去均值卷積神經網(wǎng)絡中的基本操作,通過使用離散卷積的形式,圖片區(qū)域獲得圖像的局部信息。激活函數(shù)層主要是做一個為了增加網(wǎng)絡的表達能力,常用的激活函數(shù)有Sigmoid 函 3-5 和 3-6 為兩個激活函數(shù)的函數(shù)圖像。
圖 3-6 線性整流函數(shù) 3-6 為線性整流函數(shù)圖像,線性整流函數(shù)(RectifiedLinearUnit,ReLU), 正線性單元,通常指的以斜坡函數(shù)及其變種為代表的非線性函數(shù)。常意義下線性整流函數(shù)指代數(shù)學中的斜坡函數(shù),即 ( x ) max(0, x)(3-3)公式求導可得1 0( )0 0xxx 在神經網(wǎng)絡中線性整流作為神經元的激活函數(shù),定義了該神經元在線 b 之后的非線性輸出結果。換言之對于進入神經元的來自上一層神經向量 x,使用線性整流激活函數(shù)的神經元會輸出至下一層神經元或作為絡的輸出。max(0, )TW X b
本文編號:2822030
【學位單位】:電子科技大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:R749;TN912.3
【部分圖文】:
可穿戴設備和基于 PC 端的語音分割算法是為了通過可穿戴設備(可穿戴手環(huán))構建一個有限主設計的可穿戴手環(huán)在自閉癥實驗(該實驗設計的細)的中收集被測試者(電子科技大學在校學生)的、共振峰),采集到語音社交特征會被保存在 SDK月的長時間可穿戴社交數(shù)據(jù)集,其中自閉癥實驗設詳細介紹?纱┐髟O備(可穿戴手環(huán))主要用在自閉收集,每個受測試者被要求佩戴為期四周的時間,每語音特征數(shù)據(jù)集。通過 PC 端自主設計的基于模型遷語音數(shù)據(jù)集進行有效分割,構建出語音-社交特征關系,以方便研究大學生的心理健康狀況。的社交感知平臺以及特征描述的社交感知平臺
越高遷移過程學習到的有用知識越多,在設計網(wǎng)絡結構數(shù)。從改進 VGG 網(wǎng)絡結構,基于模型的遷移學習算法和評估基于模型遷移學習語音分割算法。其中在改進 VGG 網(wǎng)絡改進的細節(jié)部分以及相應的理論依據(jù),基于模型的遷移中模型/參數(shù)遷移學習模型的部分的補充,進一步詳細介程中用到的技巧,評估與分析中將介紹模型評估的指標以。VGG 網(wǎng)絡結構經網(wǎng)絡中一般是通過常用的算子來構建出基本的網(wǎng)絡結構理的網(wǎng)絡層被稱為輸入層主要包括白化、歸一化和去均值卷積神經網(wǎng)絡中的基本操作,通過使用離散卷積的形式,圖片區(qū)域獲得圖像的局部信息。激活函數(shù)層主要是做一個為了增加網(wǎng)絡的表達能力,常用的激活函數(shù)有Sigmoid 函 3-5 和 3-6 為兩個激活函數(shù)的函數(shù)圖像。
圖 3-6 線性整流函數(shù) 3-6 為線性整流函數(shù)圖像,線性整流函數(shù)(RectifiedLinearUnit,ReLU), 正線性單元,通常指的以斜坡函數(shù)及其變種為代表的非線性函數(shù)。常意義下線性整流函數(shù)指代數(shù)學中的斜坡函數(shù),即 ( x ) max(0, x)(3-3)公式求導可得1 0( )0 0xxx 在神經網(wǎng)絡中線性整流作為神經元的激活函數(shù),定義了該神經元在線 b 之后的非線性輸出結果。換言之對于進入神經元的來自上一層神經向量 x,使用線性整流激活函數(shù)的神經元會輸出至下一層神經元或作為絡的輸出。max(0, )TW X b
【參考文獻】
相關期刊論文 前9條
1 黃晨晨;鞏微;伏文龍;馮東煜;;基于深度信念網(wǎng)絡的語音情感識別的研究[J];計算機研究與發(fā)展;2014年S1期
2 曾小娟;蔣浩;李永鑫;;農村留守初中生的心理健康與心理彈性、核心自我評價[J];中國心理衛(wèi)生雜志;2014年12期
3 陳煒亮;孫曉;;基于MFCCG-PCA的語音情感識別[J];北京大學學報(自然科學版);2015年02期
4 魏平杰;樊興華;;語音傾向性分析中的特征抽取研究[J];計算機應用研究;2014年12期
5 宋佾珈;張建新;張金鳳;;公務員的心理健康狀況及與應酬壓力、職業(yè)倦怠感、生活滿意度的關系[J];中國心理衛(wèi)生雜志;2014年04期
6 顧睿;胡立斌;王刊良;;社交網(wǎng)站價值感知和社會影響對用戶忠誠影響的實證研究[J];信息資源管理學報;2013年01期
7 凌錦雯;陸偉;劉青松;張琨磊;;利用EHMM和CLR的說話人分割聚類算法[J];小型微型計算機系統(tǒng);2012年06期
8 任新社;繆華;馬青玉;;基于改進特征值的語音分割算法研究[J];南京師范大學學報(工程技術版);2011年03期
9 高福友;陳雁翔;;一種基于說話者的無監(jiān)督語音分割算法[J];合肥工業(yè)大學學報(自然科學版);2010年05期
相關碩士學位論文 前1條
1 凌錦雯;基于多特征的說話人分割與聚類的研究[D];中國科學技術大學;2011年
本文編號:2822030
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2822030.html
最近更新
教材專著