基于語音切片的抑郁識別研究
發(fā)布時間:2024-02-13 22:53
抑郁癥又稱抑郁障礙,是一種在臨床上主要表現(xiàn)為顯著而持久心境低落的精神疾病。現(xiàn)階段,抑郁癥的診斷主要以問卷調查為主,其準確度嚴重依賴受診斷者的配合程度、對量表問題的理解程度以及醫(yī)師的專業(yè)水平,誤診率較高。因此一種有效、客觀、普適性強的抑郁癥診斷指標就顯得極為重要。語音因其非侵入、易獲取、低成本、易推廣、限制少等優(yōu)點,在近年來成為研究熱點之一。語音切片指從連續(xù)語音中截取的一小部分語音片段。本文工作主要圍繞在基于語音的抑郁識別中,使用合適長度的語音切片是否可以提供優(yōu)于、至少不差于使用整段語音的聚類決策展開,并對在使用語音切片進行抑郁識別中的幾個關鍵問題進行了研究。對基于語音切片的抑郁識別的研究,不僅可以使基于語音的抑郁識別研究工作更加聚焦,從源頭上減少工作量,還有助于提供更合適的分類模型訓練樣本,從而提高抑郁癥識別準確率。本文構建了兩個用于研究使用語音切片進行抑郁識別的語音切片數(shù)據(jù)庫,并在此基礎上對基于語音切片的抑郁識別中的幾個關鍵問題做了較為深入的研究,具體貢獻如下:第一:設計了包括訪談、詞匯朗讀、短文朗讀、圖片描述和主題統(tǒng)覺測驗五種范式,正性、中性、負性三種情緒刺激的語音采集實驗,采集了...
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3897335
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
圖3-2first、max、last劃分示意圖
使用整段語音更好或者相近的分類決策的問題,本文使用完整語音中不同部位的完整語句構建由完整語句組成的語音切片數(shù)據(jù)庫,具體方法如下:為了不失一般性,本文分別選取原始數(shù)據(jù)集中每段語音的第一個完整語句,組成新的切片集first;原始數(shù)據(jù)集中每個語音段的最后一個完整語句,組成新的數(shù)據(jù)集....
圖3-3五等分切片示意圖
考慮到切片長度對分類結果可能帶來的影響,本文對原始語音分別做3等分、5等分和10等分三種不同長度的切片處理。得到3等分、5等分和10等分切片數(shù)據(jù)集各3個、5個、10個,總計18個切片集。具體操作如下:第一:先對原始語音數(shù)據(jù)集中的語音段采用基于子帶譜....
圖4-2女性29段語音上切片與整段分類對比
4-2女性29段語音上切片與整段以清楚看到,使用語音切片進于完整語音段,而對于女性,需要指出的是,本章中使用語句,并未為提高抑郁識別準確83
圖4-1男性29段語音上切片與整段分類對比
男性29段語音上切片與整段分優(yōu)于切片17%音切片和完整語音分
本文編號:3897335
本文鏈接:http://sikaile.net/yixuelunwen/jsb/3897335.html
最近更新
教材專著