基于卷積神經(jīng)網(wǎng)絡(luò)的音樂(lè)推薦系統(tǒng)
發(fā)布時(shí)間:2021-06-24 22:33
隨著數(shù)字多媒體技術(shù)的不斷發(fā)展,音樂(lè)庫(kù)變得越來(lái)越大,音樂(lè)資源越來(lái)越豐富,如何讓用戶在浩瀚如海的音樂(lè)世界里高效地獲取自己感興趣的歌曲便成了一個(gè)難題。針對(duì)這種現(xiàn)象,個(gè)性化音樂(lè)推薦系統(tǒng)應(yīng)運(yùn)而生。然而,雖然現(xiàn)有的音樂(lè)推薦系統(tǒng)種類(lèi)繁多,但推薦效果良莠不齊,或多或少都存在一些問(wèn)題。卷積神經(jīng)網(wǎng)絡(luò)是近年發(fā)展起來(lái),并引起廣泛重視的一種高效的深度學(xué)習(xí)方法,被廣泛應(yīng)用于圖像識(shí)別、自然語(yǔ)言處理等多個(gè)領(lǐng)域,并且取得了比傳統(tǒng)機(jī)器學(xué)習(xí)更好的效果。鑒于此,本文提出了基于卷積神經(jīng)網(wǎng)絡(luò)的音樂(lè)推薦系統(tǒng)。本文提出的音樂(lè)推薦系統(tǒng)包括用戶建模模塊、音頻特征提取模塊和推薦算法模塊等。推薦算法的基本思路是:首先對(duì)音樂(lè)用戶歷史行為信息進(jìn)行采集,利用隱語(yǔ)義模型矩陣分解的方法構(gòu)建出用戶偏好模型;接著對(duì)系統(tǒng)中的音頻資源進(jìn)行預(yù)處理,并提取出能夠代表音樂(lè)特征的梅爾頻譜圖;然后對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練獲得音樂(lè)潛在特征預(yù)測(cè)的回歸模型,將用戶和音樂(lè)投影到一個(gè)共享的隱空間中;最后通過(guò)計(jì)算用戶偏好特征與音樂(lè)潛在特征之間的相似性為目標(biāo)用戶產(chǎn)生TopN推薦。本文對(duì)所提出的推薦算法進(jìn)行了系統(tǒng)性地實(shí)驗(yàn),自行構(gòu)建了模型訓(xùn)練和測(cè)試的用戶-音樂(lè)數(shù)據(jù)集,并在典型的卷積神經(jīng)網(wǎng)...
【文章來(lái)源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
淘寶、網(wǎng)易云音樂(lè)日常推薦效果圖
宦畚?第三章 基于卷積神經(jīng)網(wǎng)絡(luò)的音樂(lè)推薦算法33圖 3.4 音頻信號(hào)的聲譜圖3.4.2 梅爾頻譜與梅爾頻率倒譜系數(shù)上一節(jié)中利用短時(shí)傅里葉變換 STFT 得到的聲譜圖包含了音頻信號(hào)的全頻域信息,通常較為龐大,往往需要對(duì)其進(jìn)行壓縮。雖然人耳所能夠聽(tīng)到的聲音頻率在 20-20000Hz 范圍內(nèi),但是它對(duì)不同頻率信號(hào)響應(yīng)的靈敏度是不同的,就像一個(gè)濾波器組一樣,只會(huì)有選擇地讓某些特定的頻率信號(hào)通過(guò)。對(duì)于以‘Hz’頻率為標(biāo)度單位而言,人的聽(tīng)覺(jué)是一個(gè)非線性系統(tǒng)。例如,若將音調(diào)頻率為 1000Hz 調(diào)整到 2000Hz,人耳所能察覺(jué)的只是少許變化,而不是提高了一倍。針對(duì)這一人類(lèi)聽(tīng)覺(jué)感知特點(diǎn),在音頻信號(hào)處理時(shí)通常會(huì)將‘Hz’頻率標(biāo)度轉(zhuǎn)換為梅爾(Mel)頻率標(biāo)度,二者相互映射關(guān)系為:102595log (1 / 700)Mel Hzf f(3.24)1 /2595700(10 1)MelfHz Melf f (3.25)圖 3
圖 3.4 音頻信號(hào)的聲譜圖梅爾頻率倒譜系數(shù)時(shí)傅里葉變換 STFT 得到的聲譜圖包含了音頻信號(hào)的對(duì)其進(jìn)行壓縮。雖然人耳所能夠聽(tīng)到的聲音頻率在 20號(hào)響應(yīng)的靈敏度是不同的,就像一個(gè)濾波器組一樣,過(guò)。對(duì)于以‘Hz’頻率為標(biāo)度單位而言,人的聽(tīng)覺(jué)是為 1000Hz 調(diào)整到 2000Hz,人耳所能察覺(jué)的只是少許類(lèi)聽(tīng)覺(jué)感知特點(diǎn),在音頻信號(hào)處理時(shí)通常會(huì)將‘Hz’二者相互映射關(guān)系為:102595log (1 / 700)Mel Hzf f1 /2595700(10 1)MelfHz Melf f
【參考文獻(xiàn)】:
期刊論文
[1]音樂(lè)推薦系統(tǒng)中的用戶冷啟動(dòng)問(wèn)題[J]. 劉建東,戚利娜. 吉首大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(04)
[2]推薦系統(tǒng)中的隱語(yǔ)義模型研究[J]. 李琳娜,江雪琴. 情報(bào)工程. 2016(04)
[3]音樂(lè)個(gè)性化推薦系統(tǒng)研究綜述[J]. 譚學(xué)清,何珊. 現(xiàn)代圖書(shū)情報(bào)技術(shù). 2014(09)
[4]音樂(lè)推薦技術(shù)的現(xiàn)狀與發(fā)展[J]. 楊倩,潘興德. 電聲技術(shù). 2012(06)
[5]基于卷積神經(jīng)網(wǎng)絡(luò)LeNet-5的車(chē)牌字符識(shí)別研究[J]. 趙志宏,楊紹普,馬增強(qiáng). 系統(tǒng)仿真學(xué)報(bào). 2010(03)
[6]互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J]. 許海玲,吳瀟,李曉東,閻保平. 軟件學(xué)報(bào). 2009(02)
[7]基于項(xiàng)目評(píng)分預(yù)測(cè)的協(xié)同過(guò)濾推薦算法[J]. 鄧愛(ài)林,朱揚(yáng)勇,施伯樂(lè). 軟件學(xué)報(bào). 2003(09)
[8]個(gè)性化服務(wù)技術(shù)綜述[J]. 曾春,邢春曉,周立柱. 軟件學(xué)報(bào). 2002(10)
碩士論文
[1]基于用戶行為和項(xiàng)目?jī)?nèi)容的混合推薦算法研究與應(yīng)用[D]. 艾長(zhǎng)青.電子科技大學(xué) 2017
本文編號(hào):3247939
【文章來(lái)源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
淘寶、網(wǎng)易云音樂(lè)日常推薦效果圖
宦畚?第三章 基于卷積神經(jīng)網(wǎng)絡(luò)的音樂(lè)推薦算法33圖 3.4 音頻信號(hào)的聲譜圖3.4.2 梅爾頻譜與梅爾頻率倒譜系數(shù)上一節(jié)中利用短時(shí)傅里葉變換 STFT 得到的聲譜圖包含了音頻信號(hào)的全頻域信息,通常較為龐大,往往需要對(duì)其進(jìn)行壓縮。雖然人耳所能夠聽(tīng)到的聲音頻率在 20-20000Hz 范圍內(nèi),但是它對(duì)不同頻率信號(hào)響應(yīng)的靈敏度是不同的,就像一個(gè)濾波器組一樣,只會(huì)有選擇地讓某些特定的頻率信號(hào)通過(guò)。對(duì)于以‘Hz’頻率為標(biāo)度單位而言,人的聽(tīng)覺(jué)是一個(gè)非線性系統(tǒng)。例如,若將音調(diào)頻率為 1000Hz 調(diào)整到 2000Hz,人耳所能察覺(jué)的只是少許變化,而不是提高了一倍。針對(duì)這一人類(lèi)聽(tīng)覺(jué)感知特點(diǎn),在音頻信號(hào)處理時(shí)通常會(huì)將‘Hz’頻率標(biāo)度轉(zhuǎn)換為梅爾(Mel)頻率標(biāo)度,二者相互映射關(guān)系為:102595log (1 / 700)Mel Hzf f(3.24)1 /2595700(10 1)MelfHz Melf f (3.25)圖 3
圖 3.4 音頻信號(hào)的聲譜圖梅爾頻率倒譜系數(shù)時(shí)傅里葉變換 STFT 得到的聲譜圖包含了音頻信號(hào)的對(duì)其進(jìn)行壓縮。雖然人耳所能夠聽(tīng)到的聲音頻率在 20號(hào)響應(yīng)的靈敏度是不同的,就像一個(gè)濾波器組一樣,過(guò)。對(duì)于以‘Hz’頻率為標(biāo)度單位而言,人的聽(tīng)覺(jué)是為 1000Hz 調(diào)整到 2000Hz,人耳所能察覺(jué)的只是少許類(lèi)聽(tīng)覺(jué)感知特點(diǎn),在音頻信號(hào)處理時(shí)通常會(huì)將‘Hz’二者相互映射關(guān)系為:102595log (1 / 700)Mel Hzf f1 /2595700(10 1)MelfHz Melf f
【參考文獻(xiàn)】:
期刊論文
[1]音樂(lè)推薦系統(tǒng)中的用戶冷啟動(dòng)問(wèn)題[J]. 劉建東,戚利娜. 吉首大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(04)
[2]推薦系統(tǒng)中的隱語(yǔ)義模型研究[J]. 李琳娜,江雪琴. 情報(bào)工程. 2016(04)
[3]音樂(lè)個(gè)性化推薦系統(tǒng)研究綜述[J]. 譚學(xué)清,何珊. 現(xiàn)代圖書(shū)情報(bào)技術(shù). 2014(09)
[4]音樂(lè)推薦技術(shù)的現(xiàn)狀與發(fā)展[J]. 楊倩,潘興德. 電聲技術(shù). 2012(06)
[5]基于卷積神經(jīng)網(wǎng)絡(luò)LeNet-5的車(chē)牌字符識(shí)別研究[J]. 趙志宏,楊紹普,馬增強(qiáng). 系統(tǒng)仿真學(xué)報(bào). 2010(03)
[6]互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J]. 許海玲,吳瀟,李曉東,閻保平. 軟件學(xué)報(bào). 2009(02)
[7]基于項(xiàng)目評(píng)分預(yù)測(cè)的協(xié)同過(guò)濾推薦算法[J]. 鄧愛(ài)林,朱揚(yáng)勇,施伯樂(lè). 軟件學(xué)報(bào). 2003(09)
[8]個(gè)性化服務(wù)技術(shù)綜述[J]. 曾春,邢春曉,周立柱. 軟件學(xué)報(bào). 2002(10)
碩士論文
[1]基于用戶行為和項(xiàng)目?jī)?nèi)容的混合推薦算法研究與應(yīng)用[D]. 艾長(zhǎng)青.電子科技大學(xué) 2017
本文編號(hào):3247939
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3247939.html
最近更新
教材專著