面向高維稀疏數據的超參數調優(yōu)研究與實現(xiàn)
發(fā)布時間:2021-06-29 00:49
隨著數據爆炸時代的來臨,制造,金融,教育,健康等各種行業(yè),數據的分布與之前大不相同。在很多場景下,數據逐漸變得稀疏而分散。面對這種高維稀疏數據的數據挖掘問題,機器學習算法能夠比人工分析速度更快,效果更好。在實際業(yè)務中,各行各業(yè)出于自身需求,在應用學術成果的同時,也需要對算法模型進行適應性調整,得到更好的業(yè)務指標或生產效果。在對高維稀疏數據的分析過程中,合理地應用機器學習模型,可以使得數據分析更準確,數據挖掘更有效。在實際業(yè)務中,根據數據具體分布特征,進行機器學習模型的選取和模型超參數的設置是關鍵。本文針對指定場景下的高維稀疏數據,基于多種算法的數據分析處理結果和貝葉斯優(yōu)化算法,實現(xiàn)并改進機器學習模型自動化建立及調優(yōu)過程。本文主要研究內容有三部分。一是面向高維稀疏數據的處理與目標模型選取。本文依據多種數據分析指標,以量化分析代替定性分析,解析數據分布特征,基于帶偏置項的SVD協(xié)同過濾方法對數據填充,基于集成樹模型對數據降維,并選取合適的目標模型進行后續(xù)建模和調優(yōu)。二是建立代理函數,對目標模型的超參數與性能間真實回歸模型的分布進行預測。通過比較多種并行樹模型預測結果后,基于隨機森林算法建立...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數】:70 頁
【學位級別】:碩士
【部分圖文】:
章節(jié)間的邏輯關系
是如果兩個用戶有類似的評價行為,如對同樣的商品,電影,餐館等有相似的評分,系統(tǒng)可以對其他項目進行類似評分,如圖2-1 圖2-1 推薦系統(tǒng)中協(xié)同過濾的應用由于基于web的活動大量增加,用戶數據信息逐漸稀疏化,已經證明,從其他用戶的偏好預測目標用戶偏好的協(xié)同過濾技術是有效的[36-38] 最流行的協(xié)同過濾技術有兩類[39],基于鄰域的協(xié)同過濾技術[40-42],基于矩陣分解的協(xié)同過濾技術[43,44] 其中,基于矩陣分解的協(xié)同過濾技術包括基于SVD[4 5 ]和NMF[44,37]及其變形等方法,如圖2-2 圖2-2 基于SVD分解的協(xié)同過濾
基于SVD分解的協(xié)同過濾
【參考文獻】:
期刊論文
[1]基于隨機森林模型的雅魯藏布江流域氣溫降尺度研究[J]. 任梅芳,龐博,徐宗學,趙彥軍. 高原氣象. 2018(05)
[2]基于稀疏表示的精神分裂癥生物標記物篩選方法[J]. 武杰,魏鳳仙,付令. 中國生物醫(yī)學工程學報. 2017(06)
[3]基于卡爾曼濾波和隨機回歸森林的實時頭部姿態(tài)估計[J]. 李成龍,鐘凡,馬昕,秦學英. 計算機輔助設計與圖形學學報. 2017(12)
[4]基于決策因子選擇的梯級水庫多目標優(yōu)化調度規(guī)則研究[J]. 楊光,郭生練,陳柯兵,吳旭樹. 水利學報. 2017(08)
[5]基于穩(wěn)健稀疏主成分的經濟增長影響因素分析[J]. 喻勝華. 統(tǒng)計與信息論壇. 2017(03)
[6]神經網絡七十年:回顧與展望[J]. 焦李成,楊淑媛,劉芳,王士剛,馮志璽. 計算機學報. 2016(08)
[7]基于提升回歸樹的東、黃海鮐魚漁場預報[J]. 高峰,陳新軍,官文江,李綱. 海洋學報. 2015(10)
[8]一種基于遺傳算法的神經網絡結構優(yōu)化方法[J]. 付琦. 制造業(yè)自動化. 2015(14)
[9]相關向量機超參數優(yōu)化的網絡安全態(tài)勢預測[J]. 肖漢杰,桑秀麗. 計算機應用. 2015(07)
[10]基于增強回歸樹的水藻預測分析[J]. 佘玉萍,陳淑清. 長春大學學報. 2015(06)
碩士論文
[1]基于LS-SVM的時間序列預測方法及其應用研究[D]. 劉琦.哈爾濱工業(yè)大學 2011
本文編號:3255377
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數】:70 頁
【學位級別】:碩士
【部分圖文】:
章節(jié)間的邏輯關系
是如果兩個用戶有類似的評價行為,如對同樣的商品,電影,餐館等有相似的評分,系統(tǒng)可以對其他項目進行類似評分,如圖2-1 圖2-1 推薦系統(tǒng)中協(xié)同過濾的應用由于基于web的活動大量增加,用戶數據信息逐漸稀疏化,已經證明,從其他用戶的偏好預測目標用戶偏好的協(xié)同過濾技術是有效的[36-38] 最流行的協(xié)同過濾技術有兩類[39],基于鄰域的協(xié)同過濾技術[40-42],基于矩陣分解的協(xié)同過濾技術[43,44] 其中,基于矩陣分解的協(xié)同過濾技術包括基于SVD[4 5 ]和NMF[44,37]及其變形等方法,如圖2-2 圖2-2 基于SVD分解的協(xié)同過濾
基于SVD分解的協(xié)同過濾
【參考文獻】:
期刊論文
[1]基于隨機森林模型的雅魯藏布江流域氣溫降尺度研究[J]. 任梅芳,龐博,徐宗學,趙彥軍. 高原氣象. 2018(05)
[2]基于稀疏表示的精神分裂癥生物標記物篩選方法[J]. 武杰,魏鳳仙,付令. 中國生物醫(yī)學工程學報. 2017(06)
[3]基于卡爾曼濾波和隨機回歸森林的實時頭部姿態(tài)估計[J]. 李成龍,鐘凡,馬昕,秦學英. 計算機輔助設計與圖形學學報. 2017(12)
[4]基于決策因子選擇的梯級水庫多目標優(yōu)化調度規(guī)則研究[J]. 楊光,郭生練,陳柯兵,吳旭樹. 水利學報. 2017(08)
[5]基于穩(wěn)健稀疏主成分的經濟增長影響因素分析[J]. 喻勝華. 統(tǒng)計與信息論壇. 2017(03)
[6]神經網絡七十年:回顧與展望[J]. 焦李成,楊淑媛,劉芳,王士剛,馮志璽. 計算機學報. 2016(08)
[7]基于提升回歸樹的東、黃海鮐魚漁場預報[J]. 高峰,陳新軍,官文江,李綱. 海洋學報. 2015(10)
[8]一種基于遺傳算法的神經網絡結構優(yōu)化方法[J]. 付琦. 制造業(yè)自動化. 2015(14)
[9]相關向量機超參數優(yōu)化的網絡安全態(tài)勢預測[J]. 肖漢杰,桑秀麗. 計算機應用. 2015(07)
[10]基于增強回歸樹的水藻預測分析[J]. 佘玉萍,陳淑清. 長春大學學報. 2015(06)
碩士論文
[1]基于LS-SVM的時間序列預測方法及其應用研究[D]. 劉琦.哈爾濱工業(yè)大學 2011
本文編號:3255377
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3255377.html
最近更新
教材專著