基于二值化網(wǎng)絡(luò)的推薦系統(tǒng)的研究
發(fā)布時(shí)間:2021-09-17 18:18
迅猛發(fā)展的互聯(lián)網(wǎng)資源致使用戶可隨意獲取海量的媒體、文檔信息以及服務(wù)等,與此同時(shí),資源的快速增長也導(dǎo)致了資源過載的問題。用戶在擁有著龐大信息數(shù)據(jù)資源的同時(shí),卻也深陷于難以發(fā)現(xiàn)真正感興趣的內(nèi)容的窘境。在這種情況下,由信息過濾演變成的推薦系統(tǒng)就顯得尤為重要,它可以幫助人們發(fā)現(xiàn)感興趣的項(xiàng)目,例如電影,書,新聞,圖片或者網(wǎng)頁等。然而,隨著人們需求的逐漸增長,用戶越來越依賴對其獨(dú)特偏好進(jìn)行個(gè)性化定制的推薦系統(tǒng)。諸如此類的推薦系統(tǒng)通常都需要記錄和分析計(jì)算大量的用戶行為數(shù)據(jù),然而隨著用戶數(shù)量逐漸增大,需要記錄的行為數(shù)據(jù)越來越多,傳統(tǒng)的推薦算法不僅在物理存儲(chǔ)上承受著巨大壓力,無法實(shí)時(shí)高效地處理數(shù)據(jù)量較大的數(shù)據(jù)集等問題,且在用戶信息較為稀疏的數(shù)據(jù)集下表現(xiàn)欠佳。近期,研究人員發(fā)現(xiàn)僅僅基于誰評價(jià)了什么來記錄用戶行為的二值化推薦系統(tǒng),而非基于實(shí)際評分的推薦系統(tǒng)能不僅能在一定程度上緩解存儲(chǔ)壓力,還能得到更準(zhǔn)確的推薦結(jié)果并且具有更強(qiáng)的魯棒性,因此研究并實(shí)現(xiàn)一個(gè)基于二值化的推薦系統(tǒng)具有重大意義。本文深入研究并分析了當(dāng)前推薦系統(tǒng)的現(xiàn)狀,對推薦系統(tǒng)的概念、原理、目前主流的推薦算法以及常用的評價(jià)指標(biāo)做了深入的了解,歸納了各...
【文章來源】:昆明理工大學(xué)云南省
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.4卷積神經(jīng)網(wǎng)絡(luò)的層級結(jié)構(gòu)圖??15??
昆明理工大學(xué)專業(yè)碩士學(xué)位論文???開始???£???對數(shù)據(jù)進(jìn)行二值化??預(yù)處理??h—????★??將樣本數(shù)據(jù)輸入卷積??神含綱鉻???^???計(jì)算輸出預(yù)測結(jié)果和樣本??中實(shí)際結(jié)果的誤差??否?I ̄^??<r?達(dá)到訓(xùn)練結(jié)束條件反珣調(diào)整誤差??輸入待推薦用戶信息進(jìn)行??椎薦預(yù)測????3?[???^?w?>??結(jié)束??圖3.?1?BCNN模型推薦算法的流程圖??3.?3二值化??本文首先對數(shù)據(jù)集中非文本數(shù)據(jù)進(jìn)行正則化處理,正則化的目的是在一開始模型并不??知道哪個(gè)特征會(huì)對最終的推薦結(jié)果造成多大的影響。以電影數(shù)據(jù)為例,當(dāng)觀看次數(shù)達(dá)到十??萬次時(shí),而它卻只有十條評論,這種時(shí)候評論數(shù)與觀看次數(shù)相對比就顯得極其不協(xié)調(diào),而??m在進(jìn)行推薦預(yù)測時(shí)就會(huì)忽略評論數(shù)這個(gè)特征。然而正則化后的數(shù)據(jù),所有的特征值最終??都映射到[0,1]區(qū)間,系統(tǒng)在進(jìn)行推薦時(shí),整個(gè)模型對它們的基本權(quán)重都是一樣的,從而增??加了每個(gè)特征在系統(tǒng)中的可靠性,這樣進(jìn)行的推薦更符合常理。正則化公式如3.6所示:??,=?Xj?-min{x1,x2,?...,xn}??(3?g)??Xl?maxh,?x2,…,xn}?—?minfxp?x2,…,xn}??式中f?w為樣本總個(gè)數(shù),&為第/個(gè)樣本。屬性特征原始數(shù)據(jù)如圖3.2所示,正則化處理后??22??
昆明_3|犬##艦碩_隹論|:???將數(shù)據(jù)正則化后,本文采用閾值二值化方法將數(shù)據(jù)分為兩類,閾值,二值化方法主要分??為確定性二值化和隨機(jī)二植化兩種[54]:??(1)確定二值化:按照公式(3.7)將實(shí)值轉(zhuǎn)化成二進(jìn)制位:??x,?=?sign(x)?=?H?l^heXr^sAe[?(3.7)??其中是二進(jìn)制變量,x是實(shí)值變暈,A為特定閾值。??(2)隨機(jī)二值化:按照公式(3.8)將實(shí)值轉(zhuǎn)化成二進(jìn)制位:??Xfc=f??P?=?a(x),?(3.8)??b?U?1?-?p.??其中p為界定X的一個(gè)概率閾值,E??a(x)?=?clip(—-—,0,1)?=?max?(0,?min?(1,?—-—))?(3.9)??由于公式3.8的方法需要使用到硬件產(chǎn)生隨機(jī)數(shù),進(jìn)行計(jì)算時(shí)無論是在軟件和硬件上??花費(fèi)較多成本,而第一種方法是線性分段的,能對應(yīng)連續(xù)又有界的形式,因此本文利用公??式3.7進(jìn)行二值化處理。本文中特定閾值X取值為該類屬性正則化后的算術(shù)平均值《二值??化處理后的數(shù)據(jù)如圖3.4所示:??1?e:?1—??圖3.?4二值化處理后的數(shù)據(jù)??24??
【參考文獻(xiàn)】:
期刊論文
[1]改進(jìn)的Dropout正則化卷積神經(jīng)網(wǎng)絡(luò)[J]. 滿鳳環(huán),陳秀宏,何佳佳. 傳感器與微系統(tǒng). 2018(04)
[2]協(xié)同過濾推薦算法研究進(jìn)展[J]. 翁小蘭,王志堅(jiān). 計(jì)算機(jī)工程與應(yīng)用. 2018(01)
[3]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計(jì)算機(jī)應(yīng)用. 2016(09)
[4]計(jì)算機(jī)多媒體技術(shù)的應(yīng)用現(xiàn)狀與發(fā)展前景[J]. 嚴(yán)玲. 新媒體研究. 2015(11)
[5]一種解決稀疏數(shù)據(jù)和冷啟動(dòng)問題的組合推薦方法[J]. 郭曉波,趙書良,牛東攀,王長賓,逄煥利. 中國科學(xué)技術(shù)大學(xué)學(xué)報(bào). 2015(10)
[6]基于用戶興趣的個(gè)性化信息檢索方法研究[J]. 張一洲. 現(xiàn)代情報(bào). 2015(06)
[7]基于用戶近鄰約束的矩陣因子分解算法[J]. 查九,李振博,徐桂瓊. 計(jì)算機(jī)技術(shù)與發(fā)展. 2015(06)
[8]基于用戶屬性和評分的協(xié)同過濾推薦算法[J]. 丁少衡,姬東鴻,王路路. 計(jì)算機(jī)工程與設(shè)計(jì). 2015(02)
[9]人工神經(jīng)網(wǎng)絡(luò)的發(fā)展與應(yīng)用[J]. 邢廣成,強(qiáng)天偉. 科技風(fēng). 2012(15)
[10]人工智能及其發(fā)展應(yīng)用[J]. 鄒蕾,張先鋒. 信息網(wǎng)絡(luò)安全. 2012(02)
碩士論文
[1]基于用戶與物品信息挖掘的矩陣分解推薦算法研究[D]. 王東.西安電子科技大學(xué) 2017
[2]個(gè)性化推薦系統(tǒng)對消費(fèi)者購買意愿的影響研究[D]. 付曉悅.河南財(cái)經(jīng)政法大學(xué) 2016
[3]我國搜索引擎市場發(fā)展趨勢與策略研究[D]. 楊成寶.山東大學(xué) 2011
[4]關(guān)聯(lián)分析技術(shù)在搜索引擎營銷中的應(yīng)用研究[D]. 郝樹魁.北京郵電大學(xué) 2011
本文編號(hào):3399260
【文章來源】:昆明理工大學(xué)云南省
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.4卷積神經(jīng)網(wǎng)絡(luò)的層級結(jié)構(gòu)圖??15??
昆明理工大學(xué)專業(yè)碩士學(xué)位論文???開始???£???對數(shù)據(jù)進(jìn)行二值化??預(yù)處理??h—????★??將樣本數(shù)據(jù)輸入卷積??神含綱鉻???^???計(jì)算輸出預(yù)測結(jié)果和樣本??中實(shí)際結(jié)果的誤差??否?I ̄^??<r?達(dá)到訓(xùn)練結(jié)束條件反珣調(diào)整誤差??輸入待推薦用戶信息進(jìn)行??椎薦預(yù)測????3?[???^?w?>??結(jié)束??圖3.?1?BCNN模型推薦算法的流程圖??3.?3二值化??本文首先對數(shù)據(jù)集中非文本數(shù)據(jù)進(jìn)行正則化處理,正則化的目的是在一開始模型并不??知道哪個(gè)特征會(huì)對最終的推薦結(jié)果造成多大的影響。以電影數(shù)據(jù)為例,當(dāng)觀看次數(shù)達(dá)到十??萬次時(shí),而它卻只有十條評論,這種時(shí)候評論數(shù)與觀看次數(shù)相對比就顯得極其不協(xié)調(diào),而??m在進(jìn)行推薦預(yù)測時(shí)就會(huì)忽略評論數(shù)這個(gè)特征。然而正則化后的數(shù)據(jù),所有的特征值最終??都映射到[0,1]區(qū)間,系統(tǒng)在進(jìn)行推薦時(shí),整個(gè)模型對它們的基本權(quán)重都是一樣的,從而增??加了每個(gè)特征在系統(tǒng)中的可靠性,這樣進(jìn)行的推薦更符合常理。正則化公式如3.6所示:??,=?Xj?-min{x1,x2,?...,xn}??(3?g)??Xl?maxh,?x2,…,xn}?—?minfxp?x2,…,xn}??式中f?w為樣本總個(gè)數(shù),&為第/個(gè)樣本。屬性特征原始數(shù)據(jù)如圖3.2所示,正則化處理后??22??
昆明_3|犬##艦碩_隹論|:???將數(shù)據(jù)正則化后,本文采用閾值二值化方法將數(shù)據(jù)分為兩類,閾值,二值化方法主要分??為確定性二值化和隨機(jī)二植化兩種[54]:??(1)確定二值化:按照公式(3.7)將實(shí)值轉(zhuǎn)化成二進(jìn)制位:??x,?=?sign(x)?=?H?l^heXr^sAe[?(3.7)??其中是二進(jìn)制變量,x是實(shí)值變暈,A為特定閾值。??(2)隨機(jī)二值化:按照公式(3.8)將實(shí)值轉(zhuǎn)化成二進(jìn)制位:??Xfc=f??P?=?a(x),?(3.8)??b?U?1?-?p.??其中p為界定X的一個(gè)概率閾值,E??a(x)?=?clip(—-—,0,1)?=?max?(0,?min?(1,?—-—))?(3.9)??由于公式3.8的方法需要使用到硬件產(chǎn)生隨機(jī)數(shù),進(jìn)行計(jì)算時(shí)無論是在軟件和硬件上??花費(fèi)較多成本,而第一種方法是線性分段的,能對應(yīng)連續(xù)又有界的形式,因此本文利用公??式3.7進(jìn)行二值化處理。本文中特定閾值X取值為該類屬性正則化后的算術(shù)平均值《二值??化處理后的數(shù)據(jù)如圖3.4所示:??1?e:?1—??圖3.?4二值化處理后的數(shù)據(jù)??24??
【參考文獻(xiàn)】:
期刊論文
[1]改進(jìn)的Dropout正則化卷積神經(jīng)網(wǎng)絡(luò)[J]. 滿鳳環(huán),陳秀宏,何佳佳. 傳感器與微系統(tǒng). 2018(04)
[2]協(xié)同過濾推薦算法研究進(jìn)展[J]. 翁小蘭,王志堅(jiān). 計(jì)算機(jī)工程與應(yīng)用. 2018(01)
[3]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計(jì)算機(jī)應(yīng)用. 2016(09)
[4]計(jì)算機(jī)多媒體技術(shù)的應(yīng)用現(xiàn)狀與發(fā)展前景[J]. 嚴(yán)玲. 新媒體研究. 2015(11)
[5]一種解決稀疏數(shù)據(jù)和冷啟動(dòng)問題的組合推薦方法[J]. 郭曉波,趙書良,牛東攀,王長賓,逄煥利. 中國科學(xué)技術(shù)大學(xué)學(xué)報(bào). 2015(10)
[6]基于用戶興趣的個(gè)性化信息檢索方法研究[J]. 張一洲. 現(xiàn)代情報(bào). 2015(06)
[7]基于用戶近鄰約束的矩陣因子分解算法[J]. 查九,李振博,徐桂瓊. 計(jì)算機(jī)技術(shù)與發(fā)展. 2015(06)
[8]基于用戶屬性和評分的協(xié)同過濾推薦算法[J]. 丁少衡,姬東鴻,王路路. 計(jì)算機(jī)工程與設(shè)計(jì). 2015(02)
[9]人工神經(jīng)網(wǎng)絡(luò)的發(fā)展與應(yīng)用[J]. 邢廣成,強(qiáng)天偉. 科技風(fēng). 2012(15)
[10]人工智能及其發(fā)展應(yīng)用[J]. 鄒蕾,張先鋒. 信息網(wǎng)絡(luò)安全. 2012(02)
碩士論文
[1]基于用戶與物品信息挖掘的矩陣分解推薦算法研究[D]. 王東.西安電子科技大學(xué) 2017
[2]個(gè)性化推薦系統(tǒng)對消費(fèi)者購買意愿的影響研究[D]. 付曉悅.河南財(cái)經(jīng)政法大學(xué) 2016
[3]我國搜索引擎市場發(fā)展趨勢與策略研究[D]. 楊成寶.山東大學(xué) 2011
[4]關(guān)聯(lián)分析技術(shù)在搜索引擎營銷中的應(yīng)用研究[D]. 郝樹魁.北京郵電大學(xué) 2011
本文編號(hào):3399260
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3399260.html
最近更新
教材專著