天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

推薦系統(tǒng)中面向評(píng)分和文本數(shù)據(jù)挖掘的若干關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2021-10-07 05:34
  推薦系統(tǒng)是一種對(duì)數(shù)據(jù)進(jìn)行處理,并利用數(shù)據(jù)創(chuàng)造全新價(jià)值的數(shù)據(jù)挖掘方法。通常來(lái)說(shuō),傳統(tǒng)的推薦系統(tǒng)是利用已有的信息,例如用戶對(duì)于物品的評(píng)分(ratings)、評(píng)論(reviews)、以及用戶和物品自身的屬性(attributes)等為用戶推薦新的物品,從而為電商創(chuàng)造新的收益價(jià)值。傳統(tǒng)的推薦系統(tǒng)通常以矩陣分解和協(xié)同過(guò)濾為基礎(chǔ),通過(guò)疊加上下文信息實(shí)現(xiàn)一個(gè)較好的推薦效果。然而,隨著新技術(shù)的發(fā)展(深度學(xué)習(xí)等),傳統(tǒng)的推薦系統(tǒng)方法陳舊、評(píng)價(jià)標(biāo)準(zhǔn)單一的特點(diǎn)被暴露出來(lái),并嚴(yán)重影響了推薦系統(tǒng)和深度學(xué)習(xí)等新技術(shù)的結(jié)合。此外,隨著硬件設(shè)備的飛速發(fā)展和移動(dòng)互聯(lián)網(wǎng)的廣泛應(yīng)用,獲取數(shù)據(jù)已經(jīng)不再是推薦系統(tǒng)的發(fā)展瓶頸。如何對(duì)于數(shù)據(jù)進(jìn)行篩選整合、提高數(shù)據(jù)質(zhì)量、過(guò)濾劣質(zhì)數(shù)據(jù),從而最大限度發(fā)揮推薦系統(tǒng)的能力已經(jīng)成為了當(dāng)下推薦系統(tǒng)研究的重點(diǎn)。因此,結(jié)合數(shù)據(jù)挖掘方法對(duì)于傳統(tǒng)的推薦系統(tǒng)進(jìn)行改進(jìn)和優(yōu)化,并與新技術(shù)(深度學(xué)習(xí))進(jìn)行有效結(jié)合是非常有必要的。新環(huán)境下,推薦系統(tǒng)的研究面臨著如下的問(wèn)題:1:推薦系統(tǒng)和深度學(xué)習(xí)的結(jié)合:文本分析和圖像處理等傳統(tǒng)技術(shù)已經(jīng)在深度學(xué)習(xí)的浪潮中得到廣泛發(fā)展。在利用深度學(xué)習(xí)技術(shù)的過(guò)程中,一個(gè)關(guān)鍵的問(wèn)題是Emb... 

【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:132 頁(yè)

【學(xué)位級(jí)別】:博士

【部分圖文】:

推薦系統(tǒng)中面向評(píng)分和文本數(shù)據(jù)挖掘的若干關(guān)鍵技術(shù)研究


推薦系統(tǒng)結(jié)構(gòu)圖

生成圖像,學(xué)習(xí)模型


圖 2.1 深度學(xué)習(xí)模型最近,許多基于神經(jīng)網(wǎng)絡(luò)的模型已經(jīng)蓬勃發(fā)展起來(lái):多層感知機(jī)(MultilayerPerceptron)[54]作為神經(jīng)網(wǎng)絡(luò)最初的形式,是一種正向傳播反向反饋的神經(jīng)網(wǎng)絡(luò),在輸入和輸出層之間有較多的隱含層。MLP 是一種有效解決非線性問(wèn)題的神經(jīng)網(wǎng)絡(luò)。Autoencoder[55]是一種重構(gòu)輸入層和輸出層的神經(jīng)網(wǎng)絡(luò),在傳統(tǒng)的autoencoder 上產(chǎn)生了許多變種,其中 VAE(variationalauto-encoder)[56]被廣泛應(yīng)用在 embedding 上。在深度學(xué)習(xí)模型上,有兩種模型已經(jīng)被廣泛應(yīng)用:卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network[57])和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network[58])。其中,卷積神經(jīng)網(wǎng)絡(luò)[59]是一種能夠有效處理大型圖片的神經(jīng)網(wǎng)絡(luò),利用神經(jīng)元覆蓋其周圍的神經(jīng)元,因此可以有效的去噪和生成圖像。循環(huán)神經(jīng)網(wǎng)絡(luò)[58]是一種針對(duì)時(shí)空序列的神經(jīng)網(wǎng)絡(luò),面向語(yǔ)音識(shí)別,文本分析等序列數(shù)據(jù),具有很強(qiáng)[52]

矩陣,例子,物品,內(nèi)積


圖 3.1 一個(gè)利用內(nèi)積的矩陣 Embedding 例子在這個(gè)例子中,矩陣 R 是隱式反饋評(píng)分矩陣,用戶集合 U={u1,u2,u3},物品集合 I={i1,i2,i3}。評(píng)分矩陣內(nèi)的 1 表示用戶對(duì)于物品有反饋,0 表示沒有反饋。我們使用內(nèi)積來(lái)作為目標(biāo)函數(shù)的度量,rui=pu.qi,然后將用戶集合 U 和物品集合 I 全部映射到一個(gè) 3 維的隱向量空間內(nèi)。P,Q 表示用戶和物品的隱向量集合。這種傳統(tǒng)的利用內(nèi)積的 Embedding 結(jié)果如圖 3.1 所示。利用向量?jī)?nèi)積通常會(huì)導(dǎo)致出現(xiàn)多種結(jié)果(取決于初始化的向量服從何種分布)。本章舉出的例子就是一個(gè)普通的例子作為說(shuō)明。如果我們利用 P,Q 作為結(jié)果,將評(píng)分矩陣 R 作為真實(shí)數(shù)據(jù),并利用協(xié)同過(guò)濾進(jìn)行推薦的話[72],會(huì)產(chǎn)生非常多的問(wèn)題。首先,在隱空間內(nèi),利用向量?jī)?nèi)積作為度量,會(huì)導(dǎo)致三個(gè)隱向量之間的關(guān)系違背空間三角規(guī)則。我們將 P,Q 內(nèi)的全部隱向量看作是 3 維空間內(nèi)的點(diǎn)。而這


本文編號(hào):3421454

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3421454.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a4bc4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com