基于多場(chǎng)景會(huì)話數(shù)據(jù)的推薦技術(shù)研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-11-14 18:38
隨著互聯(lián)網(wǎng)時(shí)代的到來和信息科技的進(jìn)步,大數(shù)據(jù)時(shí)代所帶來的信息過載的問題日益嚴(yán)重。用戶很難從海量的圖像、視頻、文本和商品信息中找到適合自己個(gè)性化需求的信息。個(gè)性化推薦系統(tǒng)是一種解決信息過載的重要手段。與搜索引擎相比,推薦系統(tǒng)通過研究用戶的歷史行為數(shù)據(jù),并基于統(tǒng)計(jì)分析對(duì)用戶的興趣和偏好進(jìn)行建模,從而引導(dǎo)用戶找到自己的信息需求,從而滿足用戶個(gè)性化推薦的需求。因此,這一技術(shù)已經(jīng)被廣泛地應(yīng)用于以Web3.0技術(shù)為主的互聯(lián)網(wǎng)平臺(tái)上。跨域推薦的重點(diǎn)研究方向?yàn)檠芯款I(lǐng)域間部分重疊的跨域推薦方法。同領(lǐng)域中的用戶集合完全重疊和完全不重疊是兩種極端情況,現(xiàn)實(shí)生活中,普遍存在的一種現(xiàn)象是不同領(lǐng)域間的用戶集合存在部分重疊,F(xiàn)在很多網(wǎng)站都會(huì)提供其他網(wǎng)站賬號(hào)登錄的入口,依據(jù)此事實(shí),就能夠找到不同領(lǐng)域中的同一用戶。此外,一些文章還通過實(shí)驗(yàn)證明了有信息重疊的這一小部分用戶在每個(gè)領(lǐng)域中均和超過80%的物品都有過交互行為。使用這些信息作為域之間信息共享和遷移的橋梁是可靠并且有效的。本論文的研究背景是基于單系統(tǒng)多場(chǎng)景多元異構(gòu)數(shù)據(jù)的信息系統(tǒng),各個(gè)場(chǎng)景間的用戶幾乎相同,并且場(chǎng)景間可以使用會(huì)話數(shù)據(jù)作為橋梁,因此采用用戶部分重疊的跨域...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
行為矩陣圖
值分解是最基礎(chǔ)的基于矩陣分解的用戶向量與物品向量提取方法,SVD的核心算法基于以下理論:把矩陣A分解成=。給出×矩陣的數(shù)據(jù)A(n個(gè)用戶,m個(gè)物品),可以獲得一個(gè)×的矩陣U(n個(gè)用戶,r個(gè)概念),一個(gè)×的對(duì)角矩陣R(概念的長(zhǎng)度),R矩陣包含奇異值(奇異值總為正且降序排列),以及×的矩陣V(m個(gè)物品,r個(gè)概念)。U矩陣可以解釋成用戶概念相似矩陣,矩陣V則是物品概念相似性矩陣。每個(gè)U矩陣的行向量即為用戶在SVD模型中得到的用戶特征向量,每個(gè)V矩陣的列向量即為物品在SVD模型中得到的物品特征向量。一種典型矩陣分解模型框架如圖3-2所示。通過參數(shù)和分別控制用戶和物品的隱向量生成,得到用戶隱向量U和物品隱向量V,同時(shí)X為附加側(cè)信息,如物品的主題信息或詞向量信息,最終將U域V做內(nèi)積,得到評(píng)分R。圖3-2矩陣分解模型矩陣分解方法應(yīng)用與推薦問題的方式可以定義成為矩陣填充問題。通過設(shè)計(jì)一個(gè)稀疏矩陣,用戶為行,物品位列。矩陣中每個(gè)已知元素代表用戶對(duì)物品的偏好。如此,用戶偏好預(yù)測(cè)問題可以簡(jiǎn)化為矩陣填充問題;诖怂枷氲囊环N方法是非負(fù)矩陣分解(NMF)[22],通過引入一個(gè)偏置項(xiàng)來是的預(yù)測(cè)的矩陣的缺失值均為正值?偟膩碚f,矩陣分解模型是實(shí)現(xiàn)隱語義模型的一種途徑,其目的是學(xué)習(xí)用戶和物品的隱式特征向量,從而成為基礎(chǔ)的用戶向量與物品向量提取方法之一。在推薦系統(tǒng)領(lǐng)域內(nèi),矩陣分解可以解決一些近鄰模型無法解決的問題。近鄰模型存在的問題:1、物品之間存在相關(guān)性,信息量并不是隨著向量維度增加而線性增加2、矩陣元素稀疏,計(jì)算結(jié)果不穩(wěn)定,增減一個(gè)向量維度,導(dǎo)致緊鄰結(jié)果差異很大的情況出現(xiàn)。假設(shè)系統(tǒng)有部電影,位用戶,和從1到的整數(shù)評(píng)價(jià)值。表示用戶對(duì)電影的評(píng)價(jià),和是潛在的用戶和電影特征矩陣,其中列向量和分別表示
數(shù)據(jù)的壓縮和解壓縮函數(shù)是模型從數(shù)據(jù)中相關(guān)的、有損的、從樣本中自動(dòng)學(xué)習(xí)的。在大部分自動(dòng)編碼器的應(yīng)用場(chǎng)景下,進(jìn)行數(shù)據(jù)壓縮和解壓縮的函數(shù)是通過深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的。通過自編碼器可以同時(shí)學(xué)習(xí)用戶和物品的隱式特征表示,利用學(xué)習(xí)到的隱特征表示來最小化訓(xùn)練數(shù)據(jù)的誤差,學(xué)習(xí)物品隱特征表示。例如在推薦系統(tǒng)領(lǐng)域內(nèi),把物品作為輸入序列,把用戶作為商品的特征,通過編碼與解碼操作得到物品的隱式特征表示;把用戶作為輸入序列,把商品作為用戶的特征,通過編碼與解碼操作得到用戶的隱特征表示。一種典型的自動(dòng)編碼器結(jié)構(gòu)如圖3-3所示,該自動(dòng)編碼器擁有一個(gè)三層結(jié)構(gòu),包括輸入層、隱藏層和輸出層。圖3-3自動(dòng)編碼器自編碼器訓(xùn)練完成后,當(dāng)有新的樣本()輸入到這個(gè)訓(xùn)練好的自編碼器中后,那么隱藏層各單元的激活值組成的向量(1)=[1(1),2(1),…,(1)]就可以代表()(因?yàn)楦鶕?jù)稀疏自編碼,自編碼器可以用(1)來恢復(fù)()),也就是說(1)=[1(1),2(1),…,(1)]就是()在新的特征下的特征值。每一個(gè)特征是使某一個(gè)(1)取最大值的輸入。假設(shè)隱藏層單元有100個(gè),那么就一共有100個(gè)特征,所以()新的特征向量(1)有100維。該特征向量所表示的特征稱為一階特征。通過不斷疊加中間層,即可得到信息的高階表示,即信息的高階特征。即使自編碼器可以學(xué)習(xí)信息的潛在表示,但在輔助信息非常稀疏的情況下,學(xué)習(xí)的潛在表示往往不夠有效。因此,協(xié)同深度學(xué)習(xí)建立了一個(gè)層次貝葉斯模型。它使用堆疊去噪自編碼器(SDAE)[22]代替LDA進(jìn)行物品特征學(xué)習(xí)。然而,去噪自編碼器(DAEs)實(shí)際上沒有貝葉斯屬性,DAEs的去噪方案實(shí)際上不是從概率的角度,而是從頻率的角度。因此,這些模型難以進(jìn)行貝葉斯推理,計(jì)算量大。協(xié)同變分自編碼器(CV
【參考文獻(xiàn)】:
期刊論文
[1]推薦系統(tǒng)研究綜述[J]. 周萬珍,曹迪,許云峰,劉濱. 河北科技大學(xué)學(xué)報(bào). 2020(01)
[2]貴廣網(wǎng)絡(luò)智能推薦系統(tǒng)設(shè)計(jì)方案[J]. 曾敬鴻,朱迪,付守偉,陳丹,雷航,李趙寧. 有線電視技術(shù). 2019(10)
[3]融合元數(shù)據(jù)及attention機(jī)制的深度聯(lián)合學(xué)習(xí)推薦[J]. 張全貴,李志強(qiáng),張新新,曹志強(qiáng). 計(jì)算機(jī)應(yīng)用研究. 2019(11)
[4]基于SVD++與標(biāo)簽的跨域推薦模型[J]. 邢長(zhǎng)征,楊曉婷. 計(jì)算機(jī)工程. 2018(04)
[5]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計(jì)算機(jī)學(xué)報(bào). 2018(07)
[6]跨領(lǐng)域推薦技術(shù)綜述[J]. 陳雷慧,匡俊,陳輝,曾煒,鄭建兵,高明. 華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(05)
碩士論文
[1]基于評(píng)論和內(nèi)容深度融合的跨域推薦問題研究[D]. 付文靜.山東大學(xué) 2019
[2]基于跨域遷移學(xué)習(xí)的評(píng)分推薦研究[D]. 鄭靜.北京郵電大學(xué) 2018
[3]基于交叉用戶的跨域推薦算法研究與實(shí)現(xiàn)[D]. 王游.西安電子科技大學(xué) 2017
本文編號(hào):3495151
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
行為矩陣圖
值分解是最基礎(chǔ)的基于矩陣分解的用戶向量與物品向量提取方法,SVD的核心算法基于以下理論:把矩陣A分解成=。給出×矩陣的數(shù)據(jù)A(n個(gè)用戶,m個(gè)物品),可以獲得一個(gè)×的矩陣U(n個(gè)用戶,r個(gè)概念),一個(gè)×的對(duì)角矩陣R(概念的長(zhǎng)度),R矩陣包含奇異值(奇異值總為正且降序排列),以及×的矩陣V(m個(gè)物品,r個(gè)概念)。U矩陣可以解釋成用戶概念相似矩陣,矩陣V則是物品概念相似性矩陣。每個(gè)U矩陣的行向量即為用戶在SVD模型中得到的用戶特征向量,每個(gè)V矩陣的列向量即為物品在SVD模型中得到的物品特征向量。一種典型矩陣分解模型框架如圖3-2所示。通過參數(shù)和分別控制用戶和物品的隱向量生成,得到用戶隱向量U和物品隱向量V,同時(shí)X為附加側(cè)信息,如物品的主題信息或詞向量信息,最終將U域V做內(nèi)積,得到評(píng)分R。圖3-2矩陣分解模型矩陣分解方法應(yīng)用與推薦問題的方式可以定義成為矩陣填充問題。通過設(shè)計(jì)一個(gè)稀疏矩陣,用戶為行,物品位列。矩陣中每個(gè)已知元素代表用戶對(duì)物品的偏好。如此,用戶偏好預(yù)測(cè)問題可以簡(jiǎn)化為矩陣填充問題;诖怂枷氲囊环N方法是非負(fù)矩陣分解(NMF)[22],通過引入一個(gè)偏置項(xiàng)來是的預(yù)測(cè)的矩陣的缺失值均為正值?偟膩碚f,矩陣分解模型是實(shí)現(xiàn)隱語義模型的一種途徑,其目的是學(xué)習(xí)用戶和物品的隱式特征向量,從而成為基礎(chǔ)的用戶向量與物品向量提取方法之一。在推薦系統(tǒng)領(lǐng)域內(nèi),矩陣分解可以解決一些近鄰模型無法解決的問題。近鄰模型存在的問題:1、物品之間存在相關(guān)性,信息量并不是隨著向量維度增加而線性增加2、矩陣元素稀疏,計(jì)算結(jié)果不穩(wěn)定,增減一個(gè)向量維度,導(dǎo)致緊鄰結(jié)果差異很大的情況出現(xiàn)。假設(shè)系統(tǒng)有部電影,位用戶,和從1到的整數(shù)評(píng)價(jià)值。表示用戶對(duì)電影的評(píng)價(jià),和是潛在的用戶和電影特征矩陣,其中列向量和分別表示
數(shù)據(jù)的壓縮和解壓縮函數(shù)是模型從數(shù)據(jù)中相關(guān)的、有損的、從樣本中自動(dòng)學(xué)習(xí)的。在大部分自動(dòng)編碼器的應(yīng)用場(chǎng)景下,進(jìn)行數(shù)據(jù)壓縮和解壓縮的函數(shù)是通過深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的。通過自編碼器可以同時(shí)學(xué)習(xí)用戶和物品的隱式特征表示,利用學(xué)習(xí)到的隱特征表示來最小化訓(xùn)練數(shù)據(jù)的誤差,學(xué)習(xí)物品隱特征表示。例如在推薦系統(tǒng)領(lǐng)域內(nèi),把物品作為輸入序列,把用戶作為商品的特征,通過編碼與解碼操作得到物品的隱式特征表示;把用戶作為輸入序列,把商品作為用戶的特征,通過編碼與解碼操作得到用戶的隱特征表示。一種典型的自動(dòng)編碼器結(jié)構(gòu)如圖3-3所示,該自動(dòng)編碼器擁有一個(gè)三層結(jié)構(gòu),包括輸入層、隱藏層和輸出層。圖3-3自動(dòng)編碼器自編碼器訓(xùn)練完成后,當(dāng)有新的樣本()輸入到這個(gè)訓(xùn)練好的自編碼器中后,那么隱藏層各單元的激活值組成的向量(1)=[1(1),2(1),…,(1)]就可以代表()(因?yàn)楦鶕?jù)稀疏自編碼,自編碼器可以用(1)來恢復(fù)()),也就是說(1)=[1(1),2(1),…,(1)]就是()在新的特征下的特征值。每一個(gè)特征是使某一個(gè)(1)取最大值的輸入。假設(shè)隱藏層單元有100個(gè),那么就一共有100個(gè)特征,所以()新的特征向量(1)有100維。該特征向量所表示的特征稱為一階特征。通過不斷疊加中間層,即可得到信息的高階表示,即信息的高階特征。即使自編碼器可以學(xué)習(xí)信息的潛在表示,但在輔助信息非常稀疏的情況下,學(xué)習(xí)的潛在表示往往不夠有效。因此,協(xié)同深度學(xué)習(xí)建立了一個(gè)層次貝葉斯模型。它使用堆疊去噪自編碼器(SDAE)[22]代替LDA進(jìn)行物品特征學(xué)習(xí)。然而,去噪自編碼器(DAEs)實(shí)際上沒有貝葉斯屬性,DAEs的去噪方案實(shí)際上不是從概率的角度,而是從頻率的角度。因此,這些模型難以進(jìn)行貝葉斯推理,計(jì)算量大。協(xié)同變分自編碼器(CV
【參考文獻(xiàn)】:
期刊論文
[1]推薦系統(tǒng)研究綜述[J]. 周萬珍,曹迪,許云峰,劉濱. 河北科技大學(xué)學(xué)報(bào). 2020(01)
[2]貴廣網(wǎng)絡(luò)智能推薦系統(tǒng)設(shè)計(jì)方案[J]. 曾敬鴻,朱迪,付守偉,陳丹,雷航,李趙寧. 有線電視技術(shù). 2019(10)
[3]融合元數(shù)據(jù)及attention機(jī)制的深度聯(lián)合學(xué)習(xí)推薦[J]. 張全貴,李志強(qiáng),張新新,曹志強(qiáng). 計(jì)算機(jī)應(yīng)用研究. 2019(11)
[4]基于SVD++與標(biāo)簽的跨域推薦模型[J]. 邢長(zhǎng)征,楊曉婷. 計(jì)算機(jī)工程. 2018(04)
[5]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計(jì)算機(jī)學(xué)報(bào). 2018(07)
[6]跨領(lǐng)域推薦技術(shù)綜述[J]. 陳雷慧,匡俊,陳輝,曾煒,鄭建兵,高明. 華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(05)
碩士論文
[1]基于評(píng)論和內(nèi)容深度融合的跨域推薦問題研究[D]. 付文靜.山東大學(xué) 2019
[2]基于跨域遷移學(xué)習(xí)的評(píng)分推薦研究[D]. 鄭靜.北京郵電大學(xué) 2018
[3]基于交叉用戶的跨域推薦算法研究與實(shí)現(xiàn)[D]. 王游.西安電子科技大學(xué) 2017
本文編號(hào):3495151
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3495151.html
最近更新
教材專著