天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學習的混合式隱語義推薦模型研究

發(fā)布時間:2020-10-31 00:41
   現(xiàn)如今,隨著智能設備更新速度加快,人們的生活方式和生活習慣不斷發(fā)生變化,互聯(lián)網(wǎng)已經(jīng)成為人們在日常生活中獲取信息最方便快捷的渠道。但是,在互聯(lián)網(wǎng)為人們生活帶來便利的同時,“信息爆炸”也隨之而來。推薦系統(tǒng)和搜索引擎,作為兩種不同的信息過濾技術,均可以有效地緩解信息過載給網(wǎng)絡所帶來的問題。與搜索引擎不同的是,推薦系統(tǒng)是一種隱式、主動的個性化信息過濾技術,它不需要用戶的顯示觸發(fā)(如:主動提供檢索關鍵詞),它可以根據(jù)用戶的顯示評分記錄和隱式瀏覽點擊記錄等歷史數(shù)據(jù)作為判斷依據(jù),為目標用戶縮小用戶可能會感興趣的項目規(guī)模。例如,推薦系統(tǒng)可以幫助內容提供方(門戶網(wǎng)站、自媒體、商家)更好地定位潛在客戶,從而為商家?guī)碡S厚的經(jīng)濟利益;同時,推薦系統(tǒng)還可以幫助用戶更加準確地發(fā)現(xiàn)目標商品,節(jié)省用戶的信息過濾時間,提升用戶對內容的滿意度以及對內容提供方的忠誠度。據(jù)統(tǒng)計,Netflix~1的觀影記錄80%來自于Netflix網(wǎng)站的推薦系統(tǒng)~([1]),YouTube~2上60%的視頻點擊來自于YouTube的主頁推薦~([2])。此外,推薦系統(tǒng)的應用不僅僅局限于視頻網(wǎng)站的應用上,在我們身邊,推薦系統(tǒng)隨處可見。推薦系統(tǒng)可以為人們推薦商品、音樂、餐館、工作職位、理財產(chǎn)品等等?梢钥闯,推薦系統(tǒng)已經(jīng)成為人們生活中不可缺少的一部分。因此,對于推薦系統(tǒng)的核心算法進行深入地分析研究是非常有意義的,也是十分必要的。根據(jù)推薦策略及實際應用場景的不同,常用的推薦系統(tǒng)可以被分為三類:基于協(xié)同過濾的推薦系統(tǒng)、基于內容的推薦系統(tǒng)和混合式推薦系統(tǒng);趨f(xié)同過濾的推薦系統(tǒng)旨在利用物品與物品、用戶與用戶、用戶與物品間的關系進行推薦;基于內容的推薦系統(tǒng)則是從用戶已進行反饋的內容出發(fā),通過比對待反饋內容與已反饋內容的相似性,找到用戶可能感興趣的內容;混合式推薦系統(tǒng)則是將以上兩個策略的優(yōu)勢相結合,同時考慮物品的內容信息與協(xié)同交互關系來發(fā)現(xiàn)更為精準的推薦內容。從模型的實際效果來看,混合式推薦系統(tǒng)要優(yōu)于基于協(xié)同過濾的推薦系統(tǒng),基于協(xié)調過濾的推薦系統(tǒng)要優(yōu)于基于內容的推薦系統(tǒng)。在基于協(xié)同過濾的推薦系統(tǒng)中,隱語義模型(Latent Factor Model)是一類預測效果最好、應用場景最廣的推薦模型。顧名思義,“隱語義”是該模型的核心,具體體現(xiàn)在模型可以根據(jù)用戶與物品間的評分矩陣,將用戶和物品映射到一個共享的隱式特征向量空間(latent vector space)中,利用隱式特征向量(latent factor vector)分別表示用戶和物品,然后在隱式特征向量的基礎上,對用戶評分進行建模,從而完成評分預測。最后,系統(tǒng)可以根據(jù)預測好的評分為用戶進行推薦。由于隱語義模型適用場景多、實現(xiàn)簡單并且評分預測準確率高,因此許多推薦系統(tǒng)的核心思想都是以“隱語義”思想為基礎。盡管隱語義模型有著上述諸多優(yōu)點,但隨著數(shù)據(jù)規(guī)模日益龐大,用戶評分矩陣越來越稀疏,僅僅以用戶物品間的評分為依據(jù)的傳統(tǒng)隱語義模型在預測效果上受到很大程度的影響。同時,通過深入分析傳統(tǒng)的隱語義模型的內在機制我們發(fā)現(xiàn)隱語義模型還存在許多可以提升的方面:1)用戶的偏好是多種多樣的,而傳統(tǒng)的隱語義模型構建了一種固定的用戶隱式偏好向量表示,沒有將用戶偏好的“個性多樣化”特征考慮進來;2)除了用戶物品的評分矩陣外,與推薦系統(tǒng)相關的公開數(shù)據(jù)集中包含著大量與物品相關的輔助信息(side-information),如物品特征的文字描述、用戶對物品的文字評價和物品的圖像信息等等,但是在構建物品隱式特征向量時,傳統(tǒng)的隱語義模型并沒有將這些輔助信息考慮進來;3)用戶偏好與物品特征間有著緊密復雜的聯(lián)系,但是傳統(tǒng)的隱語義模型在預測用戶評分時只利用了簡單的內積計算(dot production)來建模用戶偏好向量和物品特征向量間的交互關系。針對上述可改進的方面,本文以用戶物品評分矩陣為主,融合大量輔助信息,從用戶、物品以及用戶物品間的關系這三個方面,結合混合推薦系統(tǒng)的思想,提出三種新穎有效的混合隱語義模型來緩解評分矩陣稀疏對隱語義模型的影響,同時提升隱語義模型的評分預測準確度。首先,針對隱語義模型用戶偏好向量缺乏“個性多樣化”問題,本文提出一種自適應性深層隱語義模型(Adaptive Deep Latent Factor Model--ADLFM)。ADLFM模型將物品文本描述與用戶物品間的評分矩陣相結合,利用卷積神經(jīng)網(wǎng)絡抽取全局高階語義特征,構造用戶偏好向量及物品特征向量。同時,利用注意力機制實現(xiàn)一種“自適應性”用戶偏好表示方法,該表示方法可以根據(jù)某一特定待評分物品對用戶偏好向量進行動態(tài)構建,將注意力集中在與待評分物品相關的局部偏好上,使用戶偏好的表達更加準確,進一步使評分預測更加精確;接下來,針對傳統(tǒng)隱語義模型通常只利用單一信息源來學習物品特征向量的情況,本文提出一種基于多模態(tài)特征融合的隱語義模型(Deep Latent Factor Model with Fusion of Multi-modal Features--FLFM)。受信息檢索領域中的跨模態(tài)檢索(Cross-Modal Retrieval)的啟發(fā),本文設計了一個新穎的物品多模態(tài)特征融合模塊,可以有效地將物品的文字描述信息與物品的圖像信息進行融合,學習到更加貼切的物品特征向量,從而提高評分預測的準確率;最后,針對傳統(tǒng)隱語義模型在對用戶偏好與物品特征間的關系進行建模時過于簡單的問題,本文提出一種基于層次化度量的深層隱語義模型(Deep Latent Factor Model with Hierarchical Similarity Measure--DLFM-HSM),DLFM-HSM模型將傳統(tǒng)隱語義模型中的用戶偏好向量替換為用戶偏好矩陣,使得用戶的偏好可以被更加全面地表示出來。通過對用戶評分進行層次化建模,DLFM-HSM可以有效地區(qū)分出用戶對物品不同特征的局部偏好,并放大這些局部偏好,從而將用戶與物品間的關系準確刻畫出來,提高評分預測的準確度。此外,與層次化建模相關的層次相似度度量方法不包含任何參數(shù),因此不需要額外的參數(shù)訓練。大量實驗結果表明,本文提出的三個混合式隱語義模型可以有效地緩解數(shù)據(jù)稀疏所帶來的問題,提高評分預測的準確率。
【學位單位】:吉林大學
【學位級別】:博士
【學位年份】:2020
【中圖分類】:TP391.3;TP18
【部分圖文】:

示意圖,隱語,模型,物品


通過觀察圖1-1,我們發(fā)現(xiàn),隱語義模型涉及四個關鍵因素:隱式空間特征、用戶隱式特征映射、物品隱式特征映射及用戶與物品間的關系建模。其中的每一個因素都關系到隱語義模型效果的優(yōu)劣;诰仃嚪纸獾膮f(xié)同過濾方法[12]是一種最簡單的隱語義模型,同時也是其他隱語義模型的思想基礎和方法基礎。它首先將用戶和物品間的顯示評分(explicit ratings)構造成一個評分矩陣,然后對評分矩陣分解,得到兩個低秩矩陣,分別用來表示用戶隱式特征和物品隱式特征,然后再利用矩陣乘積對矩陣中的缺失評分進行預測。實驗結果表明,與其他的協(xié)同過濾方式相比,在評分預測任務上,基于矩陣分解的協(xié)同過濾有著更好的準確性。但是,通過觀察整體流程,我們發(fā)現(xiàn)隱語義模型面臨以下四個挑戰(zhàn):1)用戶隱式特征個性化挑戰(zhàn):在現(xiàn)有的基于矩陣分解的隱語義模型中,用戶的隱式特征向量表示通常是固定的。從實際意義的角度來解釋,用戶的隱式特征向量表示的是用戶對全部特征的偏好程度。但是,用戶在面對不同的物品時,他所關注的側重點自然不同。因此,如果能夠將用戶對與目標物品相關的物品特征的偏好進行局部放大,則能夠更好地刻畫出用戶對某一特定物品的偏好程度。我們將這個問題稱為用戶隱式特征的“個性多樣化問題”。如何解決該問題是本文要面臨的第一個挑戰(zhàn);

實例圖,物品,元信息,數(shù)據(jù)集中


2)物品隱式特征向量單一性:圖1-2為Amazon5公共數(shù)據(jù)集中關于物品的元信息(meta-information),圖1-3為Amazon用戶對物品的某一條評價實例。通過實際數(shù)據(jù)集我們發(fā)現(xiàn),關于某一個物品的輔助信息(side information)是非常豐富的,包括文字描述、圖片、物品類別等等。由于以上這些輔助信息屬于模態(tài)不同的信息,現(xiàn)有的隱語義模型通常只是利用評分或者其中一種單一模態(tài)的信息來進行建模,因此在很大程度上限制了物品隱式特征的表達能力。我們將該問題稱為“物品隱式特征表達單一性問題”,如何解決該問題是我們要解決的第二個挑戰(zhàn);圖1-3 Amazon數(shù)據(jù)集中評論信息等描述實例

實例圖,數(shù)據(jù)集中,實例,物品


圖1-2 Amazon數(shù)據(jù)集中物品元信息等描述實例3)用戶與物品間關系建模:隱語義模型通常利用兩個低維矩陣相乘的方式來預測用戶對尚未評分物品的可能評分。從計算機制來看,根據(jù)矩陣相乘的原理,評分預測過程可以看作是用戶隱式特征向量與物品隱式特征向量之間的內積運算;從實際意義來分析,評分預測過程可以被看作是用戶偏好(preference)與物品客觀屬性(property)在各個的隱式特征維度上交互強度(interaction)的整合,是對用戶和物品間的關系進行建模。通過對計算機制進行深入分析之后,我們發(fā)現(xiàn)現(xiàn)有的大部分隱語義模型在對用戶與物品間的關系進行建模時,通常只是采用簡單的內積計算方法。因此如何有效地對用戶與物品間的交互關系進行建模是我們所要面臨的第三個挑戰(zhàn);
【相似文獻】

相關期刊論文 前10條

1 張玉連;袁偉;;隱語義模型下的科技論文推薦[J];計算機應用與軟件;2015年02期

2 孫艷;朱玉全;陳耿;;基于隱語義模型的協(xié)同過濾圖書推薦方法[J];信息技術;2015年11期

3 邊文龍;黃曉霞;;融合隱語義模型的聚類協(xié)同過濾[J];微型機與應用;2015年15期

4 李琳娜;江雪琴;;推薦系統(tǒng)中的隱語義模型研究[J];情報工程;2016年04期

5 薛琳蘭;;基于隱語義模型的電商推薦系統(tǒng)的設計與實現(xiàn)[J];數(shù)字通信世界;2020年07期

6 陳永鋒;朱振宇;;綜合隱語義模型和信任關系網(wǎng)絡的個性化推薦[J];科技創(chuàng)新與應用;2017年03期

7 紀丙全;顏建岡;;運用語義模型 解答化學實驗題[J];教育與裝備研究;2019年08期

8 金辰浩;;基于互聯(lián)網(wǎng)大數(shù)據(jù)的設計語義模型[J];工業(yè)設計;2017年10期

9 趙正利;王國宇;籍芳;;一種基于相關反饋的圖像內在語義模型[J];微計算機信息;2007年24期

10 李大強;關于動態(tài)的真理語義模型[J];科學技術與辯證法;2001年03期


相關博士學位論文 前10條

1 韓佳育;基于深度學習的混合式隱語義推薦模型研究[D];吉林大學;2020年

2 石俊飛;基于層次語義模型與散射機理的極化SAR地物分類[D];西安電子科技大學;2016年

3 萬毅;循證醫(yī)學證據(jù)評價的語義模型與應用研究[D];第四軍醫(yī)大學;2009年

4 王彬;基于實時語義模型的模型轉換及語義一致性研究[D];昆明理工大學;2011年

5 李學寧;現(xiàn)代漢語形容詞概念語義模型研究[D];上海交通大學;2008年

6 馬暉男;信息檢索中淺層語義模型的研究[D];大連理工大學;2007年

7 楊靜;UML模型的語義模型[D];貴州大學;2006年

8 李曉建;基于語義的個性化資源推薦系統(tǒng)中關鍵技術研究[D];武漢大學;2010年

9 吳明暉;面向服務的語義模型驅動企業(yè)應用軟件開發(fā)方法及關鍵技術研究[D];浙江大學;2011年

10 牟冬梅;數(shù)字圖書館知識組織語義互聯(lián)策略及其應用研究[D];吉林大學;2009年


相關碩士學位論文 前10條

1 范玉強;基于隱語義模型的推薦系統(tǒng)研究[D];貴州大學;2016年

2 巫可;基于隱語義模型的個性化推薦算法的研究[D];廣東工業(yè)大學;2016年

3 杜春河;大數(shù)據(jù)環(huán)境下隱語義模型推薦算法的改進與實現(xiàn)[D];華南理工大學;2017年

4 陳曉云;基于協(xié)同過濾和隱語義模型的個性化推薦系統(tǒng)的研究[D];上海交通大學;2018年

5 陳文悅;基于地質語義模型和機器學習的成礦遠景區(qū)預測[D];中國地質大學(北京);2019年

6 徐啟東;基于隱語義模型的個性化推薦系統(tǒng)研究[D];廣東工業(yè)大學;2019年

7 劉彼洋;基于多粒度潛語義模型和子模最大化的新聞摘要研究[D];武漢大學;2017年

8 陳博文;基于隱語義模型的混合推薦模型研究[D];蘭州大學;2019年

9 周川暢;基于深度學習與隱語義模型的推薦算法研究與實現(xiàn)[D];中央民族大學;2019年

10 喻鑫;醫(yī)學文獻診療風險語句的語義模型與提取[D];中國科學院大學(中國科學院重慶綠色智能技術研究院);2017年



本文編號:2863222

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/2863222.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶4b656***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com