天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向小樣本的新聞動態(tài)推薦模型的研究

發(fā)布時間:2021-09-08 07:34
  個性化推薦系統(tǒng)能夠推送給我們想了解的信息,加快人們對信息的獲取速度。由于新聞推薦領域中用戶興趣模型往往會隨行為信息的變化產(chǎn)生波動,傳統(tǒng)的新聞推薦算法不適合基于小樣本數(shù)據(jù)的新聞推薦。因此如何利用小樣本數(shù)據(jù)建立用戶興趣模型以及降低文本分類訓練中數(shù)據(jù)的復雜度成為個性化新聞推薦的關鍵。神經(jīng)網(wǎng)絡技術的發(fā)展,為面向小樣本的新聞動態(tài)推薦模型的研究提供了新的契機。小樣本數(shù)據(jù)集的特點是樣本數(shù)量少、特征維度高,在神經(jīng)網(wǎng)絡訓練中,如果直接對它進行特征選擇,易導致算法的損失函數(shù)呈震蕩式下降趨勢,造成過擬合現(xiàn)象,且得到的用戶興趣模型性能也不穩(wěn)定。評價推薦結果的主要指標是分類準確性和用戶召回率,與文本分類模型好壞有直接關系,而類間特征項區(qū)分度的強弱以及類內特征項依賴性的高低是界定模型好壞的關鍵。圍繞上述問題,論文主要做了如下工作:(1)為避免用戶模型的損失函數(shù)因小樣本訓練數(shù)據(jù)而呈現(xiàn)震蕩式下降導致特征過擬合問題,提出了基于神經(jīng)網(wǎng)絡的Bi-PSO算法。該算法采用向前搜索方法,根據(jù)候選特征與已選特征的相互關系(冗余或依賴)賦予權值;基于PSO思想限定算法學習因子(81和(82... 

【文章來源】:江蘇大學江蘇省

【文章頁數(shù)】:74 頁

【學位級別】:碩士

【部分圖文】:

面向小樣本的新聞動態(tài)推薦模型的研究


網(wǎng)絡新聞用戶占網(wǎng)民比例新聞推薦系統(tǒng)在學術領域也受到了越來越多的重視,隨著推薦系統(tǒng)愈發(fā)深入的

原理圖,原理圖,特征選擇


面向小樣本的新聞動態(tài)推薦模型的研究4基于對特征子集評價標準特征選擇方法的核心是對特征子集的評價方法,評價方法的好壞直接影響著特征子集的準確性。這種基于評價方法的特征選擇算法與后續(xù)的自然語言處理算法是互相獨立的,可單獨進行訓練,常用的特征子集評價方法有Filter模型、Wrapper模型、Embedded模型。目前,Vinyals等人利用數(shù)據(jù)集訓練attention(注意力機制)模型[13],將一個標記的訓練集和一個未標記的測試集映射到網(wǎng)絡標簽中,進行微調以適應新的特征集,來解決one-shotlearning(小樣本)問題;柳青林等人在LeCun提出的孿生網(wǎng)絡基礎上引入遷移學習算法[14],利用YOLOv2算法模型參數(shù),對損失函數(shù)進行修改,采取局部放大策略提高算法的性能。目前還提出了K-近鄰模型、范數(shù)支持向量機、低秩矩陣近似等特征選擇方法,這些特征選擇方法在特征間冗余處理方面還需進一步研究。信息量爆炸的大數(shù)據(jù)時代,使得數(shù)據(jù)成為領域研究重要依據(jù)的同時也存在數(shù)據(jù)特征維度高、特征相關性強的問題,給神經(jīng)網(wǎng)絡領域的發(fā)展產(chǎn)生一定的阻礙[15]。良好的特征選擇方法能夠節(jié)省獲取原始數(shù)據(jù)的時間,在自然語言處理方面可以縮減數(shù)據(jù)存儲空間,更快獲得數(shù)據(jù)模型,特征選擇能夠保留數(shù)據(jù)的原始特征,使算法具有良好的可解釋性。1.2.3新聞推薦研究現(xiàn)狀20世紀90年代,隨著第一篇基于協(xié)同過濾算法的推薦技術論文[16]發(fā)表后,研究者開始致力于個性化推薦技術領域的發(fā)展。圖1.2推薦系統(tǒng)基本工作原理圖個性化推薦技術屬于信息處理范疇,通過建立用戶與數(shù)據(jù)信息之間的關聯(lián)關系,依據(jù)用戶的某種需求向用戶推薦出符合用戶需要的信息,過濾掉與用戶需求無關的信息,最終實現(xiàn)用戶的個性化推薦。根據(jù)信息和用戶之間的關聯(lián)關系,可將個

特征圖,卷積,神經(jīng)網(wǎng)絡,卷積核


面向小樣本的新聞動態(tài)推薦模型的研究12征權值使得卷積神經(jīng)網(wǎng)絡中的信息誤差最校卷積神經(jīng)網(wǎng)絡以卷積層、采樣層、池化層為基本網(wǎng)絡結構,各網(wǎng)絡層之間相互銜接,以多維網(wǎng)絡層作為輸出端,使訓練結果的維度具有靈活性。圖2.2卷積神經(jīng)網(wǎng)絡結構卷積神經(jīng)網(wǎng)絡的基本網(wǎng)絡結構層:(1)卷積層卷積層的主要工作是將特征向量和卷積核做卷積運算,卷積層又稱為特征提取層,如圖2.3所示,將一個大小為55的特征向量進行卷積計算,提取特征信息的卷積核大小為33,最終得到計算結果3。圖2.3卷積計算原理其中,第三個矩陣中標紅的數(shù)字3是計算結果,特征向量和卷積核的計算公式如公式2.1所示,將特征向量矩陣中標紅的33矩陣與卷積核33矩陣中的對應項進行與運算得到計算結果。特征圖的維度與卷積核的維度無關,例如一個nn維的特征矩陣,經(jīng)過一個mm維的卷積核運算后會得到(nm1)(nm1)維的特征矩陣。假設iC是矩陣第i層的特征值,iC生成過程如公式2.2所示,矩陣第i層的特征值iC的生成公式中,第i層卷積核的權值向量用表示,第i層的偏置量用表示。010101110010=0&1+1&0+0&1+1&0+1&1+0&0+1&1+1&1+0&0=3110110(2.1)

【參考文獻】:
期刊論文
[1]機器學習中的特征選擇方法研究及展望[J]. 崔鴻雁,徐帥,張利鋒,Roy E.Welsch,Berthold K.P.Horn.  北京郵電大學學報. 2018(01)
[2]低秩矩陣近似與優(yōu)化問題研究進展[J]. 張恒敏,楊健,鄭瑋.  模式識別與人工智能. 2018(01)
[3]高維小樣本分類問題中特征選擇研究綜述[J]. 王翔,胡學鋼.  計算機應用. 2017(09)
[4]Recent Progresses in Deep Learning Based Acoustic Models[J]. Dong Yu,Jinyu Li.  IEEE/CAA Journal of Automatica Sinica. 2017(03)
[5]基于卷積神經(jīng)網(wǎng)絡的維吾爾語語音識別[J]. 梁玉龍,屈丹,李真,張文林.  信息工程大學學報. 2017(01)
[6]基于粒子群優(yōu)化BP神經(jīng)網(wǎng)絡的養(yǎng)腸胃菜譜判定[J]. 張璐,雷雪梅.  計算機科學. 2016(S2)
[7]高維數(shù)據(jù)的1-范數(shù)支持向量機集成特征選擇[J]. 鮑捷,楊明,劉會東.  計算機科學與探索. 2012(10)

博士論文
[1]多目標粒子群優(yōu)化算法的研究[D]. 徐鶴鳴.上海交通大學 2013

碩士論文
[1]基于小樣本學習的目標匹配研究[D]. 柳青林.西安電子科技大學 2018
[2]基于統(tǒng)計學的大數(shù)據(jù)特征分析研究[D]. 徐帥.北京郵電大學 2018
[3]高維小樣本數(shù)據(jù)的特征選擇研究及其穩(wěn)定性分析[D]. 寧永鵬.廈門大學 2014
[4]基于增量聚類和ReliefF的特征選擇方法[D]. 童憶瑩.西南大學 2011



本文編號:3390391

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3390391.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶ed0ac***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com