天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向小樣本的新聞動(dòng)態(tài)推薦模型的研究

發(fā)布時(shí)間:2021-09-08 07:34
  個(gè)性化推薦系統(tǒng)能夠推送給我們想了解的信息,加快人們對(duì)信息的獲取速度。由于新聞推薦領(lǐng)域中用戶興趣模型往往會(huì)隨行為信息的變化產(chǎn)生波動(dòng),傳統(tǒng)的新聞推薦算法不適合基于小樣本數(shù)據(jù)的新聞推薦。因此如何利用小樣本數(shù)據(jù)建立用戶興趣模型以及降低文本分類訓(xùn)練中數(shù)據(jù)的復(fù)雜度成為個(gè)性化新聞推薦的關(guān)鍵。神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,為面向小樣本的新聞動(dòng)態(tài)推薦模型的研究提供了新的契機(jī)。小樣本數(shù)據(jù)集的特點(diǎn)是樣本數(shù)量少、特征維度高,在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,如果直接對(duì)它進(jìn)行特征選擇,易導(dǎo)致算法的損失函數(shù)呈震蕩式下降趨勢(shì),造成過(guò)擬合現(xiàn)象,且得到的用戶興趣模型性能也不穩(wěn)定。評(píng)價(jià)推薦結(jié)果的主要指標(biāo)是分類準(zhǔn)確性和用戶召回率,與文本分類模型好壞有直接關(guān)系,而類間特征項(xiàng)區(qū)分度的強(qiáng)弱以及類內(nèi)特征項(xiàng)依賴性的高低是界定模型好壞的關(guān)鍵。圍繞上述問(wèn)題,論文主要做了如下工作:(1)為避免用戶模型的損失函數(shù)因小樣本訓(xùn)練數(shù)據(jù)而呈現(xiàn)震蕩式下降導(dǎo)致特征過(guò)擬合問(wèn)題,提出了基于神經(jīng)網(wǎng)絡(luò)的Bi-PSO算法。該算法采用向前搜索方法,根據(jù)候選特征與已選特征的相互關(guān)系(冗余或依賴)賦予權(quán)值;基于PSO思想限定算法學(xué)習(xí)因子(81和(82... 

【文章來(lái)源】:江蘇大學(xué)江蘇省

【文章頁(yè)數(shù)】:74 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

面向小樣本的新聞動(dòng)態(tài)推薦模型的研究


網(wǎng)絡(luò)新聞?dòng)脩粽季W(wǎng)民比例新聞推薦系統(tǒng)在學(xué)術(shù)領(lǐng)域也受到了越來(lái)越多的重視,隨著推薦系統(tǒng)愈發(fā)深入的

原理圖,原理圖,特征選擇


面向小樣本的新聞動(dòng)態(tài)推薦模型的研究4基于對(duì)特征子集評(píng)價(jià)標(biāo)準(zhǔn)特征選擇方法的核心是對(duì)特征子集的評(píng)價(jià)方法,評(píng)價(jià)方法的好壞直接影響著特征子集的準(zhǔn)確性。這種基于評(píng)價(jià)方法的特征選擇算法與后續(xù)的自然語(yǔ)言處理算法是互相獨(dú)立的,可單獨(dú)進(jìn)行訓(xùn)練,常用的特征子集評(píng)價(jià)方法有Filter模型、Wrapper模型、Embedded模型。目前,Vinyals等人利用數(shù)據(jù)集訓(xùn)練attention(注意力機(jī)制)模型[13],將一個(gè)標(biāo)記的訓(xùn)練集和一個(gè)未標(biāo)記的測(cè)試集映射到網(wǎng)絡(luò)標(biāo)簽中,進(jìn)行微調(diào)以適應(yīng)新的特征集,來(lái)解決one-shotlearning(小樣本)問(wèn)題;柳青林等人在LeCun提出的孿生網(wǎng)絡(luò)基礎(chǔ)上引入遷移學(xué)習(xí)算法[14],利用YOLOv2算法模型參數(shù),對(duì)損失函數(shù)進(jìn)行修改,采取局部放大策略提高算法的性能。目前還提出了K-近鄰模型、范數(shù)支持向量機(jī)、低秩矩陣近似等特征選擇方法,這些特征選擇方法在特征間冗余處理方面還需進(jìn)一步研究。信息量爆炸的大數(shù)據(jù)時(shí)代,使得數(shù)據(jù)成為領(lǐng)域研究重要依據(jù)的同時(shí)也存在數(shù)據(jù)特征維度高、特征相關(guān)性強(qiáng)的問(wèn)題,給神經(jīng)網(wǎng)絡(luò)領(lǐng)域的發(fā)展產(chǎn)生一定的阻礙[15]。良好的特征選擇方法能夠節(jié)省獲取原始數(shù)據(jù)的時(shí)間,在自然語(yǔ)言處理方面可以縮減數(shù)據(jù)存儲(chǔ)空間,更快獲得數(shù)據(jù)模型,特征選擇能夠保留數(shù)據(jù)的原始特征,使算法具有良好的可解釋性。1.2.3新聞推薦研究現(xiàn)狀20世紀(jì)90年代,隨著第一篇基于協(xié)同過(guò)濾算法的推薦技術(shù)論文[16]發(fā)表后,研究者開(kāi)始致力于個(gè)性化推薦技術(shù)領(lǐng)域的發(fā)展。圖1.2推薦系統(tǒng)基本工作原理圖個(gè)性化推薦技術(shù)屬于信息處理范疇,通過(guò)建立用戶與數(shù)據(jù)信息之間的關(guān)聯(lián)關(guān)系,依據(jù)用戶的某種需求向用戶推薦出符合用戶需要的信息,過(guò)濾掉與用戶需求無(wú)關(guān)的信息,最終實(shí)現(xiàn)用戶的個(gè)性化推薦。根據(jù)信息和用戶之間的關(guān)聯(lián)關(guān)系,可將個(gè)

特征圖,卷積,神經(jīng)網(wǎng)絡(luò),卷積核


面向小樣本的新聞動(dòng)態(tài)推薦模型的研究12征權(quán)值使得卷積神經(jīng)網(wǎng)絡(luò)中的信息誤差最校卷積神經(jīng)網(wǎng)絡(luò)以卷積層、采樣層、池化層為基本網(wǎng)絡(luò)結(jié)構(gòu),各網(wǎng)絡(luò)層之間相互銜接,以多維網(wǎng)絡(luò)層作為輸出端,使訓(xùn)練結(jié)果的維度具有靈活性。圖2.2卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)的基本網(wǎng)絡(luò)結(jié)構(gòu)層:(1)卷積層卷積層的主要工作是將特征向量和卷積核做卷積運(yùn)算,卷積層又稱為特征提取層,如圖2.3所示,將一個(gè)大小為55的特征向量進(jìn)行卷積計(jì)算,提取特征信息的卷積核大小為33,最終得到計(jì)算結(jié)果3。圖2.3卷積計(jì)算原理其中,第三個(gè)矩陣中標(biāo)紅的數(shù)字3是計(jì)算結(jié)果,特征向量和卷積核的計(jì)算公式如公式2.1所示,將特征向量矩陣中標(biāo)紅的33矩陣與卷積核33矩陣中的對(duì)應(yīng)項(xiàng)進(jìn)行與運(yùn)算得到計(jì)算結(jié)果。特征圖的維度與卷積核的維度無(wú)關(guān),例如一個(gè)nn維的特征矩陣,經(jīng)過(guò)一個(gè)mm維的卷積核運(yùn)算后會(huì)得到(nm1)(nm1)維的特征矩陣。假設(shè)iC是矩陣第i層的特征值,iC生成過(guò)程如公式2.2所示,矩陣第i層的特征值iC的生成公式中,第i層卷積核的權(quán)值向量用表示,第i層的偏置量用表示。010101110010=0&1+1&0+0&1+1&0+1&1+0&0+1&1+1&1+0&0=3110110(2.1)

【參考文獻(xiàn)】:
期刊論文
[1]機(jī)器學(xué)習(xí)中的特征選擇方法研究及展望[J]. 崔鴻雁,徐帥,張利鋒,Roy E.Welsch,Berthold K.P.Horn.  北京郵電大學(xué)學(xué)報(bào). 2018(01)
[2]低秩矩陣近似與優(yōu)化問(wèn)題研究進(jìn)展[J]. 張恒敏,楊健,鄭瑋.  模式識(shí)別與人工智能. 2018(01)
[3]高維小樣本分類問(wèn)題中特征選擇研究綜述[J]. 王翔,胡學(xué)鋼.  計(jì)算機(jī)應(yīng)用. 2017(09)
[4]Recent Progresses in Deep Learning Based Acoustic Models[J]. Dong Yu,Jinyu Li.  IEEE/CAA Journal of Automatica Sinica. 2017(03)
[5]基于卷積神經(jīng)網(wǎng)絡(luò)的維吾爾語(yǔ)語(yǔ)音識(shí)別[J]. 梁玉龍,屈丹,李真,張文林.  信息工程大學(xué)學(xué)報(bào). 2017(01)
[6]基于粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的養(yǎng)腸胃菜譜判定[J]. 張璐,雷雪梅.  計(jì)算機(jī)科學(xué). 2016(S2)
[7]高維數(shù)據(jù)的1-范數(shù)支持向量機(jī)集成特征選擇[J]. 鮑捷,楊明,劉會(huì)東.  計(jì)算機(jī)科學(xué)與探索. 2012(10)

博士論文
[1]多目標(biāo)粒子群優(yōu)化算法的研究[D]. 徐鶴鳴.上海交通大學(xué) 2013

碩士論文
[1]基于小樣本學(xué)習(xí)的目標(biāo)匹配研究[D]. 柳青林.西安電子科技大學(xué) 2018
[2]基于統(tǒng)計(jì)學(xué)的大數(shù)據(jù)特征分析研究[D]. 徐帥.北京郵電大學(xué) 2018
[3]高維小樣本數(shù)據(jù)的特征選擇研究及其穩(wěn)定性分析[D]. 寧永鵬.廈門大學(xué) 2014
[4]基于增量聚類和ReliefF的特征選擇方法[D]. 童憶瑩.西南大學(xué) 2011



本文編號(hào):3390391

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3390391.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ed0ac***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com