基于相似度神經(jīng)網(wǎng)絡(luò)的協(xié)同標(biāo)注模型
發(fā)布時(shí)間:2021-09-19 17:21
協(xié)同標(biāo)注作為一種成熟的技術(shù),常被用來(lái)解決信息資源索引、管理、檢索等問(wèn)題,但存在因數(shù)據(jù)間交互信息不充分或無(wú)交互信息帶來(lái)的冷啟動(dòng)問(wèn)題。目前常用的解決辦法是采用內(nèi)容信息來(lái)增強(qiáng)和改善注釋算法,尤其是基于文本內(nèi)容的協(xié)同過(guò)濾,但對(duì)于如何更好地提取文本特征、衡量項(xiàng)目相似性等還需要深入探究。針對(duì)以上問(wèn)題,本文結(jié)合稀疏線性方法(Sparse Linear Method,SLIM)和孿生卷積神經(jīng)網(wǎng)絡(luò)(Siamese Convolution Neural Network,SCNN)提出了一種基于相似度神經(jīng)網(wǎng)絡(luò)的協(xié)同標(biāo)注模型(Similarity Neural Network based Collaborative Annota-tion Model,SNNCA)。該模型將SCNN組件用于內(nèi)容信息的特征提取和項(xiàng)目相似性計(jì)算,其輸出可視為兩個(gè)輸入內(nèi)容的非線性相似性度量函數(shù)。為了解決SCNN的參數(shù)訓(xùn)練問(wèn)題,本文通過(guò)SLIM從已有項(xiàng)目標(biāo)注數(shù)據(jù)中學(xué)習(xí)項(xiàng)目間的相似關(guān)系稀疏系數(shù)矩陣W,將獲得的結(jié)果用于訓(xùn)練SCNN組件中的參數(shù);诖怂悸,本文專門設(shè)計(jì)了模型參數(shù)學(xué)習(xí)方法,并通過(guò)交叉迭代方式,實(shí)現(xiàn)模型參數(shù)的聯(lián)合優(yōu)化,即每次迭...
【文章來(lái)源】:云南大學(xué)云南省 211工程院校
【文章頁(yè)數(shù)】:52 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.2:?TextCNN模型特征提取過(guò)程PI??
云南大學(xué)【專業(yè))碩士學(xué)位論文??明的,后來(lái)被證明將其應(yīng)用于NLP具有很好的效果,如TextCNN(TextConvolution??Neural?Network127])被廣泛應(yīng)用于文本分類,其模型結(jié)構(gòu)如圖2.2所不。首先將文??本通過(guò)詞嵌入的方式表示為詞向量的形式。其次通過(guò)訓(xùn)練一個(gè)帶有卷積層的簡(jiǎn)單??CNN提取文本特征,通過(guò)池化等操作對(duì)特征進(jìn)行降維。最后根據(jù)任務(wù)要求將特征??輸入全連接層的函數(shù)作為結(jié)果輸出。??size:(2,3,4)*5??(1lters:2??Embedding?/?convH?INIax-pooling??"ke?=?=?=??=?=?=?=?=?二??=3:二===?二二二二="團(tuán)?fea"f.re??.??????^?.一^?I?'?vector??much???.?I??A?選?J??圖2.2:?TextCNN模型特征提取過(guò)程PI??卷積是CNN中的重要操作,卷積其實(shí)就是卷積核作用于神經(jīng)網(wǎng)絡(luò)輸入上的點(diǎn)??乘和,加上偏置之后的激活輸出。卷積核是一個(gè)自定義大小的滑動(dòng)窗口,其個(gè)數(shù)也??是人為設(shè)定的,不同大小的卷積核中的權(quán)重參數(shù)不同,這樣可以保證不同的卷積核??在卷積的過(guò)程中對(duì)同一區(qū)域采集的特征不同,保證提取出所有明顯的特征。卷積過(guò)??程如下圖2.3所示。??tj=5?2*5?filters????????stride?1??iL??likej??'?■■■??graphHHHHHB?一?一--■??
圖2.4:池化操作??
【參考文獻(xiàn)】:
期刊論文
[1]基于社會(huì)化標(biāo)注的用戶興趣發(fā)現(xiàn)及個(gè)性化推薦研究[J]. 王曉耘,趙菁,徐作寧. 現(xiàn)代情報(bào). 2018(07)
[2]基于余弦相似度模型的最佳教練遴選算法[J]. 陳大力,沈巖濤,謝檳竹,馬穎異. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(12)
[3]一種用于社會(huì)化標(biāo)簽推薦的主題模型[J]. 孫甲申,王小捷. 北京郵電大學(xué)學(xué)報(bào). 2014(03)
[4]基于社會(huì)網(wǎng)絡(luò)分析的協(xié)同推薦方法改進(jìn)[J]. 馮勇,李軍平,徐紅艷,黨曉婉. 計(jì)算機(jī)應(yīng)用. 2013(03)
博士論文
[1]文本分類及其相關(guān)技術(shù)研究[D]. 尚文倩.北京交通大學(xué) 2007
碩士論文
[1]文本分類中特征選擇和特征加權(quán)算法的研究[D]. 杜同森.北京郵電大學(xué) 2014
[2]文本聚類分析效果評(píng)價(jià)及文本表示研究[D]. 周昭濤.中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所) 2005
本文編號(hào):3402022
【文章來(lái)源】:云南大學(xué)云南省 211工程院校
【文章頁(yè)數(shù)】:52 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.2:?TextCNN模型特征提取過(guò)程PI??
云南大學(xué)【專業(yè))碩士學(xué)位論文??明的,后來(lái)被證明將其應(yīng)用于NLP具有很好的效果,如TextCNN(TextConvolution??Neural?Network127])被廣泛應(yīng)用于文本分類,其模型結(jié)構(gòu)如圖2.2所不。首先將文??本通過(guò)詞嵌入的方式表示為詞向量的形式。其次通過(guò)訓(xùn)練一個(gè)帶有卷積層的簡(jiǎn)單??CNN提取文本特征,通過(guò)池化等操作對(duì)特征進(jìn)行降維。最后根據(jù)任務(wù)要求將特征??輸入全連接層的函數(shù)作為結(jié)果輸出。??size:(2,3,4)*5??(1lters:2??Embedding?/?convH?INIax-pooling??"ke?=?=?=??=?=?=?=?=?二??=3:二===?二二二二="團(tuán)?fea"f.re??.??????^?.一^?I?'?vector??much???.?I??A?選?J??圖2.2:?TextCNN模型特征提取過(guò)程PI??卷積是CNN中的重要操作,卷積其實(shí)就是卷積核作用于神經(jīng)網(wǎng)絡(luò)輸入上的點(diǎn)??乘和,加上偏置之后的激活輸出。卷積核是一個(gè)自定義大小的滑動(dòng)窗口,其個(gè)數(shù)也??是人為設(shè)定的,不同大小的卷積核中的權(quán)重參數(shù)不同,這樣可以保證不同的卷積核??在卷積的過(guò)程中對(duì)同一區(qū)域采集的特征不同,保證提取出所有明顯的特征。卷積過(guò)??程如下圖2.3所示。??tj=5?2*5?filters????????stride?1??iL??likej??'?■■■??graphHHHHHB?一?一--■??
圖2.4:池化操作??
【參考文獻(xiàn)】:
期刊論文
[1]基于社會(huì)化標(biāo)注的用戶興趣發(fā)現(xiàn)及個(gè)性化推薦研究[J]. 王曉耘,趙菁,徐作寧. 現(xiàn)代情報(bào). 2018(07)
[2]基于余弦相似度模型的最佳教練遴選算法[J]. 陳大力,沈巖濤,謝檳竹,馬穎異. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(12)
[3]一種用于社會(huì)化標(biāo)簽推薦的主題模型[J]. 孫甲申,王小捷. 北京郵電大學(xué)學(xué)報(bào). 2014(03)
[4]基于社會(huì)網(wǎng)絡(luò)分析的協(xié)同推薦方法改進(jìn)[J]. 馮勇,李軍平,徐紅艷,黨曉婉. 計(jì)算機(jī)應(yīng)用. 2013(03)
博士論文
[1]文本分類及其相關(guān)技術(shù)研究[D]. 尚文倩.北京交通大學(xué) 2007
碩士論文
[1]文本分類中特征選擇和特征加權(quán)算法的研究[D]. 杜同森.北京郵電大學(xué) 2014
[2]文本聚類分析效果評(píng)價(jià)及文本表示研究[D]. 周昭濤.中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所) 2005
本文編號(hào):3402022
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3402022.html
最近更新
教材專著