基于網(wǎng)絡(luò)表示學習的學術(shù)合作者推薦問題研究
發(fā)布時間:2021-03-29 19:29
面對綜合化、多元化、交叉化的復(fù)雜科學研究,學者之間的學術(shù)合作使得在不同領(lǐng)域的學者可以學習新知識、拓寬新視野、實現(xiàn)科研資源的高效利用,從而加快科研信息的流動,提升科研成果的質(zhì)量,進而對解決技術(shù)難題和理論創(chuàng)新具有深刻意義。合作者推薦是為學者推薦合適研究領(lǐng)域的學者進行相關(guān)學術(shù)合作。然而,許多研究僅通過文本挖掘技術(shù)得到學者的文本特征表示或是通過合作關(guān)系網(wǎng)絡(luò)得到學者的結(jié)構(gòu)特征表示以及通過文本特征表示和結(jié)構(gòu)特征表示簡單融合得到學者的特征表示,而忽略了文本信息和網(wǎng)絡(luò)結(jié)構(gòu)相互促進對學者的特征表示產(chǎn)生的影響。網(wǎng)絡(luò)表示學習旨在將網(wǎng)絡(luò)中的節(jié)點表示成低維向量,而學術(shù)合作網(wǎng)絡(luò)中包含許多文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息,這些信息可以精細化網(wǎng)絡(luò)結(jié)構(gòu),有利于學者的特征表示。無論是基于關(guān)鍵詞檢索還是基于主題模型的專家檔案建立,不同的文本表示之間會存在語義鴻溝問題,而學者文本特征和網(wǎng)絡(luò)結(jié)構(gòu)特征簡單的融合相加不能準確捕獲學者之間的潛在關(guān)系。本文將學者文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息相融合,利用網(wǎng)絡(luò)表示學習技術(shù)挖掘?qū)W者的特征表示,幫助學者推薦合適的合作者。本文的研究工作主要包括:1、針對合作關(guān)系網(wǎng)絡(luò)中蘊含的潛在合作關(guān)系,提出一種基于屬性網(wǎng)絡(luò)表示...
【文章來源】:安徽大學安徽省 211工程院校
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
DBLP收錄文獻的數(shù)量Fig1.1ThenumberofpaperscollectedbytheDBLP
安徽大學碩士學位論文7和網(wǎng)絡(luò)表示學習技術(shù)的發(fā)展,利用相關(guān)技術(shù)對學者文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息進行深度挖掘得到學者的特征表示是解決合作者推薦問題的關(guān)鍵。學術(shù)合作網(wǎng)絡(luò)中大量文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息可以精細化網(wǎng)絡(luò)結(jié)構(gòu)從而有效的捕捉學者之間潛在的合作關(guān)系。本文主要利用學者的文本信息構(gòu)建合作關(guān)系網(wǎng)絡(luò),利用網(wǎng)絡(luò)表示學習技術(shù)將學者文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息這兩種異構(gòu)信息融合到同一向量空間捕獲潛在的合作關(guān)系。根據(jù)不同角度文本信息和網(wǎng)絡(luò)結(jié)構(gòu)的融合可分為兩部分,如圖1.2所示:第一部分通過構(gòu)建論文、學者和主題詞異構(gòu)信息網(wǎng)絡(luò),利用主題詞之間關(guān)聯(lián)的合作關(guān)系,使用隨機游走挖掘基于主題詞相關(guān)的可能合作關(guān)系,接著利用屬性網(wǎng)絡(luò)表示學習通過重構(gòu)目標鄰居使具有相似鄰居的學者在向量空間相近,最后基于學者的特征向量推薦合適的合作者。第二部分通過利用學者文本信息構(gòu)建學者加權(quán)文本向量表示,基于學者加權(quán)文本特征的相似性構(gòu)建文本增強型學術(shù)合作網(wǎng)絡(luò),接著利用網(wǎng)絡(luò)表示學習通過捕獲網(wǎng)絡(luò)中節(jié)點序列的關(guān)系得到學者的特征表示,最后基于學者的特征向量推薦合適的合作者。圖1.2論文的主要研究內(nèi)容Fig1.2Themainresearchcontentsofthedissertation
第二章相關(guān)理論知識14圖2.1網(wǎng)絡(luò)表示學習流程圖Fig2.1Theframeworkofnetworkembeddinglearning網(wǎng)絡(luò)表示學習方法有不同種分類標準。主要可以分為兩類:基于網(wǎng)絡(luò)結(jié)構(gòu)的網(wǎng)絡(luò)嵌入和結(jié)合外部信息的網(wǎng)絡(luò)嵌入。DeepWalk[37]利用截斷的隨機游走序列來表示每個節(jié)點的近鄰,充分隨機游走得到網(wǎng)絡(luò)結(jié)構(gòu)中的游走序列,然后利用Skip-gram模型和HierarchicalSoftmax模型對隨機游走序列中每個局部窗口內(nèi)的節(jié)點進行概率建模,最終最大化隨機游走序列的似然概率,使用隨機梯度下降方法學習得到最終的參數(shù),從而得到節(jié)點的向量表示。隨機游走只依賴于局部信息可以使用分布式系統(tǒng)避免了向鄰接矩陣那樣要將所有的信息全部存儲在內(nèi)存中。Node2vec[39]在DeepWalk的基礎(chǔ)上改變節(jié)點的游走序列,通過引入?yún)?shù)和參數(shù)控制節(jié)點游走到下一個節(jié)點時的跳轉(zhuǎn)概率,將深度優(yōu)先搜索和廣度優(yōu)先搜索這兩種游走策略引入生成隨機游走序列,其中深度優(yōu)先搜索可以捕獲節(jié)點的宏觀全局信息,而廣度優(yōu)先搜索可以捕獲局部微觀信息,通過多次出現(xiàn)相鄰節(jié)點從而降低中心節(jié)點與鄰居節(jié)點的方差。圖2.2Node2vec算法游走示意圖Fig2.2Thediagramofnode2vec
【參考文獻】:
期刊論文
[1]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計算機學報. 2017(06)
本文編號:3108068
【文章來源】:安徽大學安徽省 211工程院校
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
DBLP收錄文獻的數(shù)量Fig1.1ThenumberofpaperscollectedbytheDBLP
安徽大學碩士學位論文7和網(wǎng)絡(luò)表示學習技術(shù)的發(fā)展,利用相關(guān)技術(shù)對學者文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息進行深度挖掘得到學者的特征表示是解決合作者推薦問題的關(guān)鍵。學術(shù)合作網(wǎng)絡(luò)中大量文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息可以精細化網(wǎng)絡(luò)結(jié)構(gòu)從而有效的捕捉學者之間潛在的合作關(guān)系。本文主要利用學者的文本信息構(gòu)建合作關(guān)系網(wǎng)絡(luò),利用網(wǎng)絡(luò)表示學習技術(shù)將學者文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息這兩種異構(gòu)信息融合到同一向量空間捕獲潛在的合作關(guān)系。根據(jù)不同角度文本信息和網(wǎng)絡(luò)結(jié)構(gòu)的融合可分為兩部分,如圖1.2所示:第一部分通過構(gòu)建論文、學者和主題詞異構(gòu)信息網(wǎng)絡(luò),利用主題詞之間關(guān)聯(lián)的合作關(guān)系,使用隨機游走挖掘基于主題詞相關(guān)的可能合作關(guān)系,接著利用屬性網(wǎng)絡(luò)表示學習通過重構(gòu)目標鄰居使具有相似鄰居的學者在向量空間相近,最后基于學者的特征向量推薦合適的合作者。第二部分通過利用學者文本信息構(gòu)建學者加權(quán)文本向量表示,基于學者加權(quán)文本特征的相似性構(gòu)建文本增強型學術(shù)合作網(wǎng)絡(luò),接著利用網(wǎng)絡(luò)表示學習通過捕獲網(wǎng)絡(luò)中節(jié)點序列的關(guān)系得到學者的特征表示,最后基于學者的特征向量推薦合適的合作者。圖1.2論文的主要研究內(nèi)容Fig1.2Themainresearchcontentsofthedissertation
第二章相關(guān)理論知識14圖2.1網(wǎng)絡(luò)表示學習流程圖Fig2.1Theframeworkofnetworkembeddinglearning網(wǎng)絡(luò)表示學習方法有不同種分類標準。主要可以分為兩類:基于網(wǎng)絡(luò)結(jié)構(gòu)的網(wǎng)絡(luò)嵌入和結(jié)合外部信息的網(wǎng)絡(luò)嵌入。DeepWalk[37]利用截斷的隨機游走序列來表示每個節(jié)點的近鄰,充分隨機游走得到網(wǎng)絡(luò)結(jié)構(gòu)中的游走序列,然后利用Skip-gram模型和HierarchicalSoftmax模型對隨機游走序列中每個局部窗口內(nèi)的節(jié)點進行概率建模,最終最大化隨機游走序列的似然概率,使用隨機梯度下降方法學習得到最終的參數(shù),從而得到節(jié)點的向量表示。隨機游走只依賴于局部信息可以使用分布式系統(tǒng)避免了向鄰接矩陣那樣要將所有的信息全部存儲在內(nèi)存中。Node2vec[39]在DeepWalk的基礎(chǔ)上改變節(jié)點的游走序列,通過引入?yún)?shù)和參數(shù)控制節(jié)點游走到下一個節(jié)點時的跳轉(zhuǎn)概率,將深度優(yōu)先搜索和廣度優(yōu)先搜索這兩種游走策略引入生成隨機游走序列,其中深度優(yōu)先搜索可以捕獲節(jié)點的宏觀全局信息,而廣度優(yōu)先搜索可以捕獲局部微觀信息,通過多次出現(xiàn)相鄰節(jié)點從而降低中心節(jié)點與鄰居節(jié)點的方差。圖2.2Node2vec算法游走示意圖Fig2.2Thediagramofnode2vec
【參考文獻】:
期刊論文
[1]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計算機學報. 2017(06)
本文編號:3108068
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3108068.html
最近更新
教材專著