基于網(wǎng)絡(luò)表示學(xué)習(xí)的學(xué)術(shù)合作者推薦問(wèn)題研究
發(fā)布時(shí)間:2021-03-29 19:29
面對(duì)綜合化、多元化、交叉化的復(fù)雜科學(xué)研究,學(xué)者之間的學(xué)術(shù)合作使得在不同領(lǐng)域的學(xué)者可以學(xué)習(xí)新知識(shí)、拓寬新視野、實(shí)現(xiàn)科研資源的高效利用,從而加快科研信息的流動(dòng),提升科研成果的質(zhì)量,進(jìn)而對(duì)解決技術(shù)難題和理論創(chuàng)新具有深刻意義。合作者推薦是為學(xué)者推薦合適研究領(lǐng)域的學(xué)者進(jìn)行相關(guān)學(xué)術(shù)合作。然而,許多研究?jī)H通過(guò)文本挖掘技術(shù)得到學(xué)者的文本特征表示或是通過(guò)合作關(guān)系網(wǎng)絡(luò)得到學(xué)者的結(jié)構(gòu)特征表示以及通過(guò)文本特征表示和結(jié)構(gòu)特征表示簡(jiǎn)單融合得到學(xué)者的特征表示,而忽略了文本信息和網(wǎng)絡(luò)結(jié)構(gòu)相互促進(jìn)對(duì)學(xué)者的特征表示產(chǎn)生的影響。網(wǎng)絡(luò)表示學(xué)習(xí)旨在將網(wǎng)絡(luò)中的節(jié)點(diǎn)表示成低維向量,而學(xué)術(shù)合作網(wǎng)絡(luò)中包含許多文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息,這些信息可以精細(xì)化網(wǎng)絡(luò)結(jié)構(gòu),有利于學(xué)者的特征表示。無(wú)論是基于關(guān)鍵詞檢索還是基于主題模型的專家檔案建立,不同的文本表示之間會(huì)存在語(yǔ)義鴻溝問(wèn)題,而學(xué)者文本特征和網(wǎng)絡(luò)結(jié)構(gòu)特征簡(jiǎn)單的融合相加不能準(zhǔn)確捕獲學(xué)者之間的潛在關(guān)系。本文將學(xué)者文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息相融合,利用網(wǎng)絡(luò)表示學(xué)習(xí)技術(shù)挖掘?qū)W者的特征表示,幫助學(xué)者推薦合適的合作者。本文的研究工作主要包括:1、針對(duì)合作關(guān)系網(wǎng)絡(luò)中蘊(yùn)含的潛在合作關(guān)系,提出一種基于屬性網(wǎng)絡(luò)表示...
【文章來(lái)源】:安徽大學(xué)安徽省 211工程院校
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
DBLP收錄文獻(xiàn)的數(shù)量Fig1.1ThenumberofpaperscollectedbytheDBLP
安徽大學(xué)碩士學(xué)位論文7和網(wǎng)絡(luò)表示學(xué)習(xí)技術(shù)的發(fā)展,利用相關(guān)技術(shù)對(duì)學(xué)者文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息進(jìn)行深度挖掘得到學(xué)者的特征表示是解決合作者推薦問(wèn)題的關(guān)鍵。學(xué)術(shù)合作網(wǎng)絡(luò)中大量文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息可以精細(xì)化網(wǎng)絡(luò)結(jié)構(gòu)從而有效的捕捉學(xué)者之間潛在的合作關(guān)系。本文主要利用學(xué)者的文本信息構(gòu)建合作關(guān)系網(wǎng)絡(luò),利用網(wǎng)絡(luò)表示學(xué)習(xí)技術(shù)將學(xué)者文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息這兩種異構(gòu)信息融合到同一向量空間捕獲潛在的合作關(guān)系。根據(jù)不同角度文本信息和網(wǎng)絡(luò)結(jié)構(gòu)的融合可分為兩部分,如圖1.2所示:第一部分通過(guò)構(gòu)建論文、學(xué)者和主題詞異構(gòu)信息網(wǎng)絡(luò),利用主題詞之間關(guān)聯(lián)的合作關(guān)系,使用隨機(jī)游走挖掘基于主題詞相關(guān)的可能合作關(guān)系,接著利用屬性網(wǎng)絡(luò)表示學(xué)習(xí)通過(guò)重構(gòu)目標(biāo)鄰居使具有相似鄰居的學(xué)者在向量空間相近,最后基于學(xué)者的特征向量推薦合適的合作者。第二部分通過(guò)利用學(xué)者文本信息構(gòu)建學(xué)者加權(quán)文本向量表示,基于學(xué)者加權(quán)文本特征的相似性構(gòu)建文本增強(qiáng)型學(xué)術(shù)合作網(wǎng)絡(luò),接著利用網(wǎng)絡(luò)表示學(xué)習(xí)通過(guò)捕獲網(wǎng)絡(luò)中節(jié)點(diǎn)序列的關(guān)系得到學(xué)者的特征表示,最后基于學(xué)者的特征向量推薦合適的合作者。圖1.2論文的主要研究?jī)?nèi)容Fig1.2Themainresearchcontentsofthedissertation
第二章相關(guān)理論知識(shí)14圖2.1網(wǎng)絡(luò)表示學(xué)習(xí)流程圖Fig2.1Theframeworkofnetworkembeddinglearning網(wǎng)絡(luò)表示學(xué)習(xí)方法有不同種分類(lèi)標(biāo)準(zhǔn)。主要可以分為兩類(lèi):基于網(wǎng)絡(luò)結(jié)構(gòu)的網(wǎng)絡(luò)嵌入和結(jié)合外部信息的網(wǎng)絡(luò)嵌入。DeepWalk[37]利用截?cái)嗟碾S機(jī)游走序列來(lái)表示每個(gè)節(jié)點(diǎn)的近鄰,充分隨機(jī)游走得到網(wǎng)絡(luò)結(jié)構(gòu)中的游走序列,然后利用Skip-gram模型和HierarchicalSoftmax模型對(duì)隨機(jī)游走序列中每個(gè)局部窗口內(nèi)的節(jié)點(diǎn)進(jìn)行概率建模,最終最大化隨機(jī)游走序列的似然概率,使用隨機(jī)梯度下降方法學(xué)習(xí)得到最終的參數(shù),從而得到節(jié)點(diǎn)的向量表示。隨機(jī)游走只依賴于局部信息可以使用分布式系統(tǒng)避免了向鄰接矩陣那樣要將所有的信息全部存儲(chǔ)在內(nèi)存中。Node2vec[39]在DeepWalk的基礎(chǔ)上改變節(jié)點(diǎn)的游走序列,通過(guò)引入?yún)?shù)和參數(shù)控制節(jié)點(diǎn)游走到下一個(gè)節(jié)點(diǎn)時(shí)的跳轉(zhuǎn)概率,將深度優(yōu)先搜索和廣度優(yōu)先搜索這兩種游走策略引入生成隨機(jī)游走序列,其中深度優(yōu)先搜索可以捕獲節(jié)點(diǎn)的宏觀全局信息,而廣度優(yōu)先搜索可以捕獲局部微觀信息,通過(guò)多次出現(xiàn)相鄰節(jié)點(diǎn)從而降低中心節(jié)點(diǎn)與鄰居節(jié)點(diǎn)的方差。圖2.2Node2vec算法游走示意圖Fig2.2Thediagramofnode2vec
【參考文獻(xiàn)】:
期刊論文
[1]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
本文編號(hào):3108068
【文章來(lái)源】:安徽大學(xué)安徽省 211工程院校
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
DBLP收錄文獻(xiàn)的數(shù)量Fig1.1ThenumberofpaperscollectedbytheDBLP
安徽大學(xué)碩士學(xué)位論文7和網(wǎng)絡(luò)表示學(xué)習(xí)技術(shù)的發(fā)展,利用相關(guān)技術(shù)對(duì)學(xué)者文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息進(jìn)行深度挖掘得到學(xué)者的特征表示是解決合作者推薦問(wèn)題的關(guān)鍵。學(xué)術(shù)合作網(wǎng)絡(luò)中大量文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息可以精細(xì)化網(wǎng)絡(luò)結(jié)構(gòu)從而有效的捕捉學(xué)者之間潛在的合作關(guān)系。本文主要利用學(xué)者的文本信息構(gòu)建合作關(guān)系網(wǎng)絡(luò),利用網(wǎng)絡(luò)表示學(xué)習(xí)技術(shù)將學(xué)者文本信息和網(wǎng)絡(luò)結(jié)構(gòu)信息這兩種異構(gòu)信息融合到同一向量空間捕獲潛在的合作關(guān)系。根據(jù)不同角度文本信息和網(wǎng)絡(luò)結(jié)構(gòu)的融合可分為兩部分,如圖1.2所示:第一部分通過(guò)構(gòu)建論文、學(xué)者和主題詞異構(gòu)信息網(wǎng)絡(luò),利用主題詞之間關(guān)聯(lián)的合作關(guān)系,使用隨機(jī)游走挖掘基于主題詞相關(guān)的可能合作關(guān)系,接著利用屬性網(wǎng)絡(luò)表示學(xué)習(xí)通過(guò)重構(gòu)目標(biāo)鄰居使具有相似鄰居的學(xué)者在向量空間相近,最后基于學(xué)者的特征向量推薦合適的合作者。第二部分通過(guò)利用學(xué)者文本信息構(gòu)建學(xué)者加權(quán)文本向量表示,基于學(xué)者加權(quán)文本特征的相似性構(gòu)建文本增強(qiáng)型學(xué)術(shù)合作網(wǎng)絡(luò),接著利用網(wǎng)絡(luò)表示學(xué)習(xí)通過(guò)捕獲網(wǎng)絡(luò)中節(jié)點(diǎn)序列的關(guān)系得到學(xué)者的特征表示,最后基于學(xué)者的特征向量推薦合適的合作者。圖1.2論文的主要研究?jī)?nèi)容Fig1.2Themainresearchcontentsofthedissertation
第二章相關(guān)理論知識(shí)14圖2.1網(wǎng)絡(luò)表示學(xué)習(xí)流程圖Fig2.1Theframeworkofnetworkembeddinglearning網(wǎng)絡(luò)表示學(xué)習(xí)方法有不同種分類(lèi)標(biāo)準(zhǔn)。主要可以分為兩類(lèi):基于網(wǎng)絡(luò)結(jié)構(gòu)的網(wǎng)絡(luò)嵌入和結(jié)合外部信息的網(wǎng)絡(luò)嵌入。DeepWalk[37]利用截?cái)嗟碾S機(jī)游走序列來(lái)表示每個(gè)節(jié)點(diǎn)的近鄰,充分隨機(jī)游走得到網(wǎng)絡(luò)結(jié)構(gòu)中的游走序列,然后利用Skip-gram模型和HierarchicalSoftmax模型對(duì)隨機(jī)游走序列中每個(gè)局部窗口內(nèi)的節(jié)點(diǎn)進(jìn)行概率建模,最終最大化隨機(jī)游走序列的似然概率,使用隨機(jī)梯度下降方法學(xué)習(xí)得到最終的參數(shù),從而得到節(jié)點(diǎn)的向量表示。隨機(jī)游走只依賴于局部信息可以使用分布式系統(tǒng)避免了向鄰接矩陣那樣要將所有的信息全部存儲(chǔ)在內(nèi)存中。Node2vec[39]在DeepWalk的基礎(chǔ)上改變節(jié)點(diǎn)的游走序列,通過(guò)引入?yún)?shù)和參數(shù)控制節(jié)點(diǎn)游走到下一個(gè)節(jié)點(diǎn)時(shí)的跳轉(zhuǎn)概率,將深度優(yōu)先搜索和廣度優(yōu)先搜索這兩種游走策略引入生成隨機(jī)游走序列,其中深度優(yōu)先搜索可以捕獲節(jié)點(diǎn)的宏觀全局信息,而廣度優(yōu)先搜索可以捕獲局部微觀信息,通過(guò)多次出現(xiàn)相鄰節(jié)點(diǎn)從而降低中心節(jié)點(diǎn)與鄰居節(jié)點(diǎn)的方差。圖2.2Node2vec算法游走示意圖Fig2.2Thediagramofnode2vec
【參考文獻(xiàn)】:
期刊論文
[1]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
本文編號(hào):3108068
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3108068.html
最近更新
教材專著