基于文本和網絡信息的學者興趣挖掘研究
發(fā)布時間:2024-06-30 02:20
學者的興趣標簽不僅僅能體現學者本身的學術研究內容與方向,也體現學者對某一個或多個科研領域的關注程度,F有的學者興趣標簽挖掘方法大多基于學者的論文中包含的文本信息和網絡結構信息進行分類,但是在對文本信息的利用上,現有的方法大多采用概率主題模型生成文本屬性,得到的文本信息屬性粒度較粗;在對網絡結構信息的利用上,現有的方法則大多將原本隱含在論文信息中的異構信息網絡解構成多個同質網絡進行節(jié)點嵌入的獲取,丟失了異構信息網絡中豐富的異構語義信息。在前人研究的基礎上,本文基于文本屬性和網絡屬性對學者興趣標簽進行研究,主要貢獻如下:(1)提出基于文本信息的興趣標簽評分方法。我們對文本信息采取詞級別的向量表示,并利用雙向長短記憶循環(huán)神經網絡捕獲文本數據中的上下文信息,同時采用注意力機制加權文本中不同位置的信息,且將聚合得到的興趣標簽評分向量經過全連接層和輸出層降維,從而最終得到興趣標簽的評分。(2)提出基于網絡結構信息的興趣標簽評分方法。為了保留異構信息網絡中的語義信息,我們對網絡結構信息采用生成式對抗網絡來獲取異構信息網絡中的節(jié)點嵌入,并將其用于計算學者之間的相似度,進而獲得待預測學者的興趣標簽評分。...
【文章頁數】:56 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3998245
【文章頁數】:56 頁
【學位級別】:碩士
【部分圖文】:
圖1.1北京文獻服務處參賽方案結構
內蒙古大學碩士學位論文3圖1.1北京文獻服務處參賽方案結構Figure1.1structureofthesolutionfromBeijingDocumentServiceDepartment北京文獻服務處的參賽方案首先對給定數據進行了擴展,一方面利用給定數據中的期刊或會議名稱信....
圖1.2moon-light團隊參賽方案結構
內蒙古大學碩士學位論文3圖1.1北京文獻服務處參賽方案結構Figure1.1structureofthesolutionfromBeijingDocumentServiceDepartment北京文獻服務處的參賽方案首先對給定數據進行了擴展,一方面利用給定數據中的期刊或會議名稱信....
圖1.3ICRC@HITSZ團隊參賽方案結構
基于文本和網絡信息的學者興趣挖掘研究6圖1.3ICRC@HITSZ團隊參賽方案結構Figure1.3structureofthesolutionfromteamICRC@HITSZ在網絡結構屬性方面,采用LINE[15]方法根據論文數據中的合著網絡和引用關系網絡生成節(jié)點嵌入;在文....
圖2.1CBOW模型的模型結構
基于文本和網絡信息的學者興趣挖掘研究10藏層巨大的計算量,Word2Vec模型提出的CBOW模型和skip-gram模型都是不含隱藏層的兩層神經網絡模型。其中CBOW模型的思想上通過已知的上下文信息來預測中心詞,而skip-gram模型則是相反,通過已知的中心詞來預測上下文詞匯。....
本文編號:3998245
本文鏈接:http://sikaile.net/tushudanganlunwen/3998245.html
上一篇:文化信息資源共享工程的教化功能與實效研究——基于秦巴山區(qū)的考察
下一篇:沒有了
下一篇:沒有了