基于學(xué)術(shù)網(wǎng)絡(luò)的學(xué)者興趣標(biāo)簽發(fā)現(xiàn)研究
發(fā)布時間:2020-12-27 12:09
用戶畫像是對用戶信息標(biāo)簽化,用戶形象具體化的過程,在智能營銷、計算廣告、個性化推薦等領(lǐng)域得到了廣泛的應(yīng)用。興趣標(biāo)簽是用戶畫像的基本內(nèi)容之一,通過給用戶打標(biāo)簽的方式刻畫用戶興趣偏好,捕捉用戶興趣變化。學(xué)術(shù)研究的快速發(fā)展導(dǎo)致了學(xué)術(shù)大數(shù)據(jù)的產(chǎn)生,基于這些數(shù)據(jù),可以構(gòu)建學(xué)者的研究興趣畫像。以往的研究主要是從學(xué)術(shù)文本數(shù)據(jù)中提取學(xué)者的興趣標(biāo)簽,相比之下,基于學(xué)術(shù)網(wǎng)絡(luò)發(fā)現(xiàn)學(xué)者興趣的研究較少。因此,本文假定在興趣標(biāo)簽空間已知的前提下,將學(xué)者研究興趣的發(fā)現(xiàn)問題抽象為一個多標(biāo)簽分類問題,通過構(gòu)建以學(xué)者為節(jié)點的大規(guī)模無向合著網(wǎng)絡(luò)、有向合著網(wǎng)絡(luò)及引用網(wǎng)絡(luò),并針對合著網(wǎng)絡(luò)和引用網(wǎng)絡(luò)規(guī)模、結(jié)構(gòu)不同的特點,分別應(yīng)用不同的網(wǎng)絡(luò)表示學(xué)習(xí)方法從3種學(xué)術(shù)網(wǎng)絡(luò)中提取學(xué)者節(jié)點的特征表示,進(jìn)而設(shè)計實現(xiàn)多標(biāo)簽分類模型,為學(xué)術(shù)網(wǎng)絡(luò)中標(biāo)簽未知的學(xué)者標(biāo)注最合適的興趣標(biāo)簽。本文的主要工作包括以下三個方面:(1)基于Biendata提供的“2017開放學(xué)術(shù)精準(zhǔn)畫像大賽”論文信息數(shù)據(jù)集及爬取自微軟學(xué)術(shù)網(wǎng)的計算機(jī)科學(xué)頂級領(lǐng)域標(biāo)簽數(shù)據(jù),構(gòu)建包含百萬級節(jié)點與千萬級邊的合著網(wǎng)絡(luò)和引用網(wǎng)絡(luò),為了更準(zhǔn)確地識別無向合著網(wǎng)絡(luò)中的核心學(xué)者,構(gòu)建以論文中第一作者...
【文章來源】:西北師范大學(xué)甘肅省
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【部分圖文】:
所示,Skip-gram模型是一個簡單的三層前饋神經(jīng)網(wǎng)絡(luò),其包含3個部分:輸入層、隱藏層和輸出層
第3章學(xué)術(shù)網(wǎng)絡(luò)特征表示學(xué)習(xí)建模21表3-3學(xué)者的姓名及其頂級研究領(lǐng)域的興趣標(biāo)簽數(shù)據(jù)樣式idauthortag1tag2tag30DanielJ.PaulishprogramminglanguagesoftwareengineeringNULL1JoséCristóbalRiquelmeSantosmachinelearningalgorithmNULL2FernandoC.N.Pereiraspeechrecognitionnaturallanguageprocessingcomputerhardware3JuandeLaraalgorithmsoftwareengineeringcomputerhardware4StefanoLonardidatasciencedataminingcomputernetwork5SimeonJ.Simoffcomputervisiondatabaseprogramminglanguage6JinxiangChaicomputervisionmultimediaNULL7ShanlinYangalgorithmdistributedcomputingNULL8DairokuSekiguchisimulationmultimediacomputergraphics(images)9WilliamE.Bilesalgorithmsimulationdatamining建立細(xì)分研究領(lǐng)域標(biāo)簽到頂級領(lǐng)域標(biāo)簽的映射關(guān)系后,就可以將15367名學(xué)圖3-115367名學(xué)者的頂級領(lǐng)域標(biāo)簽頻次分布狀況
西北師范大學(xué)碩士學(xué)位論文22者的3個細(xì)分領(lǐng)域標(biāo)簽對應(yīng)到頂級領(lǐng)域,表3-3展示了將表3-2中10位學(xué)者的細(xì)分領(lǐng)域標(biāo)簽對應(yīng)到頂級領(lǐng)域標(biāo)簽后的結(jié)果。如表3-3所示,部分學(xué)者的細(xì)分領(lǐng)域標(biāo)簽在對應(yīng)到頂級領(lǐng)域標(biāo)簽后,出現(xiàn)了一個或多個標(biāo)簽為空(NULL)的現(xiàn)象,原因在于一位學(xué)者的多個細(xì)分領(lǐng)域標(biāo)簽可能屬于同一個頂級領(lǐng)域標(biāo)簽,因此,這種標(biāo)簽映射關(guān)系是一種一對一或多對一的關(guān)系。對學(xué)者論文信息數(shù)據(jù)papers_dataset、15367位學(xué)者及其頂級研究領(lǐng)域的興趣標(biāo)簽數(shù)據(jù)以及34維的標(biāo)簽空間數(shù)據(jù)經(jīng)過處理存儲到數(shù)據(jù)庫后,就可以基于這些數(shù)據(jù)構(gòu)建學(xué)術(shù)網(wǎng)絡(luò)進(jìn)而開展后續(xù)的研究內(nèi)容。3.2學(xué)術(shù)網(wǎng)絡(luò)構(gòu)建與分析3.2.1學(xué)術(shù)網(wǎng)絡(luò)構(gòu)建1.合著網(wǎng)絡(luò)構(gòu)建通過對papers_dataset中的合著情況統(tǒng)計發(fā)現(xiàn),存在合著情況的論文共有2535624篇,其中合著者人數(shù)為2人的論文數(shù)量最多,共計908177篇;合著者人數(shù)為10人以上的論文數(shù)量共計12153篇。圖3-2描述了papers_dataset中論文篇數(shù)隨合著者人數(shù)變化的趨勢:圖3-2論文篇數(shù)隨合著者人數(shù)變化的趨勢
【參考文獻(xiàn)】:
期刊論文
[1]結(jié)合詞向量和詞圖算法的用戶興趣建模研究[J]. 聶卉. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2019(12)
[2]基于LDA主題模型的用戶興趣層級演化研究[J]. 夏立新,曾杰妍,畢崇武,葉光輝. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2019(07)
[3]面向?qū)W術(shù)文獻(xiàn)的學(xué)者興趣標(biāo)簽識別方法[J]. 謝鵬. 情報工程. 2019(03)
[4]基于手勢行為的社交網(wǎng)絡(luò)用戶興趣畫像構(gòu)建及應(yīng)用[J]. 汪強(qiáng)兵,章成志. 圖書與情報. 2019(02)
[5]網(wǎng)絡(luò)表示學(xué)習(xí)的研究與發(fā)展[J]. 尹贏,吉立新,黃瑞陽,杜立新. 網(wǎng)絡(luò)與信息安全學(xué)報. 2019(02)
[6]基于學(xué)術(shù)論文的學(xué)者研究興趣標(biāo)簽發(fā)現(xiàn)研究[J]. 池雪花,劉麗帆,章成志. 情報工程. 2019(02)
[7]網(wǎng)絡(luò)表示學(xué)習(xí)算法的分析與驗證[J]. 王巖,唐杰. 中文信息學(xué)報. 2019(02)
[8]科研學(xué)術(shù)大數(shù)據(jù)的精準(zhǔn)服務(wù)架構(gòu)設(shè)計[J]. 謝靖,錢力,師洪波,孔貝貝,胡吉穎. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2019(01)
[9]異構(gòu)社交網(wǎng)絡(luò)用戶興趣挖掘方法[J]. 屠守中,閆洲,衛(wèi)玲蔚,朱小燕. 西安電子科技大學(xué)學(xué)報. 2019(02)
[10]開放互聯(lián)網(wǎng)中的學(xué)者畫像技術(shù)綜述[J]. 袁莎,唐杰,顧曉韜. 計算機(jī)研究與發(fā)展. 2018(09)
碩士論文
[1]基于用戶興趣模型和社團(tuán)挖掘的推薦方法研究[D]. 李鵬.蘭州大學(xué) 2019
[2]基于多源異構(gòu)大數(shù)據(jù)的學(xué)者用戶畫像關(guān)鍵技術(shù)研究[D]. 溫昂展.華南理工大學(xué) 2018
[3]融入社交網(wǎng)絡(luò)信息的DIT用戶偏好預(yù)測模型[D]. 張長紅.浙江工商大學(xué) 2018
本文編號:2941708
【文章來源】:西北師范大學(xué)甘肅省
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【部分圖文】:
所示,Skip-gram模型是一個簡單的三層前饋神經(jīng)網(wǎng)絡(luò),其包含3個部分:輸入層、隱藏層和輸出層
第3章學(xué)術(shù)網(wǎng)絡(luò)特征表示學(xué)習(xí)建模21表3-3學(xué)者的姓名及其頂級研究領(lǐng)域的興趣標(biāo)簽數(shù)據(jù)樣式idauthortag1tag2tag30DanielJ.PaulishprogramminglanguagesoftwareengineeringNULL1JoséCristóbalRiquelmeSantosmachinelearningalgorithmNULL2FernandoC.N.Pereiraspeechrecognitionnaturallanguageprocessingcomputerhardware3JuandeLaraalgorithmsoftwareengineeringcomputerhardware4StefanoLonardidatasciencedataminingcomputernetwork5SimeonJ.Simoffcomputervisiondatabaseprogramminglanguage6JinxiangChaicomputervisionmultimediaNULL7ShanlinYangalgorithmdistributedcomputingNULL8DairokuSekiguchisimulationmultimediacomputergraphics(images)9WilliamE.Bilesalgorithmsimulationdatamining建立細(xì)分研究領(lǐng)域標(biāo)簽到頂級領(lǐng)域標(biāo)簽的映射關(guān)系后,就可以將15367名學(xué)圖3-115367名學(xué)者的頂級領(lǐng)域標(biāo)簽頻次分布狀況
西北師范大學(xué)碩士學(xué)位論文22者的3個細(xì)分領(lǐng)域標(biāo)簽對應(yīng)到頂級領(lǐng)域,表3-3展示了將表3-2中10位學(xué)者的細(xì)分領(lǐng)域標(biāo)簽對應(yīng)到頂級領(lǐng)域標(biāo)簽后的結(jié)果。如表3-3所示,部分學(xué)者的細(xì)分領(lǐng)域標(biāo)簽在對應(yīng)到頂級領(lǐng)域標(biāo)簽后,出現(xiàn)了一個或多個標(biāo)簽為空(NULL)的現(xiàn)象,原因在于一位學(xué)者的多個細(xì)分領(lǐng)域標(biāo)簽可能屬于同一個頂級領(lǐng)域標(biāo)簽,因此,這種標(biāo)簽映射關(guān)系是一種一對一或多對一的關(guān)系。對學(xué)者論文信息數(shù)據(jù)papers_dataset、15367位學(xué)者及其頂級研究領(lǐng)域的興趣標(biāo)簽數(shù)據(jù)以及34維的標(biāo)簽空間數(shù)據(jù)經(jīng)過處理存儲到數(shù)據(jù)庫后,就可以基于這些數(shù)據(jù)構(gòu)建學(xué)術(shù)網(wǎng)絡(luò)進(jìn)而開展后續(xù)的研究內(nèi)容。3.2學(xué)術(shù)網(wǎng)絡(luò)構(gòu)建與分析3.2.1學(xué)術(shù)網(wǎng)絡(luò)構(gòu)建1.合著網(wǎng)絡(luò)構(gòu)建通過對papers_dataset中的合著情況統(tǒng)計發(fā)現(xiàn),存在合著情況的論文共有2535624篇,其中合著者人數(shù)為2人的論文數(shù)量最多,共計908177篇;合著者人數(shù)為10人以上的論文數(shù)量共計12153篇。圖3-2描述了papers_dataset中論文篇數(shù)隨合著者人數(shù)變化的趨勢:圖3-2論文篇數(shù)隨合著者人數(shù)變化的趨勢
【參考文獻(xiàn)】:
期刊論文
[1]結(jié)合詞向量和詞圖算法的用戶興趣建模研究[J]. 聶卉. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2019(12)
[2]基于LDA主題模型的用戶興趣層級演化研究[J]. 夏立新,曾杰妍,畢崇武,葉光輝. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2019(07)
[3]面向?qū)W術(shù)文獻(xiàn)的學(xué)者興趣標(biāo)簽識別方法[J]. 謝鵬. 情報工程. 2019(03)
[4]基于手勢行為的社交網(wǎng)絡(luò)用戶興趣畫像構(gòu)建及應(yīng)用[J]. 汪強(qiáng)兵,章成志. 圖書與情報. 2019(02)
[5]網(wǎng)絡(luò)表示學(xué)習(xí)的研究與發(fā)展[J]. 尹贏,吉立新,黃瑞陽,杜立新. 網(wǎng)絡(luò)與信息安全學(xué)報. 2019(02)
[6]基于學(xué)術(shù)論文的學(xué)者研究興趣標(biāo)簽發(fā)現(xiàn)研究[J]. 池雪花,劉麗帆,章成志. 情報工程. 2019(02)
[7]網(wǎng)絡(luò)表示學(xué)習(xí)算法的分析與驗證[J]. 王巖,唐杰. 中文信息學(xué)報. 2019(02)
[8]科研學(xué)術(shù)大數(shù)據(jù)的精準(zhǔn)服務(wù)架構(gòu)設(shè)計[J]. 謝靖,錢力,師洪波,孔貝貝,胡吉穎. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2019(01)
[9]異構(gòu)社交網(wǎng)絡(luò)用戶興趣挖掘方法[J]. 屠守中,閆洲,衛(wèi)玲蔚,朱小燕. 西安電子科技大學(xué)學(xué)報. 2019(02)
[10]開放互聯(lián)網(wǎng)中的學(xué)者畫像技術(shù)綜述[J]. 袁莎,唐杰,顧曉韜. 計算機(jī)研究與發(fā)展. 2018(09)
碩士論文
[1]基于用戶興趣模型和社團(tuán)挖掘的推薦方法研究[D]. 李鵬.蘭州大學(xué) 2019
[2]基于多源異構(gòu)大數(shù)據(jù)的學(xué)者用戶畫像關(guān)鍵技術(shù)研究[D]. 溫昂展.華南理工大學(xué) 2018
[3]融入社交網(wǎng)絡(luò)信息的DIT用戶偏好預(yù)測模型[D]. 張長紅.浙江工商大學(xué) 2018
本文編號:2941708
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/2941708.html
最近更新
教材專著