面向科技文獻(xiàn)作者檢索的人名消歧方法研究
【文章頁數(shù)】:72 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-1作者人名消歧輔助構(gòu)建知識(shí)圖譜
上海師范大學(xué)碩士學(xué)位論文第1章緒論1第1章緒論1.1研究背景及意義隨著信息技術(shù)和網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,互聯(lián)網(wǎng)正邁向以知識(shí)互聯(lián)為特征的“Web3.0”時(shí)代,知識(shí)互聯(lián)的目標(biāo)是實(shí)現(xiàn)人和機(jī)器都可理解的萬維網(wǎng),使得現(xiàn)在的知識(shí)網(wǎng)絡(luò)更加智能化[1-3]。因此,涉及科技、醫(yī)學(xué)、金融等各個(gè)領(lǐng)域的知識(shí)....
圖2-1Skip-gram模型的網(wǎng)絡(luò)結(jié)構(gòu)
上海師范大學(xué)碩士學(xué)位論文第2章文獻(xiàn)作者人名消歧相關(guān)理論11其中式2-12表示文本詞的TF-IDF權(quán)重ij,ij值越大,說明該詞i在文檔j中就越重要。式2-13是詞頻ijTF的計(jì)算公式,表示文本詞i在所有文檔中出現(xiàn)的頻率,用來衡量文本詞i對(duì)于不同文檔的區(qū)分能力,一般來說如果那個(gè)文檔....
圖2-2常見的聚類算法圖給出了常見的聚類算法,這里主要介紹基于劃分的聚類、基于密度的
上海師范大學(xué)碩士學(xué)位論文第2章文獻(xiàn)作者人名消歧相關(guān)理論13圖2-2常見的聚類算法圖2-2給出了常見的聚類算法,這里主要介紹基于劃分的聚類、基于密度的聚類這2種,主要原因是這兩種聚類算法應(yīng)用較為廣泛。尤其基于密度聚類算法不需要預(yù)先設(shè)定聚類簇?cái)?shù)k值,因此具備較好數(shù)據(jù)自適應(yīng)性,在人名消....
圖2-3k-means聚類算法流程
第2章文獻(xiàn)作者人名消歧相關(guān)理論上海師范大學(xué)碩士學(xué)位論文14圖2-3k-means聚類算法流程圖2-3給出了該算法的具體流程,K-means算法雖然具有計(jì)算速度快,原理簡(jiǎn)單清晰,但是該模型需要預(yù)先設(shè)定聚類簇?cái)?shù)。如何在不知道候選集具體可以分成幾個(gè)人的情況下實(shí)現(xiàn)聚類消歧才是人名消歧的主....
本文編號(hào):3925819
本文鏈接:http://sikaile.net/tushudanganlunwen/3925819.html