天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

多實(shí)體間多樣化關(guān)聯(lián)的搜索方法研究

發(fā)布時(shí)間:2020-09-04 21:03
   實(shí)體關(guān)聯(lián)搜索被應(yīng)用于許多領(lǐng)域,比如國家安全和生物信息學(xué)等。近年來,網(wǎng)絡(luò)中出現(xiàn)的圖結(jié)構(gòu)化的語義網(wǎng)數(shù)據(jù)促進(jìn)了實(shí)體關(guān)聯(lián)搜索的發(fā)展,這些數(shù)據(jù)提供了比那些隱藏在非結(jié)構(gòu)化文本中的數(shù)據(jù)更為明確的結(jié)構(gòu)化語義關(guān)聯(lián),便于計(jì)算機(jī)發(fā)現(xiàn)和處理。隨著語義網(wǎng)數(shù)據(jù)數(shù)量的急劇增長,成千上萬的語義關(guān)聯(lián)產(chǎn)生。用戶往往只想通過查看一些重要的、有價(jià)值的、包含盡可能多信息量的關(guān)聯(lián),來了解實(shí)體及其之間的關(guān)系。因此,需要進(jìn)行多實(shí)體間top-k關(guān)聯(lián)的搜索。多實(shí)體間top-k關(guān)聯(lián)的搜索返回一個(gè)包含k個(gè)語義關(guān)聯(lián)的列表,這k個(gè)關(guān)聯(lián)有關(guān)于這個(gè)查詢最大的打分和。實(shí)際上,top-k結(jié)果中的一些關(guān)聯(lián)可能是相似的,它們顯示了非常相近的語義,提供給用戶冗余的信息。多實(shí)體間多樣化top-k關(guān)聯(lián)的搜索不僅僅考慮語義關(guān)聯(lián)的打分,也考慮語義關(guān)聯(lián)的多樣性。為了進(jìn)行多實(shí)體間多樣化top-k關(guān)聯(lián)的搜索,三個(gè)問題需要被解決。第一,如何度量語義關(guān)聯(lián)的重要性,即如何對語義關(guān)聯(lián)進(jìn)行排序;第二,如何度量兩個(gè)語義關(guān)聯(lián)之間的相似度;第三,如何較快地搜索最優(yōu)的多樣化top-k語義關(guān)聯(lián)。本文針對這些問題進(jìn)行了探索,主要有以下兩個(gè)方面的貢獻(xiàn):1.設(shè)計(jì)了一種多實(shí)體間關(guān)聯(lián)排序的方法,排序原則是語義關(guān)聯(lián)的結(jié)構(gòu)大小和實(shí)體類型一致性,并基于該排序方法實(shí)現(xiàn)了一種多實(shí)體間top-k關(guān)聯(lián)的搜索方法。2.實(shí)現(xiàn)了多種多實(shí)體間多樣化top-k關(guān)聯(lián)的搜索方法,提出一種綜合考慮結(jié)構(gòu)和語義的新方法來度量語義關(guān)聯(lián)的相似性。
【學(xué)位單位】:南京大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TP391.3
【部分圖文】:

框架圖,框架,實(shí)體,搜索方法


本文著重研宄多實(shí)體間多樣化關(guān)聯(lián)的搜索方法,依次從多實(shí)體間關(guān)聯(lián)的排逡逑序、多實(shí)體間top-k關(guān)聯(lián)的搜索、多實(shí)體間多樣化top-k關(guān)聯(lián)的搜索三部分逐步逡逑展開,本文框架如圖1-4所示。本文有以下兩方面的貢獻(xiàn):逡逑?設(shè)計(jì)了一種多實(shí)體間關(guān)聯(lián)排序的方法,排序原則是語義關(guān)聯(lián)的大小和實(shí)體逡逑類型的一致性,實(shí)現(xiàn)了一種多實(shí)體間top-k關(guān)聯(lián)的搜索方法。用排序?qū)W習(xí)的逡逑方法驗(yàn)證現(xiàn)有八種排序方法的有效性,由此確定了排序原則并實(shí)現(xiàn)了多實(shí)逡逑體間top-k關(guān)聯(lián)的搜索方法。逡逑?實(shí)現(xiàn)了多種多實(shí)體間多樣化top-k關(guān)聯(lián)的搜索方法,并用較為豐富的實(shí)驗(yàn)來逡逑評估這些方法。提出一種綜合考慮結(jié)構(gòu)和語義的新方法度量語義關(guān)聯(lián)的相逡逑

關(guān)系圖,語義關(guān)聯(lián),數(shù)據(jù)集中,方法


邐第二章預(yù)備知識和相關(guān)工作逡逑M1NG方法搜索得到的最優(yōu)連通子圖能夠提供更多的信息量。圖2-2顯示了逡逑在YAGO數(shù)據(jù)集上,用MING方法對三個(gè)物理學(xué)家Niels邋Bohr、Max邋Planck和逡逑Albert邋Einstein進(jìn)行語義關(guān)聯(lián)搜索得到的最優(yōu)結(jié)果。逡逑Quantum—physicis卜—工邐M0ritz_Sch||ck逡逑Theoretical_physicist逡逑-邐'邐-NobeLPrize邋<hasW0n、Albert_Einstein逡逑A邋Nobel_Laureate_in__physics邋**逡逑圖2-2:在YAGO數(shù)據(jù)集中,用MING方法搜索得到的關(guān)于Niels邋Bohr、Max邋Planck和逡逑Albert邋Einstein的最優(yōu)語義關(guān)聯(lián)[13]逡逑SISP[12]的目標(biāo)同樣是在關(guān)系圖中搜索一個(gè)規(guī)模受限的最優(yōu)連通子圖。與逡逑CEPS方法、M1NG方法的不同點(diǎn)在于,其頂點(diǎn)“優(yōu)”的定義由兩方面決定:第逡逑一,基于PageRank得到頂點(diǎn)自身的重要性;第二,頂點(diǎn)與查詢實(shí)體之間的相逡逑關(guān)性,由頂點(diǎn)與查詢實(shí)體對應(yīng)的點(diǎn)之間的短路徑來度量。基于這兩點(diǎn)來評估搜逡逑索到的連通子圖的質(zhì)量,提出了邋PNR方法,使信息量的定義更可靠,返回的逡逑子圖更令人滿意。并實(shí)現(xiàn)了基于抽樣的Sampling方法和基于粒子群優(yōu)化算法逡逑(Particle邋Swarm邋Optimization,PSO)的SISP方法來快速搜索最優(yōu)連通子圖。SISP逡逑包含三個(gè)關(guān)鍵階段。在初始化階段

支持向量機(jī),準(zhǔn)確率,排序方法,分類算法


;C丨和;Cj*分別表示語義關(guān)聯(lián);c,.和七的用戶打分。逡逑于是可以用現(xiàn)有的分類算法來訓(xùn)練模型,比如SVM算法,其目標(biāo)分類函逡逑數(shù)為[V⑴-巧=如={±1},如圖3-3所示。實(shí)驗(yàn)中使用了五種分類算法,對逡逑訓(xùn)練數(shù)據(jù)進(jìn)行十折交叉驗(yàn)證。逡逑同時(shí),為了判斷3.1中每種排序方法是否有效,需要度量每個(gè)特征的重要逡逑程度,即每次刪去一個(gè)特征,然后進(jìn)行訓(xùn)練,觀察準(zhǔn)確率上升或者下降。如果逡逑準(zhǔn)確率下降,說明這個(gè)特征在排序中是有效的,可以用到后續(xù)排序方法設(shè)計(jì)逡逑中。若準(zhǔn)確率上升,說明這個(gè)特征在排序中無效,后續(xù)實(shí)驗(yàn)中不考慮該特征。逡逑

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 瞿輝;王菲菲;;基于多維語義關(guān)聯(lián)的學(xué)術(shù)文獻(xiàn)展示方法研究[J];情報(bào)雜志;2015年11期

2 何偉;楊小平;;基于詞間語義關(guān)聯(lián)性的本體擴(kuò)展[J];計(jì)算機(jī)應(yīng)用與軟件;2011年11期

3 胡金柱;舒江波;羅進(jìn)軍;;漢語復(fù)句中分句的語義關(guān)聯(lián)特征[J];語言文字應(yīng)用;2010年04期

4 車超;鄭曉軍;;基于語義關(guān)聯(lián)圖的詞義消歧方法[J];科研信息化技術(shù)與應(yīng)用;2014年04期

5 周偉;孫明;劉晚秋;譚振江;;基于云計(jì)算的滿語數(shù)字資源語義關(guān)聯(lián)模式研究[J];情報(bào)科學(xué);2019年08期

6 楊現(xiàn)民;余勝泉;張芳;;學(xué)習(xí)資源動(dòng)態(tài)語義關(guān)聯(lián)的設(shè)計(jì)與實(shí)現(xiàn)[J];中國電化教育;2013年01期

7 李超;王蘭成;;基于主題語義關(guān)聯(lián)的擴(kuò)展參照檢索[J];情報(bào)理論與實(shí)踐;2006年05期

8 金國棟;范煒;;卓越科學(xué)家數(shù)據(jù)語義關(guān)聯(lián)與搜索發(fā)現(xiàn)研究[J];數(shù)字圖書館論壇;2014年04期

9 陳辰;王璐;郝曉雪;;基于詞頻統(tǒng)計(jì)與語義關(guān)聯(lián)的京津冀協(xié)同發(fā)展研究熱點(diǎn)與前沿監(jiān)測研究[J];河北科技圖苑;2018年01期

10 康廷虎;吳晨靜;;情景間語義關(guān)系對語義關(guān)聯(lián)判斷的影響[J];心理與行為研究;2019年01期

相關(guān)會(huì)議論文 前10條

1 安延佩;許曉旭;王聰聰;唐衛(wèi)海;;學(xué)習(xí)內(nèi)容的語義關(guān)聯(lián)程度對協(xié)作記憶中錯(cuò)誤回憶的影響[A];中國心理學(xué)會(huì)發(fā)展心理專業(yè)委員會(huì)第十三屆學(xué)術(shù)年會(huì)摘要集[C];2015年

2 古新生;顧學(xué)春;沈鈞毅;;CIM—OSA DM CIMS環(huán)境下面向?qū)ο蟮恼Z義關(guān)聯(lián)數(shù)據(jù)模型[A];第九屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(上)[C];1990年

3 袁興宇;王挺;周會(huì)平;肖君;;以本體構(gòu)造中文信息過濾中的需求模型[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

4 萬菁;姬東鴻;任函;馮文賀;;漢語復(fù)合名詞短語特征結(jié)構(gòu)的標(biāo)注研究[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

5 王慧媛;隋潔;;語義關(guān)聯(lián)注意捕獲的右視野優(yōu)勢——來自ERP的證據(jù)[A];心理學(xué)與創(chuàng)新能力提升——第十六屆全國心理學(xué)學(xué)術(shù)會(huì)議論文集[C];2013年

6 宋t熝

本文編號:2812587


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2812587.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶45929***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com