天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

搜索引擎的情報(bào)感知與刻畫功能協(xié)同研究

發(fā)布時(shí)間:2021-09-24 19:24
  針對情報(bào)領(lǐng)域數(shù)據(jù)存在的收集、處理、感知、刻畫困難等問題,提出了一種以知識圖譜為刻畫結(jié)果的搜索引擎,從而感知領(lǐng)域細(xì)微的變化態(tài)勢;使用領(lǐng)域本體庫進(jìn)行知識抽取及挖掘,構(gòu)建了領(lǐng)域知識圖譜;采用基于知識圖譜的分布式索引的動態(tài)構(gòu)建、分布式倒排索引查詢機(jī)制和智能排序算法等技術(shù),構(gòu)建了基于知識圖譜的檢索系統(tǒng),改善了傳統(tǒng)搜索引擎檢索結(jié)果內(nèi)容單一、召回率低的問題;實(shí)現(xiàn)了高效快速地提煉出可滿足情報(bào)人員需要的、可理解的、可利用的資源,從而為企業(yè)決策者提供數(shù)據(jù)支持。 

【文章來源】:北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019,34(06)

【文章頁數(shù)】:6 頁

【部分圖文】:

搜索引擎的情報(bào)感知與刻畫功能協(xié)同研究


系統(tǒng)整體設(shè)計(jì)框架

框架圖,知識圖,框架,實(shí)體


知識圖譜是指通過構(gòu)建實(shí)體、實(shí)體屬性及實(shí)體之間的語義關(guān)系而形成的知識網(wǎng)絡(luò)[2]。圖2為構(gòu)建知識圖譜的整體框架。首先,通過一系列自動或半自動的技術(shù)對半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行實(shí)體、實(shí)體關(guān)系及屬性信息抽取;然后,將抽取的知識與結(jié)構(gòu)化數(shù)據(jù)及第三方數(shù)據(jù)進(jìn)行實(shí)體消歧、共指消解,進(jìn)行知識融合;最后,對融合后得到的新知識進(jìn)行質(zhì)量評估,將合格的數(shù)據(jù)保存到知識庫中。整個(gè)構(gòu)建過程是一個(gè)迭代更新的過程,核心分為信息抽取、知識融合及知識加工3個(gè)階段。構(gòu)建知識圖譜,信息抽取是核心也是關(guān)鍵,利用領(lǐng)域本體庫來判斷抓取的數(shù)據(jù)是否是領(lǐng)域相關(guān)數(shù)據(jù),并從數(shù)據(jù)中抽取出相關(guān)實(shí)體的知識碎片,最后將知識碎片進(jìn)行融合形成領(lǐng)域知識。本文通過實(shí)驗(yàn)對比分析了5種知識抽取方法,如圖3所示。

方法,知識圖,實(shí)體,碎片


構(gòu)建知識圖譜,信息抽取是核心也是關(guān)鍵,利用領(lǐng)域本體庫來判斷抓取的數(shù)據(jù)是否是領(lǐng)域相關(guān)數(shù)據(jù),并從數(shù)據(jù)中抽取出相關(guān)實(shí)體的知識碎片,最后將知識碎片進(jìn)行融合形成領(lǐng)域知識。本文通過實(shí)驗(yàn)對比分析了5種知識抽取方法,如圖3所示。從圖3可看出基于本體庫的知識抽取方法比傳統(tǒng)的基于歸納學(xué)習(xí)[3-5]、基于自然語言處理[5]、基于視覺特征[6-8]和基于DOM樹[9-10]的抽取方法更準(zhǔn)確。本文通過本體庫進(jìn)行特征抽取得到的實(shí)體與實(shí)體間的關(guān)系以圖4知識圖譜的形式展示與存儲,應(yīng)用于搜索引擎,為搜索提供更全面更精準(zhǔn)的檢索結(jié)果。

【參考文獻(xiàn)】:
期刊論文
[1]情報(bào)感知的研究解析[J]. 王延飛,趙柯然,陳美華,劉記.  情報(bào)理論與實(shí)踐. 2018(08)
[2]一種倒排索引壓縮方法[J]. 白福均,高建瓴,李宛蓉,賀思云,肖紹武.  計(jì)算機(jī)應(yīng)用研究. 2019(01)
[3]Accessing Alignments of Ontologies via IoT Based on SKOS Data Model[J]. Xiulei Liu,Xia Hou,Junyang Yu,Ying Gao,Yue Zhang,Yingying Zhang.  中國通信. 2017(06)
[4]知識圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光.  計(jì)算機(jī)研究與發(fā)展. 2016(03)
[5]大數(shù)據(jù)環(huán)境下中小企業(yè)競爭情報(bào)系統(tǒng)模型構(gòu)建[J]. 王洪亮,張琪,朱延濤.  情報(bào)理論與實(shí)踐. 2015(07)
[6]大數(shù)據(jù)環(huán)境下的多源融合型競爭情報(bào)研究[J]. 化柏林,李廣建.  情報(bào)理論與實(shí)踐. 2015(04)
[7]基于改進(jìn)TF-IDF算法的情報(bào)關(guān)鍵詞提取方法[J]. 張瑾.  情報(bào)雜志. 2014(04)
[8]一種基于SVM和AdaBoost的Web實(shí)體信息抽取方法[J]. 孫明,陸春生,徐秀星,李慶忠,彭朝暉.  計(jì)算機(jī)應(yīng)用與軟件. 2013(04)
[9]大數(shù)據(jù):企業(yè)競爭情報(bào)的機(jī)遇、挑戰(zhàn)及對策研究[J]. 吳金紅,張飛,鞠秀芳.  情報(bào)雜志. 2013(01)
[10]大數(shù)據(jù)時(shí)代企業(yè)競爭情報(bào)研究的創(chuàng)新與發(fā)展[J]. 黃曉斌,鐘輝新.  圖書與情報(bào). 2012(06)

碩士論文
[1]基于知識圖譜的搜索引擎技術(shù)研究與應(yīng)用[D]. 邵領(lǐng).電子科技大學(xué) 2016



本文編號:3408310

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3408310.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶09aec***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com