面向金融領(lǐng)域的知識(shí)圖譜構(gòu)建及補(bǔ)全研究
發(fā)布時(shí)間:2021-12-18 02:38
全球范圍內(nèi)伴隨著云計(jì)算,大數(shù)據(jù),人工智能等新興技術(shù)的落地,互聯(lián)網(wǎng)的數(shù)據(jù)量每?jī)赡攴环?為了更好的分析及應(yīng)用互聯(lián)網(wǎng)數(shù)據(jù),國(guó)內(nèi)外學(xué)者及機(jī)構(gòu)提出知識(shí)圖譜概念。知識(shí)圖譜將客觀世界中概念,實(shí)體及其關(guān)系以結(jié)構(gòu)化的形式呈現(xiàn),以更直觀讓人類認(rèn)識(shí)世界的形式將互聯(lián)網(wǎng)的信息進(jìn)行表達(dá),在管理、組織及分析應(yīng)用互聯(lián)網(wǎng)信息上發(fā)揮出了巨大的作用。目前,知識(shí)圖譜已經(jīng)在醫(yī)療、商業(yè)及交通等行業(yè)領(lǐng)域得到了較好的應(yīng)用且取得了良好的效果。但是目前針對(duì)金融行業(yè)的知識(shí)圖譜相對(duì)較少,很多公司的金融圖譜因信息的私密性不對(duì)外開(kāi)放且應(yīng)用時(shí)發(fā)現(xiàn)有隱含的關(guān)系尚未連接,因此在知識(shí)圖譜構(gòu)建完成后,后續(xù)的補(bǔ)全工作也變的尤為重要。經(jīng)典的知識(shí)圖譜補(bǔ)全模型往往只關(guān)注知識(shí)圖譜中相鄰的兩個(gè)節(jié)點(diǎn)所組成的路徑,忽略了節(jié)點(diǎn)與其它多個(gè)節(jié)點(diǎn)所組成的關(guān)系路徑所帶來(lái)的信息。本文針對(duì)金融圖譜缺乏問(wèn)題及知識(shí)圖譜補(bǔ)全模型的缺陷,先利用金融股票及企業(yè)信息進(jìn)行金融知識(shí)圖譜構(gòu)建,一方面以金融股票等信息為例描述金融知識(shí)圖譜的構(gòu)建方法,另一方面為后期知識(shí)補(bǔ)全任務(wù)提供基礎(chǔ)數(shù)據(jù)集,然后提出基于組合關(guān)系路徑的知識(shí)圖譜補(bǔ)全方法對(duì)金融知識(shí)圖譜進(jìn)行補(bǔ)全任務(wù)驗(yàn)證。主要工作包括:1.基于金融知識(shí)圖譜的缺乏...
【文章來(lái)源】:青島大學(xué)山東省
【文章頁(yè)數(shù)】:54 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
知識(shí)圖譜檢索示例
青島大學(xué)碩士學(xué)位論文7第二章知識(shí)圖譜構(gòu)建流程及補(bǔ)全方法概述知識(shí)圖譜將客觀世界中概念,實(shí)體及其關(guān)系以結(jié)構(gòu)化的形式進(jìn)行表示,通過(guò)知識(shí)圖譜,可以實(shí)現(xiàn)概念鏈接替換網(wǎng)頁(yè)鏈接,支持用戶按相應(yīng)的主題或者概念檢索,從而實(shí)現(xiàn)真正的語(yǔ)義檢索。因?yàn)樵谥R(shí)圖譜中,自頂向下的建模方式需要領(lǐng)域?qū)<业膮⑴c,因此在本章中,我們主要介紹自底向上的基本知識(shí)。自底向上構(gòu)建方法是一個(gè)不斷更新的過(guò)程。主要包括三個(gè)步驟:1)知識(shí)抽取,從所獲取的數(shù)據(jù)信息中抽取有價(jià)值的實(shí)體,屬性及關(guān)系;2)知識(shí)融合,將獲得的新知識(shí)進(jìn)行融合或者鏈接,消除歧義;3)知識(shí)存儲(chǔ),對(duì)于經(jīng)過(guò)融合的知識(shí),經(jīng)過(guò)評(píng)估后存儲(chǔ)到相應(yīng)的數(shù)據(jù)庫(kù)以支持后續(xù)的查詢及計(jì)算工作。2.1知識(shí)圖譜構(gòu)建流程2.1.1知識(shí)抽取知識(shí)圖譜構(gòu)建的首要工作即是知識(shí)抽取,知識(shí)圖譜中的知識(shí)來(lái)源于圖2.1所示的結(jié)構(gòu)化,半結(jié)構(gòu)化和非結(jié)構(gòu)化的信息資源,其中的關(guān)鍵問(wèn)題是如何運(yùn)用知識(shí)抽取技術(shù)從獲得的信息資源中提取出計(jì)算機(jī)可理解和計(jì)算的結(jié)構(gòu)化數(shù)據(jù),以進(jìn)行下一步的分析及利用。知識(shí)抽取任務(wù)細(xì)分為實(shí)體抽取,屬性抽取,關(guān)系抽取三大部分。圖2.1知識(shí)獲取示意圖2.1.1.1實(shí)體抽取實(shí)體抽。簩(shí)體抽取又稱為命名實(shí)體識(shí)別(NamedEntityRecognition,)[23],是將專有名
青島大學(xué)碩士學(xué)位論文102.1.3知識(shí)存儲(chǔ)知識(shí)存儲(chǔ)是對(duì)所獲得的知識(shí)進(jìn)行存儲(chǔ)以支持后期的查詢及計(jì)算,知識(shí)存儲(chǔ)的對(duì)象包括基本屬實(shí)體知識(shí)、屬性知識(shí)、關(guān)聯(lián)知識(shí)等。從存儲(chǔ)結(jié)構(gòu)劃分,知識(shí)存儲(chǔ)分為基于表結(jié)構(gòu)的存儲(chǔ)和基于圖結(jié)構(gòu)的存儲(chǔ)[40],如圖2.2所示。圖2.2知識(shí)存儲(chǔ)方式基于表結(jié)構(gòu)的存儲(chǔ),是指對(duì)知識(shí)圖譜中的數(shù)據(jù)進(jìn)行存儲(chǔ)時(shí)與以往常規(guī)數(shù)據(jù)類似,采用數(shù)據(jù)表進(jìn)行存儲(chǔ)。不同的表結(jié)構(gòu)具有不同的設(shè)計(jì)規(guī)則,如常見(jiàn)的關(guān)系數(shù)據(jù)庫(kù)。這些表結(jié)構(gòu)表示數(shù)據(jù)簡(jiǎn)單直接,易于理解,但整個(gè)知識(shí)圖譜的數(shù)據(jù)存儲(chǔ)在一張表,導(dǎo)致單表的規(guī)模太大,相應(yīng)的增刪改查操作開(kāi)銷也較大;趫D結(jié)構(gòu)的存儲(chǔ)即使用圖模型描述和存儲(chǔ)圖譜數(shù)據(jù),這種方式能夠直接反應(yīng)圖譜的內(nèi)部結(jié)構(gòu),有利于知識(shí)的查詢,結(jié)合圖計(jì)算算法,進(jìn)行知識(shí)的深度挖掘與推理。目前業(yè)界公認(rèn)的圖模型有3種,分別是屬性圖(PropertyGraph)、資源描述框架(RDF)、三元組超圖(HyperGraph),其中屬性圖和資源描述框架已廣泛應(yīng)用到多個(gè)圖數(shù)據(jù)庫(kù)產(chǎn)品中。屬性圖或帶標(biāo)簽的屬性圖(Labeled-PropertyGraph),由頂點(diǎn)、邊,屬性和標(biāo)簽構(gòu)成,頂點(diǎn)和標(biāo)簽也可以有標(biāo)簽。常見(jiàn)的屬性圖結(jié)構(gòu)如圖2.3所示
本文編號(hào):3541458
【文章來(lái)源】:青島大學(xué)山東省
【文章頁(yè)數(shù)】:54 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
知識(shí)圖譜檢索示例
青島大學(xué)碩士學(xué)位論文7第二章知識(shí)圖譜構(gòu)建流程及補(bǔ)全方法概述知識(shí)圖譜將客觀世界中概念,實(shí)體及其關(guān)系以結(jié)構(gòu)化的形式進(jìn)行表示,通過(guò)知識(shí)圖譜,可以實(shí)現(xiàn)概念鏈接替換網(wǎng)頁(yè)鏈接,支持用戶按相應(yīng)的主題或者概念檢索,從而實(shí)現(xiàn)真正的語(yǔ)義檢索。因?yàn)樵谥R(shí)圖譜中,自頂向下的建模方式需要領(lǐng)域?qū)<业膮⑴c,因此在本章中,我們主要介紹自底向上的基本知識(shí)。自底向上構(gòu)建方法是一個(gè)不斷更新的過(guò)程。主要包括三個(gè)步驟:1)知識(shí)抽取,從所獲取的數(shù)據(jù)信息中抽取有價(jià)值的實(shí)體,屬性及關(guān)系;2)知識(shí)融合,將獲得的新知識(shí)進(jìn)行融合或者鏈接,消除歧義;3)知識(shí)存儲(chǔ),對(duì)于經(jīng)過(guò)融合的知識(shí),經(jīng)過(guò)評(píng)估后存儲(chǔ)到相應(yīng)的數(shù)據(jù)庫(kù)以支持后續(xù)的查詢及計(jì)算工作。2.1知識(shí)圖譜構(gòu)建流程2.1.1知識(shí)抽取知識(shí)圖譜構(gòu)建的首要工作即是知識(shí)抽取,知識(shí)圖譜中的知識(shí)來(lái)源于圖2.1所示的結(jié)構(gòu)化,半結(jié)構(gòu)化和非結(jié)構(gòu)化的信息資源,其中的關(guān)鍵問(wèn)題是如何運(yùn)用知識(shí)抽取技術(shù)從獲得的信息資源中提取出計(jì)算機(jī)可理解和計(jì)算的結(jié)構(gòu)化數(shù)據(jù),以進(jìn)行下一步的分析及利用。知識(shí)抽取任務(wù)細(xì)分為實(shí)體抽取,屬性抽取,關(guān)系抽取三大部分。圖2.1知識(shí)獲取示意圖2.1.1.1實(shí)體抽取實(shí)體抽。簩(shí)體抽取又稱為命名實(shí)體識(shí)別(NamedEntityRecognition,)[23],是將專有名
青島大學(xué)碩士學(xué)位論文102.1.3知識(shí)存儲(chǔ)知識(shí)存儲(chǔ)是對(duì)所獲得的知識(shí)進(jìn)行存儲(chǔ)以支持后期的查詢及計(jì)算,知識(shí)存儲(chǔ)的對(duì)象包括基本屬實(shí)體知識(shí)、屬性知識(shí)、關(guān)聯(lián)知識(shí)等。從存儲(chǔ)結(jié)構(gòu)劃分,知識(shí)存儲(chǔ)分為基于表結(jié)構(gòu)的存儲(chǔ)和基于圖結(jié)構(gòu)的存儲(chǔ)[40],如圖2.2所示。圖2.2知識(shí)存儲(chǔ)方式基于表結(jié)構(gòu)的存儲(chǔ),是指對(duì)知識(shí)圖譜中的數(shù)據(jù)進(jìn)行存儲(chǔ)時(shí)與以往常規(guī)數(shù)據(jù)類似,采用數(shù)據(jù)表進(jìn)行存儲(chǔ)。不同的表結(jié)構(gòu)具有不同的設(shè)計(jì)規(guī)則,如常見(jiàn)的關(guān)系數(shù)據(jù)庫(kù)。這些表結(jié)構(gòu)表示數(shù)據(jù)簡(jiǎn)單直接,易于理解,但整個(gè)知識(shí)圖譜的數(shù)據(jù)存儲(chǔ)在一張表,導(dǎo)致單表的規(guī)模太大,相應(yīng)的增刪改查操作開(kāi)銷也較大;趫D結(jié)構(gòu)的存儲(chǔ)即使用圖模型描述和存儲(chǔ)圖譜數(shù)據(jù),這種方式能夠直接反應(yīng)圖譜的內(nèi)部結(jié)構(gòu),有利于知識(shí)的查詢,結(jié)合圖計(jì)算算法,進(jìn)行知識(shí)的深度挖掘與推理。目前業(yè)界公認(rèn)的圖模型有3種,分別是屬性圖(PropertyGraph)、資源描述框架(RDF)、三元組超圖(HyperGraph),其中屬性圖和資源描述框架已廣泛應(yīng)用到多個(gè)圖數(shù)據(jù)庫(kù)產(chǎn)品中。屬性圖或帶標(biāo)簽的屬性圖(Labeled-PropertyGraph),由頂點(diǎn)、邊,屬性和標(biāo)簽構(gòu)成,頂點(diǎn)和標(biāo)簽也可以有標(biāo)簽。常見(jiàn)的屬性圖結(jié)構(gòu)如圖2.3所示
本文編號(hào):3541458
本文鏈接:http://sikaile.net/guanlilunwen/bankxd/3541458.html
最近更新
教材專著