天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類博士論文 >

知識(shí)圖譜的擴(kuò)展與檢錯(cuò)關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2021-10-31 09:49
  知識(shí)圖譜作為當(dāng)今最有影響力的數(shù)據(jù)共享源與知識(shí)解釋工具,其重要程度不言而喻。如今在大數(shù)據(jù)環(huán)境下,隨著事物的快速演變,知識(shí)圖譜的擴(kuò)展與檢錯(cuò)工作成為了研究熱點(diǎn)之一。知識(shí)圖譜擴(kuò)展與檢錯(cuò)的核心任務(wù)可細(xì)分為兩個(gè)方面,即對(duì)外部知識(shí)的理解與對(duì)自身內(nèi)部知識(shí)的推理。因此,本文將分別介紹對(duì)外部數(shù)據(jù)源進(jìn)行解析時(shí)遇到的困難與對(duì)自身內(nèi)部知識(shí)進(jìn)行推理時(shí)面臨的挑戰(zhàn),并通過(guò)提出行之有效的解決方案來(lái)克服研究?jī)?nèi)容中的難點(diǎn)。論文主要的研究?jī)?nèi)容與貢獻(xiàn)如下:1.基于集體推理的萬(wàn)維網(wǎng)表格語(yǔ)義理解與實(shí)體擴(kuò)展:傳統(tǒng)的集合相似度匹配方法無(wú)法對(duì)無(wú)重疊元素的兩個(gè)集合進(jìn)行匹配。由于知識(shí)圖譜的不完整性與萬(wàn)維網(wǎng)內(nèi)容的多樣性,萬(wàn)維網(wǎng)表格與知識(shí)圖譜中存在很多語(yǔ)義相似卻無(wú)法匹配的列與類別。另外,較少的重疊元素還會(huì)導(dǎo)致低質(zhì)量的列類匹配結(jié)果。因此,本文提出了一個(gè)全局集體推理框架來(lái)推理未知列的語(yǔ)義類別,同時(shí)還能夠大幅度提高列類匹配的Top-k質(zhì)量,尤其是Top-1的質(zhì)量。另外,本文設(shè)計(jì)了一套有效的列語(yǔ)義匹配模型,其中包括了對(duì)列的特征抽取以及訓(xùn)練數(shù)據(jù)的自動(dòng)生成方法。此外,考慮到數(shù)據(jù)集的規(guī)模,還提出了三種推理策略來(lái)提升整體的推理效率。最后,本文采用眾包對(duì)列類匹配... 

【文章來(lái)源】:清華大學(xué)北京市 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:99 頁(yè)

【學(xué)位級(jí)別】:博士

【部分圖文】:

知識(shí)圖譜的擴(kuò)展與檢錯(cuò)關(guān)鍵技術(shù)研究


圖1.2典型知識(shí)屢譜示例??

模塊圖,知識(shí)圖,內(nèi)容,萬(wàn)維網(wǎng)


?第1拿緒論???S??/?strr?趨??Semi-structured??^^^^^^Unstructured?Data??^?^?yA?Knowledge?Knowledge?Knowledge??Relational?Tables?/?Matching?Extraction?Representation??^??Knowledge?Quality??Knowledge?Graph?Inference?Evaluation??圖1.4知識(shí)圖譜的維護(hù)流程圖??識(shí)推理模塊則是通過(guò)對(duì)已構(gòu)建的知識(shí)圖譜內(nèi)容進(jìn)行分析與推理,并進(jìn)一步發(fā)現(xiàn)其??中缺失或錯(cuò)誤的知識(shí)內(nèi)容,從而達(dá)到知識(shí)圖譜補(bǔ)全與檢錯(cuò)的目的。??1.1.1基于集體推理的萬(wàn)維網(wǎng)表格語(yǔ)義理解與實(shí)體擴(kuò)展??隨霞S聯(lián)網(wǎng)的迅猛發(fā)展,萬(wàn)維網(wǎng)上產(chǎn)生了各式各樣的數(shù)據(jù)種類,其格式包括??文本、表格、列表、圖片、音頻與視頻等J余此之外,各類數(shù)據(jù)的規(guī)模更是呈現(xiàn)出??爆炸式的增長(zhǎng)趨勢(shì),萁中表格數(shù)據(jù)由于?萁良好的結(jié)構(gòu)化性質(zhì),使得其易于應(yīng)用于??知識(shí)抽娶數(shù)據(jù)挖掘等領(lǐng)域的相關(guān)任務(wù)。因此,萬(wàn)維網(wǎng)表格數(shù)據(jù)成為當(dāng)今最重要的??數(shù)據(jù)源之一[氣并引起了學(xué)術(shù)界[34-36]與:工業(yè)界[37—39]的共同關(guān)注。在2008年,谷??歌發(fā)表的一份研究報(bào)告133,401中指出在一百四十多億個(gè)原始萬(wàn)維網(wǎng)表格中抽取到了??-億五千四莨多萬(wàn)個(gè)關(guān)系型數(shù)據(jù)表格,雖然占比僅為總量的1.1%,但其絕對(duì)數(shù)釁??已達(dá)到可以為各種應(yīng)用提供服務(wù)的規(guī)模,例如知識(shí)圖譜擴(kuò)展[41’42]、搜索引擊犯441??與在線事務(wù)處理等I45^a因此,本文將通過(guò)萬(wàn)維網(wǎng)表格數(shù)據(jù)集的大規(guī)模列類匹配??任務(wù)對(duì)知識(shí)圖譜中缺失的實(shí)體進(jìn)行了擴(kuò)

結(jié)構(gòu)圖,論文,結(jié)構(gòu)圖,萬(wàn)維網(wǎng)


?第1寧緒論???方I細(xì)T以非It輕易地與傳統(tǒng)的嵌入技術(shù)迸行融告.*如TransE、Trans.H、TransR和’??TransD等,來(lái)增強(qiáng)其預(yù)測(cè)結(jié)果^本文將在第4章中詳細(xì)介紹基于關(guān)系敏感嵌入式技??術(shù)的知識(shí)圖譜擴(kuò)展與檢錯(cuò)工作。??1.2主要研究?jī)?nèi)容與貢獻(xiàn)??大規(guī)模萬(wàn)維網(wǎng)表格數(shù)據(jù)集的I?基于人機(jī)結(jié)合的萬(wàn)維網(wǎng)表格??列類匹配與實(shí)體抽取?1?^?模式解析與知識(shí)抽取??CX?表格模式候選支持?々??實(shí)體-類別擴(kuò)^^?體-關(guān)系擴(kuò)展??國(guó)??知識(shí)圖譜??缺失關(guān)系擴(kuò)展II錯(cuò)誤關(guān)系糾錯(cuò)??基于知識(shí)圖譜嵌入式技術(shù)的知識(shí)推理??圖1.5論文結(jié)構(gòu)圖??圖1.5展示了本文的整體結(jié)構(gòu),其生要包含了以下三個(gè)工怍:???大規(guī)褸萬(wàn)維網(wǎng)表格數(shù)據(jù)集的列類匹配與實(shí)體抽。涸诖笠(guī)模萬(wàn)維網(wǎng)表格數(shù)據(jù)??集中,針對(duì)傳統(tǒng)方法無(wú)怯匹配到的列提ili?了一個(gè)全新的全局集體推理框架,??不僅可以有效地推理出未匹配列的語(yǔ)義類別來(lái)提高整體匹配結(jié)果的召調(diào)率,??而旦還可以大幅度改善已匹配列的準(zhǔn)確率,尤其是Top-1的匹配結(jié)果。最后,??通過(guò)利用眾包平臺(tái)來(lái)抽取出基寧列類E配結(jié)果的新實(shí)體,并將其擴(kuò)展到知識(shí)??圖譜也???基于人機(jī)結(jié)#的萬(wàn)維.網(wǎng)表格模式解析與知識(shí)抽。阂詸C(jī)器算法的生成結(jié)果作??為_礎(chǔ),通過(guò)進(jìn)一步深入研究人機(jī)結(jié)合技術(shù)來(lái)吏準(zhǔn)確地解析萬(wàn)維網(wǎng)表格的語(yǔ)??義模式,以達(dá)到抽取出高麵的全新知識(shí)來(lái)擴(kuò)展知識(shí)圖譜的內(nèi)容。為降低眾??包的成本代價(jià),首先靂要設(shè)計(jì)有效的機(jī)器算法來(lái)生成盡可能少且影響力較大??的候選集,即盡爆去除掉無(wú)意義的候選項(xiàng)來(lái)節(jié)省人力資源。然后,,簠點(diǎn)研究??了眾包任務(wù)分派算法來(lái)優(yōu)化問(wèn)題的選擇策略,以減少問(wèn)題的總數(shù)霉聞時(shí),??8??


本文編號(hào):3467912

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3467912.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶aca5c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com