天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

面向社交站點的雙語知識圖譜構建方法的研究

發(fā)布時間:2020-05-29 00:07
【摘要】:隨著語義網的不斷發(fā)展,由數(shù)百億RDF三元組構成的相互鏈接的不同類型的數(shù)據(jù)集在萬維網中發(fā)布,這些數(shù)據(jù)集又稱為知識圖譜,是輔助語義搜索、問答系統(tǒng)、情報分析等眾多智能應用的重要基礎資源。因此,構建知識圖譜已成為學術界與工業(yè)界共同關注的研究課題。目前已存在較多關于知識圖譜構建方法的研究工作,但是這些工作并未全面關注一種非常重要的知識挖掘來源,即萬維網中不同類型的社交站點,包括電子商務、百科、問答、博客、游戲、旅行等站點。與此同時,隨著信息全球化的發(fā)展,跨語言知識對齊已成為支撐眾多跨語言應用(如跨語言信息檢索、跨語言語義標注等)的關鍵技術。然而,由于英文是世界上使用國家數(shù)最多的語言,所以在現(xiàn)有的多語言知識圖譜中,英文知識(包括概念、實例、三元組)的數(shù)量始終占絕對主導地位,而其他語言的知識相對較少是跨語言知識對齊的主要障礙之一。因此,如何針對任意給定的兩種語言有效地構建雙語知識圖譜,即構建每種語言對應的知識圖譜并進行跨語言知識對齊是亟需探索的研究方向,而現(xiàn)有的相關工作也僅在百科站點中研究如何構建雙語知識圖譜;谏鲜鲇懻,本文選擇研究面向社交站點的雙語知識圖譜構建的方法。由于社交站點中存在大量的由分類構成的層次分類體系及標簽構成的分眾分類系統(tǒng),且這些分類與標簽均表示概念,所以采用自頂向下地從模式層到實例層的雙語知識圖譜的構建方式,即首先嘗試挖掘社交站點中概念之間的關系,該任務在本文中又稱為模式知識挖掘,而已有的方法依賴于特定語言的特征與規(guī)則,不具有語言通用性?紤]到跨語言知識對齊是雙語知識圖譜構建的重點工作之一,本文將跨語言概念匹配作為第二項任務,但現(xiàn)有的方法嚴重依賴于翻譯后的字符串相似度與特定的領域信息,導致其不具有領域通用性且匹配效果往往不佳。本文的第三項任務旨在利用實例類別推斷技術,為雙語知識圖譜引入實例知識,而現(xiàn)有工作同樣依賴于特定語言的規(guī)則,所以也不具備語言通用性。因此,為了克服上述三項任務的問題,本文主要進行如下研究:1)在模式知識挖掘方面,提出一種新的結合機器學習與規(guī)則的方法,其中將規(guī)則嵌入到機器學習的過程中。該方法不涉及任何特定語言的特征與規(guī)則,從而達成各語言通用的目標。在實驗中,將該方法分別應用于中英文社交站點中的模式知識挖掘,其在測試數(shù)據(jù)集上的查準率、查全率、F1值均優(yōu)于其他基準對比方法,并且能夠生成大規(guī)模、高質量的中英文模式知識。2)在跨語言概念匹配方面,提出一種新的基于雙語主題模型的方法,其中包含兩種新的雙語主題模型,利用任意一個模型均可學習得到不同語言概念的向量表示,最終通過向量相似度決定不同語言概念之間的相似程度。該方法不涉及任何特定的領域信息,從而達成各領域通用的目標。實驗結果表明,此方法在兩種中英文層次分類體系上的查準率@1與MRR均優(yōu)于其他基準對比方法。3)在實例類別推斷方面,提出一種新的基于隨機游走模型的方法,在抽取得到的實例、屬性、概念組成的圖上進行隨機游走以計算某個概念是給定實例的類別的概率。該方法不涉及任何特定語言的規(guī)則,從而達成各語言通用的目標。在實驗中,將該方法分別應用于中英文維基百科中的實例類別推斷,不僅其在測試數(shù)據(jù)集上的查準率、查全率、F1值均優(yōu)于現(xiàn)有工作,而且能夠生成大規(guī)模、高質量的中英文實例類別知識。
【學位授予單位】:東南大學
【學位級別】:博士
【學位授予年份】:2018
【分類號】:TP391.1;TP181

【相似文獻】

相關期刊論文 前10條

1 王宏理;;水稻葉綠體基因文庫及物理圖譜構建達到國際先進水平[J];今日科技;1988年03期

2 彭海;張靜;;兩種基因組甲基圖譜構建技術評介[J];江漢大學學報(自然科學版);2011年03期

3 陳優(yōu)敏;;知識圖譜構建方法探究[J];中國新通信;2019年05期

4 顧志良,周勤宣;雞基因圖譜構建的現(xiàn)狀[J];中國畜牧雜志;1997年03期

5 ;RFLP圖譜構建及其用于高梁種質的改良[J];國外農學-雜糧作物;1995年04期

6 王穎;錢力;謝靖;常志軍;孔貝貝;;科技大數(shù)據(jù)知識圖譜構建模型與方法研究[J];數(shù)據(jù)分析與知識發(fā)現(xiàn);2019年01期

7 徐磊;人類基因組表達圖譜構建的進展[J];國外醫(yī)學.遺傳學分冊;1996年06期

8 戴繼軍;;初中數(shù)學知識圖譜構建研究[J];數(shù)學大世界(中旬);2018年05期

9 王通;艾中良;張先國;;基于深度學習的威脅情報知識圖譜構建技術[J];計算機與現(xiàn)代化;2018年12期

10 田曉;劉勇超;王婧;孟巍;林曉蘭;;電網公司客戶服務知識圖譜構建的應用價值[J];山東電力技術;2015年12期

相關會議論文 前3條

1 李博;江錫兵;張德強;張志毅;;毛白楊未成熟木質部轉錄組圖譜構建[A];第六屆全國林木遺傳育種大會論文集[C];2008年

2 張文英;Bianca Büttner;Gretel Schulze-Buxloh;Christian Jung;Andreas Müller;;與甜菜抽薹基因緊密連鎖標記篩選及物理圖譜構建[A];2009年中國作物學會學術年會論文摘要集[C];2009年

3 唐敏強;張園園;胡鳴;劉越英;程曉暉;童超波;黃軍艷;劉勝毅;;甘藍型油菜單體型圖譜構建及株高性狀全基因組關聯(lián)分析[A];中國作物學會油料作物專業(yè)委員會第八次會員代表大會暨學術年會綜述與摘要集[C];2018年

相關重要報紙文章 前2條

1 記者 胡其峰 通訊員 李海芬;黃瓜全基因組遺傳變異圖譜構建完成[N];光明日報;2013年

2 本報記者 史俊斌 通訊員 張琳;挑戰(zhàn)小麥基因“珠穆朗瑪峰”[N];科技日報;2019年

相關博士學位論文 前3條

1 吳天星;面向社交站點的雙語知識圖譜構建方法的研究[D];東南大學;2018年

2 李新龍;中醫(yī)師辨證論治失眠癥知識圖譜構建方法研究[D];中國中醫(yī)科學院;2018年

3 李博;毛白楊與毛新楊轉錄組圖譜構建及若干性狀的遺傳學聯(lián)合分析[D];北京林業(yè)大學;2009年

相關碩士學位論文 前10條

1 肖娜;基于自然語言處理的能源電池領域的知識圖譜構建[D];青島理工大學;2018年

2 劉衛(wèi)東;面向多元空間大數(shù)據(jù)的知識圖譜構建及其核心特征提取方法研究[D];上海大學;2018年

3 廖盼;基于多方法融合的學科知識圖譜構建研究[D];湖北工業(yè)大學;2018年

4 赫中翮;面向中文知識圖譜構建的知識抽取方法研究與實現(xiàn)[D];國防科學技術大學;2017年

5 宮云寶;面向知識圖譜構建的知識驗證方法研究[D];國防科學技術大學;2016年

6 劉敏;基于專業(yè)領域文獻的信息抽取與新知識發(fā)現(xiàn)系統(tǒng)研究與應用[D];山東大學;2018年

7 鐘亮;基于中文百科的初中數(shù)學學科知識圖譜構建與應用[D];江西財經大學;2018年

8 林煬平;文物知識圖譜構建與檢索關鍵技術研究與實現(xiàn)[D];浙江大學;2017年

9 孫孝邦;中國人軀干部位可變形統(tǒng)計圖譜構建研究[D];大連理工大學;2017年

10 郭芳;基于眾包的教育知識圖譜構建與研究[D];鄭州大學;2017年



本文編號:2686049

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2686049.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶fa47c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com