基于中文百科的知識圖譜分類體系構建研究
本文關鍵詞:基于中文百科的知識圖譜分類體系構建研究
【摘要】:分類體系作為知識圖譜的骨干組成部分,對整個知識圖譜的易用性和連通性具有起到決定性的作用。隨著知識圖譜應用的日益廣泛,國內外都不斷涌現出優(yōu)秀的知識圖譜項目。如何為知識圖譜構建分類體系,是亟需解決的問題,這是一個非常有意義和挑戰(zhàn)的問題。在文中,我們提出了一套完善的為中文百科知識圖譜構建分類體系的方法。我們以百科詞條為實體,從百科頁面中抽取了詞條的相關信息,并把詞條的信息結構化為特征。我們從百科自有分類樹和詞條的分類標簽中抽取出了類目詞條,并根據實體詞條和類目詞條之間的關聯為類目生成了結構化特征。為了獲得分類體系中的subclass-of關系,我們采用了支持向量機模型(SVM)。首先構造出兩個類目之間的相關性特征作為輸入,用人工標注的數據訓練好的模型之后,再用模型判斷兩個類目之間是否存在subclass-of關系。對與instance-of關系的判斷,我們在加入subclass-of關系制約的基礎上還提出了兩種整數規(guī)劃的方法。整數規(guī)劃的方法除了考慮直接的instance-of關系特征外,還考慮到了類目之間的關聯結構。我們通過實驗證明了我們的方法在解決實際問題上獲得了令人滿意的結果。最后我們還嘗試了把整個分類體系構建算法放到迭代模型當中。在整個迭代的過程中,我們利用了subclass-of關系和instance-of關系的傳遞性,使得它們之間能夠相互制約同時相互提升。通過實驗數據,我們看到整個迭代模型達到了預期的效果,可以在此基礎上進行后續(xù)的研究。
【關鍵詞】:分類體系 知識圖譜 整數規(guī)劃
【學位授予單位】:浙江大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1
【目錄】:
- 摘要4-5
- Abstract5-11
- 第1章 緒論11-15
- 1.1 課題背景11-12
- 1.2 本文的研究工作12-13
- 1.3 本文的組織結構13-14
- 1.4 本章小結14-15
- 第2章 國內外研究現狀15-22
- 2.1 概述15-16
- 2.2 實體和類目的區(qū)別16-17
- 2.3 基于規(guī)則的is-a關系挖掘17-18
- 2.4 基于機器學習的is-a關系挖掘18-19
- 2.5 國內外知識圖譜的分類體系構建研究19-21
- 2.5.1 DBpedia19-20
- 2.5.2 YAGO20
- 2.5.3 Zhishi.me20
- 2.5.4 XLore20-21
- 2.5.5 知識魔方21
- 2.6 本章小結21-22
- 第3章 分類體系的上層構建22-33
- 3.1 實體的抽取和結構化22-23
- 3.2 類目的抽取和結構化23-24
- 3.3 Subclass-of關系判斷24-29
- 3.3.1 Subclass-of關系備選集生成24-25
- 3.3.2 支持向量機分類器25-27
- 3.3.3 實驗評估27-29
- 3.4 類目的篩選與融合29-31
- 3.5 本章小結31-33
- 第4章 分類體系的下層構建33-49
- 4.1 Instance-of關系備選集生成33-34
- 4.2 支持向量機分類器34-36
- 4.3 混合整數規(guī)劃方法36-39
- 4.4 非線性整數規(guī)劃方法39-41
- 4.5 實驗評估41-45
- 4.5.1 數據集41-42
- 4.5.2 評估方法42-43
- 4.5.3 結果分析43-45
- 4.6 參數優(yōu)化45-48
- 4.7 本章小結48-49
- 第5章 基于迭代模型的一體算法49-58
- 5.1 迭代模型50-51
- 5.2 Subclass-of關系判斷51
- 5.3 類目特征更新51-52
- 5.4 實驗評估52-57
- 5.4.1 數據集52-53
- 5.4.2 結果分析53-57
- 5.5 本章小結57-58
- 第6章 系統(tǒng)展示與總結展望58-68
- 6.1 CKB系統(tǒng)展示58-65
- 6.2 工作總結65-66
- 6.3 未來展望66-68
- 參考文獻68-71
- 攻讀碩士學位期間主要的研究成果71-72
- 致謝72
【相似文獻】
中國期刊全文數據庫 前10條
1 宋蓓玲;淺析構建網絡信息分類體系[J];情報雜志;2004年08期
2 羅德一;;農業(yè)網絡信息分類體系初探[J];農業(yè)圖書情報學刊;2010年08期
3 華勛基;;十九世紀以來科學分類體系的演變及其趨勢[J];圖書館學研究;1983年05期
4 夏南強;類書分類體系的發(fā)展演變[J];華中師范大學學報(人文社會科學版);2001年02期
5 劉延章;差異與改進:兩種分類體系[J];圖書館論壇;2002年05期
6 史學斌;網絡信息分類體系[J];圖書館;2002年02期
7 劉延章,謝琳惠;中文搜索引擎分類體系的特點、問題及其改進[J];鄭州大學學報(哲學社會科學版);2002年06期
8 史學斌;網絡信息分類體系[J];山東圖書館季刊;2002年01期
9 楊健,吳英梅;四庫分類體系中的小說歸屬芻議——從二十世紀編纂的幾種古籍書目談起[J];圖書館工作與研究;2003年04期
10 鄭慶勝,易曉陽;從新浪等網站看網絡信息分類體系的建立——兼論綜合性中文網站分類體系之建立[J];圖書館建設;2003年01期
中國重要會議論文全文數據庫 前10條
1 李琳;華薇娜;;美國工程信息村中的工程分類體系探析[A];中國索引學會第三次全國會員代表大會暨學術論壇論文集[C];2008年
2 房艷紅;;從“15+2”模式到課程應用性分類體系基礎上的多模式實踐教學[A];北京高教學會實驗室工作研究會2010年學術研討會論文集(上冊)[C];2010年
3 呂品;張萍;林森;顧鄉(xiāng);;關于改革我國排球教材技戰(zhàn)術分類體系的研究[A];第七屆全國體育科學大會論文摘要匯編(一)[C];2004年
4 王余沛;劉梅姜;;新一輪土地利用總體規(guī)劃修編土地分類體系的銜接[A];2008年中國土地學會學術年會論文集[C];2008年
5 王余沛;劉梅姜;;新一輪土地利用總體規(guī)劃修編土地分類體系的銜接[A];科學合理用地 人地和諧相處2008年學術年會論文集[C];2008年
6 孫劍飛;;國際洛迦諾分類體系在我國的研究與實踐[A];發(fā)展知識產權服務業(yè),支撐創(chuàng)新型國家建設-2012年中華全國專利代理人協(xié)會年會第三屆知識產權論壇論文選編(第二部分)[C];2011年
7 姜永志;;西方心理學理論分類體系的反思與建構[A];心理學與創(chuàng)新能力提升——第十六屆全國心理學學術會議論文集[C];2013年
8 廖遠濤;肖榮波;艾勇軍;;城鄉(xiāng)一體的綠地分類體系研究[A];城市規(guī)劃和科學發(fā)展——2009中國城市規(guī)劃年會論文集[C];2009年
9 范敏;許志慶;朱寧;;CPC分類體系的特點和檢索字段分析[A];2014年中華全國專利代理人協(xié)會年會第五屆知識產權論壇論文(第二部分)[C];2014年
10 王善平;;建設科學的科技期刊論文主題-分類體系[A];學報編輯論叢(第十三集)[C];2005年
中國重要報紙全文數據庫 前7條
1 本報記者 彭嘉陵;北美行業(yè)分類體系[N];中國信息報;2013年
2 忠民;透視新土地分類體系[N];中國國土資源報;2001年
3 國家知識產權局專利局機械發(fā)明審查部 劉建;美國為何選用專利分類新體系?[N];中國知識產權報;2013年
4 任曉玲;歐洲專利局即將推出清潔能源專利新分類體系[N];中國高新技術產業(yè)導報;2010年
5 本報記者 魏瑋;順應行業(yè)發(fā)展 細化基金分類體系[N];中國證券報;2009年
6 中國建筑標準設計研究院 李昭君;中國國家BIM標準探究——分類與編碼勢在必行[N];中國建設報;2013年
7 陳連喜;“六大管理體系”激活用人機制[N];中國人口報;2006年
中國碩士學位論文全文數據庫 前9條
1 樓仁杰;基于中文百科的知識圖譜分類體系構建研究[D];浙江大學;2016年
2 羅德一;農業(yè)分類搜索引擎分類體系研究[D];南京農業(yè)大學;2007年
3 劉梅;村鎮(zhèn)教育資源分類體系的研究與應用[D];華中師范大學;2011年
4 侯永春;建設項目集成化信息分類體系研究[D];東南大學;2003年
5 黃弋蕓;災害應急管理信息資源分類體系研究[D];南昌大學;2013年
6 吳禮志;《中國網絡信息分類法》編制研究[D];武漢大學;2004年
7 呂峰;《城鄉(xiāng)規(guī)劃法》背景下的城鄉(xiāng)用地分類研究[D];華中科技大學;2011年
8 陳瑞;基于多源POI數據的匹配融合方法研究[D];蘭州交通大學;2014年
9 董桂平;現代漢語義類詞典分類體系考察與研究[D];魯東大學;2012年
,本文編號:1124732
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1124732.html