自動化構(gòu)建的中文知識圖譜系統(tǒng)
本文關(guān)鍵詞:自動化構(gòu)建的中文知識圖譜系統(tǒng)
更多相關(guān)文章: 知識圖譜 網(wǎng)絡(luò)爬蟲 三元組文件 知識庫 圖數(shù)據(jù)庫
【摘要】:為解決當前中文知識圖譜構(gòu)建的準確率低、耗時長且需要大量人工參與的問題,提出一種端到端基于中文百科數(shù)據(jù)的完整中文知識圖譜自動化構(gòu)建解決方案,并在此基礎(chǔ)上開發(fā)實現(xiàn)了面向用戶的中文知識圖譜系統(tǒng)。在此方案中,通過自定義的網(wǎng)絡(luò)爬蟲,原始百科數(shù)據(jù)的詞條屬性以及相關(guān)的文本信息會不間斷地被抓取到本地系統(tǒng)中,并以帶擴展屬性的三元組形式保存。后端系統(tǒng)則自動通過圖數(shù)據(jù)庫Cayley以及MongoDB數(shù)據(jù)庫系統(tǒng),對三元組文件數(shù)據(jù)進行導(dǎo)入,轉(zhuǎn)換為龐大的知識圖譜系統(tǒng),從而在前端為用戶提供豐富的基于知識圖譜的應(yīng)用服務(wù)。通過與其他知識圖譜系統(tǒng)的比較,該方案在構(gòu)建時間上明顯減少,并且知識圖譜中的實體及關(guān)系數(shù)量總規(guī)模高于YAGO、知網(wǎng)(HowNet)和中文概念詞典等中文知識圖譜系統(tǒng)至少50%。
【作者單位】: 同濟大學(xué)電子與信息工程學(xué)院;
【關(guān)鍵詞】: 知識圖譜 網(wǎng)絡(luò)爬蟲 三元組文件 知識庫 圖數(shù)據(jù)庫
【基金】:國家973計劃項目(2014CB340404) 上海市科委科研計劃項目(14511108002)~~
【分類號】:TP311.13
【正文快照】: 0引言一個典型的知識圖譜通常包含著一系列概念、實例和關(guān)系[1],其為最有效的知識表達形式之一[2]。一些著名的知識圖譜包括Internet Movie Database、YAGO[3-4]、DBpedia[5-6]和Freebase[7]。近幾年來,大量的知識圖譜已經(jīng)被構(gòu)建起來,并且有關(guān)知識圖譜的話題也非常豐富,在工業(yè)
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 戚欣;;基于本體的主題網(wǎng)絡(luò)爬蟲設(shè)計[J];武漢理工大學(xué)學(xué)報;2009年03期
2 彭軻;廖聞劍;;基于瀏覽器服務(wù)的網(wǎng)絡(luò)爬蟲[J];硅谷;2009年04期
3 王江紅;朱麗君;李彩虹;;一種新型網(wǎng)絡(luò)爬蟲的設(shè)計與實現(xiàn)[J];微計算機信息;2010年03期
4 孫立偉;何國輝;吳禮發(fā);;網(wǎng)絡(luò)爬蟲技術(shù)的研究[J];電腦知識與技術(shù);2010年15期
5 楊靖韜;陳會果;;對網(wǎng)絡(luò)爬蟲技術(shù)的研究[J];科技創(chuàng)業(yè)月刊;2010年10期
6 于成龍;于洪波;;網(wǎng)絡(luò)爬蟲技術(shù)研究[J];東莞理工學(xué)院學(xué)報;2011年03期
7 李志義;;網(wǎng)絡(luò)爬蟲的優(yōu)化策略探略[J];現(xiàn)代情報;2011年10期
8 焦賽美;;網(wǎng)絡(luò)爬蟲技術(shù)的研究[J];瓊州學(xué)院學(xué)報;2011年05期
9 宋海洋;劉曉然;錢?;;一種新的主題網(wǎng)絡(luò)爬蟲爬行策略[J];計算機應(yīng)用與軟件;2011年11期
10 王娟;吳金鵬;;網(wǎng)絡(luò)爬蟲的設(shè)計與實現(xiàn)[J];軟件導(dǎo)刊;2012年04期
中國重要會議論文全文數(shù)據(jù)庫 前4條
1 夏詔杰;郭力;李曉霞;;化學(xué)主題網(wǎng)絡(luò)爬蟲的研究[A];第十屆全國計算(機)化學(xué)學(xué)術(shù)會議論文摘要集[C];2009年
2 李楠;谷利澤;鈕心忻;;用于XSS掃描的網(wǎng)絡(luò)爬蟲的設(shè)計與實現(xiàn)[A];2010年全國通信安全學(xué)術(shù)會議論文集[C];2010年
3 張軍;于浩;內(nèi)野寬治;;UGC中產(chǎn)品評論信息的挖掘[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
4 徐劍;柯貴明;;網(wǎng)絡(luò)爬蟲技術(shù)在搜索引擎中的應(yīng)用[A];全國第21屆計算機技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2010)暨全國第2屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會議論文集[C];2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 陶俊文;基于Heritrix框架的專業(yè)鎮(zhèn)信息網(wǎng)絡(luò)爬蟲系統(tǒng)[D];華南理工大學(xué);2015年
2 馬漢超;基于主題網(wǎng)絡(luò)爬蟲的汽車行業(yè)多元信息web系統(tǒng)設(shè)計與實現(xiàn)[D];西南交通大學(xué);2015年
3 李威;基于交通流量圖的交通信息提取技術(shù)研究[D];長安大學(xué);2015年
4 朱嶸良;分布式并行環(huán)境下的網(wǎng)絡(luò)爬蟲研究[D];中央民族大學(xué);2015年
5 周思華;股票系統(tǒng)之熱門話題發(fā)現(xiàn)子系統(tǒng)的設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年
6 丁杰;基于網(wǎng)絡(luò)爬蟲的虛假網(wǎng)頁主動智能檢測[D];華北電力大學(xué);2015年
7 唐華棟;網(wǎng)頁防抓取系統(tǒng)的設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年
8 白劍飛;基于層次主題模型的網(wǎng)絡(luò)新聞匯聚[D];浙江大學(xué);2015年
9 袁野;企業(yè)內(nèi)網(wǎng)搜索引擎關(guān)鍵技術(shù)研究與實現(xiàn)[D];電子科技大學(xué);2014年
10 金梅;網(wǎng)絡(luò)爬蟲性能提升與功能拓展的研究與實現(xiàn)[D];吉林大學(xué);2012年
,本文編號:690539
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/690539.html