基于本體的民族教育資源自動語義標注研究
本文關(guān)鍵詞:基于本體的民族教育資源自動語義標注研究
更多相關(guān)文章: 語義標注 本體 迭代模型 三元組
【摘要】:現(xiàn)在我們面對著網(wǎng)絡數(shù)據(jù)的浩瀚海洋,要想使計算機能夠完全準確地從這些數(shù)量大、結(jié)構(gòu)不規(guī)則的數(shù)據(jù)中提取出滿足人們要求的信息變得越來越難,以前我們使用搜索引擎進行搜索時不僅所需要的時間非常短,而且搜索產(chǎn)生的數(shù)據(jù)也是十分準確的,但是現(xiàn)在我們要想更好地實現(xiàn)信息檢索就要往語義檢索的方向發(fā)展,要想實現(xiàn)語義檢索的前提是語義標注,只有將網(wǎng)絡上的資源進行了有效的語義標注才能將人類的語義檢索的夢想變?yōu)楝F(xiàn)實。也就是說我們現(xiàn)在面對著數(shù)據(jù)海量化與檢索低效率化這樣一個矛盾,在這樣一個矛盾的背景下,語義標注尤其是自動語義標注越來越受到研究者的青睞,然而由于各國使用的網(wǎng)絡語言不同,以及不同的網(wǎng)絡時代下的網(wǎng)絡框架的區(qū)別等諸多原因,語義標注的完全自動化仍未得到全面的發(fā)展,要滿足人們的個性化、專業(yè)化的檢索需求還需要克服相當大的困難。在這樣一個復雜的情況下,本論文首先分析信息采集的原理和方法,對民族教育信息網(wǎng)絡文檔資源的采集技術(shù)進行了充分研究,通過網(wǎng)絡爬蟲技術(shù)爬取了網(wǎng)絡上的資源,接著充分利用了領(lǐng)域本體在語義表達上的有利條件,來對網(wǎng)絡上的資源進行有效的語義表達,因此構(gòu)建了領(lǐng)域本體庫來對特定主題的網(wǎng)絡資源進行描述,最后對語義標注方法進行了深入研究分析,借鑒軟件工程的思想,以迭代模型為基礎(chǔ),并改進原有的OCRNIP算法,提出了語義標注的迭代模型,同時對該模型系統(tǒng)進行了設計實現(xiàn)與實驗分析。
【關(guān)鍵詞】:語義標注 本體 迭代模型 三元組
【學位授予單位】:云南師范大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:G750;TP391.1
【目錄】:
- 摘要3-4
- Abstract4-9
- 第1章 緒論9-14
- 1.1 引言9-10
- 1.2 國內(nèi)外研究現(xiàn)狀10-12
- 1.3 本文的主要研究工作12-13
- 1.4 本文結(jié)構(gòu)13-14
- 第2章 語義網(wǎng)的發(fā)展14-22
- 2.1 Web的發(fā)展14-17
- 2.1.1 PC時代15
- 2.1.2 Web1.0 時代15-16
- 2.1.3 Web2.0 時代16
- 2.1.4 Web3.0 時代16-17
- 2.1.5 Web4.0 時代17
- 2.1.6 Web發(fā)展歷程小結(jié)17
- 2.2 語義網(wǎng)17-21
- 2.2.1 語義網(wǎng)的概念18
- 2.2.2 語義網(wǎng)的層次模型18-20
- 2.2.3 語義網(wǎng)和萬維網(wǎng)的對比分析20-21
- 2.3 本章小結(jié)21-22
- 第3章 相關(guān)理論與技術(shù)22-40
- 3.1 本體的相關(guān)理論22-28
- 3.1.1 本體與領(lǐng)域本體的基本概念22-24
- 3.1.2 本體描述語言24-27
- 3.1.3 本體構(gòu)建工具27-28
- 3.2 民族教育資源本體庫的構(gòu)建28-35
- 3.2.1 民族教育資源本體領(lǐng)域數(shù)據(jù)來源29
- 3.2.2 民族教育資源本體構(gòu)建流程29-31
- 3.2.3 民族教育資源本體庫的設計與實現(xiàn)——以傣族為例31-35
- 3.3 網(wǎng)絡爬蟲技術(shù)35-38
- 3.3.1 網(wǎng)絡爬蟲的概念35
- 3.3.2 網(wǎng)絡爬蟲的基本框架35-36
- 3.3.3 主題爬蟲36-38
- 3.4 中文分詞技術(shù)38-39
- 3.5 本章小結(jié)39-40
- 第4章 語義標注系統(tǒng)模型40-58
- 4.1 語義標注的基本概念40-41
- 4.2 語義標注方法的分類41-44
- 4.2.1 根據(jù)標注方法分類41-43
- 4.2.2 根據(jù)自動化程度劃分43-44
- 4.3 語義標注工具44-46
- 4.4 語義標注系統(tǒng)模型——語義標注迭代模型46-57
- 4.4.1 網(wǎng)頁文檔內(nèi)容的獲取過程49
- 4.4.2 本體庫的建立與完善49
- 4.4.3 用戶自定義詞典的獲取49-50
- 4.4.4 分詞文檔的獲取50-53
- 4.4.5 RDF文檔的獲取53-57
- 4.5 本章小結(jié)57-58
- 第5章 語義標注迭代模型在傣族教育資源中的應用58-65
- 5.1 語義標注迭代模型系統(tǒng)的實現(xiàn)58-63
- 5.1.1 網(wǎng)頁內(nèi)容抽取59-61
- 5.1.2 用戶自定義詞典的生成61
- 5.1.3 中文分詞61-62
- 5.1.4 生成RDF文件62-63
- 5.2 語義標注迭代模型系統(tǒng)的實驗結(jié)果及分析63-64
- 5.2.1 評價指標63
- 5.2.2 結(jié)果分析63-64
- 5.3 本章小結(jié)64-65
- 第6章 總結(jié)與展望65-66
- 6.1 總結(jié)65
- 6.2 展望65-66
- 參考文獻66-70
- 攻讀學位期間發(fā)表的學術(shù)論文和研究成果70-71
- 致謝71
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 欒悉道;謝毓湘;陳丹雯;鄧莉瓊;;基于劇本描述的動畫素材語義標注方法[J];長沙大學學報;2012年02期
2 ;[J];;年期
中國重要會議論文全文數(shù)據(jù)庫 前9條
1 苗傳江;劉智穎;;現(xiàn)代漢語語料的句子級語義標注[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學聯(lián)合學術(shù)會議論文集[C];2003年
2 謝法奎;張全;袁毅;;基于HNC理論的語義標注語料庫[A];內(nèi)容計算的研究與應用前沿——第九屆全國計算語言學學術(shù)會議論文集[C];2007年
3 張娜;李濟洪;;基于語義標注的中文閱讀理解語料庫的建設[A];內(nèi)容計算的研究與應用前沿——第九屆全國計算語言學學術(shù)會議論文集[C];2007年
4 宋雨;鄭懌;吳燕;;RDFa語義標注技術(shù)綜述[A];2009全國計算機網(wǎng)絡與通信學術(shù)會議論文集[C];2009年
5 鮑廣宇;譚偉;吳亞寧;;機器兵力指揮控制語言的語義標注技術(shù)研究[A];2013第一屆中國指揮控制大會論文集[C];2013年
6 馬永騰;亢世勇;;非典型成員的語義標注策略和問題[A];內(nèi)容計算的研究與應用前沿——第九屆全國計算語言學學術(shù)會議論文集[C];2007年
7 王浩然;徐建良;張巍;;一種XML元數(shù)據(jù)的自動語義標注方法[A];2008'中國信息技術(shù)與應用學術(shù)論壇論文集(二)[C];2008年
8 袁柳;李戰(zhàn)懷;陳世亮;;OntoWord:一種新的Web頁面語義標注方法[A];第二十五屆中國數(shù)據(jù)庫學術(shù)會議論文集(二)[C];2008年
9 曾誠;李兵;何克清;;KMP算法在Web服務語義標注中的應用[A];2010年全國開放式分布與并行計算機學術(shù)會議論文集[C];2010年
中國博士學位論文全文數(shù)據(jù)庫 前5條
1 米楊;基于頂級本體整合的醫(yī)學領(lǐng)域語義標注研究[D];吉林大學;2012年
2 謝銘;關(guān)聯(lián)數(shù)據(jù)和知識表示的自動語義標注技術(shù)[D];武漢大學;2012年
3 唐金輝;視頻語義標注的若干問題研究[D];中國科學技術(shù)大學;2008年
4 荊濤;面向領(lǐng)域網(wǎng)頁的語義標注若干問題研究[D];吉林大學;2011年
5 王傳清;超網(wǎng)絡視域下數(shù)字資源聚合研究[D];吉林大學;2015年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 彭晨漪;物聯(lián)網(wǎng)環(huán)境下面向服務的實體語義標注[D];華南理工大學;2015年
2 張銳;面向期刊論文的多粒度語義標注方法研究[D];華中師范大學;2015年
3 程童凌;基于維基類百科知識資源的實體關(guān)系發(fā)現(xiàn)和語義標注[D];北京化工大學;2015年
4 何中山;基于語義網(wǎng)的初中數(shù)學的自動語義標注方法研究與實現(xiàn)[D];電子科技大學;2014年
5 崔愉;面向文本的自動語義標注技術(shù)研究與實現(xiàn)[D];西安電子科技大學;2014年
6 王偉強;基于運動捕捉數(shù)據(jù)的人體行為分割與行為語義標注[D];北京交通大學;2016年
7 孫亞男;基于本體的民族教育資源自動語義標注研究[D];云南師范大學;2016年
8 丁長林;中醫(yī)古籍文獻語義標注技術(shù)的研究[D];沈陽航空航天大學;2013年
9 丁蓉;自動語義標注方法研究[D];蘭州理工大學;2012年
10 王國印;科技文獻語義標注系統(tǒng)研究[D];華中科技大學;2009年
,本文編號:1040549
本文鏈接:http://sikaile.net/jiaoyulunwen/crjy/1040549.html