基于維基百科分類體系的多語海洋敘詞表構(gòu)建
本文關(guān)鍵詞:基于維基百科分類體系的多語海洋敘詞表構(gòu)建
【摘要】:自古以來,海洋的重要性就不言而喻,一方面它作為生命的搖籃孕育了生命,另一方面它作為資源的寶庫蘊(yùn)含了十分豐富的資源。但是海洋是浩瀚而神秘的,作為海洋大國的我國,海岸線就長達(dá)18萬公里,我們只有運(yùn)用科學(xué)的調(diào)查方法和規(guī)范的管理手段才能逐漸揭開海洋的神秘面紗。隨著經(jīng)濟(jì)、科技的發(fā)展以及經(jīng)費(fèi)和人力的不斷投入,我國的大洋科學(xué)考察事業(yè)得到長足發(fā)展。一方面加強(qiáng)了國際間的合作:我國不僅積極參與國際合作調(diào)查項目,還積極組織建立國際調(diào)查項目,吸引了多個國家組織的參與;另一方面我國自主開展的大洋科學(xué)考察航次越來越多,使用的科學(xué)實驗設(shè)備也越來越先進(jìn),獲取了大量的珍貴的樣品及數(shù)據(jù);谝陨犀F(xiàn)狀,如何科學(xué)規(guī)范的管理這些科研數(shù)據(jù),對海洋事業(yè)的發(fā)展尤為重要。本文以海洋數(shù)據(jù)管理為出發(fā)點(diǎn),致力于研究以維基百科為語義資源來構(gòu)建多語海洋敘詞表的問題,以期實現(xiàn)海洋敘詞的科學(xué)有效管理,為其他海洋數(shù)據(jù)的使用和管理提供便利。主要工作包括:1.研究維基百科的組織特點(diǎn),分析維基百科作為語義資源的可行性。2.研究敘詞表的編制標(biāo)準(zhǔn)及微觀結(jié)構(gòu),形成維基百科鏈接關(guān)系與敘詞表微觀結(jié)構(gòu)的映射關(guān)系。3.研究當(dāng)前利用維基百科來計算語義相關(guān)度的算法,并根據(jù)這些算法的特點(diǎn)對其分類。4.研究維基百科轉(zhuǎn)儲數(shù)據(jù)的特點(diǎn),使用相關(guān)算法和工具抽取并保存維基百科轉(zhuǎn)儲數(shù)據(jù)中的相關(guān)信息。5.研究支持向量分類機(jī)的特點(diǎn),并結(jié)合一定的語義相關(guān)度算法實現(xiàn)相關(guān)信息的分類。
【關(guān)鍵詞】:維基百科 敘詞表 海洋 多語
【學(xué)位授予單位】:中國海洋大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.1
【目錄】:
- 摘要5-6
- Abstract6-10
- 1 緒論10-16
- 1.1 研究背景和意義10-12
- 1.2 研究現(xiàn)狀及可行性分析12-15
- 1.2.1 維基百科作為語料庫的可行性分析12-13
- 1.2.2 網(wǎng)絡(luò)信息抽取研究現(xiàn)狀13-15
- 1.3 論文主要研究內(nèi)容15
- 1.4 論文研究框架15-16
- 2 維基百科和敘詞表16-30
- 2.1 維基百科16-23
- 2.1.1 維基百科條目的編輯規(guī)則18-19
- 2.1.2 維基百科中的特殊條目19-21
- 2.1.3 維基百科中的超鏈接21-23
- 2.2 敘詞表23-30
- 2.2.1 敘詞表編制發(fā)展概況23-25
- 2.2.2 敘詞表編制標(biāo)準(zhǔn)和詞間關(guān)系25-28
- 2.2.3 維基百科詞間關(guān)系與敘詞表詞間關(guān)系的映射28-30
- 3 基于維基百科的語義相關(guān)度算法研究30-37
- 3.1 基于統(tǒng)計學(xué)的語義相關(guān)度算法30-33
- 3.1.1 詞匯共現(xiàn)法30-32
- 3.1.2 鏈接共現(xiàn)法32-33
- 3.2 基于維基百科路徑的語義相關(guān)度算法33-37
- 4 維基百科信息抽取算法設(shè)計與實現(xiàn)37-47
- 4.1 維基百科轉(zhuǎn)儲數(shù)據(jù)37-40
- 4.1.1 維基百科命名空間37-39
- 4.1.2 條目在XML中的存儲格式39-40
- 4.2 信息抽取步驟及相關(guān)技術(shù)40-43
- 4.2.1 信息抽取步驟40-42
- 4.2.2 相關(guān)技術(shù)及工具42-43
- 4.3 數(shù)據(jù)庫設(shè)計及抽取結(jié)果43-47
- 4.3.1 數(shù)據(jù)庫設(shè)計43-45
- 4.3.2 抽取結(jié)果45-47
- 5 信息分類及實驗結(jié)果分析47-58
- 5.1 支持向量分類機(jī)原理47-48
- 5.2 信息分類處理過程48-55
- 5.2.1 信息預(yù)處理48-49
- 5.2.2 選取分類特征項49-53
- 5.2.3 選擇訓(xùn)練集53-55
- 5.3 信息分類實驗結(jié)果及分析55-58
- 6 總結(jié)與展望58-60
- 6.1 全文總結(jié)58-59
- 6.2 未來的工作方向59-60
- 參考文獻(xiàn)60-62
- 致謝62-63
- 個人簡歷63
- 在校期間研究成果63
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 朱玉強(qiáng);;維基百科:分享知識的自由百科全書[J];農(nóng)業(yè)圖書情報學(xué)刊;2006年01期
2 羅伯特·馬休斯;;維基百科是怎樣“煉”成的?[J];青年記者;2006年03期
3 ;維基百科有專業(yè)化趨勢,音樂維基“喵客”異軍突起[J];計算機(jī)與網(wǎng)絡(luò);2006年23期
4 尹開國;;自由人的自由聯(lián)合:維基百科評介[J];圖書情報工作;2007年02期
5 真真;;調(diào)查顯示:維基百科受到歡迎[J];國外社會科學(xué);2007年06期
6 王丹丹;;維基百科自組織模式下質(zhì)量保證機(jī)制分析[J];情報科學(xué);2009年05期
7 王丹丹;;維基百科在學(xué)術(shù)領(lǐng)域的應(yīng)用分析[J];圖書館建設(shè);2009年05期
8 孫穎;;維基百科生日快樂[J];互聯(lián)網(wǎng)天地;2009年05期
9 徐爭榮;;構(gòu)建電影專業(yè)維基百科的設(shè)想[J];圖書情報工作;2009年S1期
10 何筠紅;;在線共享的自由百科全書——維基百科[J];新世紀(jì)圖書館;2006年04期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 孟新萍;王會珍;張俐;;維基百科人物屬性自動獲取方法研究[A];第五屆全國青年計算語言學(xué)研討會論文集[C];2010年
2 張葦如;孫樂;韓先培;;基于維基百科和模式聚類的實體關(guān)系抽取方法[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
3 謝科;劉奕群;岑榮偉;馬少平;茹立云;楊磊;;基于維基百科層次分類框架的主題推薦系統(tǒng)的研究[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 佚名;維基百科遭遇成長煩惱[N];計算機(jī)世界;2005年
2 羅添;維基百科模式難在華復(fù)制[N];北京商報;2007年
3 潘海東 朱春雷 梅春;四原因引爆維基百科[N];計算機(jī)世界;2006年
4 王希怡;維基百科 硬傷不治必落下神壇[N];廣州日報;2013年
5 本報記者 張貴勇;維基百科:知識因草根而改變[N];中國教育報;2009年
6 宿亮;維基百科“關(guān)門”“抗議壞法案”[N];新華每日電訊;2012年
7 記者 錢平廣;美國反盜版法爭議升級 維基百科黑屏24小時抗議[N];第一財經(jīng)日報;2012年
8 電腦虎;知識共享的平臺:WiKi[N];中國電腦教育報;2004年
9 彭致;維基百科九月首推印刷版[N];中國新聞出版報;2008年
10 付蓓;“維客”:你的網(wǎng)頁大家編[N];中國稅務(wù)報;2005年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 肖奎;維基百科大數(shù)據(jù)的知識挖掘與管理方法研究[D];武漢大學(xué);2013年
2 趙靜;發(fā)揮用戶的興趣及資源從而提升用戶在維基百科上的貢獻(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2011年
3 李峗;基于中文維基百科的語義知識挖掘相關(guān)研究[D];北京郵電大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 朱蘇陽;自指導(dǎo)社會關(guān)系網(wǎng)絡(luò)構(gòu)建研究[D];蘇州大學(xué);2015年
2 王忠振;基于深度學(xué)習(xí)算法的領(lǐng)域詞義關(guān)聯(lián)研究[D];國防科學(xué)技術(shù)大學(xué);2014年
3 景雪芹;基于維基百科分類體系的多語海洋敘詞表構(gòu)建[D];中國海洋大學(xué);2015年
4 崔政;維基百科:精神交往理論研究的新進(jìn)路[D];河北大學(xué);2008年
5 劉喜梅;從維基百科看互聯(lián)網(wǎng)語境下的知識生產(chǎn)與傳播[D];湖南師范大學(xué);2013年
6 張華杰;基于維基百科的知識抽取和重用[D];上海交通大學(xué);2009年
7 盛志超;基于維基百科的語義比較[D];復(fù)旦大學(xué);2011年
8 伍成志;基于維基百科的知識查找系統(tǒng)的研究與實現(xiàn)[D];華南理工大學(xué);2012年
9 馬鳴卉;維基百科的網(wǎng)絡(luò)結(jié)構(gòu)及可信分析[D];電子科技大學(xué);2010年
10 常天舒;關(guān)于維基百科內(nèi)容質(zhì)量的研究[D];大連理工大學(xué);2013年
,本文編號:812172
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/812172.html