基于關(guān)聯(lián)分析和聚類的領(lǐng)域本體構(gòu)建方法及其應(yīng)用研究
本文關(guān)鍵詞:基于關(guān)聯(lián)分析和聚類的領(lǐng)域本體構(gòu)建方法及其應(yīng)用研究,由筆耕文化傳播整理發(fā)布。
【摘要】: 本體的概念起源于哲學(xué)領(lǐng)域,由希臘哲學(xué)家亞里士多德將本體定義為研究“存在”的科學(xué)。20世紀(jì)90年代以來,本體的概念被引入人工智能、知識(shí)工程和圖書情報(bào)領(lǐng)域,成為科學(xué)研究的基礎(chǔ),在思維、信息傳播、組織和檢索中發(fā)揮著重要作用。 本體是一種用來描述概念以及概念間關(guān)系的知識(shí)組織方法,自提出以來就引起了國(guó)內(nèi)外眾多科研人員的關(guān)注,并在計(jì)算機(jī)的許多領(lǐng)域得到了廣泛的應(yīng)用。作為本體應(yīng)用研究的一項(xiàng)基礎(chǔ)性工作——本體的構(gòu)建方法,也吸引了國(guó)內(nèi)外眾多科研人員的關(guān)注。目前還沒有成熟、統(tǒng)一的方法論指導(dǎo)本體的構(gòu)建工作,建立相對(duì)完整的領(lǐng)域本體,不僅需要捕獲大量的領(lǐng)域概念,而且必須處理這些領(lǐng)域概念的語義沖突、二義性等問題。這使構(gòu)建本體的工作成為既單調(diào)乏味,又困難棘手的任務(wù),成為知識(shí)獲取的瓶頸。另外,雖然現(xiàn)有本體構(gòu)建工具的編輯環(huán)境已經(jīng)可以滿足建立本體的需要,但是完全靠人工搜集領(lǐng)域概念及領(lǐng)域概念間的關(guān)系來構(gòu)建本體,仍然是一項(xiàng)費(fèi)時(shí)費(fèi)力的工作,使得基于本體的應(yīng)用難以推廣。 本文在調(diào)研了國(guó)內(nèi)外大量文獻(xiàn)和網(wǎng)頁的基礎(chǔ)上,全面研究探索了本體的理論與方法。闡述了本體的起源、內(nèi)涵、分類和應(yīng)用,介紹了國(guó)內(nèi)外關(guān)于本體構(gòu)建研究的相關(guān)進(jìn)展、原則、方法和工具,分析了目前本體構(gòu)建存在的問題。為解決這些問題,本文提出將面向文本的知識(shí)發(fā)現(xiàn)技術(shù)應(yīng)用到領(lǐng)域本體的構(gòu)建過程中,通過對(duì)領(lǐng)域語料庫文本的處理,從語料中自動(dòng)提取領(lǐng)域概念,并以關(guān)聯(lián)分析和聚類分析為工具發(fā)現(xiàn)領(lǐng)域概念間關(guān)系,最后通過人工校驗(yàn)來修正結(jié)果,從而減少對(duì)領(lǐng)域?qū)<业囊蕾?提高本體構(gòu)建的自動(dòng)化程度,加快本體的構(gòu)建過程。在這些理論和方法的指導(dǎo)下,本文創(chuàng)建了一個(gè)以等離子專利信息資源為應(yīng)用領(lǐng)域的領(lǐng)域本體。
【關(guān)鍵詞】:領(lǐng)域本體構(gòu)建 聚類 關(guān)聯(lián)分析 概念提取 概念關(guān)系發(fā)現(xiàn)
【學(xué)位授予單位】:南京理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2009
【分類號(hào)】:H0-05
【目錄】:
- 摘要5-6
- Abstract6-8
- 目錄8-10
- 圖表目錄10-12
- 1 緒論12-23
- 1.1 本文研究背景12-13
- 1.2 本體概述13-18
- 1.2.1 本體的內(nèi)涵14
- 1.2.2 本體的分類14-16
- 1.2.3 本體的研究與應(yīng)用16-18
- 1.3 本文研究意義18-19
- 1.4 研究?jī)?nèi)容與方法19-23
- 1.4.1 研究思路和內(nèi)容19-21
- 1.4.2 研究方法21-22
- 1.4.3 創(chuàng)新點(diǎn)22-23
- 2 基于文本知識(shí)發(fā)現(xiàn)的領(lǐng)域本體構(gòu)建框架研究23-42
- 2.1 本體構(gòu)建相關(guān)研究進(jìn)展23-30
- 2.1.1 本體構(gòu)建的研究現(xiàn)狀23-24
- 2.1.2 本體構(gòu)建的原則24
- 2.1.3 本體構(gòu)建的方法24-27
- 2.1.4 本體構(gòu)建的工具27-29
- 2.1.5 本體構(gòu)建存在的問題29-30
- 2.2 面向文本的知識(shí)發(fā)現(xiàn)概述30-37
- 2.2.1 知識(shí)發(fā)現(xiàn)的內(nèi)涵30-32
- 2.2.2 知識(shí)發(fā)現(xiàn)的應(yīng)用32-33
- 2.2.3 文本知識(shí)發(fā)現(xiàn)的主要類型33-37
- 2.3 文本知識(shí)發(fā)現(xiàn)技術(shù)在領(lǐng)域本體構(gòu)建中的應(yīng)用框架37-42
- 2.3.1 現(xiàn)有研究的現(xiàn)狀37-38
- 2.3.2 應(yīng)用研究所需的技術(shù)方法38-39
- 2.3.3 基于文本知識(shí)發(fā)現(xiàn)的領(lǐng)域本體構(gòu)建的框架39-42
- 3 領(lǐng)域概念的自動(dòng)提取方法研究42-57
- 3.1 主要功能與步驟42-44
- 3.2 中文文本自動(dòng)分詞44-46
- 3.3 中文術(shù)語提取46-55
- 3.3.1 典型的中文術(shù)語提取方法46-48
- 3.3.2 一種基于隱性馬爾可夫模型的中文術(shù)語提取方法48-55
- 3.4 術(shù)語領(lǐng)域相關(guān)度判斷55-57
- 4 領(lǐng)域概念間典型關(guān)系的自動(dòng)發(fā)現(xiàn)方法研究57-72
- 4.1 領(lǐng)域概念間的典型關(guān)系及其自動(dòng)發(fā)現(xiàn)57-59
- 4.1.1 領(lǐng)域概念間的關(guān)系及發(fā)現(xiàn)方法57-58
- 4.1.2 概念關(guān)系發(fā)現(xiàn)的處理步驟58-59
- 4.2 領(lǐng)域概念的關(guān)聯(lián)分析59-62
- 4.2.1 基于關(guān)聯(lián)規(guī)則挖掘的關(guān)聯(lián)分析59-60
- 4.2.2 基于共現(xiàn)的關(guān)聯(lián)分析60-61
- 4.2.3 基于相關(guān)性統(tǒng)計(jì)的關(guān)聯(lián)分析61-62
- 4.3 領(lǐng)域概念間聚類及關(guān)系發(fā)現(xiàn)62-72
- 4.3.1 聚類的內(nèi)涵與一般流程62-64
- 4.3.2 典型的聚類算法64-67
- 4.3.3 一種基于“最小最大”原則的初始質(zhì)心優(yōu)選的K-means聚類算法67-72
- 5 基于關(guān)聯(lián)分析和聚類的領(lǐng)域本體構(gòu)建系統(tǒng)研究及實(shí)驗(yàn)評(píng)估72-94
- 5.1 系統(tǒng)總體結(jié)構(gòu)圖72-73
- 5.2 實(shí)驗(yàn)語料及實(shí)驗(yàn)流程說明73-75
- 5.3 領(lǐng)域概念的自動(dòng)提取實(shí)驗(yàn)75-78
- 5.4 領(lǐng)域概念間典型關(guān)系的自動(dòng)發(fā)現(xiàn)實(shí)驗(yàn)78-85
- 5.5 領(lǐng)域本體的構(gòu)建實(shí)驗(yàn)85-94
- 6 結(jié)束語94-97
- 6.1 本文所做的工作94-95
- 6.2 研究中存在的問題和后續(xù)研究95
- 6.3 展望95-97
- 致謝97-98
- 參考文獻(xiàn)98-104
- 附錄104
【相似文獻(xiàn)】
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 楊勰;劉群;吳渝;;基于聚類算法的粒子系統(tǒng)模擬實(shí)現(xiàn)[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年
2 樊迪;劉振明;金宏威;張亮仁;張禮和;;基于配體結(jié)合模式的輔酶A結(jié)合蛋白的分類方法研究[A];第十屆全國(guó)計(jì)算(機(jī))化學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2009年
3 高冠東;賈克斌;肖珂;;一種新的基于特征點(diǎn)匹配的圖像拼接方法[A];第十三屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2006年
4 馬垣;張紅云;李曉瑞;劉剛;張小平;馬文勝;;關(guān)系數(shù)據(jù)庫中基于拓?fù)淇臻g的聚類方法[A];第十八屆全國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
5 秦龍;吳義堅(jiān);王仁華;;基于HMM的說話人轉(zhuǎn)換中MLLR回歸矩陣綁定方法的研究[A];第八屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
6 謝毓湘;欒悉道;吳玲達(dá);文軍;老松楊;;一種基于聚類的播音員鏡頭探測(cè)方法[A];第一屆建立和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2005)論文集[C];2005年
7 趙曉煜;康錦江;;基于客戶價(jià)值的客戶聚類及特征分析方法[A];中國(guó)市場(chǎng)學(xué)會(huì)2006年年會(huì)暨第四次全國(guó)會(huì)員代表大會(huì)論文集[C];2006年
8 朱琳;周水庚;;基于聚類的文本分類屬性加權(quán)[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
9 王云龍;李遜;;基于數(shù)據(jù)場(chǎng)的數(shù)據(jù)挖掘方法在入侵檢測(cè)中的應(yīng)用[A];第十九次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2004年
10 李涵;;一種改進(jìn)的聚類方法在異常檢測(cè)中的應(yīng)用[A];2010年全國(guó)開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集[C];2010年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫
1 本刊特稿 陳巖;魯西南村名的文化解讀[N];濟(jì)寧日?qǐng)?bào);2007年
2 李海峰;優(yōu)化無功管理 實(shí)現(xiàn)電網(wǎng)安全運(yùn)行[N];國(guó)家電網(wǎng)報(bào);2008年
3 王國(guó)定 宋瑞卿 王永亮;山西上市公司綜合實(shí)力誰強(qiáng)?[N];山西日?qǐng)?bào);2001年
4 王宇喬;減肥品男性消費(fèi)群不容忽視[N];民營(yíng)經(jīng)濟(jì)報(bào);2005年
5 本報(bào)實(shí)習(xí)生 龐仕影;權(quán)威榜單不能讓數(shù)字牽著走[N];國(guó)際金融報(bào);2004年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王勇;基于流形學(xué)習(xí)的分類與聚類方法及其應(yīng)用研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年
2 熊峗;生物序列模式挖掘與聚類研究[D];復(fù)旦大學(xué);2007年
3 郝占剛;基于遺傳算法等技術(shù)的數(shù)據(jù)與文本聚分類研究[D];天津大學(xué);2006年
4 李敏;蛋白質(zhì)網(wǎng)絡(luò)中復(fù)合物和功能模塊挖掘算法研究[D];中南大學(xué);2008年
5 胡雅婷;可能性聚類方法研究及應(yīng)用[D];吉林大學(xué);2012年
6 劉建偉;流數(shù)據(jù)查詢系統(tǒng)結(jié)構(gòu)及模式查詢算法的研究[D];東華大學(xué);2005年
7 吳瑞;模糊和粗糙環(huán)境下的網(wǎng)絡(luò)用戶瀏覽模式研究[D];天津大學(xué);2006年
8 殷瑞飛;數(shù)據(jù)挖掘中的聚類方法及其應(yīng)用[D];廈門大學(xué);2008年
9 王昱;考慮特征變量異質(zhì)性的分類方法及其在風(fēng)險(xiǎn)決策中的應(yīng)用研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年
10 錢鵬江;大規(guī)模數(shù)據(jù)集聚類方法研究及應(yīng)用[D];江南大學(xué);2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張蓓蓓;基于關(guān)聯(lián)分析和聚類的領(lǐng)域本體構(gòu)建方法及其應(yīng)用研究[D];南京理工大學(xué);2009年
2 盛文峰;面向數(shù)據(jù)挖掘的遺傳算法的研究與應(yīng)用[D];上海交通大學(xué);2007年
3 倪樂央;基于非參數(shù)方法的我國(guó)城市化水平聚類分析[D];浙江工商大學(xué);2007年
4 伊莉娜;基于Agent的移動(dòng)查詢技術(shù)研究[D];哈爾濱理工大學(xué);2008年
5 李國(guó)宇;基于J2EE的數(shù)據(jù)挖掘系統(tǒng)的構(gòu)建及聚類技術(shù)研究[D];天津大學(xué);2007年
6 吳孫丹;基于聚類的入侵檢測(cè)方法的研究[D];華中科技大學(xué);2007年
7 金燕;多時(shí)間序列數(shù)據(jù)流聚類算法研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2007年
8 李敏;基于網(wǎng)格和密度的數(shù)據(jù)流聚類算法研究[D];武漢理工大學(xué);2009年
9 司學(xué)鋒;基于聚類的BP神經(jīng)網(wǎng)絡(luò)在織物染色計(jì)算機(jī)配色中的應(yīng)用研究[D];青島大學(xué);2009年
10 梁敏君;分形聚類分析在證券客戶細(xì)分中的應(yīng)用研究[D];合肥工業(yè)大學(xué);2009年
本文關(guān)鍵詞:基于關(guān)聯(lián)分析和聚類的領(lǐng)域本體構(gòu)建方法及其應(yīng)用研究,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):282929
本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/282929.html