面向航天領(lǐng)域知識(shí)管理的信息采集與分類應(yīng)用研究
本文關(guān)鍵詞:面向航天領(lǐng)域知識(shí)管理的信息采集與分類應(yīng)用研究,由筆耕文化傳播整理發(fā)布。
【摘要】:我國(guó)航天事業(yè)蓬勃發(fā)展,在日益發(fā)達(dá)的互聯(lián)網(wǎng)、大數(shù)據(jù)和知識(shí)經(jīng)濟(jì)時(shí)代,為應(yīng)對(duì)海量信息資源,作為知識(shí)密集型的航天從業(yè)機(jī)構(gòu),開(kāi)始引入知識(shí)管理相關(guān)理論與技術(shù),以有效挖掘、組織、管理、利用和傳承領(lǐng)域的核心知識(shí)資源。知識(shí)獲取是知識(shí)管理過(guò)程中的基礎(chǔ)環(huán)節(jié),而知識(shí)獲取相關(guān)系統(tǒng)的設(shè)計(jì)實(shí)施需要諸多關(guān)鍵技術(shù)支撐,如信息采集、文本分類、信息抽取、知識(shí)圖譜、語(yǔ)義網(wǎng)絡(luò)等自然語(yǔ)言處理、數(shù)據(jù)挖掘相關(guān)的技術(shù)。近年來(lái),對(duì)信息的獲取與處理技術(shù)在學(xué)術(shù)界和實(shí)際應(yīng)用中有了突飛猛進(jìn)的發(fā)展,本文將對(duì)航天領(lǐng)域知識(shí)管理系統(tǒng)中知識(shí)獲取環(huán)節(jié)的信息采集和文本自動(dòng)分類兩個(gè)關(guān)鍵技術(shù)進(jìn)行應(yīng)用研究。航天領(lǐng)域的知識(shí)信息冗雜多樣,包含于相關(guān)企業(yè)及科研機(jī)構(gòu)的生產(chǎn)研究過(guò)程中產(chǎn)生的大量文檔,也貯藏在巨大龐雜的互聯(lián)網(wǎng)信息資源中。針對(duì)航天領(lǐng)域信息的這些特點(diǎn),實(shí)施有效知識(shí)管理首先迫切需要的關(guān)鍵技術(shù)是如何高效準(zhǔn)確獲取行業(yè)情報(bào)信息,并能有效組織管理信息,進(jìn)而才能實(shí)現(xiàn)進(jìn)一步的信息抽取、知識(shí)挖掘。對(duì)于航天情報(bào)信息的高效獲取,能夠在滿足科研人員對(duì)航天情報(bào)數(shù)量大、專業(yè)性強(qiáng)、新穎及時(shí)、完整準(zhǔn)確需求的同時(shí),避免從龐雜異構(gòu)的互聯(lián)網(wǎng)中大海撈針,降低信息獲取成本;而對(duì)于航天信息的自動(dòng)分類,可以準(zhǔn)確高效地組織已有的或獲取到的雜亂無(wú)章的信息,能夠幫助快速建設(shè)航天領(lǐng)域知識(shí)庫(kù),優(yōu)化信息檢索系統(tǒng)的信息組織結(jié)構(gòu)和檢索效果,滿足從業(yè)人員對(duì)領(lǐng)域知識(shí)的進(jìn)一步的挖掘需求。因此本文面向航天領(lǐng)域知識(shí)管理進(jìn)行的信息采集與文本自動(dòng)分類關(guān)鍵技術(shù)的應(yīng)用研究具有重要的現(xiàn)實(shí)意義和實(shí)用價(jià)值。本文的主要研究工作如下:(1)介紹面向航天領(lǐng)域知識(shí)管理進(jìn)行信息采集和文本分類兩個(gè)關(guān)鍵技術(shù)應(yīng)用研究的背景及意義;調(diào)研知識(shí)管理及其在航天領(lǐng)域應(yīng)用的發(fā)展現(xiàn)狀,信息采集和文本分類技術(shù)及其在航天領(lǐng)域內(nèi)應(yīng)用的發(fā)展現(xiàn)狀。(2)研究基于主題爬蟲(chóng)的航天領(lǐng)域情報(bào)采集方法,設(shè)計(jì)航天情報(bào)采集主題爬蟲(chóng)的總體框架,實(shí)現(xiàn)相關(guān)程序部件,并基于主題向量空間模型和支持向量機(jī)(SVM)二類分類器兩種方法實(shí)現(xiàn)主題判定模型,與基于關(guān)鍵詞匹配的方法進(jìn)行對(duì)比實(shí)驗(yàn)驗(yàn)證。(3)研究基于支持向量機(jī)(SVM)的航天領(lǐng)域文本多類分類算法,設(shè)計(jì)航天領(lǐng)域內(nèi)不同類別信息的多類分類流程框架,并考慮航天領(lǐng)域特點(diǎn),在特征加權(quán)階段提出了針對(duì)性改進(jìn),針對(duì)航天領(lǐng)域?qū)I(yè)術(shù)語(yǔ)等區(qū)分度較高的詞匯增加了額外權(quán)重,以提高分類效果。實(shí)現(xiàn)相關(guān)程序部件,并與基于樸素貝葉斯和K近鄰的文本分類算法進(jìn)行對(duì)比實(shí)驗(yàn)。通過(guò)相關(guān)實(shí)驗(yàn)驗(yàn)證表明,本文面向航天領(lǐng)域知識(shí)管理的情報(bào)采集與文本分類應(yīng)用研究達(dá)到預(yù)期效果,具有實(shí)際意義。其中,本文設(shè)計(jì)的基于主題爬蟲(chóng)的航天領(lǐng)域情報(bào)采集方法是可行的、高效的,能夠滿足實(shí)際知識(shí)管理過(guò)程中對(duì)航天領(lǐng)域情報(bào)的采集需求;本文設(shè)計(jì)并改進(jìn)的基于支持向量機(jī)(SVM)的航天領(lǐng)域文本多類自動(dòng)分類算法是可行的、高效的,并且相比同類算法表現(xiàn)更加優(yōu)秀,能夠滿足實(shí)際知識(shí)管理過(guò)程中對(duì)航天領(lǐng)域文本信息的高效準(zhǔn)確自動(dòng)分類組織需求。
【關(guān)鍵詞】:航天領(lǐng)域 知識(shí)管理 信息采集 主題爬蟲(chóng) 文本分類 支持向量機(jī)
【學(xué)位授予單位】:中國(guó)科學(xué)院國(guó)家空間科學(xué)中心
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1
【目錄】:
- 摘要5-7
- ABSTRACT7-14
- 第1章 緒論14-28
- 1.1 課題背景及研究意義14-16
- 1.1.1 課題背景14-15
- 1.1.2 研究意義15-16
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀16-24
- 1.2.1 航天領(lǐng)域知識(shí)管理16-20
- 1.2.2 信息采集技術(shù)20-22
- 1.2.3 文本分類技術(shù)22-24
- 1.3 主要研究?jī)?nèi)容24-25
- 1.3.1 基于主題爬蟲(chóng)的航天領(lǐng)域信息采集技術(shù)24
- 1.3.2 基于SVM的航天領(lǐng)域文本分類技術(shù)24-25
- 1.4 論文組織結(jié)構(gòu)25-28
- 第2章 相關(guān)技術(shù)與理論概述28-38
- 2.1 中文分詞28-29
- 2.2 文本表示與特征選擇方法29-31
- 2.2.1 向量空間模型29-30
- 2.2.2 特征選擇30-31
- 2.3 網(wǎng)絡(luò)爬蟲(chóng)31-32
- 2.4 支持向量機(jī)32-38
- 2.4.1 線性可分33-34
- 2.4.2 線性不可分34-36
- 2.4.3 多類分類問(wèn)題36-38
- 第3章 基于主題爬蟲(chóng)的航天情報(bào)采集38-46
- 3.1 航天情報(bào)采集總體框架38-40
- 3.2 主題判定模型40-46
- 3.2.1 主題向量空間模型41-42
- 3.2.2 SVM主題分類器42-46
- 第4章 基于SVM的航天領(lǐng)域文本分類46-54
- 4.1 SVM文本分類總體框架46-47
- 4.2 SVM文本分類主要流程47-54
- 4.2.1 語(yǔ)料預(yù)處理47-48
- 4.2.2 文本表示與特征選擇48-49
- 4.2.3 分類模型訓(xùn)練與優(yōu)化49-52
- 4.2.4 文檔分類預(yù)測(cè)52-54
- 第5章 實(shí)驗(yàn)論證與結(jié)果分析54-64
- 5.1 實(shí)驗(yàn)環(huán)境54
- 5.2 評(píng)價(jià)指標(biāo)54-56
- 5.2.1 航天主題爬蟲(chóng)54-55
- 5.2.2 航天SVM文本分類55-56
- 5.3 論證過(guò)程56-58
- 5.3.1 航天主題爬蟲(chóng)56-57
- 5.3.2 航天SVM文本分類57-58
- 5.4 結(jié)果分析58-64
- 5.4.1 航天主題爬蟲(chóng)58-61
- 5.4.2 航天SVM文本分類61-64
- 第6章 總結(jié)與展望64-68
- 6.1 工作總結(jié)64-65
- 6.2 研究展望65-68
- 參考文獻(xiàn)68-70
- 作者簡(jiǎn)歷及攻讀學(xué)位期間發(fā)表的論文與研究成果70-72
- 致謝72-73
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 ;中國(guó)航天機(jī)電集團(tuán)公司第八三五八研究所簡(jiǎn)介[J];科學(xué)學(xué)與科學(xué)技術(shù)管理;2000年11期
2 胡紹林,黃劉生;航天故障的成因分析與診斷技術(shù)[J];控制工程;2003年04期
3 ;《上海航天》簡(jiǎn)介[J];電子科技文摘;2003年04期
4 王禮恒,潘堅(jiān),曹秀云;近期世界航天科技發(fā)展及我們的思考[J];中國(guó)科技論壇;2004年06期
5 李程;;2012年世界航天發(fā)展回顧[J];衛(wèi)星與網(wǎng)絡(luò);2013年03期
6 許達(dá)哲;;中國(guó)航天取得舉世矚目的成就[J];衛(wèi)星與網(wǎng)絡(luò);2013年10期
7 尚昭;;神七飛船:來(lái)自太空的IT挑戰(zhàn)[J];中國(guó)計(jì)算機(jī)用戶;2008年40期
8 ;航空、航天與航海工程[J];電子科技文摘;1999年04期
9 ;2010年航天工程育種論壇成功召開(kāi)[J];衛(wèi)星與網(wǎng)絡(luò);2010年09期
10 ;航空、航天與航海工程[J];電子科技文摘;2003年09期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前9條
1 ;清華大學(xué)航天航空學(xué)院[A];慶祝中國(guó)力學(xué)學(xué)會(huì)成立50周年暨中國(guó)力學(xué)學(xué)會(huì)學(xué)術(shù)大會(huì)’2007論文摘要集(上)[C];2007年
2 王永志;;錢(qián)學(xué)森在中國(guó)導(dǎo)彈航天事業(yè)中的科學(xué)成就[A];錢(qián)學(xué)森科學(xué)貢獻(xiàn)暨學(xué)術(shù)思想研討會(huì)論文集[C];2001年
3 李勇;肖瑾;顏廷貴;;優(yōu)秀文化在建設(shè)一流總體部中的作用[A];軍工文化論文集[C];2006年
4 麥強(qiáng);;航天工程項(xiàng)目風(fēng)險(xiǎn)分析研究現(xiàn)狀[A];國(guó)家自然科學(xué)基金委員會(huì)管理科學(xué)部宏觀管理與政策學(xué)科青年基金獲得者交流研討會(huì)論文集[C];2010年
5 湯莉;;把責(zé)任擔(dān)在肩上將理想托付藍(lán)天[A];中國(guó)有色金屬工業(yè)企業(yè)管理現(xiàn)代化成果、優(yōu)秀論文專集[C];2003年
6 張健;安軍社;汪大興;;基于國(guó)產(chǎn)CPU的航天用計(jì)算機(jī)的研制[A];中國(guó)空間科學(xué)學(xué)會(huì)空間探測(cè)專業(yè)委員會(huì)第十七次學(xué)術(shù)會(huì)議論文集[C];2004年
7 孫家棟;;錢(qián)學(xué)森帶領(lǐng)我們搞航天[A];錢(qián)學(xué)森科學(xué)貢獻(xiàn)暨學(xué)術(shù)思想研討會(huì)論文集[C];2001年
8 張傳軍;侯宇葵;;國(guó)防科技查新在航天工程實(shí)踐中的應(yīng)用探討[A];第二十五屆全國(guó)空間探測(cè)學(xué)術(shù)研討會(huì)摘要集[C];2012年
9 韓恩厚;;航天用鎂合金與空間環(huán)境損傷[A];中國(guó)空間科學(xué)學(xué)會(huì)空間材料專業(yè)委員會(huì)2012學(xué)術(shù)交流會(huì)議論文(摘要)集[C];2012年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 酒泉衛(wèi)星發(fā)射中心副主任 于本城;關(guān)于我國(guó)航天文化的思考[N];光明日?qǐng)?bào);2008年
2 本報(bào)特派記者 張曉鳴;航天游有待突破一日游[N];文匯報(bào);2013年
3 ;為航天事業(yè)發(fā)展提供堅(jiān)強(qiáng)保證[N];中國(guó)航天報(bào);2013年
4 本報(bào)評(píng)論員;確保航天重大工程圓滿完成的必然要求[N];中國(guó)航天報(bào);2013年
5 ;大力協(xié)同 同舟共濟(jì)[N];中國(guó)航天報(bào);2006年
6 林大安;全國(guó)郵展航天類郵集的成功與不足[N];中國(guó)集郵報(bào);2006年
7 綜言;航天科技圖書(shū)出版基金設(shè)立[N];中國(guó)文化報(bào);2007年
8 王杭生;航天科技書(shū)出版基金設(shè)立[N];中國(guó)新聞出版報(bào);2007年
9 本報(bào)記者 孫敏邋徐瑩波 實(shí)習(xí)生 馮曉文;桂林航天人:見(jiàn)證中國(guó)航天新紀(jì)元誕生[N];桂林日?qǐng)?bào);2008年
10 本報(bào)記者 汪挺;中國(guó)正在迎來(lái)“后航天經(jīng)濟(jì)時(shí)代”[N];中國(guó)商報(bào);2005年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前7條
1 郭頌;面向航天領(lǐng)域知識(shí)管理的信息采集與分類應(yīng)用研究[D];中國(guó)科學(xué)院國(guó)家空間科學(xué)中心;2016年
2 邵雪山;航天工程項(xiàng)目組織管理能力的分階段綜合評(píng)價(jià)方法及應(yīng)用[D];南京航空航天大學(xué);2012年
3 胡發(fā)興;航天三十五所知識(shí)管理系統(tǒng)研究[D];哈爾濱工業(yè)大學(xué);2010年
4 王根平;基于人才成長(zhǎng)規(guī)律的航天科技人員培養(yǎng)與激勵(lì)機(jī)制研究[D];天津大學(xué);2013年
5 張繼紅;航天科技人員工作壓力與績(jī)效的相關(guān)性分析[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2005年
6 趙楊楊;基于FMI的一體化仿真平臺(tái)及其在航天工程中的應(yīng)用[D];哈爾濱工業(yè)大學(xué);2013年
7 袁趙祥;宇航元器件在航天工程中應(yīng)用管理研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2013年
本文關(guān)鍵詞:面向航天領(lǐng)域知識(shí)管理的信息采集與分類應(yīng)用研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):362193
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/362193.html