天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于敘詞表和文獻(xiàn)數(shù)據(jù)庫(kù)的農(nóng)業(yè)領(lǐng)域本體構(gòu)建方法研究

發(fā)布時(shí)間:2021-07-24 19:50
  我國(guó)是一個(gè)農(nóng)業(yè)大國(guó),農(nóng)業(yè)的發(fā)展對(duì)于國(guó)民經(jīng)濟(jì)的增長(zhǎng)具有舉足輕重的作用,而農(nóng)業(yè)領(lǐng)域的科學(xué)研究則與農(nóng)業(yè)發(fā)展有著直接而密切的聯(lián)系。目前,農(nóng)業(yè)領(lǐng)域的科研人員所面臨的一個(gè)困擾就是自己被信息的海洋所湮沒(méi),無(wú)法方便地獲得自己需要的信息,根本原因在于傳統(tǒng)的知識(shí)組織方式固有的弊端。而本體的構(gòu)建可以在很大程度上解決這個(gè)問(wèn)題。本文在研究了國(guó)內(nèi)外大量相關(guān)文獻(xiàn)的基礎(chǔ)上,提出了以《農(nóng)業(yè)科學(xué)敘詞表》和農(nóng)業(yè)領(lǐng)域文獻(xiàn)為基礎(chǔ)進(jìn)行農(nóng)業(yè)領(lǐng)域本體半自動(dòng)構(gòu)建的思路。該思想的提出基于以下兩點(diǎn):(1)《農(nóng)表》是現(xiàn)已有的知識(shí)體系,是農(nóng)業(yè)領(lǐng)域?qū)<壹w智慧的結(jié)晶,它提供了最豐富、最權(quán)威的術(shù)語(yǔ)集合,從中進(jìn)行領(lǐng)域概念和術(shù)語(yǔ)的提取,可以保證本體知識(shí)體系的完整性和規(guī)范性。(2)農(nóng)業(yè)領(lǐng)域文獻(xiàn)作為本體概念的另一個(gè)來(lái)源,則是《農(nóng)表》最為有力的補(bǔ)充,它存儲(chǔ)量大,動(dòng)態(tài)性好,可以為本體的構(gòu)建提供更為廣泛的術(shù)語(yǔ)范圍和更復(fù)雜的概念關(guān)系。文章對(duì)于農(nóng)業(yè)文獻(xiàn)的篇章結(jié)構(gòu)進(jìn)行了研究,并據(jù)此提出了農(nóng)業(yè)領(lǐng)域本體的整體框架,確定了主要的類(lèi)、屬性及類(lèi)間關(guān)系,橫向上保證了本體框架的科學(xué)性和合理性;對(duì)于《農(nóng)表》編制結(jié)構(gòu)、收錄的術(shù)語(yǔ)范圍、術(shù)語(yǔ)間關(guān)系進(jìn)行了深入剖析,挑取出了本體的主要研究類(lèi)... 

【文章來(lái)源】:中國(guó)農(nóng)業(yè)科學(xué)院北京市

【文章頁(yè)數(shù)】:67 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于敘詞表和文獻(xiàn)數(shù)據(jù)庫(kù)的農(nóng)業(yè)領(lǐng)域本體構(gòu)建方法研究


語(yǔ)義網(wǎng)層次結(jié)構(gòu)

文檔,格式,中文分詞


圖 3-4 PDF 文檔向 WORD 格式的轉(zhuǎn)換Figure 3-4 The Conversion of PDF to WORD3.3.2 中文分詞(1)分詞方法英文中的詞與詞之間都有空格這一分隔符,因此,英文基本不用分詞就可以直接進(jìn)入到檢索技術(shù)、短語(yǔ)切分、語(yǔ)義分析等高一層的技術(shù)領(lǐng)域。中文與英文不同,對(duì)于中文來(lái)說(shuō),詞是承載語(yǔ)義的最小單位。單個(gè)漢字一般很難單獨(dú)表達(dá)一定的含義,需要幾個(gè)字連在一起去表達(dá)一個(gè)完整的意思,又因?yàn)橹形牡脑~之間沒(méi)有自然分隔符,這就需要采用一定的技術(shù)手段把中文的詞進(jìn)行切分,使其成為有意義的詞,把字與字連在一起的漢語(yǔ)句子分成若干個(gè)相互獨(dú)立、完整、正確的單詞的過(guò)程就是中文分詞。中文分詞屬于自然語(yǔ)言處理技術(shù)的范疇,處理過(guò)程需要依賴(lài)分詞算法才能進(jìn)行,F(xiàn)有的分詞方法分為以下三種:1)基于字符串匹配的分詞法該方法又叫機(jī)械分詞法,一般以分詞詞典為依據(jù),按照一定的策略將文檔中的待切分漢字串與詞典中的詞條進(jìn)行逐一匹配,若在詞典中找到一個(gè)最長(zhǎng)的結(jié)果,則匹配成功。常用的幾種機(jī)械分詞方法如下:正向最大匹配法(Forward Maximum Matching,F(xiàn)MM)、逆向最大匹配法(Reverse

獼猴桃科,獼猴桃屬植物,獼猴桃屬


該方法的缺陷在于,會(huì)抽取出一些共現(xiàn)頻度很高、但又不是詞的字組,此外詞的識(shí)別精度差,時(shí)空開(kāi)銷(xiāo)比較大。實(shí)際應(yīng)用中,統(tǒng)計(jì)分詞系統(tǒng)一般將串匹配和串頻統(tǒng)計(jì)結(jié)合到一起進(jìn)行分詞。用一部常用行串匹配分詞,同時(shí)利用串頻統(tǒng)計(jì)方法識(shí)別新詞,這樣既結(jié)合了匹配分詞切詞速度快的特用了無(wú)詞典分詞方法能夠識(shí)別生詞、自動(dòng)消除歧義的優(yōu)勢(shì)。)分詞工具 ICTCLAS2011基于多層隱馬模型的漢語(yǔ)語(yǔ)法分析系統(tǒng) ICTCLAS(Institute of Computing Technology,Chical Analysis System)是由中國(guó)科學(xué)院計(jì)算技術(shù)研究所在多年研究基礎(chǔ)上研制成功的。它一個(gè)開(kāi)放源碼的中文分詞系統(tǒng),其主要功能包括中文分詞、詞性標(biāo)注、命名實(shí)體識(shí)別、識(shí)別,同時(shí)支持用戶(hù)詞典、繁體中文,支持 UNICODE、GBK、UTF-8、UTF-7 等多種。ICTCLAS 還提供完整的動(dòng)態(tài)連接庫(kù)組件和相應(yīng)的概率詞典,開(kāi)發(fā)者可以完全忽略漢析,直接在自己的系統(tǒng)中調(diào)用 ICTCLAS。2011 年 4 月,ICTCLAS 的發(fā)明者張華平博士ICTCLAS2011 最新 u0404 版本,該版本的主要更新有:全面支持 UTF-8,BIG5 與 GBK式;修正了部分內(nèi)核 Bug;提供了 Win7 下的支持庫(kù),提供 Linux64 位與 32 位的支持庫(kù)

【參考文獻(xiàn)】:
期刊論文
[1]基于領(lǐng)域本體的政務(wù)信息檢索系統(tǒng)[J]. 于靜,吳國(guó)全,盧燚.  計(jì)算機(jī)應(yīng)用. 2010(06)
[2]電子信息產(chǎn)品領(lǐng)域的本體構(gòu)建與應(yīng)用[J]. 蔣國(guó)瑞,袁通.  計(jì)算機(jī)應(yīng)用研究. 2010(05)
[3]文本從屬語(yǔ)義關(guān)系提取及本體構(gòu)建研究[J]. 殷鳳霞.  安康學(xué)院學(xué)報(bào). 2010(02)
[4]醫(yī)學(xué)文獻(xiàn)領(lǐng)域本體的構(gòu)建及其關(guān)鍵技術(shù)分析[J]. 李萍萍,李書(shū)賓.  預(yù)防醫(yī)學(xué)情報(bào)雜志. 2010(03)
[5]基于政務(wù)主題詞表的政府信息本體構(gòu)建及應(yīng)用[J]. 盧燚,張波.  計(jì)算機(jī)工程與設(shè)計(jì). 2010(03)
[6]從文本自動(dòng)構(gòu)建OWL本體的研究[J]. 蔡榮彥.  信息與電腦(理論版). 2010(02)
[7]中文本體構(gòu)建及可視化研究[J]. 王曉盈,王曉璇,劉鵬.  計(jì)算機(jī)技術(shù)與發(fā)展. 2010(02)
[8]中文核心領(lǐng)域本體構(gòu)建的一種改進(jìn)方法[J]. 諶貽榮,陸勤,李文捷,崔高穎.  中文信息學(xué)報(bào). 2010(01)
[9]構(gòu)建本體時(shí)獲取概念方法研究[J]. 李光達(dá),常春.  情報(bào)科學(xué). 2009(05)
[10]新時(shí)期數(shù)字圖書(shū)館的本體自動(dòng)構(gòu)建[J]. 顧波.  黑龍江史志. 2009(07)

博士論文
[1]領(lǐng)域本體的構(gòu)建方法與應(yīng)用研究[D]. 李景.中國(guó)農(nóng)業(yè)科學(xué)院 2009
[2]基于敘詞表的中醫(yī)古籍文獻(xiàn)領(lǐng)域本體建模方法研究[D]. 谷建軍.中國(guó)中醫(yī)科學(xué)院 2006
[3]Ontology在農(nóng)業(yè)信息管理中的構(gòu)建和轉(zhuǎn)化[D]. 常春.中國(guó)農(nóng)業(yè)科學(xué)院 2004

碩士論文
[1]基于統(tǒng)計(jì)的多文檔關(guān)鍵短語(yǔ)和文摘抽取研究[D]. 張永剛.蘇州大學(xué) 2010
[2]中文自動(dòng)分詞系統(tǒng)的研究與實(shí)現(xiàn)[D]. 周程遠(yuǎn).華東師范大學(xué) 2010
[3]科技論文關(guān)鍵詞抽取技術(shù)的研究[D]. 嚴(yán)春風(fēng).蘇州大學(xué) 2009
[4]基于領(lǐng)域本體的用戶(hù)查詢(xún)?cè)~擴(kuò)展方法的研究[D]. 張冰.西華大學(xué) 2009
[5]基于用戶(hù)詞典的搜索個(gè)性化研究[D]. 羅穎.重慶大學(xué) 2009
[6]基于機(jī)器學(xué)習(xí)的中文文本分類(lèi)方法研究[D]. 劉依璐.西安電子科技大學(xué) 2009
[7]基于領(lǐng)域本體的語(yǔ)義信息檢索及相關(guān)技術(shù)研究[D]. 劉愛(ài)軍.西北大學(xué) 2008
[8]本體知識(shí)庫(kù)的構(gòu)建與進(jìn)化方法研究[D]. 王璀民.中國(guó)海洋大學(xué) 2008
[9]農(nóng)業(yè)科學(xué)敘詞表向農(nóng)業(yè)本體轉(zhuǎn)化系統(tǒng)的研究與實(shí)現(xiàn)[D]. 鮮國(guó)建.中國(guó)農(nóng)業(yè)科學(xué)院 2008
[10]基于中文文本的本體構(gòu)建方法研究[D]. 劉威.哈爾濱工程大學(xué) 2008



本文編號(hào):3301315

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/3301315.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)d8115***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com