天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于樹(shù)形分類的知識(shí)構(gòu)建和查詢應(yīng)用

發(fā)布時(shí)間:2021-10-17 14:27
  基于樹(shù)形分類的數(shù)據(jù)廣泛存在于人們的生產(chǎn)生活中,其具有內(nèi)在的邏輯性與科學(xué)性,可以更好地表現(xiàn)現(xiàn)實(shí)事物中的包含關(guān)系。但是受限于本身的劃分規(guī)則,其存在一定的局限性。主要表現(xiàn)在當(dāng)新的劃分需求出現(xiàn)時(shí),會(huì)在原有樹(shù)形分類下會(huì)產(chǎn)生一些跨越多個(gè)子類的新類,這個(gè)新類所包含的數(shù)據(jù)可能分布在原有樹(shù)形分類的各個(gè)分支中。因此需要對(duì)樹(shù)形分類數(shù)據(jù)進(jìn)行知識(shí)構(gòu)建,提取這些分支以滿足新的劃分需求。同時(shí),本文根據(jù)提取的新類信息設(shè)計(jì)并實(shí)現(xiàn)分類查詢的功能。在根據(jù)樹(shù)形分類數(shù)據(jù)進(jìn)行知識(shí)構(gòu)建過(guò)程中,本文從樹(shù)形分類的結(jié)構(gòu)特點(diǎn)出發(fā),將數(shù)據(jù)的位置信息作為構(gòu)建的依據(jù)。當(dāng)需要根據(jù)新類名進(jìn)行知識(shí)構(gòu)建時(shí),將與新類名相匹配的結(jié)點(diǎn)信息進(jìn)行剪枝,并將這些結(jié)點(diǎn)信息再次在樹(shù)形分類的數(shù)據(jù)中進(jìn)行匹配剪枝操作,重復(fù)這一部分直到無(wú)結(jié)點(diǎn)匹配成功時(shí),結(jié)束知識(shí)構(gòu)建。通過(guò)多次對(duì)子結(jié)點(diǎn)的提取,能夠?qū)⒉缓行骂惷c之語(yǔ)義相關(guān)的結(jié)點(diǎn)提取出來(lái),避免了僅僅基于新類名進(jìn)行字符串匹配而造成構(gòu)建結(jié)果不全面的問(wèn)題,實(shí)現(xiàn)了基于剪枝的知識(shí)構(gòu)建方法。在分類查詢的過(guò)程中,首先需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,將其轉(zhuǎn)化為分類查詢算法可以處理的向量形式。然后需要對(duì)于常用的分類算法進(jìn)行實(shí)驗(yàn)比較,選取適合本文的分類查詢... 

【文章來(lái)源】:北京林業(yè)大學(xué)北京市 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:53 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于樹(shù)形分類的知識(shí)構(gòu)建和查詢應(yīng)用


圖3.5?HTML頁(yè)面的樹(shù)形結(jié)構(gòu)表示??

信息,結(jié)點(diǎn),知識(shí)構(gòu)建,數(shù)據(jù)信息


作為知識(shí)構(gòu)建的數(shù)據(jù)準(zhǔn)備。??本文所采用的數(shù)據(jù),其結(jié)點(diǎn)信息W<key,value>形式的表示。其中key值表示了信??息的標(biāo)簽,value表示了信息的內(nèi)容。本文所采取數(shù)據(jù)標(biāo)簽中存在的條目如圖3.6所??不。??MeSH?Heading??Tree?Number(s)??Unique?ID??Annotation??Scope?Note??Entry?Version??Entry?Term(s)??Previous?Indexing??Public?MeSH?Note??History?Note??Date?Established??Date?of?Entry??Revision?Date??圖3.6本文所釆用數(shù)據(jù)信息??Figure?3.6?Data?information?used?in?this?paper??由圖3.6所示,本文所采取的數(shù)據(jù)其結(jié)點(diǎn)信息不僅包含了對(duì)于結(jié)點(diǎn)描述如MeSH??Heading、Scope?Note,還存在一些其它信息,如?Date?Established、Revision?Date、History??Note等。這些信息是對(duì)結(jié)點(diǎn)的一個(gè)補(bǔ)充說(shuō)明,但并不能代表結(jié)點(diǎn)的特征。因此應(yīng)當(dāng)??去除這些信息,避免其對(duì)知識(shí)構(gòu)建造成影響。??最后將樹(shù)中所有結(jié)點(diǎn)的數(shù)據(jù)信息創(chuàng)建索引并存儲(chǔ)到本地,索引記錄了數(shù)據(jù)信息在??結(jié)點(diǎn)中出現(xiàn)的位置,查詢結(jié)點(diǎn)信息時(shí),不需要在樹(shù)形分類數(shù)據(jù)中進(jìn)行遍歷,只需根據(jù)??其下標(biāo)進(jìn)行查找,可以節(jié)省查找時(shí)間。當(dāng)樹(shù)形數(shù)據(jù)不出現(xiàn)變動(dòng)的時(shí)候,索引不需要調(diào)??整

示意圖,樹(shù)形數(shù)據(jù),示意圖,樹(shù)形分類


基于樹(shù)形分類的知識(shí)構(gòu)建和查詢應(yīng)用??研究對(duì)象為基于樹(shù)形分類的數(shù)據(jù),因此要選擇合適的數(shù)據(jù)示,盡可能得保存原樹(shù)形分類數(shù)據(jù)中的信息。??數(shù)據(jù)的特點(diǎn)??的數(shù)據(jù)并不是脫離彼此獨(dú)立存在的,在數(shù)據(jù)之間常常存在16)。每一個(gè)數(shù)據(jù)都對(duì)應(yīng)樹(shù)形結(jié)構(gòu)中的一個(gè)結(jié)點(diǎn);數(shù)據(jù)之兄弟關(guān)系等。因此,基于樹(shù)形分類的數(shù)據(jù)不僅包含結(jié)點(diǎn)間的關(guān)系信息。若實(shí)現(xiàn)基于新類名的知識(shí)構(gòu)建,需要同時(shí)結(jié)點(diǎn)之間關(guān)系信息,從而最大程度上保證知識(shí)構(gòu)建結(jié)果準(zhǔn)據(jù)如圖3.7所示。??

【參考文獻(xiàn)】:
期刊論文
[1]WordNG-Vec:一種應(yīng)用于CNN文本分類的詞向量模型[J]. 王勇,何養(yǎng)明,鄒輝,黎春,陳薈西.  小型微型計(jì)算機(jī)系統(tǒng). 2019(03)
[2]一種改進(jìn)的類別區(qū)分詞特征選擇算法[J]. 李富星,蒙祖強(qiáng).  計(jì)算機(jī)與現(xiàn)代化. 2019(03)
[3]基于SA-SVM的中文文本分類研究[J]. 郭超磊,陳軍華.  計(jì)算機(jī)應(yīng)用與軟件. 2019(03)
[4]基于最大匹配算法的似然導(dǎo)向中文分詞方法[J]. 楊貴軍,徐雪,鳳麗洲,徐玉慧.  統(tǒng)計(jì)與信息論壇. 2019(03)
[5]基于詞向量的文本分類研究[J]. 馬力,李沙沙.  計(jì)算機(jī)與數(shù)字工程. 2019(02)
[6]中文文本分類方法研究[J]. 李凱.  電腦知識(shí)與技術(shù). 2019(04)
[7]基于支持向量機(jī)的不均衡文本分類方法[J]. 高超,許翰林.  現(xiàn)代電子技術(shù). 2018(15)
[8]基于Doc2Vec與SVM的聊天內(nèi)容過(guò)濾[J]. 岳文應(yīng).  計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(07)
[9]樹(shù)形層次結(jié)構(gòu)的非平衡SVM分類方法[J]. 鄧曦輝,趙麗.  計(jì)算機(jī)工程與設(shè)計(jì). 2017(08)
[10]一種基于改進(jìn)的TF-IDF和支持向量機(jī)的中文文本分類研究[J]. 郭太勇.  軟件. 2016(12)

碩士論文
[1]基于機(jī)器學(xué)習(xí)的文本分類研究與實(shí)現(xiàn)[D]. 王振.南京郵電大學(xué) 2018
[2]基于word2vec和SVM的文本內(nèi)容監(jiān)測(cè)分析應(yīng)用研究[D]. 王慶龍.南昌大學(xué) 2018
[3]基于最小二乘支持向量機(jī)的軟件系統(tǒng)老化預(yù)測(cè)研究[D]. 陳珂.西安建筑科技大學(xué) 2018
[4]基于混合核函數(shù)MAPSO-SVR的邊坡位移預(yù)測(cè)研究[D]. 于良.江西理工大學(xué) 2018
[5]閉合頻繁子樹(shù)挖掘算法研究[D]. 唐知毅.吉林大學(xué) 2016
[6]基于GPU的樹(shù)形結(jié)構(gòu)數(shù)據(jù)處理[D]. 陸易凡.東南大學(xué) 2016
[7]基于模型空間的樹(shù)形數(shù)據(jù)分類和回歸[D]. 董亞?wèn)|.中國(guó)科學(xué)技術(shù)大學(xué) 2016
[8]基于樹(shù)形關(guān)鍵詞集合的中文文本分類方法研究與實(shí)現(xiàn)[D]. 連惠瓊.華南理工大學(xué) 2015



本文編號(hào):3441917

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3441917.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ce217***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com