基于《知網(wǎng)》的多種類型文獻(xiàn)混合自動(dòng)分類研究
本文關(guān)鍵詞:基于《知網(wǎng)》的多種類型文獻(xiàn)混合自動(dòng)分類研究 出處:《現(xiàn)代圖書(shū)情報(bào)技術(shù)》2016年02期 論文類型:期刊論文
更多相關(guān)文章: 第三方資源 知網(wǎng) 特征擴(kuò)展 語(yǔ)義差異
【摘要】:【目的】解決由于不同類型文獻(xiàn)而產(chǎn)生的特征不匹配等問(wèn)題,提高待分類文本的分類效果!痉椒ā渴褂门c待分類文本屬于不同文獻(xiàn)類型的文本作為語(yǔ)料庫(kù)的訓(xùn)練集,引入第三方資源《知網(wǎng)》進(jìn)行語(yǔ)義特征擴(kuò)展!窘Y(jié)果】利用該方法在網(wǎng)頁(yè)、圖書(shū)、非學(xué)術(shù)性期刊、學(xué)術(shù)性期刊4種類型文獻(xiàn)上進(jìn)行分類實(shí)驗(yàn),與未經(jīng)過(guò)擴(kuò)展的分類方法相比,分類準(zhǔn)確率提高1.2%至11.0%。【局限】未對(duì)每一種文獻(xiàn)類型都使用公開(kāi)語(yǔ)料進(jìn)行測(cè)試,因此本文方法的通用性和實(shí)驗(yàn)結(jié)果的客觀性有待進(jìn)一步檢驗(yàn)。【結(jié)論】實(shí)驗(yàn)結(jié)果表明,該方法具有一定的可行性和實(shí)用性,在不同程度上可以消除不同類型文獻(xiàn)之間的語(yǔ)義差異,從語(yǔ)料庫(kù)構(gòu)建和特征擴(kuò)展兩個(gè)途徑提高文本自動(dòng)分類的分類效果。
[Abstract]:The results show that the method has certain feasibility and practicability , which can eliminate the semantic differences among different types of documents , and improve the classification effect of text automatic classification from corpus construction and feature extension .
【作者單位】: 武漢大學(xué)信息管理學(xué)院;武漢大學(xué)信息資源研究中心;
【基金】:國(guó)家社會(huì)科學(xué)基金項(xiàng)目“多種類型文本數(shù)字資源自動(dòng)分類研究”(項(xiàng)目編號(hào):15BTQ066)的研究成果之一
【分類號(hào)】:TP391.1
【正文快照】: 1引言隨著互聯(lián)網(wǎng)的迅猛發(fā)展,網(wǎng)絡(luò)上的信息資源日益劇增,人們可以從互聯(lián)網(wǎng)上源源不斷地獲取各種形式的信息,如文本、圖片、音頻、視頻等。而文本可以來(lái)自于網(wǎng)頁(yè)、圖書(shū)、學(xué)術(shù)期刊論文等眾多文獻(xiàn)類型,人們可以獲得同一主題下具有不同內(nèi)涵、質(zhì)量、發(fā)布速度的信息。因此,利用文本分
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 吳慰慈;;文獻(xiàn)類型和特點(diǎn)概析[J];圖書(shū)與情報(bào);1990年04期
2 蔣蕊;簡(jiǎn)論“文獻(xiàn)類型學(xué)”[J];黑龍江圖書(shū)館;1991年01期
3 ;文獻(xiàn)類型[J];電子科技文摘;1999年04期
4 本刊編輯部;;參考文獻(xiàn)著錄中文獻(xiàn)類型、電子文獻(xiàn)載體類型標(biāo)志代碼如下[J];黔南民族醫(yī)專學(xué)報(bào);2011年02期
5 黃俊貴;;文獻(xiàn)類型標(biāo)識(shí)符探討[J];廣東圖書(shū)館學(xué)刊;1982年04期
6 王立貴;;文獻(xiàn)類型淺說(shuō)[J];山東圖書(shū)館季刊;1985年03期
7 江乃武;再論“連續(xù)性出版物”[J];圖書(shū)情報(bào)知識(shí);1986年01期
8 江乃武;;連續(xù)性出版物單獨(dú)管理是發(fā)展之必然[J];圖書(shū)館理論與實(shí)踐;1987年01期
9 朱芊;;文獻(xiàn)類型因素的主題詞和手檢標(biāo)題組配詞序的標(biāo)引方法[J];國(guó)家圖書(shū)館學(xué)刊;1988年03期
10 程磊;;關(guān)于文獻(xiàn)類型演變規(guī)律的研究——從文獻(xiàn)內(nèi)容重復(fù)交叉談起[J];圖書(shū)情報(bào)工作;1991年03期
,本文編號(hào):1433141
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1433141.html