天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于《知網(wǎng)》的多種類型文獻混合自動分類研究

發(fā)布時間:2018-01-16 12:26

  本文關(guān)鍵詞:基于《知網(wǎng)》的多種類型文獻混合自動分類研究 出處:《現(xiàn)代圖書情報技術(shù)》2016年02期  論文類型:期刊論文


  更多相關(guān)文章: 第三方資源 知網(wǎng) 特征擴展 語義差異


【摘要】:【目的】解決由于不同類型文獻而產(chǎn)生的特征不匹配等問題,提高待分類文本的分類效果。【方法】使用與待分類文本屬于不同文獻類型的文本作為語料庫的訓(xùn)練集,引入第三方資源《知網(wǎng)》進行語義特征擴展。【結(jié)果】利用該方法在網(wǎng)頁、圖書、非學(xué)術(shù)性期刊、學(xué)術(shù)性期刊4種類型文獻上進行分類實驗,與未經(jīng)過擴展的分類方法相比,分類準(zhǔn)確率提高1.2%至11.0%。【局限】未對每一種文獻類型都使用公開語料進行測試,因此本文方法的通用性和實驗結(jié)果的客觀性有待進一步檢驗。【結(jié)論】實驗結(jié)果表明,該方法具有一定的可行性和實用性,在不同程度上可以消除不同類型文獻之間的語義差異,從語料庫構(gòu)建和特征擴展兩個途徑提高文本自動分類的分類效果。
[Abstract]:The results show that the method has certain feasibility and practicability , which can eliminate the semantic differences among different types of documents , and improve the classification effect of text automatic classification from corpus construction and feature extension .

【作者單位】: 武漢大學(xué)信息管理學(xué)院;武漢大學(xué)信息資源研究中心;
【基金】:國家社會科學(xué)基金項目“多種類型文本數(shù)字資源自動分類研究”(項目編號:15BTQ066)的研究成果之一
【分類號】:TP391.1
【正文快照】: 1引言隨著互聯(lián)網(wǎng)的迅猛發(fā)展,網(wǎng)絡(luò)上的信息資源日益劇增,人們可以從互聯(lián)網(wǎng)上源源不斷地獲取各種形式的信息,如文本、圖片、音頻、視頻等。而文本可以來自于網(wǎng)頁、圖書、學(xué)術(shù)期刊論文等眾多文獻類型,人們可以獲得同一主題下具有不同內(nèi)涵、質(zhì)量、發(fā)布速度的信息。因此,利用文本分

【相似文獻】

相關(guān)期刊論文 前10條

1 吳慰慈;;文獻類型和特點概析[J];圖書與情報;1990年04期

2 蔣蕊;簡論“文獻類型學(xué)”[J];黑龍江圖書館;1991年01期

3 ;文獻類型[J];電子科技文摘;1999年04期

4 本刊編輯部;;參考文獻著錄中文獻類型、電子文獻載體類型標(biāo)志代碼如下[J];黔南民族醫(yī)專學(xué)報;2011年02期

5 黃俊貴;;文獻類型標(biāo)識符探討[J];廣東圖書館學(xué)刊;1982年04期

6 王立貴;;文獻類型淺說[J];山東圖書館季刊;1985年03期

7 江乃武;再論“連續(xù)性出版物”[J];圖書情報知識;1986年01期

8 江乃武;;連續(xù)性出版物單獨管理是發(fā)展之必然[J];圖書館理論與實踐;1987年01期

9 朱芊;;文獻類型因素的主題詞和手檢標(biāo)題組配詞序的標(biāo)引方法[J];國家圖書館學(xué)刊;1988年03期

10 程磊;;關(guān)于文獻類型演變規(guī)律的研究——從文獻內(nèi)容重復(fù)交叉談起[J];圖書情報工作;1991年03期

,

本文編號:1433141

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1433141.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e256d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com