機器學(xué)習(xí)在中文期刊論文自動分類研究中的應(yīng)用
發(fā)布時間:2017-10-28 10:13
本文關(guān)鍵詞:機器學(xué)習(xí)在中文期刊論文自動分類研究中的應(yīng)用
更多相關(guān)文章: 機器學(xué)習(xí) 期刊論文 文本自動分類 特征加權(quán) 層次分類法
【摘要】:【目的】在機器學(xué)習(xí)的計算模式下,利用特征加權(quán)和淺層次分類方法可以有效實現(xiàn)期刊論文的中圖法分類!緫(yīng)用背景】傳統(tǒng)的人工分類方式在大數(shù)據(jù)環(huán)境下顯得力不從心,而期刊電子化趨勢使得自動分類技術(shù)能夠有效緩解人工分類的壓力。【方法】將機器學(xué)習(xí)的思想運用到期刊論文的自動分類領(lǐng)域,分析比較支持向量機和BP神經(jīng)網(wǎng)絡(luò)算法在期刊論文自動分類中的效果,利用層次分類理念將中圖法轉(zhuǎn)化為三層分類體系,將類目號的獲取簡化為三層分類的實現(xiàn),基于特征的來源設(shè)置特征值的權(quán)重!窘Y(jié)果】分類實驗表明,支持向量機算法在大規(guī)模稀疏數(shù)據(jù)環(huán)境中較BP神經(jīng)網(wǎng)絡(luò)算法更合理,三層體系的分類正確率自頂向下分別達(dá)到95.05%、92.89%和89.02%,綜合正確率接近80%,多來源的特征權(quán)重在論文自動分類中較單一權(quán)重具有更好的分類效果!窘Y(jié)論】研究表明機器學(xué)習(xí)方法在期刊論文的自動分類方面具有較高的可行性、合理性和有效性,為期刊論文自動分類的實現(xiàn)提出新的思路。
【作者單位】: 南京大學(xué)信息管理學(xué)院;
【關(guān)鍵詞】: 機器學(xué)習(xí) 期刊論文 文本自動分類 特征加權(quán) 層次分類法
【基金】:江蘇省自然科學(xué)基金項目“面向?qū)@A(yù)警的中文本體學(xué)習(xí)研究”(項目編號:BK20130587) 國家社會科學(xué)基金重點項目“基于語義的館藏資源深度聚合與可視化展示研究”(項目編號:11AZD090)子課題的研究成果之一
【分類號】:TP181;TP391.1
【正文快照】: 1引言隨著信息技術(shù)的發(fā)展,人們對圖書館信息服務(wù)數(shù)字化的要求也越來越強烈,數(shù)字圖書館建設(shè)已經(jīng)成為圖書館事業(yè)發(fā)展的重要課題。期刊數(shù)字圖書館就是將期刊論文電子化,主要面臨兩個工作:期刊論文的格式必須有統(tǒng)一標(biāo)準(zhǔn)、期刊論文的分類管理[1]。經(jīng)過多年的努力,期刊論文現(xiàn)在已經(jīng)
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉大寧;楊永樂;白林;;SVM核函數(shù)對分類精度影響的研究[J];佳木斯大學(xué)學(xué)報(自然科學(xué)版);2012年04期
2 張野;楊建林;;基于KNN和SVM的中文文本自動分類研究[J];情報科學(xué);2011年09期
3 王東波;蘇新寧;朱丹浩;年洪東;;基于支持向量機的醫(yī)學(xué)期刊文章自動分類研究[J];情報理論與實踐;2011年04期
4 奉國和;;SVM分類核函數(shù)及參數(shù)選擇比較[J];計算機工程與應(yīng)用;2011年03期
5 牛延莉;張化;;文本自動分類研究進展[J];軟件導(dǎo)刊;2008年04期
6 蕭莉明;于寬;蔡s,
本文編號:1107791
本文鏈接:http://sikaile.net/wenshubaike/xingzhengshiwu/1107791.html
最近更新
教材專著