半監(jiān)督的網(wǎng)絡(luò)科技信息分類模型
本文選題:網(wǎng)絡(luò)科技信息 + 網(wǎng)絡(luò)科技信息分類模型 ; 參考:《現(xiàn)代圖書情報(bào)技術(shù)》2014年11期
【摘要】:【目的】開放的網(wǎng)絡(luò)科技信息網(wǎng)頁內(nèi)容之間區(qū)分度較小,傳統(tǒng)基于規(guī)則和統(tǒng)計(jì)學(xué)習(xí)的方法無法滿足網(wǎng)絡(luò)科技信息網(wǎng)頁分類的具體應(yīng)用需求!痉椒ā客ㄟ^深入分析網(wǎng)絡(luò)科技信息主題網(wǎng)頁的內(nèi)容和結(jié)構(gòu),利用開放本體等資源實(shí)現(xiàn)領(lǐng)域特征的學(xué)習(xí),構(gòu)建半監(jiān)督的網(wǎng)絡(luò)科技信息分類模型!窘Y(jié)果】實(shí)驗(yàn)結(jié)果表明提出的方法在網(wǎng)絡(luò)科技信息分類實(shí)驗(yàn)中的精度、召回率和F1值分別達(dá)到0.9016、0.8756和0.8884,相比貝葉斯方法具有明顯優(yōu)勢(shì)!揪窒蕖吭摲椒ㄔ趹(yīng)用到其他類別的網(wǎng)絡(luò)科技信息分類時(shí),仍然需要領(lǐng)域?qū)<姨峁┫嚓P(guān)領(lǐng)域的核心種子特征!窘Y(jié)論】該方法可以滿足網(wǎng)絡(luò)科技信息深度加工的需求,實(shí)現(xiàn)有效的網(wǎng)絡(luò)科技信息網(wǎng)頁分類。
[Abstract]:[objective] Open web science and technology information web pages have a relatively small degree of differentiation, The traditional rule-based and statistical learning methods can not meet the specific application needs of the classification of web pages of network science and technology information. [methods] through in-depth analysis of the content and structure of the subject pages of network science and technology information, Using open ontology and other resources to realize domain feature learning, a semi-supervised classification model of network science and technology information is constructed. [results] the experimental results show the accuracy of the proposed method in the network science and technology information classification experiment. The recall rate and F1 value are 0.9016, 0.8756 and 0.8884, respectively, which have obvious advantages over Bayes method. [limitation] this method is applied to other types of network scientific and technological information classification. It is still necessary for domain experts to provide the core seed features of related fields. [conclusion] this method can meet the needs of the advanced processing of network science and technology information and realize the effective classification of web pages of network science and technology information.
【作者單位】: 中國科學(xué)院文獻(xiàn)情報(bào)中心;
【基金】:中國科學(xué)院文獻(xiàn)情報(bào)能力建設(shè)專項(xiàng)“網(wǎng)絡(luò)科技信息自動(dòng)監(jiān)測(cè)系統(tǒng)二期建設(shè)”項(xiàng)目(項(xiàng)目編號(hào):院1306) 國家“十二五”科技支撐計(jì)劃課題“科技知識(shí)組織體系共享服務(wù)平臺(tái)建設(shè)”(項(xiàng)目編號(hào):2011BAH10B03)的研究成果之一
【分類號(hào)】:TP393.0
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 劉云;王小黎;樊威;;國際科技資源監(jiān)測(cè)與服務(wù)體系構(gòu)建[J];科學(xué)學(xué)與科學(xué)技術(shù)管理;2012年08期
2 陳旭玲;樓佩煌;;改進(jìn)層次聚類算法在文獻(xiàn)分析中的應(yīng)用[J];數(shù)值計(jì)算與計(jì)算機(jī)應(yīng)用;2009年04期
3 劉勘;周麗紅;陳媈;;基于關(guān)鍵詞的科技文獻(xiàn)聚類研究[J];圖書情報(bào)工作;2012年04期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王飛躍;;國防裝備與系統(tǒng)的未來變革:從3D打印到平行軍事體系[J];國防科技;2013年03期
2 張倩;;大數(shù)據(jù)在突發(fā)事件政府決策中的應(yīng)用[J];東北農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2013年06期
3 高曉云;;試論基于大數(shù)據(jù)環(huán)境下的技術(shù)創(chuàng)新管理方法[J];中國管理信息化;2015年01期
4 李小培;張洪偉;鄒書蓉;;一種改進(jìn)的人工魚群聚類算法[J];成都信息工程學(xué)院學(xué)報(bào);2014年05期
5 劉勘;周麗紅;陳媈;;基于關(guān)鍵詞的科技文獻(xiàn)聚類研究[J];圖書情報(bào)工作;2012年04期
6 龔光明;王薇;蔣艷輝;周雙文;;基于領(lǐng)域本體的文本資料聚類算法改進(jìn)研究[J];情報(bào)科學(xué);2013年06期
7 王飛躍;;社會(huì)信號(hào)處理與分析的基本框架:從社會(huì)傳感網(wǎng)絡(luò)到計(jì)算辯證解析方法[J];中國科學(xué):信息科學(xué);2013年12期
8 王方;阮梅花;朱海剛;熊燕;繆有剛;;基于向量空間模型的科技文獻(xiàn)自動(dòng)分類研究[J];情報(bào)探索;2013年12期
9 鐘輝新;張興旺;黃曉斌;;面向大數(shù)據(jù)的企業(yè)競(jìng)爭(zhēng)情報(bào)動(dòng)態(tài)運(yùn)行模式MDD:監(jiān)控、發(fā)現(xiàn)、決策的互動(dòng)[J];情報(bào)理論與實(shí)踐;2014年03期
10 王翠波;吳金紅;;大數(shù)據(jù)環(huán)境下技術(shù)競(jìng)爭(zhēng)情報(bào)分析的挑戰(zhàn)及其應(yīng)對(duì)策略[J];情報(bào)雜志;2014年03期
相關(guān)會(huì)議論文 前1條
1 吳楠;王紅蕾;;大數(shù)據(jù)背景下管理科學(xué)發(fā)展前沿動(dòng)態(tài)[A];系統(tǒng)工程理論與應(yīng)用——貴州省系統(tǒng)工程學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2014年
相關(guān)博士學(xué)位論文 前2條
1 杜暉;基于耦合關(guān)系的學(xué)術(shù)信息資源深度聚合研究[D];武漢大學(xué);2013年
2 張?zhí)m廷;大數(shù)據(jù)的社會(huì)價(jià)值與戰(zhàn)略選擇[D];中共中央黨校;2014年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 許厚金;劉永炎;鄧成玉;劉永山;;基于相似中心的k-cmeans文本聚類算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2010年08期
2 陳旭玲;樓佩煌;;改進(jìn)層次聚類算法在文獻(xiàn)分析中的應(yīng)用[J];數(shù)值計(jì)算與計(jì)算機(jī)應(yīng)用;2009年04期
3 徐建鎖,王正歐;基于LSI和自組織神經(jīng)網(wǎng)絡(luò)的高效文本聚類方法[J];天津大學(xué)學(xué)報(bào);2004年11期
4 楚存坤;李韜;;模糊聚類技術(shù)在文獻(xiàn)自動(dòng)分類系統(tǒng)中的應(yīng)用[J];現(xiàn)代情報(bào);2009年09期
5 馬楠;官建成;;利用引文分析方法識(shí)別研究前沿的進(jìn)展與展望[J];中國科技論壇;2006年04期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 呂鳳英;關(guān)于網(wǎng)絡(luò)信息分類的一點(diǎn)思考[J];天中學(xué)刊;2002年05期
2 張s,
本文編號(hào):2003849
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2003849.html