天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于多標(biāo)簽分類的學(xué)術(shù)文獻潛在時間意圖識別研究

發(fā)布時間:2018-05-05 16:40

  本文選題:多標(biāo)簽分類 + 主題模型 ; 參考:《湖南大學(xué)學(xué)報(自然科學(xué)版)》2017年10期


【摘要】:為了提高檢索結(jié)果的時間相關(guān)性,將文本特征抽取和多標(biāo)簽分類算法應(yīng)用于文獻檢索的潛在時間意圖分類研究之中.從檢索潛在時間意圖分類的角度出發(fā),提出一種基于文本時間信息抽取和Labeled LDA(標(biāo)簽主題模型)的文獻潛在時間意圖自動分類算法.首先,在獲取的文獻時間信息基礎(chǔ)上,將文獻檢索潛在時間意圖映射至具體時間類別.其次,為了減少時間信息的稀疏性對分類特征學(xué)習(xí)過程的影響,利用交叉學(xué)科中時間短語分布特征優(yōu)化Labeled LDA分類模型的標(biāo)簽選擇過程.最后,將所提算法與其他多標(biāo)簽分類算法進行對比實驗,分析和評估文獻檢索潛在時間意圖自動分類的準(zhǔn)確率.結(jié)果表明,所提算法的AUC的值達(dá)到79.6%,較同類基準(zhǔn)算法ECC(整體分類鏈)提高約10.9%,且針對不同學(xué)科均取得了較好的分類效果,是一種有效的文獻檢索潛在時間意圖學(xué)習(xí)方法.
[Abstract]:In order to improve the temporal correlation of retrieval results, text feature extraction and multi-label classification algorithms are applied to the research of potential temporal intention classification in literature retrieval. From the point of view of retrieval potential time intention classification, a document potential time intention automatic classification algorithm based on text time information extraction and Labeled LDA (label topic Model) is proposed. Firstly, based on the acquired time information, the potential time intention of literature retrieval is mapped to specific time categories. Secondly, in order to reduce the influence of time information sparsity on classification feature learning process, the label selection process of Labeled LDA classification model is optimized by using temporal phrase distribution features in cross-discipline. Finally, the proposed algorithm is compared with other multi-label classification algorithms to analyze and evaluate the accuracy of automatic classification of potential time intention in literature retrieval. The results show that the AUC value of the proposed algorithm is 79.6, which is about 10.9 higher than that of the similar benchmark algorithm Ecc (global classification chain), and the classification effect is good for different subjects. It is an effective method for document retrieval potential time intention learning.
【作者單位】: 南京理工大學(xué)經(jīng)濟管理學(xué)院;華南師范大學(xué)計算機學(xué)院;
【基金】:國家自然科學(xué)基金資助項目(71503124) 江蘇省社會科學(xué)基金青年資助項目(15TQC03)~~
【分類號】:TP391.1

【相似文獻】

相關(guān)期刊論文 前5條

1 侯小雯;鄒永利;;網(wǎng)絡(luò)學(xué)術(shù)文獻內(nèi)圖片的自動識別與檢索[J];情報理論與實踐;2008年06期

2 李黎;唐亮;高凡;;中國學(xué)術(shù)文獻總庫(CNKI)的主要功能和使用技巧[J];農(nóng)業(yè)圖書情報學(xué)刊;2009年04期

3 沙勇;;《中國學(xué)術(shù)文獻網(wǎng)絡(luò)出版總庫》應(yīng)用研究[J];齊齊哈爾大學(xué)學(xué)報;2008年06期

4 郭萍;;CAJ Viewer在學(xué)術(shù)文獻使用中的功能與技巧[J];金陵科技學(xué)院學(xué)報;2011年03期

5 何焱;宋麗麗;;關(guān)鍵領(lǐng)域熱點發(fā)現(xiàn)與跟蹤[J];西南師范大學(xué)學(xué)報(自然科學(xué)版);2014年07期

相關(guān)會議論文 前1條

1 倪維健;柳梅;曾慶田;劉彤;湯建渝;;一個面向主題的學(xué)術(shù)文獻數(shù)據(jù)分析工具[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)(NDBC2012)[C];2012年

相關(guān)重要報紙文章 前1條

1 本報見習(xí)記者 李淼;駛向?qū)W術(shù)文獻網(wǎng)絡(luò)出版的藍(lán)海[N];中國新聞出版報;2009年

相關(guān)博士學(xué)位論文 前1條

1 強繼朋;基于帶有通配符序列模式和概率主題模型的多文檔摘要技術(shù)研究[D];合肥工業(yè)大學(xué);2016年



本文編號:1848457

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1848457.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶47864***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com