天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于多特征多分類器集成的專利自動分類研究

發(fā)布時間:2018-05-09 02:38

  本文選題:專利分類 + 段落向量 ; 參考:《數(shù)據(jù)分析與知識發(fā)現(xiàn)》2017年08期


【摘要】:【目的】為了準確地給專利申請書分配IPC分類號,本文提出一種基于多特征多分類器集成的專利自動分類方法。【方法】使用從專利申請書中提取的全詞典TFIDF特征、信息增益詞典TFIDF特征、段落向量特征、主題模型向量特征,分別訓練樸素貝葉斯、支持向量機、AdaBoost分類器,以此構(gòu)建特征 類別矩陣,并結(jié)合F1權(quán)重矩陣集成,獲得最終IPC預測分類號!窘Y(jié)果】對2014年 2016年"發(fā)動機或泵"領(lǐng)域的10個小類進行分類,使用Top Prediction、All Categories和Two Guesses三種評估方法得到準確率分別為:78.9%、80.1%、91.2%。【局限】訓練僅僅使用了2014年 2016年共三年的專利數(shù)據(jù),數(shù)據(jù)規(guī)模有限!窘Y(jié)論】在"發(fā)動機或泵"領(lǐng)域,本文方法能夠有效地提高專利文本分類的準確率。
[Abstract]:[objective] in order to assign IPC classification number to patent application accurately, this paper presents a patent automatic classification method based on multi-feature multi-classifier integration. [methods] A full-dictionary TFIDF feature extracted from patent application is used. TFIDF feature, paragraph vector feature, subject model vector feature of information gain dictionary, training naive Bayes, support vector machine and AdaBoost classifier respectively to construct feature class matrix and integrate F1 weight matrix. Get the final IPC forecast taxonomy number. [results] classify 10 subcategories in the "engine or pump" area in 2014 or 2016, Using the Top prediction all Categories and Two Guesses methods, the accuracy rates are: 78.9% and 80.1%, 91.2% respectively. [limited] the training only uses patent data from 2014 to 2016, and the data scale is limited. [conclusion] in the field of "engines or pumps," This method can effectively improve the accuracy of patent text classification.
【作者單位】: 北京聯(lián)合大學智慧城市學院;北京聯(lián)合大學機器人學院;北京聯(lián)合大學城市軌道交通與物流學院;
【基金】:國家重點研發(fā)計劃項目“公共安全風險防控與應急技術(shù)裝備”(項目編號:2016YFC0802107) 北京市教育委員會科技計劃面上項目(項目編號:SQKM201411417013)的研究成果之一
【分類號】:G254.1

【相似文獻】

相關(guān)期刊論文 前1條

1 喬建忠;;基于多分類器組合擇優(yōu)方法的主題爬行分類策略[J];圖書情報工作;2013年14期



本文編號:1864214

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/1864214.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶29a6a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com