天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 社科論文 > 圖書檔案論文 >

基于深度學(xué)習(xí)的中文專利文本自動(dòng)分類研究

發(fā)布時(shí)間:2025-01-09 02:54
  專利文本作為重要信息的載體,對(duì)其實(shí)現(xiàn)自動(dòng)分類具有重要的研究意義。隨著大數(shù)據(jù)時(shí)代的到來(lái),人們?cè)絹?lái)越重視知識(shí)產(chǎn)權(quán),專利文件也越來(lái)越多,面臨的問(wèn)題就是如何對(duì)專利文件進(jìn)行正確的檢索與分類管理。目前對(duì)于專利的分類主要還是以人工為主,不僅耗時(shí)耗力,還不能保證分類的準(zhǔn)確率。因此,迫切需要對(duì)專利文本進(jìn)行自動(dòng)分類,以提高專利分類效率與審查速度。針對(duì)上述情況,本文對(duì)中文專利文本分類主要做了以下研究:首先,針對(duì)海量的專利文本,提出一種基于Word2Vec和logistic回歸的中文專利文本分類的機(jī)器學(xué)習(xí)方法。本方法利用Word2Vec產(chǎn)生的詞向量對(duì)專利文本進(jìn)行表示,然后配合logistic回歸模型,對(duì)專利說(shuō)明和摘要合并的文本語(yǔ)料進(jìn)行學(xué)習(xí)和訓(xùn)練,從而實(shí)現(xiàn)對(duì)專利文本的自動(dòng)分類。試驗(yàn)結(jié)果表明,本文提出的機(jī)器學(xué)習(xí)方法能夠得到較好的分類效果,其中個(gè)別類別的分類準(zhǔn)確率達(dá)到了 83.6%;并且與k近鄰算法相比,該模型在精確度、召回率以及F1值上均有顯著提高。另外,雖然Word2Vec模型相較one-hot編碼、TF-IDF表示法而言,有顯著提高分類的效果,但是它不能解決一詞多義的問(wèn)題。因此,為解決利用Word2Vec模型進(jìn)...

【文章頁(yè)數(shù)】:64 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖1-1論文研宄框架??第一章是引言,主要包括專利文本分類的研究背景及意義、目前國(guó)內(nèi)外的研??究現(xiàn)狀

圖1-1論文研宄框架??第一章是引言,主要包括專利文本分類的研究背景及意義、目前國(guó)內(nèi)外的研??究現(xiàn)狀

浙江科技學(xué)院碩士學(xué)位論文?第1章引言??f?\?,??I?引言?I??!?L?一???J??\?^^^_?:??!?背景及意義?國(guó)內(nèi)外研究現(xiàn)狀?研究?jī)?nèi)容與結(jié)構(gòu)|??I?V?)?V?J?V?J?\??I?廣?N?I??;?f專利文本分類相關(guān)?I??!?技術(shù)?:??j?t?一、^^?....


圖2-1專利文本分類流程??

圖2-1專利文本分類流程??

浙江科技學(xué)院碩士學(xué)位論文?第2章專利文本分類相關(guān)技術(shù)介紹??第2章專利文本分類相關(guān)技術(shù)介紹??2.1專利文本分類流程??專利文本是一種特殊的文本,大量專業(yè)術(shù)語(yǔ)的使用,行業(yè)特定的語(yǔ)言降低了??詞匯密度,并可能導(dǎo)致算法的搜索空間稀疏。故意使用的非標(biāo)準(zhǔn)化語(yǔ)言可能會(huì)幫??助申請(qǐng)人擴(kuò)大專利....


圖2-2決策樹示意圖??決策樹訓(xùn)練的過(guò)程其實(shí)是一個(gè)從訓(xùn)練集中歸納總結(jié)分類規(guī)則的過(guò)程,能對(duì)訓(xùn)??

圖2-2決策樹示意圖??決策樹訓(xùn)練的過(guò)程其實(shí)是一個(gè)從訓(xùn)練集中歸納總結(jié)分類規(guī)則的過(guò)程,能對(duì)訓(xùn)??

浙江科技學(xué)院碩士學(xué)位論文?第2章專利文本分類相關(guān)技術(shù)介紹??型的樹形結(jié)構(gòu)表示基于特征對(duì)樣本進(jìn)行決策的過(guò)程[48]。決策樹不僅是一個(gè)遞歸??過(guò)程,還可以認(rèn)為是定義在特征空間與類空間上的條件概率分布。根據(jù)損失函數(shù)??最小化原則在訓(xùn)練時(shí)利用訓(xùn)練集建立決策樹模型,然后利用該模型在預(yù)測(cè)時(shí)對(duì)....


圖3-1'可知,CBOW的核心思想.是在B知上下文w(t_2)、Wa—D、w(t+1)、??

圖3-1'可知,CBOW的核心思想.是在B知上下文w(t_2)、Wa—D、w(t+1)、??

Skip-gram模型也加入一個(gè)投影層>?但此投影層??只對(duì)輸入的當(dāng)前詞匯的ft量進(jìn)行加權(quán),最后經(jīng)過(guò)輸出層輸出當(dāng)前詞t的J:下文詞??匯:的詞??輸入?搜影?輸:出?輸入?_?輸出??w(,-2)?^?wit-'X)??冰(,-1)|?N.?\w(t-l)??????>????^....



本文編號(hào):4025034

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/4025034.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶97da2***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com