天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于關(guān)鍵詞策略和卷積神經(jīng)網(wǎng)絡(luò)的中文文本分類算法研究

發(fā)布時(shí)間:2021-01-20 06:55
  隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展和成熟,各種數(shù)字化信息的產(chǎn)生和發(fā)布速度呈爆炸式增長(zhǎng),海量文本數(shù)據(jù)占據(jù)較大比例。如何在海量文本數(shù)據(jù)中進(jìn)行自動(dòng)快速分類,已經(jīng)成為了一項(xiàng)值得深入研究的課題。傳統(tǒng)的人工文本分類方法是以人工方式按規(guī)則來(lái)構(gòu)建分類器,已無(wú)法應(yīng)對(duì)當(dāng)前的數(shù)據(jù)量。近些年,隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,因其強(qiáng)大的表征能力,使得能夠更好的提取文本中的主要信息,在文本分類中取得優(yōu)異的成果。因此,本文利用深度學(xué)習(xí)的方法通過(guò)對(duì)中文文本分類中數(shù)據(jù)預(yù)處理、文本特征表示及分類器模型進(jìn)行研究,提出一種新框架,具體研究?jī)?nèi)容及結(jié)果如下:本文首先介紹了文本分類相關(guān)理論,主要從文本分類定義及流程、文本預(yù)處理、中文文本特征向量表示模型、特征詞提取算法等方面進(jìn)行了詳細(xì)介紹。其次,針對(duì)中文文本存在噪聲多、特征稀疏的問(wèn)題,在輸入分類模型前,有必要去除無(wú)用特征詞,提出一種基于關(guān)鍵詞策略和卷積神經(jīng)網(wǎng)絡(luò)的中文文本分類框架。在該框架中,首先基于Word2Vec構(gòu)建詞向量模型,然后采用分詞頻文檔頻率(Segmentation Term Frequency-Document Frequency,STF-DF)篩選出類別區(qū)分能力強(qiáng)的關(guān)鍵詞,來(lái)作為... 

【文章來(lái)源】:廈門理工學(xué)院福建省

【文章頁(yè)數(shù)】:72 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于關(guān)鍵詞策略和卷積神經(jīng)網(wǎng)絡(luò)的中文文本分類算法研究


圖2.2?Word2Vec的簡(jiǎn)要流程圖??首先假設(shè),?詞庫(kù)里的詞數(shù)為20000,詞向量的維數(shù)為128,下面以單個(gè)訓(xùn)練樣??

示意圖,超平面,樣本空間,表達(dá)式


?第二章文本分類相關(guān)理論???wT?x-\-b?=?1?2????r=iMi??:??,+?6?=-1??/Z?/★?★?★??/??XI???>??圖2-3?SVM示意圖??在樣本空間中,分類超平面的表達(dá)式如下:??w1?x+b?=?0?(2-6)??樣本空間中某一點(diǎn)x到分類超平面(w,b)之間距離的計(jì)算公式為:??\wTx?+?b\??,,???'?(2-7)??丨卜II??假設(shè)圖中分類超平面正確區(qū)分了樣本類別,則可得到如下公式:??f?wTxi?+?6?>?+1,?v;?=?+1??\?T?(2-8)??[wTxi?+?b?>?-\,yi?=?-1??在圖中的樣本點(diǎn)中,距離分類超平面最近的樣本為“支持向量”,兩個(gè)不同??類別的支持向量到分類超平面之間的距離和稱為支持向量機(jī)的“間隔”,計(jì)算公??式如下:??r?=?^i?^??支持向量機(jī)的目標(biāo)就是是間隔最大化,最大化間隔可以轉(zhuǎn)換為最小化||叫|2,??計(jì)算公式如下:??1?,??min?,*-?||?w||?(2-10)??SVM既可以處理文本二分類問(wèn)題,也可以處理文本多分類問(wèn)題,其將線性??不可分低緯度向量空間轉(zhuǎn)化成線性可分的高緯度向量空間,使得文本多分類問(wèn)題??變成處理一系列二分類問(wèn)題。??15??

過(guò)程圖,卷積核,理工學(xué)院,碩士學(xué)位


圖2-4卷積核的計(jì)算過(guò)程??、

【參考文獻(xiàn)】:
期刊論文
[1]卷積神經(jīng)網(wǎng)絡(luò)CNN算法在文本分類上的應(yīng)用研究[J]. 侯小培,高迎.  科技與創(chuàng)新. 2019(04)
[2]基于word2vec和雙向LSTM的情感分類深度模型[J]. 黃賢英,劉廣峰,劉小洋,陽(yáng)安志.  計(jì)算機(jī)應(yīng)用研究. 2019(12)
[3]面向大規(guī)模中文文本分類的樸素貝葉斯并行Spark算法(英文)[J]. 劉鵬,趙慧含,滕家雨,仰彥妍,劉亞峰,朱宗衛(wèi).  Journal of Central South University. 2019(01)
[4]機(jī)器學(xué)習(xí)方法在文本分類中的應(yīng)用[J]. 韓琪恒.  電子制作. 2018(18)
[5]基于LSTM-Attention的中文新聞文本分類[J]. 藍(lán)雯飛,徐蔚,汪敦志,潘鵬程.  中南民族大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(03)
[6]基于關(guān)鍵詞的文本向量化與分類算法研究[J]. 蘇玉龍,張著洪.  貴州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(03)
[7]融合多策略的中文分詞算法研究[J]. 王一成,馬寧,萬(wàn)福成.  西北民族大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(02)
[8]基于fastText的中文文本分類[J]. 代令令,蔣侃.  計(jì)算機(jī)與現(xiàn)代化. 2018(05)
[9]文本分類中一種特征選擇方法研究[J]. 趙婧,邵雄凱,劉建舟,王春枝.  計(jì)算機(jī)應(yīng)用研究. 2019(08)
[10]基于深度學(xué)習(xí)的文本分類研究進(jìn)展[J]. 劉婷婷,朱文東,劉廣一.  電力信息與通信技術(shù). 2018(03)

碩士論文
[1]基于分詞頻的特征選擇算法在文本分類中的研究[D]. 劉藝彬.西安理工大學(xué) 2018
[2]基于卷積神經(jīng)網(wǎng)絡(luò)的文本分類器的設(shè)計(jì)與實(shí)現(xiàn)[D]. 白璐.北京交通大學(xué) 2018
[3]基于深度神經(jīng)網(wǎng)絡(luò)的文本表示與分類研究[D]. 劉騰飛.北京交通大學(xué) 2018
[4]中文文本分類中卡方統(tǒng)計(jì)特征選擇方法和TF-IDF權(quán)重計(jì)算方法的研究[D]. 姚海英.吉林大學(xué) 2016
[5]基于機(jī)器學(xué)習(xí)的中文文本分類方法研究[D]. 劉依璐.西安電子科技大學(xué) 2009



本文編號(hào):2988600

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2988600.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0e21c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
伊人天堂午夜精品草草网| 中文字幕一二区在线观看| 日韩综合国产欧美一区| 欧美日韩精品综合一区| 欧美夫妻性生活一区二区| 91日韩在线视频观看| 国产av一区二区三区四区五区| 国产精品亚洲欧美一区麻豆| 亚洲av熟女一区二区三区蜜桃 | 狠狠干狠狠操亚洲综合| 东京热男人的天堂一二三区 | 久久精品少妇内射毛片| 亚洲av又爽又色又色| 国产av一区二区三区麻豆| 精品日韩视频在线观看| 欧美一区二区三区性视频| 日韩精品视频免费观看| 国产a天堂一区二区专区| 久久热在线视频免费观看| 激情视频在线视频在线视频| 亚洲中文字幕人妻av| 亚洲视频一区自拍偷拍另类| 少妇在线一区二区三区| 亚洲国产成人久久一区二区三区 | 99久久精品免费精品国产| 久久热麻豆国产精品视频| 99久久成人精品国产免费| 丰满少妇被猛烈撞击在线视频| 自拍偷拍福利视频在线观看| 国产av大片一区二区三区| 国产成人国产精品国产三级| 亚洲欧美日韩在线中文字幕| 国产精品午夜视频免费观看| 一区二区免费视频中文乱码国产| 久草视频这里只是精品| 国产日韩欧美一区二区| 在线日韩中文字幕一区| 欧美做爰猛烈叫床大尺度| 亚洲黑人精品一区二区欧美| 亚洲一区二区精品免费视频| 日韩国产传媒在线精品|