面向新聞網(wǎng)頁的主題識別及自動分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
【文章頁數(shù)】:84 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖3-5特征詞向量示例圖
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文-25-詞向量設(shè)置成k維,k是指在進(jìn)行詞嵌入向量轉(zhuǎn)化時(shí)映射成的K維實(shí)數(shù)向量,把結(jié)構(gòu)向量設(shè)置成m維大小,k和m決定了聯(lián)合特征矩陣的列寬度。將上述得到的網(wǎng)頁的聯(lián)合特征矩陣共同作為分類模型的輸入,進(jìn)行模型的學(xué)習(xí)訓(xùn)練。3.5實(shí)驗(yàn)與分析本節(jié)以真實(shí)環(huán)境下爬取的新....
圖3-6主題-詞分布圖
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文-26-在表3-1中,本文以“足球”特征詞為例,得到相似特征詞,同時(shí)得到兩個(gè)詞在語義空間的相似度值。通過以上實(shí)驗(yàn)分析得到,使用詞嵌入特征向量可以在語義上進(jìn)行相似度計(jì)算,相比于傳統(tǒng)的空間向量表示模型對特征項(xiàng)進(jìn)行表示,可以充分學(xué)習(xí)文本的語義關(guān)系,保留了詞....
圖4-5CNN網(wǎng)絡(luò)架構(gòu)圖
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文-30-一種,CNN網(wǎng)絡(luò)結(jié)構(gòu)由輸入層、卷積層、池化層、全連接層組成[46]。CNN的網(wǎng)絡(luò)架構(gòu)圖如圖4-5所示。圖4-5CNN網(wǎng)絡(luò)架構(gòu)圖輸入層,就是把一個(gè)網(wǎng)頁的特征向量矩陣作為輸入數(shù)據(jù)送入CNN模型,并且和卷積層連接起來,進(jìn)行卷積操作。特征矩陣中的每一....
圖4-8精確率對比圖
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文-38-的卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)頁分類方法TFCNN[18](TextFeaturesConvoltionalNeuralNetworks,TFCNN),TFCNN是基于在CNN模型的基礎(chǔ)上只使用網(wǎng)頁的文本特征向量作為模型的特征矩陣,來進(jìn)行實(shí)驗(yàn)驗(yàn)證分析。圖4....
本文編號:3895819
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3895819.html