基于機器學習的植物表型基因的文獻分類及其應用
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
圖2-3?CBOW和skip-gram模型示意圖??Fig.?2-3?Schematic?diagram?of?CBOW?and?skip-gram?models??
于其??他神經(jīng)網(wǎng)絡,運行速度更快,而且不需要手工標記標簽來創(chuàng)建訓練集。CB0W模型??又叫連續(xù)詞袋模型是根據(jù)目標詞上下文的詞向量對該詞的詞向量進行預測,而??Skip-gram貝U相反,Skip-gram又叫跳節(jié)模型,逆轉CBOW的因果關系,通過目標詞??的詞向量預測上下文的詞向....
圖3-1文獻分類流程圖??Fig.?3-1?Document?classification?flow?chart??本章主要介紹的是文獻的預處理和特征選擇,下文是詳細介紹
文獻清洗??文獻切分??表型數(shù)據(jù)集?S?詞干提取??5特征選擇?S?分類器??去除停用詞??文獻預處理??圖3-1文獻分類流程圖??Fig.?3-1?Document?classification?flow?chart??本章主要介紹的是文獻的預處理和特征選擇,下文是詳細介紹。?....
圖3-2株高類別的植物表型文檔???
omology?was?observed?between?Bt2?and?L2?in?their?coding?region,?but?homology?was?poor?in?the?3'?noncoding?border.??This?result?demonstrates?....
圖3-4?spike詞向量??Fig.?3-4?spike?word?vector??
容合并一起過程中,要讓文本輸出格式符合utf-8編碼要求。??植物表型基因語料庫共收集到超過100000個單詞,嵌入100維的詞向量,產(chǎn)生??了龐大的權重矩陣,在神經(jīng)網(wǎng)絡中進行梯度下降速率較慢,由于需要訓練數(shù)據(jù)來調(diào)整??權重避免過擬合,為了優(yōu)化訓練過程,避免權重矩陣過大,本實驗使....
本文編號:3950859
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3950859.html