基于深度學(xué)習(xí)的高維稀疏數(shù)據(jù)分類研究與應(yīng)用
發(fā)布時(shí)間:2021-08-10 09:50
互聯(lián)網(wǎng)大數(shù)據(jù)中蘊(yùn)含著海量文本,如何有效地管理和利用這些數(shù)據(jù)是信息科學(xué)的研究熱點(diǎn)。與此同時(shí),隨著高通量實(shí)驗(yàn)技術(shù)的不斷進(jìn)步,生物組學(xué)數(shù)據(jù)呈現(xiàn)爆炸性增長(zhǎng),基于組學(xué)數(shù)據(jù)的疾病特征分析成為生物醫(yī)學(xué)研究的熱點(diǎn)問(wèn)題。文本和代謝組學(xué)數(shù)據(jù)雖然來(lái)源不同,卻都有高維和稀疏的特點(diǎn)。傳統(tǒng)機(jī)器學(xué)習(xí)方法在解決高維稀疏矩陣計(jì)算問(wèn)題時(shí),常會(huì)因維數(shù)災(zāi)難得不到令人滿意的結(jié)果。本文提出了基于深度學(xué)習(xí)的高維稀疏數(shù)據(jù)分類方法,重點(diǎn)討論了深度學(xué)習(xí)在文本和代謝組學(xué)數(shù)據(jù)分類上的應(yīng)用。具體研究工作如下:(1)針對(duì)于高維稀疏文本數(shù)據(jù),提出了一種深度置信網(wǎng)絡(luò)(deep belief networks,DBN)和Softmax分類器相融合的文本分類方法。在該方法中,DBN用來(lái)對(duì)高維和稀疏文本數(shù)據(jù)降維,Softmax實(shí)現(xiàn)對(duì)降維數(shù)據(jù)的分類。在預(yù)訓(xùn)練過(guò)程中,DBN和Softmax分別完成各自的工作;在微調(diào)階段,將二者作為一個(gè)整體,引入了L-BFGS(limited memory Broyden Fletcher Goldfarb Shanno)算法調(diào)整系統(tǒng)模型參數(shù)。在Reuters-21578和20-Newsgroup數(shù)據(jù)集上的實(shí)驗(yàn)表明,針對(duì)不同規(guī)...
【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:89 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
小規(guī)模數(shù)據(jù)集實(shí)驗(yàn)誤差率比較圖
小規(guī)模數(shù)據(jù)集實(shí)驗(yàn)均方誤差變化比較
大規(guī)模數(shù)據(jù)集實(shí)驗(yàn)誤差率比較圖
【參考文獻(xiàn)】:
期刊論文
[1]丹參多酚酸鹽改善擴(kuò)張性心肌病心肌功能的作用機(jī)制[J]. 王曦?zé)?單曉彤,王伊林,李丹,趙明,許良. 高等學(xué)校化學(xué)學(xué)報(bào). 2016(05)
[2]Biomarkers for pancreatic cancer:Recent achievements in proteomics and genomics through classical and multivariate statistical methods[J]. Emilio Marengo,Elisa Robotti. World Journal of Gastroenterology. 2014(37)
[3]白細(xì)胞介素37在類風(fēng)濕關(guān)節(jié)炎發(fā)病機(jī)制中的作用[J]. 陳歡雪,王曉非. 中國(guó)醫(yī)科大學(xué)學(xué)報(bào). 2014(03)
[4]K-最近鄰分類技術(shù)的改進(jìn)算法[J]. 王曉曄,王正歐. 電子與信息學(xué)報(bào). 2005(03)
[5]一種實(shí)用高效的文本分類算法[J]. 王建會(huì),王洪偉,申展,胡運(yùn)發(fā). 計(jì)算機(jī)研究與發(fā)展. 2005(01)
[6]概念推理網(wǎng)及其在文本分類中的應(yīng)用[J]. 李曉黎,劉繼敏,史忠植. 計(jì)算機(jī)研究與發(fā)展. 2000(09)
博士論文
[1]文本分類及其特征降維研究[D]. 廖一星.浙江大學(xué) 2012
本文編號(hào):3333839
【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:89 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
小規(guī)模數(shù)據(jù)集實(shí)驗(yàn)誤差率比較圖
小規(guī)模數(shù)據(jù)集實(shí)驗(yàn)均方誤差變化比較
大規(guī)模數(shù)據(jù)集實(shí)驗(yàn)誤差率比較圖
【參考文獻(xiàn)】:
期刊論文
[1]丹參多酚酸鹽改善擴(kuò)張性心肌病心肌功能的作用機(jī)制[J]. 王曦?zé)?單曉彤,王伊林,李丹,趙明,許良. 高等學(xué)校化學(xué)學(xué)報(bào). 2016(05)
[2]Biomarkers for pancreatic cancer:Recent achievements in proteomics and genomics through classical and multivariate statistical methods[J]. Emilio Marengo,Elisa Robotti. World Journal of Gastroenterology. 2014(37)
[3]白細(xì)胞介素37在類風(fēng)濕關(guān)節(jié)炎發(fā)病機(jī)制中的作用[J]. 陳歡雪,王曉非. 中國(guó)醫(yī)科大學(xué)學(xué)報(bào). 2014(03)
[4]K-最近鄰分類技術(shù)的改進(jìn)算法[J]. 王曉曄,王正歐. 電子與信息學(xué)報(bào). 2005(03)
[5]一種實(shí)用高效的文本分類算法[J]. 王建會(huì),王洪偉,申展,胡運(yùn)發(fā). 計(jì)算機(jī)研究與發(fā)展. 2005(01)
[6]概念推理網(wǎng)及其在文本分類中的應(yīng)用[J]. 李曉黎,劉繼敏,史忠植. 計(jì)算機(jī)研究與發(fā)展. 2000(09)
博士論文
[1]文本分類及其特征降維研究[D]. 廖一星.浙江大學(xué) 2012
本文編號(hào):3333839
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3333839.html
最近更新
教材專著