天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于局部樣本的特征選擇算法在轉(zhuǎn)錄組數(shù)據(jù)中的應(yīng)用研究

發(fā)布時(shí)間:2018-01-05 01:32

  本文關(guān)鍵詞:基于局部樣本的特征選擇算法在轉(zhuǎn)錄組數(shù)據(jù)中的應(yīng)用研究 出處:《吉林大學(xué)》2017年碩士論文 論文類(lèi)型:學(xué)位論文


  更多相關(guān)文章: 局部樣本 特征選擇 癌癥分類(lèi) 轉(zhuǎn)錄組數(shù)據(jù)


【摘要】:隨著基因芯片和二代測(cè)序技術(shù)的發(fā)展,研究人員通過(guò)實(shí)驗(yàn)獲得了大量的基因轉(zhuǎn)錄組數(shù)據(jù),但是小樣本、高維度的數(shù)據(jù)特點(diǎn)嚴(yán)重影響了提取有效特征的效率。因此,開(kāi)發(fā)一個(gè)高效、魯棒的特征選擇方法,從高維基因轉(zhuǎn)錄組數(shù)據(jù)中提取有效的特征,對(duì)于研究者來(lái)說(shuō)是非常重要的。近些年來(lái),研究者開(kāi)始使用特征選擇算法對(duì)這種高維小樣本的數(shù)據(jù)進(jìn)行分析。隨著研究的深入,研究者發(fā)現(xiàn)使用全部樣本訓(xùn)練的特征選擇模型不能獲得最優(yōu)的結(jié)果,噪聲樣本、樣本異常值、樣本不平衡分布等因素可能會(huì)導(dǎo)致分類(lèi)準(zhǔn)確率的下降。所以,對(duì)局部樣本的研究也就尤為重要。癌癥是一種異質(zhì)性疾病,在癌癥發(fā)展和進(jìn)化的過(guò)程中,具有相同遺傳特征的病人可能含有相同的分子機(jī)制。所以,通過(guò)使用具有相同遺傳特征的局部樣本獲得更加準(zhǔn)確的分類(lèi)模型就變得愈發(fā)重要,而準(zhǔn)確率越高的模型越能夠更加準(zhǔn)確的預(yù)測(cè)一個(gè)人是否患有癌癥。因此,本文選擇癌癥的轉(zhuǎn)錄組數(shù)據(jù)的特征選擇作為研究對(duì)象。在本文中,我們提出一種新穎、有效的基于局部樣本的特征選擇方法,這種方法能夠獲得更加準(zhǔn)確的特征,從而獲得更優(yōu)的性能。局部樣本可通過(guò)以下三個(gè)步驟獲取,首先,計(jì)算任意兩個(gè)樣本之間的歐式距離;其次,為每個(gè)中心樣本選擇與其最近的若干鄰居樣本構(gòu)建共表達(dá)網(wǎng)絡(luò),同時(shí)使用重啟動(dòng)隨機(jī)游走方法形成最終的穩(wěn)態(tài)概率網(wǎng)絡(luò),其中穩(wěn)態(tài)概率可看成樣本間的相似性,最終形成樣本相似性網(wǎng)絡(luò);最后,為了選擇更好的局部樣本,通過(guò)設(shè)置一個(gè)確定的范圍,對(duì)樣本相似性網(wǎng)絡(luò)進(jìn)行劃分,并且在比較了五種樣本選擇策略之后,獲得了具有最優(yōu)分類(lèi)性能的局部樣本集合。我們把乳腺癌、胃癌、胰腺癌、肺癌、甲狀腺癌、前列腺癌等6種癌癥的轉(zhuǎn)錄組數(shù)據(jù)作為算法測(cè)試的數(shù)據(jù)集,分別將其應(yīng)用在基于局部樣本的特征選擇方法上,使用留一交叉驗(yàn)證方法評(píng)價(jià)分類(lèi)性能,并且與T檢驗(yàn)、秩和檢驗(yàn)、最大相關(guān)最小冗余等方法進(jìn)行對(duì)比。實(shí)驗(yàn)結(jié)果顯示,本文提出的方法在六種數(shù)據(jù)集上的最大分類(lèi)準(zhǔn)確率分別是98.51%、97.27%、98.55%、100%、100%和100%,在大多數(shù)數(shù)據(jù)集上均獲得非常好的效果。由此可見(jiàn),我們的方法能夠從不同癌癥數(shù)據(jù)中提取有用的特征,進(jìn)而對(duì)癌癥進(jìn)行分類(lèi),有很好的適用性和可應(yīng)用性,同時(shí)也為醫(yī)學(xué)研究者提供了參考建議。
[Abstract]:With the development of gene chip and the two generation sequencing technology, the researchers obtained gene transcriptome data by numerous experiments, but the small sample data, the characteristics of high dimension has seriously affected the efficiency of extracting effective features. Therefore, the development of an efficient and robust feature selection method, extracting effective features from high dimensional gene transcription set of data, is very important for researchers. In recent years, researchers have begun to use data feature selection algorithm based on the high dimension and small sample were analyzed. With the in-depth study, the researchers found that the use of all the features of the training sample selection model can obtain optimal results, noise samples, sample outliers sample unbalanced distribution and other factors may result in decreased classification accuracy. Therefore, the study on the local sample is particularly important. Cancer is a heterogeneous disease in cancer development The process and evolution, has the same genetic characteristics of the patient may contain the same molecular mechanisms. So, through the use of local samples with the same genetic characteristics to obtain more accurate classification model has become more and more important, and the higher the accuracy of the model is able to more accurately predict whether a person suffering from cancer. Therefore, the characteristics of this paper choose cancer transcriptome data selection as the research object. In this paper, we propose a novel and effective feature selection method based on local samples, this method can obtain more accurate characteristics, so as to obtain better performance. The local sample can be obtained, through the following three steps: first, calculate European the distance between any two samples; secondly, for each center and the nearest neighbor number of sample selection sample to construct the co expression network, at the same time using random restart if you The formation of the final steady-state probability network method, which can be regarded as the steady-state probability similarity between samples, the final formation of the sample similarity network; finally, in order to better local sample selection, by setting a certain range of sample similarity network to be divided, and the comparison of five kinds of sample selection strategy, the local sample classification performance is optimal set. We have breast cancer, gastric cancer, pancreatic cancer, lung cancer, thyroid cancer, prostate cancer transcriptome data of 6 kinds of cancer as the algorithm test data sets, respectively, which is applied in the sample selection method based on local characteristics, the performance of classification is evaluated using leave one out cross validation method and T test, rank sum test, comparison of minimum redundancy and maximum correlation method. The experimental results show that the proposed method in the six largest classification data sets are accurate 98.51%, 97.27%, 98.55%, 100%, 100% and 100%, in most of the data sets were obtained very good effect. Thus, our method can extract useful features from different cancer data, and the classification of cancer, has good applicability and applicability, but also provides suggestions for medical researchers.

【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:Q811.4;TP181

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 何勁松,施澤生;特征選擇方法中的信號(hào)分析方法研究[J];中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào);2001年01期

2 孫霞;鄭慶華;;一種面向非平衡數(shù)據(jù)的鄰居詞特征選擇方法[J];小型微型計(jì)算機(jī)系統(tǒng);2008年12期

3 蔣盛益;鄭琪;張倩生;;基于聚類(lèi)的特征選擇方法[J];電子學(xué)報(bào);2008年S1期

4 王加龍;朱顥東;;結(jié)合類(lèi)別相關(guān)性和辨識(shí)集的特征選擇方法[J];微型機(jī)與應(yīng)用;2009年23期

5 朱顥東;周姝;鐘勇;;結(jié)合差別對(duì)象對(duì)集的綜合性特征選擇方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2010年03期

6 姜慧研;柴天佑;;基于可信間隔的特征選擇方法研究[J];控制與決策;2011年08期

7 姚旭;王曉丹;張玉璽;權(quán)文;;特征選擇方法綜述[J];控制與決策;2012年02期

8 王志昊;王中卿;李壽山;李培峰;;不平衡情感分類(lèi)中的特征選擇方法研究[J];中文信息學(xué)報(bào);2013年04期

9 張玉紅;周全;胡學(xué)鋼;;面向跨領(lǐng)域情感分類(lèi)的特征選擇方法[J];模式識(shí)別與人工智能;2013年11期

10 李敏;卡米力·木依丁;;特征選擇方法與算法的研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2013年12期

相關(guān)會(huì)議論文 前6條

1 徐燕;王斌;李錦濤;孫春明;;知識(shí)增益:文本分類(lèi)中一種新的特征選擇方法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

2 肖婷;唐雁;;文本分類(lèi)中特征選擇方法及應(yīng)用[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年

3 徐燕;孫春明;王斌;李錦濤;;基于詞條頻率的特征選擇算法研究[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年

4 陳慶軒;鄭德權(quán);鄭博文;趙鐵軍;李生;;中文文本分類(lèi)中基于文檔頻度分布的特征選擇方法[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2009年學(xué)術(shù)交流年會(huì)論文集[C];2010年

5 顧成杰;張順頤;劉凱;黃河;;基于粗糙集和禁忌搜索的特征選擇方法[A];江蘇省電子學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年

6 王秀娟;郭軍;鄭康鋒;;基于互信息可信度的特征選擇方法[A];2006通信理論與技術(shù)新進(jìn)展——第十一屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2006年

相關(guān)博士學(xué)位論文 前5條

1 張逸石;基于冗余—互補(bǔ)散度及特征包絡(luò)前沿的數(shù)據(jù)驅(qū)動(dòng)特征選擇方法研究[D];華中科技大學(xué);2016年

2 毛勇;基于支持向量機(jī)的特征選擇方法的研究與應(yīng)用[D];浙江大學(xué);2006年

3 尹留志;關(guān)于非平衡數(shù)據(jù)特征問(wèn)題的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年

4 裴志利;數(shù)據(jù)挖掘技術(shù)在文本分類(lèi)和生物信息學(xué)中的應(yīng)用[D];吉林大學(xué);2008年

5 劉明霞;屬性學(xué)習(xí)若干重要問(wèn)題的研究及應(yīng)用[D];南京航空航天大學(xué);2015年

相關(guān)碩士學(xué)位論文 前10條

1 曹晉;基于SVDD的特征選擇方法研究及其應(yīng)用[D];蘇州大學(xué);2015年

2 張強(qiáng);靜態(tài)圖像上的行人檢測(cè)方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2015年

3 張曉梅;基于融合特征的微博主客觀分類(lèi)方法研究[D];山西大學(xué);2014年

4 王君;基于SVM-RFE的特征選擇方法研究[D];大連理工大學(xué);2015年

5 于海珠;面向文本聚類(lèi)的特征選擇方法及應(yīng)用研究[D];大連理工大學(xué);2015年

6 趙世琛;文本分類(lèi)中特征選擇方法研究[D];山西大學(xué);2014年

7 王丹;特征選擇算法研究及其在異常檢測(cè)中的應(yīng)用[D];電子科技大學(xué);2014年

8 林艷峰;中文文本分類(lèi)特征選擇方法的研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2014年

9 盧志浩;基于GEP的kNN算法改進(jìn)研究[D];廣西師范學(xué)院;2015年

10 王立鵬;面向圖數(shù)據(jù)的特征選擇方法及其應(yīng)用研究[D];南京航空航天大學(xué);2015年

,

本文編號(hào):1381030

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1381030.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)01a93***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
欧美日韩国产免费看黄片| 日本午夜免费啪视频在线| 爱草草在线观看免费视频| 色婷婷国产熟妇人妻露脸| 欧美日韩高清不卡在线播放| 亚洲中文字幕剧情在线播放| 久久99精品日韩人妻| 少妇成人精品一区二区| 精品一区二区三区免费看| 亚洲国产欧美久久精品| 中文字幕熟女人妻视频| 国产欧美韩日一区二区三区| 91欧美激情在线视频| 欧美日韩黑人免费观看| 在线懂色一区二区三区精品| 狠狠做深爱婷婷久久综合| 亚洲欧美国产精品一区二区| 亚洲中文字幕免费人妻| 日韩免费午夜福利视频| 国产大屁股喷水在线观看视频| 91偷拍裸体一区二区三区| 亚洲中文在线中文字幕91| 久久人人爽人人爽大片av| 日韩欧美一区二区不卡看片| 国产毛片av一区二区三区小说| 国产精品香蕉在线的人| 日韩亚洲激情在线观看| 老司机精品线观看86| 四十女人口红哪个色好看| 亚洲高清欧美中文字幕| 日韩成人动画在线观看| 东京热男人的天堂社区| 国内精品偷拍视频久久| 91人妻人人做人碰人人九色| 日韩精品综合免费视频| 91人妻人人澡人人人人精品| 欧美自拍偷自拍亚洲精品| 日本欧美一区二区三区就| 日韩一级一片内射视频4k| 国产免费成人激情视频| 能在线看的视频你懂的|