天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 理工論文 > 生物學論文 >

基于規(guī)則的跨平臺基因表達數(shù)據(jù)分類研究

發(fā)布時間:2021-01-17 12:07
  為了探索關(guān)于人類自身的編碼而啟動的人類基因組計劃經(jīng)過近三十年的努力已基本完成。隨之而來產(chǎn)生了大量的生物分子數(shù)據(jù),這些高維的數(shù)據(jù)內(nèi)具有豐富的信息,其背后隱藏著人類尚未充分了解的關(guān)于自身的知識。利用數(shù)學、統(tǒng)計學與計算機科學相關(guān)方法幫助生物學家從海量信息中發(fā)現(xiàn)有價值的信息,促進人類醫(yī)學研究領(lǐng)域的進步,這一迫切需求促進了生物信息學這一學科的快速發(fā)展。cDNA微陣列和寡核苷酸芯片等高通量檢測技術(shù)應用至今已經(jīng)積累了大量來自不同平臺的數(shù)據(jù),從現(xiàn)有數(shù)據(jù)中得到分類模式并應用于新的樣本對基因表達數(shù)據(jù)挖掘工作具有重要意義。由于基因表達數(shù)據(jù)集的大都具有小樣本,高維度的特性,在同一個平臺上的少數(shù)樣本數(shù)據(jù)相對于高維特征來講是極其有限的。數(shù)據(jù)集樣本數(shù)量的稀疏性在與特征的高維度性相疊加造成了維度災難,導致難以從單個小樣本數(shù)據(jù)集上提取魯棒的關(guān)鍵信息。如果能夠?qū)EO多個平臺上的基因表達數(shù)據(jù)結(jié)合起來,通過增大樣本數(shù)據(jù)量緩和維度災難問題,這對于相關(guān)的研究工作是十分有益的。然而基因表達數(shù)據(jù)所涉及到的生物學實驗是一個多步驟的復雜過程,由于其中生物樣本的來源、芯片制作所采用的技術(shù)手段、設備標準的不同,多個平臺的基因表達數(shù)據(jù)之間存... 

【文章來源】:廣東工業(yè)大學廣東省

【文章頁數(shù)】:53 頁

【學位級別】:碩士

【部分圖文】:

基于規(guī)則的跨平臺基因表達數(shù)據(jù)分類研究


主成分分析線性變換[29]

示意圖,示意圖,樣本個數(shù),召回率


圖 2-3 二分類結(jié)果示意圖[32]Fig 2-3 Binary classification result[32]分類問題,將 TP 定義為正確分類的正類樣本個數(shù),F(xiàn)N 定義為錯誤標簽為正類的樣本個數(shù);TN 定義為正確分類的負類樣本個數(shù), FP正類而真實標簽為負類的樣本個數(shù)。則準確率、召回率、精確度 F1方法如下。(Accuracy)評估的是樣本集中的每一個樣本是否被正確分類,定義Accuracy=(TP+TN)/(TP+FN+TN+FP)(Recall)評估的是測試集中的正類樣本是否被正確分類,召回率計Recall=TP/(TP+FN)(Precision)評估的是測試集中被預測為正類的樣本是否正確,精確

函數(shù)圖,輸入數(shù)據(jù),廣東工業(yè)大學,碩士學位論文


廣東工業(yè)大學碩士學位論文 ,輸入數(shù)據(jù)對應的標簽為 ,則邏輯回歸模型的數(shù)學: ( ) 邏輯回歸將任意范圍內(nèi)的輸入映射為值域為[0,1]的概率值,如圖 4-3,根據(jù)輸 ( )的值判定輸入數(shù)據(jù)屬于正類或負類,若 ( ) ,則 一般取值為 0.5。

【參考文獻】:
期刊論文
[1]半監(jiān)督集成學習綜述[J]. 蔡毅,朱秀芳,孫章麗,陳阿嬌.  計算機科學. 2017(S1)
[2]基于最大間隔的基因表達規(guī)則篩選[J]. 蔡瑞初,王美華,郝志峰,溫雯.  計算機工程與應用. 2011(26)

碩士論文
[1]基于信息熵的改進k-TSP方法及其在癌癥分類中的應用[D]. 周純葆.吉林大學 2009



本文編號:2982854

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/2982854.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶383b8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com