多樣性增量特征選擇技術的應用
發(fā)布時間:2021-09-29 23:57
采用機器學習算法對基因組或蛋白質的靶序列或靶位點進行分類識別,是生物信息學的主要研究內容之一。隨著所研究問題的復雜度的增加,在解決此類問題時,往往面臨樣本少而特征維數(shù)高的境況。高維特征在分類過程中存在著對樣本的過擬合,進而導致結果的泛化能力降低以及精度反常的現(xiàn)象。因此,應用特征選擇技術進行數(shù)據(jù)分析和特征優(yōu)化越來越受到人們的關注。因為這些技術可以實現(xiàn)提取研究對象的基本特征和提高模型的識別精度。特征選擇技術的核心是在保證識別精度損失最小的前提下,從特征集中篩選出一個最優(yōu)的特征子集。特征子集中的特征應該具備兩個基本特點,一是特征與類別間的相關性大,二是特征之間的冗余性小。在近幾年機器學習領域中,特征選擇技術成為了最為活躍的研究內容之一。我們組在研究蛋白質柔性位點識別問題時,提出一個新的特征選擇技術,稱為多樣性增量特征選擇技術(feature selection technique based on increment of diversity,FSID)。為了進一步檢驗和完善FSID方法,本文,我們應用FSID方法,分別研究了在基因組和蛋白質兩個層面中,最為活躍的兩個重要熱點問題:基因組核小...
【文章來源】:內蒙古工業(yè)大學內蒙古自治區(qū)
【文章頁數(shù)】:44 頁
【學位級別】:碩士
【部分圖文】:
蛋白質磷酸化/去磷酸化機制簡圖
縮并為“B”,“SW”縮并為“C”,“SS”縮并為“D”。這樣,一條由4種堿基(“A”,??“C”,“G”,“T”)組成的原長為N的DNA序列,被轉換為由四種字母(“A”,“B”,??“C”,“D”)組成的長度為N/2的新序列。轉換過程的示意簡圖見圖5-1。??原序列;AAT?G?A?ATTGG?GATGGA?G?GTA...??ja??約化Iy列:wwwsssswswwwsssssssswwsswsssssww...??轉換斤:列:abdccaddddadbdda?...??"/=1?ACDDBA?...??子序列:?k=3^?;=2?BCDAD?...??、,=3?DADDD?...??圖5-1?DNA序列約化和轉換示意圖??Fig.?5-1?A?schematic?diagram?of?reduction?and?transformation?for?DNA?sequence??其后,按照指定的A:值(比如b3,見圖5-1),將新序列抽取為t個子序列,??用于計算新序列的HI斤)值。這里需注意到,經(jīng)過以上操作后,如果在新序列中發(fā)現(xiàn)??24??
本文編號:3414706
【文章來源】:內蒙古工業(yè)大學內蒙古自治區(qū)
【文章頁數(shù)】:44 頁
【學位級別】:碩士
【部分圖文】:
蛋白質磷酸化/去磷酸化機制簡圖
縮并為“B”,“SW”縮并為“C”,“SS”縮并為“D”。這樣,一條由4種堿基(“A”,??“C”,“G”,“T”)組成的原長為N的DNA序列,被轉換為由四種字母(“A”,“B”,??“C”,“D”)組成的長度為N/2的新序列。轉換過程的示意簡圖見圖5-1。??原序列;AAT?G?A?ATTGG?GATGGA?G?GTA...??ja??約化Iy列:wwwsssswswwwsssssssswwsswsssssww...??轉換斤:列:abdccaddddadbdda?...??"/=1?ACDDBA?...??子序列:?k=3^?;=2?BCDAD?...??、,=3?DADDD?...??圖5-1?DNA序列約化和轉換示意圖??Fig.?5-1?A?schematic?diagram?of?reduction?and?transformation?for?DNA?sequence??其后,按照指定的A:值(比如b3,見圖5-1),將新序列抽取為t個子序列,??用于計算新序列的HI斤)值。這里需注意到,經(jīng)過以上操作后,如果在新序列中發(fā)現(xiàn)??24??
本文編號:3414706
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3414706.html
最近更新
教材專著