支持向量機(jī)在基因核心啟動(dòng)子識(shí)別中的應(yīng)用研究
發(fā)布時(shí)間:2017-09-08 23:46
本文關(guān)鍵詞:支持向量機(jī)在基因核心啟動(dòng)子識(shí)別中的應(yīng)用研究
更多相關(guān)文章: 核心啟動(dòng)子 支持向量機(jī) 識(shí)別
【摘要】:核心啟動(dòng)子是DNA轉(zhuǎn)錄起始位上游一段可以與引發(fā)轉(zhuǎn)錄但又不被轉(zhuǎn)錄的關(guān)鍵序列。目前啟動(dòng)子預(yù)測(cè)已經(jīng)有許多的研究,但預(yù)測(cè)的準(zhǔn)確程度仍有待提高。支持向量機(jī)是主要用于分類的一種機(jī)器學(xué)習(xí)方法,它在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì)。本研究采用支持向量機(jī)的機(jī)器學(xué)習(xí)方法,以多聚體詞頻統(tǒng)計(jì)和核酸序列正交編碼兩種特征提取方式,使用公共數(shù)據(jù)庫(kù)提供的測(cè)試數(shù)據(jù),對(duì)若干包括啟動(dòng)子和非啟動(dòng)子的大量核酸樣本序列進(jìn)行啟動(dòng)子識(shí)別和10折的交叉校驗(yàn)研究,發(fā)現(xiàn)核酸序列正交編碼方式預(yù)測(cè)的準(zhǔn)確率優(yōu)于多聚體方式,而支持向量機(jī)的四種核函數(shù)中RBF核函數(shù)預(yù)測(cè)的準(zhǔn)確性最高。研究還發(fā)現(xiàn)采用不同的序列長(zhǎng)度(起始從-249到-100),預(yù)測(cè)準(zhǔn)確度都接近,反映啟動(dòng)子與非啟動(dòng)子的核酸序列模式差異主要位于轉(zhuǎn)錄起始位上游-100到下游+50這段區(qū)間內(nèi),啟動(dòng)子序列中堿基G和C出現(xiàn)的頻率顯著性高于A和T,而非啟動(dòng)子正好相反。
【作者單位】: 咸陽(yáng)職業(yè)技術(shù)學(xué)院;西安交通大學(xué);
【關(guān)鍵詞】: 核心啟動(dòng)子 支持向量機(jī) 識(shí)別
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目《基因調(diào)控序列的信息學(xué)識(shí)別及若干腫瘤相關(guān)基因調(diào)控序列的確定》(60601017)資助
【分類號(hào)】:Q811.4
【正文快照】: Research on Application of Support Vector Machine in the Identification ofGene Core PromoterLi Hongbin1,2*He Guangzhong1Wu Xiaoming21 Xianyang Vocational and Technical College,Xianyang,712000;2 Xi'an Jiaotong University Xi'an,710049*Corresponding author,
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 張忠東;成軍;鐘彥偉;楊倩;董菁;楊艷杰;張樹(shù)林;;羧肽酶N調(diào)節(jié)乙型肝炎病毒核心啟動(dòng)子表達(dá)活性的研究[J];世界華人消化雜志;2003年08期
2 侯婧逸;李華;康亞妮;孫潔林;;裂殖酵母核心啟動(dòng)子結(jié)構(gòu)的初步研究[J];核技術(shù);2013年03期
3 彭R,
本文編號(hào):817051
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/817051.html
最近更新
教材專著