基于統(tǒng)計檢驗(yàn)與機(jī)器學(xué)習(xí)的全基因組關(guān)聯(lián)研究框架
本文關(guān)鍵詞:基于統(tǒng)計檢驗(yàn)與機(jī)器學(xué)習(xí)的全基因組關(guān)聯(lián)研究框架 出處:《數(shù)學(xué)的實(shí)踐與認(rèn)識》2017年14期 論文類型:期刊論文
更多相關(guān)文章: 全基因關(guān)聯(lián)分析(GWAS) 統(tǒng)計檢驗(yàn) 機(jī)器學(xué)習(xí)
【摘要】:采用統(tǒng)計檢驗(yàn)和機(jī)器學(xué)習(xí)的方法來研究SNP或基因與疾病(可測性狀)的關(guān)聯(lián)性.先對SNP選擇合適的數(shù)值編碼方式,并設(shè)計了相應(yīng)的統(tǒng)計檢驗(yàn)流程,隨后通過P值初步篩選出了與疾病或性狀相關(guān)聯(lián)的位點(diǎn).在此基礎(chǔ)上,對篩選出的位點(diǎn),采用隨機(jī)森林,XGBoost等機(jī)器學(xué)習(xí)方法,從樣本外預(yù)測的角度判斷SNP與疾病或性狀的關(guān)聯(lián)度.相關(guān)結(jié)果,顯示發(fā)現(xiàn)運(yùn)用該分析框架能較好地篩選出與疾病或性狀關(guān)聯(lián)的SNP(基因).并且框架由于考慮了多種分類模型,有著穩(wěn)健性高,計算開銷較小以及可以交叉比對等優(yōu)勢.框架未來在還可在金融,社交網(wǎng)絡(luò)等方面發(fā)揮作用.
[Abstract]:Statistical test and machine learning were used to study the association of SNP or gene with disease (measurable traits). Firstly, the appropriate numerical coding method was selected for SNP, and the corresponding statistical test procedure was designed. Then the loci associated with disease or traits were preliminarily screened by P value. On this basis, the machine learning methods such as random forest XGBoost were used for the selected loci. The correlation degree between SNP and disease or trait was judged from the angle of prediction outside the sample. It was found that the SNPs associated with disease or traits could be well screened by using the framework, and the framework had high robustness because of the consideration of various classification models. The framework can also play a role in finance, social networks and so on in the future.
【作者單位】: 上海大學(xué)經(jīng)濟(jì)學(xué)院;上海大學(xué)理學(xué)院;
【分類號】:O213;R3416;TP181
【正文快照】: 1 問題背景 大量研究表明,人體的許多表型性狀差異以及對藥物和b;病的易感性等都可能與某些堿基位點(diǎn)相關(guān)聯(lián),或和包含有多個位點(diǎn)的基因相關(guān)聯(lián).因此,定位與性狀或疾病相關(guān)聯(lián)的位點(diǎn)在染色體或基因中的位置,能幫助研究人員了解性狀和一些疾病的遺傳機(jī)理,也能使人們對致病位點(diǎn)加以
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王玨,石純一;機(jī)器學(xué)習(xí)研究[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2003年02期
2 張震;李軍利;;機(jī)器學(xué)習(xí)方法及其在生物信息學(xué)中的應(yīng)用[J];吉首大學(xué)學(xué)報(自然科學(xué)版);2006年04期
3 許程;;機(jī)器學(xué)習(xí)的主要策略與基本結(jié)構(gòu)[J];科技資訊;2010年03期
4 黃蔚;;淺析機(jī)器學(xué)習(xí)及其在教育中的應(yīng)用[J];科技信息;2011年18期
5 曹加恒;湯怡群;姚唐;;機(jī)器學(xué)習(xí)研究[J];武漢大學(xué)學(xué)報(自然科學(xué)版);1988年01期
6 林士敏;機(jī)器學(xué)習(xí)概況[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);1989年02期
7 盧美律;張渡;;機(jī)器學(xué)習(xí):理論、方法及應(yīng)用[J];科學(xué);1995年02期
8 羅芳;李志亮;;基于分類的機(jī)器學(xué)習(xí)方法中的決策樹算法[J];寧德師專學(xué)報(自然科學(xué)版);2009年01期
9 李鈞濤;楊瑞峰;左紅亮;;統(tǒng)計機(jī)器學(xué)習(xí)研究[J];河南師范大學(xué)學(xué)報(自然科學(xué)版);2010年06期
10 黃健;;何清:挖掘數(shù)據(jù)開啟新知[J];科學(xué)中國人;2013年12期
相關(guān)會議論文 前10條
1 王玨;;歸納機(jī)器學(xué)習(xí)[A];2001年中國智能自動化會議論文集(上冊)[C];2001年
2 王昊;李銀波;紀(jì)志梁;;利用機(jī)器學(xué)習(xí)方法預(yù)測嚴(yán)重藥物不良反應(yīng)-呼吸困難[A];中國化學(xué)會第28屆學(xué)術(shù)年會第13分會場摘要集[C];2012年
3 吳滄浦;;智能系統(tǒng)與機(jī)器學(xué)習(xí)的新領(lǐng)域[A];西部大開發(fā) 科教先行與可持續(xù)發(fā)展——中國科協(xié)2000年學(xué)術(shù)年會文集[C];2000年
4 周晴杰;徐立鴻;吳啟迪;;機(jī)器學(xué)習(xí)串級結(jié)構(gòu)的初步探討[A];1998年中國控制會議論文集[C];1998年
5 李剛;郭崇慧;林鴻飛;楊志豪;唐煥文;;基于詞典法和機(jī)器學(xué)習(xí)法相結(jié)合的蛋白質(zhì)名識別[A];大連理工大學(xué)生物醫(yī)學(xué)工程學(xué)術(shù)論文集(第2卷)[C];2005年
6 徐禮勝;李乃民;王寬全;張冬雨;耿斌;姜曉睿;陳超海;羅貴存;;機(jī)器學(xué)習(xí)在中醫(yī)計算機(jī)診斷識別系統(tǒng)中的應(yīng)用思考[A];第一屆全國中西醫(yī)結(jié)合診斷學(xué)術(shù)會議論文選集[C];2006年
7 蔡健平;林世平;;基于機(jī)器學(xué)習(xí)的詞語和句子極性分析[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
8 黃金鐵;李景銀;周建常;;對高爐爐況評價模型參數(shù)的機(jī)器學(xué)習(xí)——一個三類線性模式分類器的實(shí)現(xiàn)[A];1995中國控制與決策學(xué)術(shù)年會論文集[C];1995年
9 程國建;蔡磊;潘華賢;;核向量機(jī)在大規(guī)模機(jī)器學(xué)習(xí)中的應(yīng)用[A];第十一屆中國青年信息與管理學(xué)者大會論文集[C];2009年
10 張鈸;張鈴;;統(tǒng)計學(xué)習(xí)理論及其應(yīng)用[A];2001年中國智能自動化會議論文集(上冊)[C];2001年
相關(guān)重要報紙文章 前10條
1 黎驪/文 [美] Tom M.Mitchell 著;機(jī)器學(xué)習(xí)與智能化社會[N];中國郵政報;2003年
2 IBM大數(shù)據(jù)專家 James Kobielus 范范 編譯;機(jī)器學(xué)習(xí)已成為大數(shù)據(jù)基石[N];網(wǎng)絡(luò)世界;2014年
3 本報記者 房琳琳;合久必分:分布式“機(jī)器學(xué)習(xí)”應(yīng)運(yùn)而生[N];科技日報;2014年
4 雨辰;機(jī)器學(xué)習(xí)類圖書為什么火爆[N];中華讀書報;2014年
5 百度公司技術(shù)副總監(jiān) 多媒體部負(fù)責(zé)人 余凱;深度學(xué)習(xí)與多媒體搜索技術(shù)演進(jìn)[N];中國信息化周報;2013年
6 本報記者 余建斌;機(jī)器學(xué)習(xí)與互聯(lián)網(wǎng)搜索[N];人民日報;2011年
7 本報記者 張曄邋通訊員 李瑋;周志華:永不墨守成規(guī)[N];科技日報;2008年
8 記者 彭德倩;機(jī)器學(xué)習(xí)精度提升近6個百分點(diǎn)[N];解放日報;2006年
9 本報記者 閔杰;大數(shù)據(jù)熱 高端人才缺[N];中國電子報;2013年
10 沈建苗 編譯;如何成為大數(shù)據(jù)科學(xué)家[N];計算機(jī)世界;2013年
相關(guān)博士學(xué)位論文 前10條
1 董春茹;機(jī)器學(xué)習(xí)中的權(quán)重學(xué)習(xí)與差分演化[D];華南理工大學(xué);2015年
2 姚明臣;機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中的若干問題研究[D];大連理工大學(xué);2016年
3 Maxim Pecionchin;[D];對外經(jīng)濟(jì)貿(mào)易大學(xué);2016年
4 杜宇;基于深度機(jī)器學(xué)習(xí)的體態(tài)與手勢感知計算關(guān)鍵技術(shù)研究[D];浙江大學(xué);2017年
5 鐘錦紅;群智學(xué)習(xí)若干問題研究[D];中國科學(xué)技術(shù)大學(xué);2017年
6 趙玉鵬;機(jī)器學(xué)習(xí)的哲學(xué)探索[D];大連理工大學(xué);2010年
7 胡巍;面向格結(jié)構(gòu)的機(jī)器學(xué)習(xí)[D];上海交通大學(xué);2009年
8 張義榮;基于機(jī)器學(xué)習(xí)的入侵檢測技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2005年
9 錢線;快速精確的結(jié)構(gòu)化機(jī)器學(xué)習(xí)方法研究[D];復(fù)旦大學(xué);2010年
10 梁錫軍;稀疏優(yōu)化在機(jī)器學(xué)習(xí)中的若干應(yīng)用[D];大連理工大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 毛海斌;基于半監(jiān)督機(jī)器學(xué)習(xí)的情感分類領(lǐng)域適應(yīng)問題研究[D];南京理工大學(xué);2015年
2 安軍輝;基于微博數(shù)據(jù)的微博用戶性別判斷研究[D];華中師范大學(xué);2015年
3 陳召陽;基于機(jī)器學(xué)習(xí)的改性麥槽吸附重金屬構(gòu)效關(guān)系模型研究[D];江西理工大學(xué);2014年
4 王成;基于半監(jiān)督機(jī)器學(xué)習(xí)的文本情感分析技術(shù)[D];南京理工大學(xué);2015年
5 孫科;基于Spark的機(jī)器學(xué)習(xí)應(yīng)用框架研究與實(shí)現(xiàn)[D];上海交通大學(xué);2015年
6 劉江龍;基于機(jī)器學(xué)習(xí)的射頻指紋定位方法研究[D];電子科技大學(xué);2015年
7 張蕾;基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)輿情采集技術(shù)研究與設(shè)計[D];電子科技大學(xué);2014年
8 施宇;基于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的木馬檢測系統(tǒng)設(shè)計與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
9 施應(yīng)敏;基于機(jī)器學(xué)習(xí)的Femtocell信道頻譜與功率資源分配算法的研究[D];南京郵電大學(xué);2015年
10 裴松年;基于機(jī)器學(xué)習(xí)的分類算法研究[D];中北大學(xué);2016年
,本文編號:1404945
本文鏈接:http://sikaile.net/xiyixuelunwen/1404945.html