基于擬合回歸的癌癥代謝分析和基因間相關性研究
發(fā)布時間:2020-06-19 03:40
【摘要】:擬合回歸是一類用于分析和確定多種變量之間定量相互依賴關系的算法模型。作為被廣泛使用的數(shù)據(jù)挖掘方法,它的應用極大地推動了以生物信息學為代表的眾多學科的深入發(fā)展。本文使用、設計并實現(xiàn)基于擬合回歸的算法模型,用于分析生物組學數(shù)據(jù),進而回答生物信息學問題。論文的主要工作集中在谷氨酰胺和谷氨酸在多種癌癥中的代謝分析和基于擬合回歸模型的基因間相關性研究兩方面。在第一部分主要研究工作中,本文使用11種癌癥和對照正常組織的轉錄組學數(shù)據(jù)研究谷氨酰胺和谷氨酸在癌癥組織中的代謝異常,相較于僅使用細胞系實驗和動物模型數(shù)據(jù),其結果更能夠如實地反映這兩種氨基酸代謝在人體癌癥組織中的真實情況;采用多元多重線性回歸模型,用于計算每種癌癥組織中谷氨酰胺/谷氨酸參與7種合成代謝過程中產(chǎn)物合成的程度及其統(tǒng)計顯著性,在國內外眾多研究工作中,首次對多種類型癌癥組織中谷氨酰胺/谷氨酸參與生物過程水平進行了橫向的比較。經(jīng)過分析,對谷氨酰胺和谷氨酸在癌癥組織中參與生物過程的情況有了全新的認識,發(fā)現(xiàn)這兩種氨基酸在不同的癌癥組織中參與7種合成代謝過程的程度存在顯著異常,尤其是其中谷氨酰胺和谷氨酸參與某些合成過程顯著增強可以作為新的癌癥代謝特征,為以谷氨酰胺和谷氨酸代謝為靶點的癌癥治療手段提供新思路與理論依據(jù)。在第二部分主要研究工作中,本文設計并實現(xiàn)基于擬合回歸的多特征相似性(MFR)模型,聯(lián)合使用兩類異構基因對特征:共表達相似性和先驗知識相似性,綜合考量兩種評分標準:共表達相關性和先驗知識相關性,用于更準確地衡量特定實驗條件下的基因間相關性,避免使用單一類型基因對特征和單一評分標準的不足;使用支持向量機為核心構建MFR模型,實現(xiàn)多目標優(yōu)化,并保證模型具有較好的泛化能力;針對使用支持向量機這一廣義線性邏輯回歸模型為核心構建模型用于衡量連續(xù)數(shù)值的基因間相關性問題,使用基因對樣本屬于正/負樣本集合的“概率”,即基因對樣本距離支持向量機最終分類面的距離的歸一化數(shù)值作為衡量特定實驗條件下基因間相關性的新指標——MFR。實驗結果表明,新模型相較于其它經(jīng)典多特征線性模型和共表達分析算法,具有更好的準確性、魯棒性和應用性。MFR模型腳本已經(jīng)由R語言實現(xiàn)并公布在MFR模型網(wǎng)站首頁用于自由下載和學術研究。本文的兩部分主要研究工作不僅都是基于擬合回歸的思想,而且恰好分別是擬合回歸兩種主要用途在具體生物信息學問題中的實際應用,并計劃在未來的研究工作中進一步結合,其研究成果具有現(xiàn)實意義。
【學位授予單位】:吉林大學
【學位級別】:博士
【學位授予年份】:2018
【分類號】:TP311.13;R73
【圖文】:
圖 1.1 癌癥特征圖 1.2 2005 年和 2015 年中造成人類死亡的 9 種主要原因在全球的死亡率本文的第一部分主要研究工作是擬發(fā)現(xiàn)新的可以作為癌癥特征的代謝改變,主要聚
2圖 1.2 2005 年和 2015 年中造成人類死亡的 9 種主要原因在全球的死亡率本文的第一部分主要研究工作是擬發(fā)現(xiàn)新的可以作為癌癥特征的代謝改變,主要聚焦在氨基酸代謝,特別是谷氨酰胺和谷氨酸代謝。在以往的國內外研究中,大量的實驗據(jù)表明:谷氨酰胺是人體血液循環(huán)中含量最高的自由氨基酸[18][19];與正;蛘甙┡越M織相比,腫瘤細胞攝入谷氨酰胺能力顯著增強,谷氨酰胺的跨膜轉運蛋白基因 SLC1A5 和SLC38A1 在多種癌癥,例如:乳腺癌[20]、腸癌[21]、肺癌[22]中高表達;此外在多種癌癥的不同生物過程中谷氨酰胺都發(fā)揮著重要的作用[23]。其中谷氨酰胺主要參與的生物過程包括:參與合成蛋白質和核苷酸[24];在瓦伯格效應(Warburg effect)下,水解成為谷氨酸進入三羧酸循環(huán),為腫瘤細胞的生長合成必要的代謝產(chǎn)物[25][26],例如:能量、脂肪等
本文編號:2720250
【學位授予單位】:吉林大學
【學位級別】:博士
【學位授予年份】:2018
【分類號】:TP311.13;R73
【圖文】:
圖 1.1 癌癥特征圖 1.2 2005 年和 2015 年中造成人類死亡的 9 種主要原因在全球的死亡率本文的第一部分主要研究工作是擬發(fā)現(xiàn)新的可以作為癌癥特征的代謝改變,主要聚
2圖 1.2 2005 年和 2015 年中造成人類死亡的 9 種主要原因在全球的死亡率本文的第一部分主要研究工作是擬發(fā)現(xiàn)新的可以作為癌癥特征的代謝改變,主要聚焦在氨基酸代謝,特別是谷氨酰胺和谷氨酸代謝。在以往的國內外研究中,大量的實驗據(jù)表明:谷氨酰胺是人體血液循環(huán)中含量最高的自由氨基酸[18][19];與正;蛘甙┡越M織相比,腫瘤細胞攝入谷氨酰胺能力顯著增強,谷氨酰胺的跨膜轉運蛋白基因 SLC1A5 和SLC38A1 在多種癌癥,例如:乳腺癌[20]、腸癌[21]、肺癌[22]中高表達;此外在多種癌癥的不同生物過程中谷氨酰胺都發(fā)揮著重要的作用[23]。其中谷氨酰胺主要參與的生物過程包括:參與合成蛋白質和核苷酸[24];在瓦伯格效應(Warburg effect)下,水解成為谷氨酸進入三羧酸循環(huán),為腫瘤細胞的生長合成必要的代謝產(chǎn)物[25][26],例如:能量、脂肪等
【相似文獻】
相關期刊論文 前3條
1 閆常陸;王峰;;基于薩道夫斯基公式擬合的爆破振動規(guī)律研究[J];現(xiàn)代礦業(yè);2018年06期
2 呂純濂;用QR分解擬合回歸方程參數(shù)估計和剩余的迭代加細[J];數(shù)值計算與計算機應用;2000年04期
3 仝宇;;基于徑向基網(wǎng)絡動態(tài)稱量數(shù)據(jù)修正[J];山西電子技術;2015年01期
相關會議論文 前1條
1 張明;姬光剛;潘林;;科學冶煉精益管理模式的應用和探索[A];2017年全國高爐煉鐵學術年會論文集(上)[C];2017年
相關博士學位論文 前1條
1 田原;基于擬合回歸的癌癥代謝分析和基因間相關性研究[D];吉林大學;2018年
相關碩士學位論文 前1條
1 張瑞瓊;改善厚板滾切式雙邊剪剪切質量的研究[D];燕山大學;2009年
本文編號:2720250
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/2720250.html
最近更新
教材專著