基于生物信息學方法識別肺鱗狀細胞癌預后相關基因及擬合預測風險模型
發(fā)布時間:2022-02-08 22:14
肺鱗狀細胞癌(lung squamous cell carcinoma,LUSC)簡稱肺鱗癌,是非小細胞肺癌中一類常見的病理類型。由于其發(fā)病隱蔽,往往發(fā)現(xiàn)時已屬晚期,加上缺乏有效的靶向治療藥物等因素,肺鱗癌患者的預后差,因此迫切需要找到與肺鱗癌預后相關的生物標志物,為臨床治療提供策略,改善患者的預后。本研究基于NCBI的GEO和TCGA兩個大型腫瘤基因組組學數(shù)據(jù)庫,利用生物信息學的方法篩選肺鱗癌預后相關基因,建立預測風險模型。1、從GEO中下載肺鱗癌的基因表達譜數(shù)據(jù)和TCGA的轉(zhuǎn)錄組數(shù)據(jù)及臨床隨訪信息,分別利用R語言中Bioconductor的“affy”和“edgeR”包進行對數(shù)據(jù)進行預處理。2、基于癌樣本中基因表達值的中位數(shù)絕對偏差值,分別在數(shù)據(jù)集中篩選75%差異最大的基因。3、為了篩選出可靠的差異基因,選擇在各個GEO數(shù)據(jù)集及TCGA的轉(zhuǎn)錄組數(shù)據(jù)中均是有異常表達的基因作為我們的異常表達基因。4、對篩選出的異常表達基因進行生存分析。將基因在正常樣本中的平均表達水平設置為閾值,進行分組(大于其閾值為高表達組,反之為低表達組)。根據(jù)log-rank檢驗,P<0.01認為有統(tǒng)計學意...
【文章來源】:南昌大學江西省211工程院校
【文章頁數(shù)】:50 頁
【學位級別】:碩士
【部分圖文】:
GEO數(shù)據(jù)集和TCGA數(shù)據(jù)共有的異常表達的基因(n=7925)
圖 3.2 訓練集(n=325)中 11 基因模型的預測效果評估為了進一步的驗證我們 11 基因模型的預測能力和可靠性。我們在驗證集中進行了驗證。根據(jù)同樣的方法,我們在驗證集中計算了基于 11 基因模型的風險得分,利用 ROC 曲線進行預測了未來 3 年的總生存率,ROC 曲線下的面積AUC=0.711。表明該模型在驗證集中具有較好的預測能力和可靠性。根據(jù)在訓練集中得到的最佳閾值 1.499,驗證集同樣被分為高風險組和低風險組,風險的分
圖 3.3 11 基因模型在驗證集(n=139)中的預測效果評估此外,我們也將訓練集和驗證集整合起來進一步的驗證該模型的預測能力靠性,在 464 個樣本中,我們進行繪制 ROC 曲線,同樣預測 3 年的總生存結果表明,ROC 曲線的下的面積為 AUC=0.748,說明我們的 11 基因模型具好的穩(wěn)定性。在整合的數(shù)據(jù)集中,高風險組(n=150),低風險組(n=314),比較兩組的總生存,根據(jù) log rank 檢驗結果表明高風險組的患者總生存時
【參考文獻】:
期刊論文
[1]高危職業(yè)暴露與肺癌臨床特征的相關性分析[J]. 韓書閣,郭云嶺,馮曉英,程瑞清. 中國腫瘤. 2018(10)
[2]TBC蛋白家族成員在人類疾病發(fā)生發(fā)展中的作用[J]. 施夢婷,張瑩,周鋼橋. 遺傳. 2018(01)
[3]營養(yǎng)與肺癌的關系及肺癌患者營養(yǎng)干預[J]. 張冉,劉杰,林洪生,王宜. 中國中西醫(yī)結合外科雜志. 2017(05)
[4]吸煙對wnt/β-catenin信號轉(zhuǎn)導途徑的激活情況及與肺鱗狀細胞癌發(fā)病率的相關性[J]. 王松. 中國綜合臨床. 2017 (02)
[5]焦化廠職業(yè)暴露與肺癌關系研究進展[J]. 王陽,王一婧. 山西醫(yī)藥雜志. 2015(09)
[6]吸煙、被動吸煙與肺癌發(fā)病風險的病例對照研究[J]. 劉志強,何斐,蔡琳. 中華疾病控制雜志. 2015(02)
[7]肺鱗癌驅(qū)動基因及其靶向治療的研究進展[J]. 黃芳,李穎,姜達. 腫瘤學雜志. 2014(12)
[8]p63與表皮生長因子受體突變肺鱗癌患者生存的關系[J]. 王碧波,韓一平,萬善志,黃玲,馬大烈,鄭建明,李強. 第二軍醫(yī)大學學報. 2014(04)
[9]肺鱗癌全基因組lncRNAs表達研究[J]. 王瑛,尹繼業(yè),李湘平,陳娟,錢晨月,鄭藝,劉昭前. 腫瘤藥學. 2013(04)
[10]生存分析的方法及應用[J]. 羅勝蘭,俞敏. 浙江預防醫(yī)學. 2013(05)
本文編號:3615848
【文章來源】:南昌大學江西省211工程院校
【文章頁數(shù)】:50 頁
【學位級別】:碩士
【部分圖文】:
GEO數(shù)據(jù)集和TCGA數(shù)據(jù)共有的異常表達的基因(n=7925)
圖 3.2 訓練集(n=325)中 11 基因模型的預測效果評估為了進一步的驗證我們 11 基因模型的預測能力和可靠性。我們在驗證集中進行了驗證。根據(jù)同樣的方法,我們在驗證集中計算了基于 11 基因模型的風險得分,利用 ROC 曲線進行預測了未來 3 年的總生存率,ROC 曲線下的面積AUC=0.711。表明該模型在驗證集中具有較好的預測能力和可靠性。根據(jù)在訓練集中得到的最佳閾值 1.499,驗證集同樣被分為高風險組和低風險組,風險的分
圖 3.3 11 基因模型在驗證集(n=139)中的預測效果評估此外,我們也將訓練集和驗證集整合起來進一步的驗證該模型的預測能力靠性,在 464 個樣本中,我們進行繪制 ROC 曲線,同樣預測 3 年的總生存結果表明,ROC 曲線的下的面積為 AUC=0.748,說明我們的 11 基因模型具好的穩(wěn)定性。在整合的數(shù)據(jù)集中,高風險組(n=150),低風險組(n=314),比較兩組的總生存,根據(jù) log rank 檢驗結果表明高風險組的患者總生存時
【參考文獻】:
期刊論文
[1]高危職業(yè)暴露與肺癌臨床特征的相關性分析[J]. 韓書閣,郭云嶺,馮曉英,程瑞清. 中國腫瘤. 2018(10)
[2]TBC蛋白家族成員在人類疾病發(fā)生發(fā)展中的作用[J]. 施夢婷,張瑩,周鋼橋. 遺傳. 2018(01)
[3]營養(yǎng)與肺癌的關系及肺癌患者營養(yǎng)干預[J]. 張冉,劉杰,林洪生,王宜. 中國中西醫(yī)結合外科雜志. 2017(05)
[4]吸煙對wnt/β-catenin信號轉(zhuǎn)導途徑的激活情況及與肺鱗狀細胞癌發(fā)病率的相關性[J]. 王松. 中國綜合臨床. 2017 (02)
[5]焦化廠職業(yè)暴露與肺癌關系研究進展[J]. 王陽,王一婧. 山西醫(yī)藥雜志. 2015(09)
[6]吸煙、被動吸煙與肺癌發(fā)病風險的病例對照研究[J]. 劉志強,何斐,蔡琳. 中華疾病控制雜志. 2015(02)
[7]肺鱗癌驅(qū)動基因及其靶向治療的研究進展[J]. 黃芳,李穎,姜達. 腫瘤學雜志. 2014(12)
[8]p63與表皮生長因子受體突變肺鱗癌患者生存的關系[J]. 王碧波,韓一平,萬善志,黃玲,馬大烈,鄭建明,李強. 第二軍醫(yī)大學學報. 2014(04)
[9]肺鱗癌全基因組lncRNAs表達研究[J]. 王瑛,尹繼業(yè),李湘平,陳娟,錢晨月,鄭藝,劉昭前. 腫瘤藥學. 2013(04)
[10]生存分析的方法及應用[J]. 羅勝蘭,俞敏. 浙江預防醫(yī)學. 2013(05)
本文編號:3615848
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3615848.html
最近更新
教材專著