基于網(wǎng)絡(luò)數(shù)據(jù)庫及WGCNA-LASSO算法胃癌預(yù)后lncRNA分子標(biāo)志物篩選
發(fā)布時間:2021-06-28 16:37
目的基于網(wǎng)絡(luò)數(shù)據(jù)庫中胃癌和癌旁組織的RNA測序數(shù)據(jù)及臨床特征數(shù)據(jù),運(yùn)用系統(tǒng)生物學(xué)方法聯(lián)合機(jī)器學(xué)習(xí)算法進(jìn)行生物信息學(xué)分析,篩選出胃癌預(yù)后長鏈非編碼RNA(long noncoding RNA,lncRNA)分子標(biāo)志物,為研究胃癌發(fā)生發(fā)展的分子學(xué)機(jī)制提供參考。方法1從癌癥基因組圖譜官網(wǎng)下載胃癌和癌旁組織RNA測序數(shù)據(jù)及臨床特征數(shù)據(jù),提取lncRNA數(shù)據(jù)并進(jìn)行標(biāo)準(zhǔn)化處理,運(yùn)用“edge R”函數(shù)包篩選胃癌差異表達(dá)lncRNA,采用加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(Weighted Gene Correlation Network Analysis,WGCNA)鑒定與胃癌總體生存時間相關(guān)的lncRNA模塊。2運(yùn)用最小化絕對收縮和選擇算子(Least Absolute Shrinkage and Selection Operator,LASSO)算法對模塊內(nèi)lncRNA構(gòu)建胃癌預(yù)后lncRNA模型,繪制受試者工作特征曲線(Receiver Operating Characteristic,ROC)并計(jì)算曲線下面積(Area Under Curve,AUC)評價模型。根據(jù)模型計(jì)算胃癌和癌旁樣本對應(yīng)的風(fēng)險評分...
【文章來源】:華北理工大學(xué)河北省
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
鑒定胃癌預(yù)后lncRNA模塊的研究步驟圖
-8-II127(30%)12(37%)III199(64%)20(63%)X9(3%)0(0%)表1中包含5個臨床特征,其中1個臨床特征屬于等級數(shù)據(jù),即病理分級(Grade),分為病理I級、病理II級、病理III級,分級不能明確的則劃分為病理X級;其中2個臨床特征數(shù)據(jù)屬于分類數(shù)據(jù),即性別(男/女)、生存狀態(tài)(存活/死亡);年齡(≥65歲/<65歲)和總體生存時間(≥2000天/<2000天,5年近似于2000天)這2個臨床特征數(shù)據(jù)為連續(xù)性數(shù)值數(shù)據(jù)!癱hisq.test()”函數(shù)對胃癌和癌旁組織樣本基線特征進(jìn)行卡方(χ2)檢驗(yàn),發(fā)現(xiàn)在性別、年齡、總體生存時間、最終生存狀態(tài)及病理分級方面胃癌和癌旁組織樣本之間P值均大于0.05,差異不具有統(tǒng)計(jì)學(xué)意義。結(jié)果提示研究納入特征與胃癌組織與否無明顯相關(guān)性,該數(shù)據(jù)分布進(jìn)行胃癌預(yù)后lncRNA分子標(biāo)志物的篩選研究較為合理。1.2.2篩選胃癌差異表達(dá)lncRNA針對預(yù)處理得到的14448個lncRNA表達(dá)數(shù)據(jù),運(yùn)行“edgeR”函數(shù)包進(jìn)行胃癌差異表達(dá)lncRNA的篩選,并繪制胃癌差異表達(dá)lncRNA火山圖(圖2)。本研究共篩選得到3301個胃癌差異表達(dá)lncRNA,其中有2439個lncRNA表達(dá)上調(diào)(紅色),862個lncRNA表達(dá)下調(diào)(綠色)。圖2胃癌差異表達(dá)lncRNA火山圖
-9-將edgeR函數(shù)篩選所得胃癌差異表達(dá)lncRNA對應(yīng)統(tǒng)計(jì)量進(jìn)行匯總,按所得P值從小到大進(jìn)行排序,一般認(rèn)為P值越小代表差異表達(dá)性越顯著,依據(jù)P值選擇差異表達(dá)最顯著的前10個lncRNA,并列表如表2。表2胃癌差異表達(dá)最顯著前10個lncRNAIndexGeneIDLogFCLogCPMP-ValueFDR1IL12A.AS1-3.625.041.17e-621.25e-582ADAMTS9.AS1-2.996.503.43e-511.82e-473RP11-867G23.10-3.326.134.63e-461.64e-424RP11-770J1.3-1.985.481.39e-443.69e-415AL928768.3-4.006.847.19e-441.53e-406AF131217.1-2.755.439.30e-421.65e-387AC090616.2-2.305.941.26e-401.92e-378RP11-613D13.8-2.554.876.16e-388.19e-359AC067959.1-3.843.337.87e-389.32e-3510HCG22-4.667.273.00e-373.20e-341.2.3構(gòu)建加權(quán)基因共表達(dá)網(wǎng)絡(luò)以動態(tài)剪切樹法進(jìn)行聚類分析,選取剪切高度50000為標(biāo)準(zhǔn)進(jìn)行剪切,保留高度較為一致的數(shù)據(jù),繪制聚類圖(如圖3)。紅線代表剪切高度50000,紅線以上代表去除數(shù)據(jù),去除4例胃癌樣本數(shù)據(jù),保留紅線以下的373例胃癌和癌旁組織樣本數(shù)據(jù)進(jìn)行加權(quán)基因共表達(dá)網(wǎng)絡(luò)的構(gòu)建。圖3聚類圖
【參考文獻(xiàn)】:
期刊論文
[1]中國胃癌發(fā)病趨勢及預(yù)測[J]. 楊之洵,鄭榮壽,張思維,曾紅梅,陳萬青. 中國腫瘤. 2019(05)
[2]顱內(nèi)動脈瘤相關(guān)基因的共表達(dá)網(wǎng)絡(luò)構(gòu)建與分析[J]. 廖寶,周鳳坤,鐘松辛,周遠(yuǎn)方,覃燕生,周夢曉,秦超. 中華醫(yī)學(xué)雜志. 2019 (07)
[3]基于癌癥基因組圖譜構(gòu)建胃癌預(yù)后評估模型[J]. 王舉,竇忠霞,姜洪偉,王永強(qiáng),高小平,張勇. 天津醫(yī)藥. 2018(12)
[4]胃癌分子標(biāo)志物在臨床中的研究進(jìn)展[J]. 麗敏,劉險峰,孫魯山,王虎明. 中國醫(yī)學(xué)工程. 2018(09)
[5]肺癌關(guān)鍵基因篩選及預(yù)測模型的研究[J]. 潘以紅,范雪萌,朱平. 生物學(xué)雜志. 2019(02)
[6]殘胃癌淋巴結(jié)轉(zhuǎn)移的高危因素分析及預(yù)測模型的建立[J]. 王瑋,聶潤聰,周志偉. 中華胃腸外科雜志. 2018 (05)
[7]中國早期胃癌篩查流程專家共識意見(草案)(2017年,上海)[J]. 杜奕奇,蔡全才,廖專,方軍,朱春平. 胃腸病學(xué). 2018(02)
[8]利用轉(zhuǎn)錄組測序數(shù)據(jù)分析胃癌長鏈非編碼RNA的研究[J]. 曹偉軍,談路軒,李超,韓維維,張軍,張振玉. 臨床腫瘤學(xué)雜志. 2017(12)
[9]早期胃癌患者淋巴結(jié)轉(zhuǎn)移危險因素分析及風(fēng)險預(yù)測模型的建立[J]. 韓文秀,徐阿曼,陳章明,韋之見,劉虎. 中華普通外科雜志. 2017 (04)
[10]中國胃癌流行病學(xué)現(xiàn)狀[J]. 左婷婷,鄭榮壽,曾紅梅,張思維,陳萬青. 中國腫瘤臨床. 2017(01)
本文編號:3254673
【文章來源】:華北理工大學(xué)河北省
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
鑒定胃癌預(yù)后lncRNA模塊的研究步驟圖
-8-II127(30%)12(37%)III199(64%)20(63%)X9(3%)0(0%)表1中包含5個臨床特征,其中1個臨床特征屬于等級數(shù)據(jù),即病理分級(Grade),分為病理I級、病理II級、病理III級,分級不能明確的則劃分為病理X級;其中2個臨床特征數(shù)據(jù)屬于分類數(shù)據(jù),即性別(男/女)、生存狀態(tài)(存活/死亡);年齡(≥65歲/<65歲)和總體生存時間(≥2000天/<2000天,5年近似于2000天)這2個臨床特征數(shù)據(jù)為連續(xù)性數(shù)值數(shù)據(jù)!癱hisq.test()”函數(shù)對胃癌和癌旁組織樣本基線特征進(jìn)行卡方(χ2)檢驗(yàn),發(fā)現(xiàn)在性別、年齡、總體生存時間、最終生存狀態(tài)及病理分級方面胃癌和癌旁組織樣本之間P值均大于0.05,差異不具有統(tǒng)計(jì)學(xué)意義。結(jié)果提示研究納入特征與胃癌組織與否無明顯相關(guān)性,該數(shù)據(jù)分布進(jìn)行胃癌預(yù)后lncRNA分子標(biāo)志物的篩選研究較為合理。1.2.2篩選胃癌差異表達(dá)lncRNA針對預(yù)處理得到的14448個lncRNA表達(dá)數(shù)據(jù),運(yùn)行“edgeR”函數(shù)包進(jìn)行胃癌差異表達(dá)lncRNA的篩選,并繪制胃癌差異表達(dá)lncRNA火山圖(圖2)。本研究共篩選得到3301個胃癌差異表達(dá)lncRNA,其中有2439個lncRNA表達(dá)上調(diào)(紅色),862個lncRNA表達(dá)下調(diào)(綠色)。圖2胃癌差異表達(dá)lncRNA火山圖
-9-將edgeR函數(shù)篩選所得胃癌差異表達(dá)lncRNA對應(yīng)統(tǒng)計(jì)量進(jìn)行匯總,按所得P值從小到大進(jìn)行排序,一般認(rèn)為P值越小代表差異表達(dá)性越顯著,依據(jù)P值選擇差異表達(dá)最顯著的前10個lncRNA,并列表如表2。表2胃癌差異表達(dá)最顯著前10個lncRNAIndexGeneIDLogFCLogCPMP-ValueFDR1IL12A.AS1-3.625.041.17e-621.25e-582ADAMTS9.AS1-2.996.503.43e-511.82e-473RP11-867G23.10-3.326.134.63e-461.64e-424RP11-770J1.3-1.985.481.39e-443.69e-415AL928768.3-4.006.847.19e-441.53e-406AF131217.1-2.755.439.30e-421.65e-387AC090616.2-2.305.941.26e-401.92e-378RP11-613D13.8-2.554.876.16e-388.19e-359AC067959.1-3.843.337.87e-389.32e-3510HCG22-4.667.273.00e-373.20e-341.2.3構(gòu)建加權(quán)基因共表達(dá)網(wǎng)絡(luò)以動態(tài)剪切樹法進(jìn)行聚類分析,選取剪切高度50000為標(biāo)準(zhǔn)進(jìn)行剪切,保留高度較為一致的數(shù)據(jù),繪制聚類圖(如圖3)。紅線代表剪切高度50000,紅線以上代表去除數(shù)據(jù),去除4例胃癌樣本數(shù)據(jù),保留紅線以下的373例胃癌和癌旁組織樣本數(shù)據(jù)進(jìn)行加權(quán)基因共表達(dá)網(wǎng)絡(luò)的構(gòu)建。圖3聚類圖
【參考文獻(xiàn)】:
期刊論文
[1]中國胃癌發(fā)病趨勢及預(yù)測[J]. 楊之洵,鄭榮壽,張思維,曾紅梅,陳萬青. 中國腫瘤. 2019(05)
[2]顱內(nèi)動脈瘤相關(guān)基因的共表達(dá)網(wǎng)絡(luò)構(gòu)建與分析[J]. 廖寶,周鳳坤,鐘松辛,周遠(yuǎn)方,覃燕生,周夢曉,秦超. 中華醫(yī)學(xué)雜志. 2019 (07)
[3]基于癌癥基因組圖譜構(gòu)建胃癌預(yù)后評估模型[J]. 王舉,竇忠霞,姜洪偉,王永強(qiáng),高小平,張勇. 天津醫(yī)藥. 2018(12)
[4]胃癌分子標(biāo)志物在臨床中的研究進(jìn)展[J]. 麗敏,劉險峰,孫魯山,王虎明. 中國醫(yī)學(xué)工程. 2018(09)
[5]肺癌關(guān)鍵基因篩選及預(yù)測模型的研究[J]. 潘以紅,范雪萌,朱平. 生物學(xué)雜志. 2019(02)
[6]殘胃癌淋巴結(jié)轉(zhuǎn)移的高危因素分析及預(yù)測模型的建立[J]. 王瑋,聶潤聰,周志偉. 中華胃腸外科雜志. 2018 (05)
[7]中國早期胃癌篩查流程專家共識意見(草案)(2017年,上海)[J]. 杜奕奇,蔡全才,廖專,方軍,朱春平. 胃腸病學(xué). 2018(02)
[8]利用轉(zhuǎn)錄組測序數(shù)據(jù)分析胃癌長鏈非編碼RNA的研究[J]. 曹偉軍,談路軒,李超,韓維維,張軍,張振玉. 臨床腫瘤學(xué)雜志. 2017(12)
[9]早期胃癌患者淋巴結(jié)轉(zhuǎn)移危險因素分析及風(fēng)險預(yù)測模型的建立[J]. 韓文秀,徐阿曼,陳章明,韋之見,劉虎. 中華普通外科雜志. 2017 (04)
[10]中國胃癌流行病學(xué)現(xiàn)狀[J]. 左婷婷,鄭榮壽,曾紅梅,張思維,陳萬青. 中國腫瘤臨床. 2017(01)
本文編號:3254673
本文鏈接:http://sikaile.net/yixuelunwen/zlx/3254673.html
最近更新
教材專著