兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺(tái)
發(fā)布時(shí)間:2021-12-24 10:14
腫瘤是成人和兒童死亡的主要原因,但相對(duì)而言,大多數(shù)兒童腫瘤是比較罕見的疾病。Therapeutically Applicable Research To Generate Effective Treatments(TARGET)數(shù)據(jù)庫已經(jīng)釋放了多種兒童腫瘤的多組學(xué)數(shù)據(jù)以及臨床數(shù)據(jù)。這些數(shù)據(jù)為挖掘兒童腫瘤發(fā)展相關(guān)分子機(jī)制創(chuàng)造了條件。然而,由于組學(xué)數(shù)據(jù)具有存儲(chǔ)量大,維度高等特點(diǎn),對(duì)無生物信息學(xué)背景的研究人員而言門檻較高且難以使用,極大地限制了多組學(xué)數(shù)據(jù)在兒童腫瘤中的應(yīng)用。此外,目前很少有專門針對(duì)兒童腫瘤數(shù)據(jù)分析的平臺(tái),為無生物信息科研背景或編程能力薄弱的研究人員使用。因此,本課題開發(fā)了兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺(tái),通過Web Server的形式進(jìn)行展示。基于來自GEO、TARGET、SRA數(shù)據(jù)庫中的多種兒童腫瘤的不同組學(xué)數(shù)據(jù),提供了多種定制化的分析功能,包括基因基本信息查詢、基因差異表達(dá)分析、甲基化差異分析、多組學(xué)關(guān)聯(lián)分析、相似基因計(jì)算檢測(cè)、患者生存分析、腫瘤免疫細(xì)胞浸潤程度分析。本平臺(tái)針對(duì)兒童腫瘤數(shù)據(jù)進(jìn)行了多方位的分析,為相關(guān)的研究人員提供全面、簡(jiǎn)潔的數(shù)據(jù)挖掘功能,致力于將多組學(xué)應(yīng)用于兒...
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:88 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
TARGET數(shù)據(jù)庫數(shù)據(jù)類型
華東師范大學(xué)碩士學(xué)位論文6度分析模塊。對(duì)于可以提前進(jìn)行分析計(jì)算的數(shù)據(jù),我們會(huì)提前通過程序腳本計(jì)算出分析結(jié)果,并存儲(chǔ)在本地的MySQL數(shù)據(jù)庫中。本文旨在開發(fā)常用的數(shù)據(jù)分析功能,對(duì)數(shù)據(jù)挖掘進(jìn)行可視化,使得更多的研究人員通過簡(jiǎn)單的操作就能實(shí)現(xiàn)復(fù)雜的數(shù)據(jù)分析。兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺(tái)的系統(tǒng)架構(gòu)如圖1-2所示,整個(gè)系統(tǒng)的工作流程如下,前期先進(jìn)行數(shù)據(jù)收集工作,分別從TARGET、GEO以及SRA數(shù)據(jù)庫中下載了兒童腫瘤的不同組學(xué)的數(shù)據(jù)和臨床數(shù)據(jù),因?yàn)閬碜圆煌瑪?shù)據(jù)庫中的原始數(shù)據(jù)存儲(chǔ)的格式存在差異,所以需要對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一的標(biāo)準(zhǔn)化,然后對(duì)數(shù)據(jù)進(jìn)行清洗,過濾掉RNA-Seq數(shù)據(jù)中低豐度的基因以及甲基化芯片中包含大量缺失值的位點(diǎn),最后對(duì)數(shù)據(jù)進(jìn)行預(yù)處理工作,將數(shù)據(jù)整理成后續(xù)分析可用的輸入格式。數(shù)據(jù)處理好后,下一步便是進(jìn)行數(shù)據(jù)分析、數(shù)據(jù)挖掘,最后開發(fā)網(wǎng)站平臺(tái)進(jìn)行結(jié)果展示。圖1-2兒童腫瘤多組學(xué)大數(shù)據(jù)分析數(shù)據(jù)庫平臺(tái)的構(gòu)建流程圖在數(shù)據(jù)分析的模塊中,我們做了在腫瘤癌癥研究中常用的數(shù)據(jù)分析,如基因表達(dá)的差異分析、甲基化的差異分析、腫瘤免疫浸潤程度分析、多組學(xué)關(guān)聯(lián)分析、相似基因檢測(cè)以及生存分析等。最終并開發(fā)成Web平臺(tái),Web平臺(tái)的設(shè)計(jì)理念一切從簡(jiǎn),為了讓不會(huì)編程的科研人員也能夠快速的做腫瘤癌癥相關(guān)的交互式數(shù)據(jù)分析,網(wǎng)站上按照分析的功能模塊進(jìn)行劃分。系統(tǒng)的數(shù)據(jù)處理和數(shù)據(jù)展示的架
華東師范大學(xué)碩士學(xué)位論文7構(gòu)如圖1-3,原始數(shù)據(jù)通過數(shù)據(jù)計(jì)算層得到分析結(jié)果存儲(chǔ)在數(shù)據(jù)層中,然后通過邏輯層的操作將分析結(jié)果通過表格以及矢量圖的形式展現(xiàn)在視圖層中。網(wǎng)站中的所有繪圖功能都是使用R腳本開發(fā)的,網(wǎng)站的輸出包括表格和圖表。網(wǎng)站中的靜態(tài)數(shù)據(jù)可視化主要是通過便攜式文檔格式(PDF)進(jìn)行呈現(xiàn)。圖1-3兒童腫瘤多組學(xué)大數(shù)據(jù)分析數(shù)據(jù)庫的架構(gòu)與此同時(shí),本文完成了兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺(tái)的網(wǎng)站開發(fā),開發(fā)了多種交互式的數(shù)據(jù)分析功能,并且提供定制化的繪圖功能。網(wǎng)站主要提供了7個(gè)模塊:基因基本信息查詢模塊,基因表達(dá)差異分析模塊,甲基化差異分析模塊,多組學(xué)關(guān)聯(lián)分析模塊,腫瘤臨床生存分析模塊,相似基因計(jì)算檢測(cè)模塊,腫瘤免疫細(xì)胞浸潤程度分析模塊。兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺(tái)網(wǎng)站免費(fèi)提供給所有用戶,前端是基于HTML5和JavaScript庫(https://jquery.com/)和Bootstrap模板(https://www.bootcss.com/)進(jìn)行開發(fā),數(shù)據(jù)可視化基于ECHARTS庫
本文編號(hào):3550299
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:88 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
TARGET數(shù)據(jù)庫數(shù)據(jù)類型
華東師范大學(xué)碩士學(xué)位論文6度分析模塊。對(duì)于可以提前進(jìn)行分析計(jì)算的數(shù)據(jù),我們會(huì)提前通過程序腳本計(jì)算出分析結(jié)果,并存儲(chǔ)在本地的MySQL數(shù)據(jù)庫中。本文旨在開發(fā)常用的數(shù)據(jù)分析功能,對(duì)數(shù)據(jù)挖掘進(jìn)行可視化,使得更多的研究人員通過簡(jiǎn)單的操作就能實(shí)現(xiàn)復(fù)雜的數(shù)據(jù)分析。兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺(tái)的系統(tǒng)架構(gòu)如圖1-2所示,整個(gè)系統(tǒng)的工作流程如下,前期先進(jìn)行數(shù)據(jù)收集工作,分別從TARGET、GEO以及SRA數(shù)據(jù)庫中下載了兒童腫瘤的不同組學(xué)的數(shù)據(jù)和臨床數(shù)據(jù),因?yàn)閬碜圆煌瑪?shù)據(jù)庫中的原始數(shù)據(jù)存儲(chǔ)的格式存在差異,所以需要對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一的標(biāo)準(zhǔn)化,然后對(duì)數(shù)據(jù)進(jìn)行清洗,過濾掉RNA-Seq數(shù)據(jù)中低豐度的基因以及甲基化芯片中包含大量缺失值的位點(diǎn),最后對(duì)數(shù)據(jù)進(jìn)行預(yù)處理工作,將數(shù)據(jù)整理成后續(xù)分析可用的輸入格式。數(shù)據(jù)處理好后,下一步便是進(jìn)行數(shù)據(jù)分析、數(shù)據(jù)挖掘,最后開發(fā)網(wǎng)站平臺(tái)進(jìn)行結(jié)果展示。圖1-2兒童腫瘤多組學(xué)大數(shù)據(jù)分析數(shù)據(jù)庫平臺(tái)的構(gòu)建流程圖在數(shù)據(jù)分析的模塊中,我們做了在腫瘤癌癥研究中常用的數(shù)據(jù)分析,如基因表達(dá)的差異分析、甲基化的差異分析、腫瘤免疫浸潤程度分析、多組學(xué)關(guān)聯(lián)分析、相似基因檢測(cè)以及生存分析等。最終并開發(fā)成Web平臺(tái),Web平臺(tái)的設(shè)計(jì)理念一切從簡(jiǎn),為了讓不會(huì)編程的科研人員也能夠快速的做腫瘤癌癥相關(guān)的交互式數(shù)據(jù)分析,網(wǎng)站上按照分析的功能模塊進(jìn)行劃分。系統(tǒng)的數(shù)據(jù)處理和數(shù)據(jù)展示的架
華東師范大學(xué)碩士學(xué)位論文7構(gòu)如圖1-3,原始數(shù)據(jù)通過數(shù)據(jù)計(jì)算層得到分析結(jié)果存儲(chǔ)在數(shù)據(jù)層中,然后通過邏輯層的操作將分析結(jié)果通過表格以及矢量圖的形式展現(xiàn)在視圖層中。網(wǎng)站中的所有繪圖功能都是使用R腳本開發(fā)的,網(wǎng)站的輸出包括表格和圖表。網(wǎng)站中的靜態(tài)數(shù)據(jù)可視化主要是通過便攜式文檔格式(PDF)進(jìn)行呈現(xiàn)。圖1-3兒童腫瘤多組學(xué)大數(shù)據(jù)分析數(shù)據(jù)庫的架構(gòu)與此同時(shí),本文完成了兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺(tái)的網(wǎng)站開發(fā),開發(fā)了多種交互式的數(shù)據(jù)分析功能,并且提供定制化的繪圖功能。網(wǎng)站主要提供了7個(gè)模塊:基因基本信息查詢模塊,基因表達(dá)差異分析模塊,甲基化差異分析模塊,多組學(xué)關(guān)聯(lián)分析模塊,腫瘤臨床生存分析模塊,相似基因計(jì)算檢測(cè)模塊,腫瘤免疫細(xì)胞浸潤程度分析模塊。兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺(tái)網(wǎng)站免費(fèi)提供給所有用戶,前端是基于HTML5和JavaScript庫(https://jquery.com/)和Bootstrap模板(https://www.bootcss.com/)進(jìn)行開發(fā),數(shù)據(jù)可視化基于ECHARTS庫
本文編號(hào):3550299
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3550299.html
最近更新
教材專著