基于推薦算法的lncRNA與蛋白質(zhì)相互作用預(yù)測(cè)研究
發(fā)布時(shí)間:2021-08-02 12:18
lncRNA(長(zhǎng)非編碼RNA)是一類長(zhǎng)度超過200個(gè)核苷酸的非編碼RNA,近年來受到科學(xué)研究的熱切關(guān)注。越來越多的研究表明,lncRNA與基因表達(dá)水平的調(diào)節(jié)有關(guān),如表觀遺傳、轉(zhuǎn)錄調(diào)控和轉(zhuǎn)錄后調(diào)控等,然而只有少數(shù)的lncRNA功能和機(jī)制被闡明。lncRNA通過與蛋白質(zhì)相互作用,在各種生物過程中發(fā)揮著廣泛而重要的作用。因此,lncRNA與蛋白質(zhì)互作關(guān)系的預(yù)測(cè)和鑒定可以進(jìn)一步揭示lncRNA相關(guān)的功能,并且有利于在分子水平上研究復(fù)雜疾病的發(fā)病機(jī)制。傳統(tǒng)的生物實(shí)驗(yàn)方法能夠準(zhǔn)確鑒定lncRNA與蛋白質(zhì)的互作關(guān)系,但這類方法難度大且費(fèi)時(shí)費(fèi)力。近年來,越來越多計(jì)算機(jī)領(lǐng)域的研究學(xué)者密切關(guān)注著生物信息學(xué)相關(guān)的前沿交叉學(xué)科的發(fā)展,并致力于將機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)習(xí)應(yīng)用到生物數(shù)據(jù)挖掘的研究中。因此,一些計(jì)算模型被提出來預(yù)測(cè)lncRNA與蛋白質(zhì)的互作關(guān)系。利用已有的相關(guān)數(shù)據(jù)來預(yù)測(cè)潛在的lncRNA與蛋白質(zhì)互作關(guān)系,可以為未來進(jìn)一步研究lncRNA提供有益的幫助。在前人相關(guān)工作的基礎(chǔ)上,本文提出基于改進(jìn)的二分網(wǎng)絡(luò)推薦算法的lncRNA與蛋白質(zhì)相互作用預(yù)測(cè)模型LPI-IBNRA。首先,收集并整理lncRNA和蛋白質(zhì)的生...
【文章來源】:廣東工業(yè)大學(xué)廣東省
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
二分網(wǎng)絡(luò)示意圖
廣東工業(yè)大學(xué)碩士學(xué)位論文10123,,,,nO=oooo表示產(chǎn)品。E表示邊的集合。同類節(jié)點(diǎn)之間不存在邊,兩類節(jié)點(diǎn)之間有連邊代表用戶選擇過產(chǎn)品。用戶-產(chǎn)品網(wǎng)絡(luò)可以用矩陣ijmnAa=表示。如果用戶iu選擇過產(chǎn)品jo,那么用戶iu與產(chǎn)品jo之間連接一條邊,1ija=,未選擇過則0ija=。當(dāng)用戶選擇過某產(chǎn)品,可以假設(shè)用戶喜歡該產(chǎn)品。()iku表示用戶iu的度,即用戶iu選擇過的產(chǎn)品數(shù)量。()jko表示產(chǎn)品jo的度,即選擇過產(chǎn)品jo的用戶數(shù)量。推薦算法的目標(biāo)是預(yù)測(cè)用戶對(duì)所有未選擇過的產(chǎn)品的喜好程度,根據(jù)喜好程度對(duì)產(chǎn)品打分并排序,把排名靠前的產(chǎn)品推薦給用戶。假設(shè)曾經(jīng)被用戶iu選擇過的產(chǎn)品,都擁有某種將其它產(chǎn)品推薦給用戶iu的能力,這種能力可以抽象為可量化的資源值,那么,理論上擁有資源值的產(chǎn)品會(huì)傾向于將更多的資源值傳遞給用戶iu可能感興趣的產(chǎn)品。對(duì)于由m個(gè)用戶和n個(gè)產(chǎn)品構(gòu)成的二分網(wǎng)絡(luò),產(chǎn)品單頂點(diǎn)網(wǎng)絡(luò)中的邊的權(quán)重ijw,表示產(chǎn)品io愿意傳遞給產(chǎn)品jo的資源值。圖2-2物質(zhì)擴(kuò)散推薦算法過程Fig.2-2TheProcessofProbabilisticSpreadingRecommenderAlgorithm物理學(xué)中的物質(zhì)擴(kuò)散是指物質(zhì)分子從濃度較高的區(qū)域向濃度較低的區(qū)域轉(zhuǎn)移的現(xiàn)象,物質(zhì)擴(kuò)散推薦算法(probabilisticspreadingalgorithm,ProbS)將該物理現(xiàn)象應(yīng)用于推薦過程中,在二分網(wǎng)絡(luò)不同類型的節(jié)點(diǎn)之間轉(zhuǎn)移資源值來模擬物質(zhì)擴(kuò)散的過程。假設(shè)二分網(wǎng)絡(luò)是無權(quán)二分圖,那么任意用戶節(jié)點(diǎn)的資源值能夠均勻地?cái)U(kuò)散到與其鄰接的產(chǎn)品節(jié)點(diǎn)上,同理,任意產(chǎn)品節(jié)點(diǎn)的資源值也能夠均勻地?cái)U(kuò)散到與其鄰接的用戶節(jié)點(diǎn)上。物質(zhì)擴(kuò)散推薦算法的推薦過程實(shí)際上是在二分網(wǎng)絡(luò)上進(jìn)行資源分配的過程,如圖2-2所示。資源分配過程分為三個(gè)步驟:初始資源配置、第一次資源轉(zhuǎn)移和第二次資源轉(zhuǎn)移。
廣東工業(yè)大學(xué)碩士學(xué)位論文122.3.2熱傳導(dǎo)推薦算法熱傳導(dǎo)推薦算法(heatspreadingalgorithm,HeatS)是將物理學(xué)中的熱量傳導(dǎo)原理應(yīng)用在推薦過程中。在物理學(xué)中,熱平衡方程原理如下公式:()()2kTr=rJ(2.6)其中k表示導(dǎo)熱,()2rT表示溫度梯度,J(r)?表示局部熱量。將熱傳導(dǎo)的思想應(yīng)用于推薦過程中,計(jì)算公式為:0Hs=Ws(2.7)其中WH表示傳遞矩陣,矩陣中的元素ijw表示從產(chǎn)品io傳導(dǎo)給產(chǎn)品jo的資源。0s表示初始資源,相當(dāng)于公式(2.6)中的()2kTr鄧,s表示熱傳導(dǎo)完成后的資源,相當(dāng)于公式(2.6)中的J(r)?。公式(2.7)是將熱傳導(dǎo)方程進(jìn)行離散化。圖2-3熱傳導(dǎo)推薦算法過程Fig.2-3TheProcessofHeatSpreadingRecommenderAlgorithm使用物理學(xué)熱傳導(dǎo)原理的推薦算法是基于矩陣運(yùn)算的,算法的時(shí)間復(fù)雜度和空間復(fù)度都很高,無法應(yīng)用于大規(guī)模的數(shù)據(jù)算理和運(yùn)算中。Zhou等人將二分網(wǎng)絡(luò)和熱傳導(dǎo)的思想進(jìn)行結(jié)合,提出了更加形象的熱傳導(dǎo)推薦算法[40]。該算法計(jì)算簡(jiǎn)單,預(yù)測(cè)多樣性較好,且能應(yīng)用到大規(guī)模的數(shù)據(jù)預(yù)測(cè)中。一個(gè)任意的二分網(wǎng)絡(luò)G(U,O,E),其中123,,,,mU=uuuu表示m個(gè)用戶節(jié)點(diǎn)的集合,123,,,,nO=oooo表示n個(gè)產(chǎn)品節(jié)點(diǎn)集合,E表示兩種不同類型節(jié)點(diǎn)之前邊的集合。用戶-產(chǎn)品網(wǎng)絡(luò)可以用矩陣ijmnAa=表示。如果用戶iu選擇過產(chǎn)品jo,那么用戶iu與產(chǎn)品jo之間連接一條邊,1ija=,反之則0ija=。當(dāng)用戶選擇過某產(chǎn)品,
【參考文獻(xiàn)】:
期刊論文
[1]長(zhǎng)鏈非編碼RNA生物學(xué)特性和功能研究進(jìn)展[J]. 計(jì)紅,李悅,牛春陽,詹雪龍,郭景茹,甄莉,楊煥民,李士澤. 黑龍江八一農(nóng)墾大學(xué)學(xué)報(bào). 2019(02)
[2]長(zhǎng)鏈非編碼RNA與腫瘤代謝的研究進(jìn)展[J]. 姚志峰,張譯文,姚建新,陳錦飛. 中國(guó)腫瘤. 2019(04)
[3]lncRNA生物學(xué)功能研究進(jìn)展[J]. 牛春陽,薛琳琳,計(jì)紅,李士澤. 中國(guó)生物制品學(xué)雜志. 2019(02)
[4]長(zhǎng)鏈非編碼RNA的異常表達(dá)在腫瘤中的作用[J]. 楊培培,宇龍,孔旭,楊文奇. 安徽醫(yī)學(xué). 2018(11)
[5]基于二分網(wǎng)絡(luò)社團(tuán)劃分的推薦算法[J]. 陳東明,嚴(yán)燕斌,黃新宇,王冬琦. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(08)
[6]推薦系統(tǒng)算法在生物信息學(xué)中應(yīng)用的研究進(jìn)展[J]. 趙琪,于海帆,胡桓,張力,劉宏生. 遼寧大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(04)
[7]長(zhǎng)鏈非編碼RNA-蛋白質(zhì)相互作用在腫瘤研究中的新進(jìn)展[J]. 李夢(mèng)軒,薛逸荃,曹雪濤. 中國(guó)腫瘤生物治療雜志. 2017(04)
[8]生物信息學(xué)在長(zhǎng)非編碼RNA研究中的應(yīng)用[J]. 李俊豪,楊建華,屈良鵠. 生理科學(xué)進(jìn)展. 2016(03)
[9]非編碼RNA對(duì)基因轉(zhuǎn)錄的調(diào)控[J]. 劉旭,單革. 生命科學(xué). 2016(05)
[10]A Bipartite Network-based Method for Prediction of Long Non-coding RNA–protein Interactions[J]. Mengqu Ge,Ao Li,Minghui Wang. Genomics,Proteomics & Bioinformatics. 2016(01)
博士論文
[1]基于相似性網(wǎng)絡(luò)的疾病miRNAs預(yù)測(cè)方法研究及應(yīng)用[D]. 李小英.湖南大學(xué) 2018
碩士論文
[1]基于矩陣分解算法的長(zhǎng)非編碼RNA-蛋白質(zhì)相互作用預(yù)測(cè)研究[D]. 張?zhí)硪?中國(guó)科學(xué)技術(shù)大學(xué) 2018
[2]基于物質(zhì)擴(kuò)散的個(gè)性化推薦算法研究[D]. 陳桂林.北京郵電大學(xué) 2018
[3]網(wǎng)絡(luò)結(jié)構(gòu)對(duì)推薦算法影響的研究[D]. 李健.電子科技大學(xué) 2017
[4]推薦網(wǎng)絡(luò)分析及個(gè)性化推薦算法研究[D]. 關(guān)遠(yuǎn).電子科技大學(xué) 2014
[5]基于二分網(wǎng)絡(luò)的個(gè)性化推薦系統(tǒng)研究[D]. 韓騰躍.南昌航空大學(xué) 2013
本文編號(hào):3317552
【文章來源】:廣東工業(yè)大學(xué)廣東省
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
二分網(wǎng)絡(luò)示意圖
廣東工業(yè)大學(xué)碩士學(xué)位論文10123,,,,nO=oooo表示產(chǎn)品。E表示邊的集合。同類節(jié)點(diǎn)之間不存在邊,兩類節(jié)點(diǎn)之間有連邊代表用戶選擇過產(chǎn)品。用戶-產(chǎn)品網(wǎng)絡(luò)可以用矩陣ijmnAa=表示。如果用戶iu選擇過產(chǎn)品jo,那么用戶iu與產(chǎn)品jo之間連接一條邊,1ija=,未選擇過則0ija=。當(dāng)用戶選擇過某產(chǎn)品,可以假設(shè)用戶喜歡該產(chǎn)品。()iku表示用戶iu的度,即用戶iu選擇過的產(chǎn)品數(shù)量。()jko表示產(chǎn)品jo的度,即選擇過產(chǎn)品jo的用戶數(shù)量。推薦算法的目標(biāo)是預(yù)測(cè)用戶對(duì)所有未選擇過的產(chǎn)品的喜好程度,根據(jù)喜好程度對(duì)產(chǎn)品打分并排序,把排名靠前的產(chǎn)品推薦給用戶。假設(shè)曾經(jīng)被用戶iu選擇過的產(chǎn)品,都擁有某種將其它產(chǎn)品推薦給用戶iu的能力,這種能力可以抽象為可量化的資源值,那么,理論上擁有資源值的產(chǎn)品會(huì)傾向于將更多的資源值傳遞給用戶iu可能感興趣的產(chǎn)品。對(duì)于由m個(gè)用戶和n個(gè)產(chǎn)品構(gòu)成的二分網(wǎng)絡(luò),產(chǎn)品單頂點(diǎn)網(wǎng)絡(luò)中的邊的權(quán)重ijw,表示產(chǎn)品io愿意傳遞給產(chǎn)品jo的資源值。圖2-2物質(zhì)擴(kuò)散推薦算法過程Fig.2-2TheProcessofProbabilisticSpreadingRecommenderAlgorithm物理學(xué)中的物質(zhì)擴(kuò)散是指物質(zhì)分子從濃度較高的區(qū)域向濃度較低的區(qū)域轉(zhuǎn)移的現(xiàn)象,物質(zhì)擴(kuò)散推薦算法(probabilisticspreadingalgorithm,ProbS)將該物理現(xiàn)象應(yīng)用于推薦過程中,在二分網(wǎng)絡(luò)不同類型的節(jié)點(diǎn)之間轉(zhuǎn)移資源值來模擬物質(zhì)擴(kuò)散的過程。假設(shè)二分網(wǎng)絡(luò)是無權(quán)二分圖,那么任意用戶節(jié)點(diǎn)的資源值能夠均勻地?cái)U(kuò)散到與其鄰接的產(chǎn)品節(jié)點(diǎn)上,同理,任意產(chǎn)品節(jié)點(diǎn)的資源值也能夠均勻地?cái)U(kuò)散到與其鄰接的用戶節(jié)點(diǎn)上。物質(zhì)擴(kuò)散推薦算法的推薦過程實(shí)際上是在二分網(wǎng)絡(luò)上進(jìn)行資源分配的過程,如圖2-2所示。資源分配過程分為三個(gè)步驟:初始資源配置、第一次資源轉(zhuǎn)移和第二次資源轉(zhuǎn)移。
廣東工業(yè)大學(xué)碩士學(xué)位論文122.3.2熱傳導(dǎo)推薦算法熱傳導(dǎo)推薦算法(heatspreadingalgorithm,HeatS)是將物理學(xué)中的熱量傳導(dǎo)原理應(yīng)用在推薦過程中。在物理學(xué)中,熱平衡方程原理如下公式:()()2kTr=rJ(2.6)其中k表示導(dǎo)熱,()2rT表示溫度梯度,J(r)?表示局部熱量。將熱傳導(dǎo)的思想應(yīng)用于推薦過程中,計(jì)算公式為:0Hs=Ws(2.7)其中WH表示傳遞矩陣,矩陣中的元素ijw表示從產(chǎn)品io傳導(dǎo)給產(chǎn)品jo的資源。0s表示初始資源,相當(dāng)于公式(2.6)中的()2kTr鄧,s表示熱傳導(dǎo)完成后的資源,相當(dāng)于公式(2.6)中的J(r)?。公式(2.7)是將熱傳導(dǎo)方程進(jìn)行離散化。圖2-3熱傳導(dǎo)推薦算法過程Fig.2-3TheProcessofHeatSpreadingRecommenderAlgorithm使用物理學(xué)熱傳導(dǎo)原理的推薦算法是基于矩陣運(yùn)算的,算法的時(shí)間復(fù)雜度和空間復(fù)度都很高,無法應(yīng)用于大規(guī)模的數(shù)據(jù)算理和運(yùn)算中。Zhou等人將二分網(wǎng)絡(luò)和熱傳導(dǎo)的思想進(jìn)行結(jié)合,提出了更加形象的熱傳導(dǎo)推薦算法[40]。該算法計(jì)算簡(jiǎn)單,預(yù)測(cè)多樣性較好,且能應(yīng)用到大規(guī)模的數(shù)據(jù)預(yù)測(cè)中。一個(gè)任意的二分網(wǎng)絡(luò)G(U,O,E),其中123,,,,mU=uuuu表示m個(gè)用戶節(jié)點(diǎn)的集合,123,,,,nO=oooo表示n個(gè)產(chǎn)品節(jié)點(diǎn)集合,E表示兩種不同類型節(jié)點(diǎn)之前邊的集合。用戶-產(chǎn)品網(wǎng)絡(luò)可以用矩陣ijmnAa=表示。如果用戶iu選擇過產(chǎn)品jo,那么用戶iu與產(chǎn)品jo之間連接一條邊,1ija=,反之則0ija=。當(dāng)用戶選擇過某產(chǎn)品,
【參考文獻(xiàn)】:
期刊論文
[1]長(zhǎng)鏈非編碼RNA生物學(xué)特性和功能研究進(jìn)展[J]. 計(jì)紅,李悅,牛春陽,詹雪龍,郭景茹,甄莉,楊煥民,李士澤. 黑龍江八一農(nóng)墾大學(xué)學(xué)報(bào). 2019(02)
[2]長(zhǎng)鏈非編碼RNA與腫瘤代謝的研究進(jìn)展[J]. 姚志峰,張譯文,姚建新,陳錦飛. 中國(guó)腫瘤. 2019(04)
[3]lncRNA生物學(xué)功能研究進(jìn)展[J]. 牛春陽,薛琳琳,計(jì)紅,李士澤. 中國(guó)生物制品學(xué)雜志. 2019(02)
[4]長(zhǎng)鏈非編碼RNA的異常表達(dá)在腫瘤中的作用[J]. 楊培培,宇龍,孔旭,楊文奇. 安徽醫(yī)學(xué). 2018(11)
[5]基于二分網(wǎng)絡(luò)社團(tuán)劃分的推薦算法[J]. 陳東明,嚴(yán)燕斌,黃新宇,王冬琦. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(08)
[6]推薦系統(tǒng)算法在生物信息學(xué)中應(yīng)用的研究進(jìn)展[J]. 趙琪,于海帆,胡桓,張力,劉宏生. 遼寧大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(04)
[7]長(zhǎng)鏈非編碼RNA-蛋白質(zhì)相互作用在腫瘤研究中的新進(jìn)展[J]. 李夢(mèng)軒,薛逸荃,曹雪濤. 中國(guó)腫瘤生物治療雜志. 2017(04)
[8]生物信息學(xué)在長(zhǎng)非編碼RNA研究中的應(yīng)用[J]. 李俊豪,楊建華,屈良鵠. 生理科學(xué)進(jìn)展. 2016(03)
[9]非編碼RNA對(duì)基因轉(zhuǎn)錄的調(diào)控[J]. 劉旭,單革. 生命科學(xué). 2016(05)
[10]A Bipartite Network-based Method for Prediction of Long Non-coding RNA–protein Interactions[J]. Mengqu Ge,Ao Li,Minghui Wang. Genomics,Proteomics & Bioinformatics. 2016(01)
博士論文
[1]基于相似性網(wǎng)絡(luò)的疾病miRNAs預(yù)測(cè)方法研究及應(yīng)用[D]. 李小英.湖南大學(xué) 2018
碩士論文
[1]基于矩陣分解算法的長(zhǎng)非編碼RNA-蛋白質(zhì)相互作用預(yù)測(cè)研究[D]. 張?zhí)硪?中國(guó)科學(xué)技術(shù)大學(xué) 2018
[2]基于物質(zhì)擴(kuò)散的個(gè)性化推薦算法研究[D]. 陳桂林.北京郵電大學(xué) 2018
[3]網(wǎng)絡(luò)結(jié)構(gòu)對(duì)推薦算法影響的研究[D]. 李健.電子科技大學(xué) 2017
[4]推薦網(wǎng)絡(luò)分析及個(gè)性化推薦算法研究[D]. 關(guān)遠(yuǎn).電子科技大學(xué) 2014
[5]基于二分網(wǎng)絡(luò)的個(gè)性化推薦系統(tǒng)研究[D]. 韓騰躍.南昌航空大學(xué) 2013
本文編號(hào):3317552
本文鏈接:http://sikaile.net/projectlw/swxlw/3317552.html
最近更新
教材專著