急性白血病相關(guān)基因的文本挖掘分析
本文關(guān)鍵詞:國際石油價格波動行為機理及預(yù)測模型研究,,由筆耕文化傳播整理發(fā)布。
《中國醫(yī)科大學(xué)》 2006年
急性白血病相關(guān)基因的文本挖掘分析
閆雷
【摘要】:目的 尋找一種通過文本挖掘獲取醫(yī)學(xué)文獻中的有益信息進而用于解釋生物數(shù)據(jù)的方法。本文以急性白血病為例,通過主題詞和自然語言兩種途徑以疾病與基因的共現(xiàn)關(guān)系為基礎(chǔ)進行聚類分析,挖掘基因與疾病之間的關(guān)系,并對兩種途徑的有效性進行評價。 材料與方法 以“l(fā)eukemia[majr] AND genes[majr]”為檢索策略通過PUBMED檢索1966年到2005年9月6日的有關(guān)白血病與基因關(guān)系的相關(guān)文獻,共檢得3529篇。將檢索結(jié)果分別保存為XML格式和Medline格式,作為挖掘樣本。對XML格式的樣本,根據(jù)主題詞的樹狀結(jié)構(gòu)從中篩選急性白血病類和基因類主題詞進行處理,選取出現(xiàn)頻次大于等于3的主要主題詞共75個進行統(tǒng)計,生成詞篇矩陣,對生成的詞篇矩陣采用二值(Binary)資料測量中的hamann變換,使用重心法(centroid clustering)進行聚類。對medline格式樣本采用MMTx進行處理,從處理結(jié)果中提取語義類型為“neoplastic process”出現(xiàn)頻次大于30的前30個腫瘤類概念為列,另取語義類型為“gene or genome”出現(xiàn)頻次大于67的前60個基因類概念為行,計算生成腫瘤類概念與基因類概念的共句矩陣,對生成的矩陣采用計數(shù)資料(counts)測量中的chisquare法,使用最大距離(furthest neighbor)進行聚類。 結(jié)果 從XML格式文件中提取出來的有關(guān)急性白血病類主題詞/副主題詞與基因類主題詞/副主題詞生成的詞篇矩陣中涉及29種具體基因。medline
【關(guān)鍵詞】:
【學(xué)位授予單位】:中國醫(yī)科大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2006
【分類號】:R733.71
【目錄】:
下載全文 更多同類文獻
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【引證文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 李穎;賈二鵬;馬力;;國內(nèi)外共詞分析研究綜述[J];新世紀圖書館;2012年01期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 李穎;國內(nèi)競爭情報研究演進態(tài)勢—共詞分析視角[D];湘潭大學(xué);2010年
2 李博;關(guān)于知識管理研究的知識結(jié)構(gòu)圖譜[D];山西師范大學(xué);2013年
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 梅馨,邢桂芬;文本挖掘技術(shù)綜述[J];江蘇大學(xué)學(xué)報(自然科學(xué)版);2003年05期
2 崔雷;專題文獻高頻主題詞的共詞聚類分析[J];情報理論與實踐;1996年04期
3 崔雷,胡海榮,李紀賓;文獻計量學(xué)共引分析系統(tǒng)設(shè)計與開發(fā)[J];情報學(xué)報;2000年04期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 李楠;楊彬彬;;決策樹ID3分類算法在文本分類中的應(yīng)用研究[J];大連大學(xué)學(xué)報;2009年06期
2 秦長江;侯漢清;;知識圖譜——信息管理與知識管理的新領(lǐng)域[J];大學(xué)圖書館學(xué)報;2009年01期
3 王洋;劉忠;;貝葉斯算法實現(xiàn)文本分類器[J];大眾科技;2011年02期
4 蔡坤;姜保慶;;關(guān)于文本挖掘中文本聚類算法的研究[J];福建電腦;2009年04期
5 文庭孝;劉曉英;羅賢春;張蕊;;知識關(guān)聯(lián)的測度及應(yīng)用研究[J];高校圖書館工作;2010年04期
6 許航;吳堅;;凝血酶及其相關(guān)編碼基因的文本挖掘分析[J];安徽農(nóng)業(yè)科學(xué);2012年31期
7 楊金鳳;馬巧麗;;基于共詞分析的甘肅省種植業(yè)熱點領(lǐng)域分析[J];甘肅農(nóng)業(yè)大學(xué)學(xué)報;2013年04期
8 謝坤武;;文本挖掘中的層次聚類算法[J];湖北民族學(xué)院學(xué)報(自然科學(xué)版);2009年04期
9 張勤;馬費成;;國外知識管理研究范式——以共詞分析為方法[J];管理科學(xué)學(xué)報;2007年06期
10 姜亞莉;關(guān)澤群;;用于Web文檔聚類的基于相似度的軟聚類算法[J];計算機工程;2006年02期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 許振亮;趙宇娜;;國際創(chuàng)業(yè)研究現(xiàn)狀的知識可視化分析——基于共詞分析法的視角[A];2012年全國科學(xué)學(xué)理論與學(xué)科建設(shè)暨科學(xué)技術(shù)學(xué)兩委聯(lián)合年會論文集[C];2012年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 楊瑞龍;基于短語特征的Web文檔聚類方法研究[D];重慶大學(xué);2010年
2 趙慶齡;基于文獻計量的土壤重金屬污染國際比較研究[D];中國農(nóng)業(yè)科學(xué)院;2010年
3 徐建鎖;知識管理和文本挖掘的若干問題研究[D];天津大學(xué);2004年
4 郝占剛;基于遺傳算法等技術(shù)的數(shù)據(jù)與文本聚分類研究[D];天津大學(xué);2006年
5 耿新青;基于模糊邏輯和神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)及文本挖掘的方法研究[D];天津大學(xué);2005年
6 席運江;組織知識的網(wǎng)絡(luò)表示模型及分析方法[D];大連理工大學(xué);2007年
7 康宇航;一種基于共現(xiàn)分析的科技跟蹤方法研究[D];大連理工大學(xué);2008年
8 秦長江;基于科學(xué)計量學(xué)共現(xiàn)分析法的中國農(nóng)史學(xué)科知識圖譜構(gòu)建研究[D];南京農(nóng)業(yè)大學(xué);2009年
9 季托;國際石油價格波動行為機理及預(yù)測模型研究[D];東北石油大學(xué);2011年
10 詹國梁;基于生命周期策略的企業(yè)知識管理[D];武漢大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 李穎;國內(nèi)競爭情報研究演進態(tài)勢—共詞分析視角[D];湘潭大學(xué);2010年
2 劉曉英;知識關(guān)聯(lián)及其應(yīng)用研究[D];湘潭大學(xué);2010年
3 許芳芳;基于DBSCAN優(yōu)化算法的Web文本聚類研究[D];華東師范大學(xué);2011年
4 何曉;模糊聚類算法在漢語文本聚類中的研究[D];天津財經(jīng)大學(xué);2011年
5 馬麗;融入語義相似度的HITS算法研究及實現(xiàn)[D];南京理工大學(xué);2011年
6 任剛;面向?qū)W科相關(guān)性分析的文本關(guān)聯(lián)規(guī)則挖掘技術(shù)研究[D];中南大學(xué);2011年
7 王玲玉;文獻共引分析中的關(guān)聯(lián)強度和相關(guān)系數(shù)改進研究[D];鄭州大學(xué);2011年
8 邵慧琴;1999-2009年我國15種中文核心期刊體育旅游研究文獻計量分析[D];江西師范大學(xué);2011年
9 閆士濤;知識管理學(xué)學(xué)科體系構(gòu)建研究[D];安徽大學(xué);2011年
10 楊麗;基于遺傳算法的文本聚類研究[D];南京航空航天大學(xué);2009年
【同被引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 黃小燕;;情報領(lǐng)域研究熱點透視——情報領(lǐng)域論文關(guān)鍵詞詞頻分析(1999—2003)[J];圖書與情報;2005年06期
2 寶貢敏;徐碧祥;;國外知識共享理論研究述評[J];重慶大學(xué)學(xué)報(社會科學(xué)版);2007年02期
3 劉濤,陳忠,陳曉榮;復(fù)雜網(wǎng)絡(luò)理論及其應(yīng)用研究概述[J];系統(tǒng)工程;2005年06期
4 朱東華,袁軍鵬;基于數(shù)據(jù)挖掘的科技監(jiān)測方法研究[J];管理工程學(xué)報;2004年04期
5 戰(zhàn)培志,廖文和;企業(yè)知識管理中的知識共享建模技術(shù)[J];華南理工大學(xué)學(xué)報(自然科學(xué)版);2005年07期
6 卜心怡;趙靈麗;;知識共享研究方法與進展綜述[J];杭州電子科技大學(xué)學(xué)報;2007年03期
7 楊立英;;基因組學(xué)領(lǐng)域演進的科學(xué)計量研究[J];科學(xué)觀察;2007年01期
8 梁立明,謝彩霞;詞頻分析法用于我國納米科技研究動向分析[J];科學(xué)學(xué)研究;2003年02期
9 朱祖平;芻議知識管理及其體系框架[J];科研管理;2000年01期
10 梁立明,李小寧;SPRU科研選題的詞頻分析與計量研究[J];科研管理;2003年03期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉寧;知識管理與技術(shù)創(chuàng)新的相關(guān)性研究[D];哈爾濱理工大學(xué);2011年
2 肖景;論社會組織的知識管理[D];華中師范大學(xué);2006年
3 李珈;企業(yè)知識共享中個體主體主觀障礙及對策研究[D];重慶大學(xué);2006年
4 宋爽;共現(xiàn)分析在文本知識挖掘中的應(yīng)用研究[D];南京理工大學(xué);2006年
5 郝麗云;非相關(guān)文獻知識發(fā)現(xiàn)的醫(yī)學(xué)研究與實踐[D];中國人民解放軍軍事醫(yī)學(xué)科學(xué)院;2007年
6 陳穎;基于摘要信息的中文信息檢索可視化系統(tǒng)研究與實現(xiàn)[D];黑龍江大學(xué);2007年
7 張浩;MEDLINE數(shù)據(jù)庫中生物體類主題詞相關(guān)語義關(guān)系的構(gòu)建與評價[D];中國醫(yī)科大學(xué);2008年
8 唐一冰;知識要素對都市圈競爭力提升的作用研究[D];上海交通大學(xué);2009年
9 宋志航;技術(shù)創(chuàng)新能力對產(chǎn)業(yè)國際競爭力的影響研究[D];中南大學(xué);2008年
10 謝衛(wèi)軍;文化產(chǎn)業(yè)集群內(nèi)組織間知識共享與產(chǎn)業(yè)集聚研究[D];陜西師范大學(xué);2010年
【二級引證文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 唐曉波;肖璐;;融合關(guān)鍵詞增補與領(lǐng)域本體的共詞分析方法研究[J];現(xiàn)代圖書情報技術(shù);2013年11期
2 俞仙子;高英蓮;馬春霞;劉金星;;提取核心特征詞的懲罰性矩陣分解方法——以共詞分析為例[J];現(xiàn)代圖書情報技術(shù);2014年03期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 郝心寧;生物育種領(lǐng)域知識結(jié)構(gòu)與知識演化研究[D];中國農(nóng)業(yè)科學(xué)院;2013年
2 張素芳;網(wǎng)絡(luò)社區(qū)學(xué)術(shù)資源關(guān)聯(lián)研究[D];南開大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 李坤侖;多維網(wǎng)絡(luò)視角下研究領(lǐng)域可視化分析[D];西南大學(xué);2012年
2 楊愛青;我國圖書情報學(xué)科研究態(tài)勢的可視化研究[D];曲阜師范大學(xué);2012年
3 劉濤;關(guān)于我國圖書館學(xué)研究熱點分析[D];東北師范大學(xué);2012年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前7條
1 王繼成,潘金貴,張福炎;Web文本挖掘技術(shù)研究[J];計算機研究與發(fā)展;2000年05期
2 邢桂芬;ERP與CRM一體化結(jié)構(gòu)中數(shù)據(jù)實時通訊的研究[J];江蘇大學(xué)學(xué)報(自然科學(xué)版);2002年06期
3 何佳訊;;中國引文分析的實踐歷史:1980—1990——基于論文結(jié)構(gòu)的分析[J];情報學(xué)刊;1993年03期
4 崔雷;專題文獻高被引論文的連續(xù)同被引聚類分析[J];情報理論與實踐;1996年01期
5 崔雷;專題文獻高被引論文的時間分布與同被引聚類分析[J];情報學(xué)報;1995年01期
6 崔雷;當(dāng)年高被引論文的主題詞鏈聚類分析及其在情報預(yù)測中的應(yīng)用[J];情報學(xué)報;1995年05期
7 宋擒豹,沈鈞毅;基于關(guān)聯(lián)規(guī)則的Web文檔聚類算法[J];軟件學(xué)報;2002年03期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 張新華;白血病相關(guān)基因研究現(xiàn)狀[J];醫(yī)學(xué)綜述;1998年10期
2 于文強;早幼粒細胞白血病相關(guān)基因研究進展[J];白血病.淋巴瘤;1998年03期
3 韓為東,于力,樓方定,王全順,趙瑜,史子江,靳海杰;RACE技術(shù)在釣取白血病相關(guān)基因LRP16全長cDNA中的應(yīng)用[J];中國實驗血液學(xué)雜志;2001年01期
4 于文強;早幼粒細胞白血病相關(guān)基因與維甲酸治療[J];腫瘤防治研究;1998年03期
5 于力,韓為東,樓方定,王全順,趙瑜,MichaelACaligiuri;新的白血病相關(guān)基因LRP16的克隆[J];軍醫(yī)進修學(xué)院學(xué)報;2000年02期
6 韓為東,于力,樓方定,王全順,趙瑜,史子江,焦宏遠,周建軍;一個新的白血病相關(guān)基因LRP16全長cDNA的克隆、序列分析及表達特征[J];中國生物化學(xué)與分子生物學(xué)報;2001年02期
7 徐周敏,樓方定,于力,盧學(xué)春,楊龍,呂鳴,呂有靈,陳堅,章菲菲;新的白血病相關(guān)基因LRP15真核表達載體構(gòu)建及在K562細胞中的表達[J];武警醫(yī)學(xué);2003年11期
8 陳賽娟,朱勇梅;白血病的基因研究對提高臨床診治水平的作用[J];診斷學(xué)理論與實踐;2003年03期
9 方福德;《基因組科學(xué)與人類疾病》一書下半年出版[J];中國醫(yī)學(xué)科學(xué)院學(xué)報;2000年04期
10 王克來;中國人類基因組研究走向“主戰(zhàn)場”[J];生物技術(shù)通報;2002年01期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 蔡輝國;于珍;姜學(xué)英;徐晶;張麗艷;;利用改良的SSH方法篩選致白血病相關(guān)基因[A];中國生物化學(xué)與分子生物學(xué)會第八屆會員代表大會暨全國學(xué)術(shù)會議論文摘要集[C];2001年
中國重要報紙全文數(shù)據(jù)庫 前4條
1 本報記者 王代同;[N];科技日報;2001年
2 記者 汪敏華;[N];解放日報;2000年
3 本報記者 李恩青;[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報;2001年
4 陶春祥;[N];中國醫(yī)藥報;2002年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 韓為東;一個新的白血病相關(guān)基因—LRP16的克隆、序列分析、表達特征及其生物學(xué)功能推測[D];軍醫(yī)進修學(xué)院;2001年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 李焱;利用寡核苷酸芯片檢測部分白血病相關(guān)基因改變[D];第三軍醫(yī)大學(xué);2003年
2 徐周敏;新的白血病相關(guān)基因LRP15的克隆及其功能的初步研究[D];中國人民解放軍軍醫(yī)進修學(xué)院;2003年
3 孫薏;利用寡聚核苷酸芯片進行急性白血病疾病基因組檢測及基因分型的初步研究[D];中國人民解放軍軍事醫(yī)學(xué)科學(xué)院;2003年
本文關(guān)鍵詞:國際石油價格波動行為機理及預(yù)測模型研究,由筆耕文化傳播整理發(fā)布。
本文編號:77259
本文鏈接:http://sikaile.net/kejilunwen/shiyounenyuanlunwen/77259.html