醫(yī)學(xué)文獻相似性研究
發(fā)布時間:2021-10-24 07:34
科學(xué)技術(shù)突飛猛進的發(fā)展使得科學(xué)領(lǐng)域的每一項技術(shù)都有日新月異的變化。隨之產(chǎn)生的則是海量的數(shù)據(jù)信息,而計算機技術(shù)的發(fā)展為其創(chuàng)造了新的存儲方式一數(shù)據(jù)庫。而不同的時代會有不同的結(jié)構(gòu)的數(shù)據(jù),如何把這些異構(gòu)數(shù)據(jù)統(tǒng)一成一個易查詢的數(shù)據(jù)庫,已經(jīng)越來越成為人們關(guān)注的焦點。國內(nèi)外相繼涌現(xiàn)出了大量的文獻數(shù)據(jù)庫,如:MEDLINE、中文科技期刊數(shù)據(jù)庫、中國期刊網(wǎng)等,充分顯示出人們對信息檢索問題的重視。雖然數(shù)據(jù)庫資源異常豐富,檢索文獻的手段多種多樣,但是檢索結(jié)果的正確性和準確性卻往往因檢索出很多無關(guān)的文獻而不盡如人意。因而,提高檢索效率、正確性及相關(guān)性已經(jīng)成為檢索領(lǐng)域迫切需要解決的問題。本文針對上述兩個問題,以各種形式的醫(yī)學(xué)文檔信息數(shù)據(jù)為基礎(chǔ),設(shè)計出一個基于關(guān)系數(shù)據(jù)庫模型的異構(gòu)數(shù)據(jù)存儲方案,該方案統(tǒng)一了異構(gòu)數(shù)據(jù);并在此數(shù)據(jù)庫基礎(chǔ)上,利用后綴樹向量空間模型(VSM),為每篇文獻建立相應(yīng)的基于內(nèi)容的向量模型,通過計算夾角的余弦值得出文獻之間的相似度,最終構(gòu)建一個醫(yī)學(xué)文獻相關(guān)性數(shù)據(jù)庫。接著,以醫(yī)學(xué)文獻的相似性研究為出發(fā)點,從搜集數(shù)據(jù)、整理數(shù)據(jù)、處理數(shù)據(jù)直到為用戶提供檢索接口,最終構(gòu)建了一個“醫(yī)學(xué)文獻信息檢索系統(tǒng)”。本...
【文章來源】:首都師范大學(xué)北京市
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
系統(tǒng)設(shè)計過程
圖2一2系統(tǒng)主要流程2.IJ系統(tǒng)流程如圖2一2所示,系統(tǒng)分為兩個部分:(1)數(shù)據(jù)處理部分,(2)系統(tǒng)功能部分。其中數(shù)據(jù)處理部分又可以分為兩個部分:(1)數(shù)據(jù)的導(dǎo)入;(2)相關(guān)性計算。系統(tǒng)功能部分在下2.2節(jié)中介紹,有關(guān)相關(guān)性的具體計算將在第四章中介紹。數(shù)據(jù)處理部分:如圖2一3所示,異構(gòu)數(shù)據(jù)分為三個部分,第一部分是中英文XML文獻,第二部分是中英文DBF文獻,第三部分是EXCEL文檔,最終將三者統(tǒng)一導(dǎo)入到 MssQLservcr數(shù)據(jù)庫HcaithyGuide中。其中
紹系統(tǒng)的主要功能及其子功能。2.2.1導(dǎo)入異構(gòu)數(shù)據(jù)如圖2一4所示,數(shù)據(jù)導(dǎo)入部分,可以導(dǎo)入XML,中英文DBF數(shù)據(jù)庫,Exeel數(shù)據(jù)表等。導(dǎo)入的過程中如果發(fā)現(xiàn)數(shù)據(jù)有異常,可以及時清理數(shù)據(jù)。
【參考文獻】:
期刊論文
[1]向量空間模型在醫(yī)學(xué)文獻相關(guān)性研究中的應(yīng)用[J]. 邱宇紅,郭繼軍. 現(xiàn)代圖書情報技術(shù). 2007(07)
[2]基于后綴樹的骨干網(wǎng)絡(luò)垃圾郵件檢測方法[J]. 鄭耀東,譚建龍,郭莉. 計算機工程與應(yīng)用. 2006(28)
[3]向量空間模型信息檢索技術(shù)討論[J]. 劉斌,陳樺. 情報雜志. 2006(07)
[4]基于后綴樹模型的文本實時分類系統(tǒng)的研究和實現(xiàn)[J]. 郭莉,張吉,譚建龍. 中文信息學(xué)報. 2005(05)
[5]基于向量空間模型的信息檢索系統(tǒng)的設(shè)計[J]. 包金龍. 情報雜志. 2005(07)
[6]基于N元漢字串模型的文本表示和實時分類的研究與實現(xiàn)[J]. 王映,常毅,譚建龍,白碩. 計算機工程與應(yīng)用. 2005(05)
[7]基于規(guī)則的自動分類在文本分類中的應(yīng)用[J]. 李渝勤,孫麗華. 中文信息學(xué)報. 2004(04)
[8]基于向量空間模型的文本自動分類系統(tǒng)的研究與實現(xiàn)[J]. 龐劍鋒,卜東波,白碩. 計算機應(yīng)用研究. 2001(09)
[9]獨立于語種的文本分類方法[J]. 黃萱菁,吳立德,石崎洋之,徐國偉. 中文信息學(xué)報. 2000(06)
[10]文檔中詞語權(quán)重計算方法的改進[J]. 魯松,李曉黎,白碩,王實. 中文信息學(xué)報. 2000(06)
碩士論文
[1]基于Agent專業(yè)搜索引擎的研究[D]. 鄒慶欣.大連海事大學(xué) 2008
[2]專業(yè)搜索引擎的數(shù)據(jù)存儲研究[D]. 陳小峰.南京師范大學(xué) 2007
[3]中國生物醫(yī)學(xué)工程文獻相關(guān)性數(shù)據(jù)庫建設(shè)研究[D]. 萬莉莉.中國協(xié)和醫(yī)科大學(xué) 2007
[4]搜索引擎中的數(shù)據(jù)存儲問題研究[D]. 何華.浙江大學(xué) 2005
本文編號:3454863
【文章來源】:首都師范大學(xué)北京市
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
系統(tǒng)設(shè)計過程
圖2一2系統(tǒng)主要流程2.IJ系統(tǒng)流程如圖2一2所示,系統(tǒng)分為兩個部分:(1)數(shù)據(jù)處理部分,(2)系統(tǒng)功能部分。其中數(shù)據(jù)處理部分又可以分為兩個部分:(1)數(shù)據(jù)的導(dǎo)入;(2)相關(guān)性計算。系統(tǒng)功能部分在下2.2節(jié)中介紹,有關(guān)相關(guān)性的具體計算將在第四章中介紹。數(shù)據(jù)處理部分:如圖2一3所示,異構(gòu)數(shù)據(jù)分為三個部分,第一部分是中英文XML文獻,第二部分是中英文DBF文獻,第三部分是EXCEL文檔,最終將三者統(tǒng)一導(dǎo)入到 MssQLservcr數(shù)據(jù)庫HcaithyGuide中。其中
紹系統(tǒng)的主要功能及其子功能。2.2.1導(dǎo)入異構(gòu)數(shù)據(jù)如圖2一4所示,數(shù)據(jù)導(dǎo)入部分,可以導(dǎo)入XML,中英文DBF數(shù)據(jù)庫,Exeel數(shù)據(jù)表等。導(dǎo)入的過程中如果發(fā)現(xiàn)數(shù)據(jù)有異常,可以及時清理數(shù)據(jù)。
【參考文獻】:
期刊論文
[1]向量空間模型在醫(yī)學(xué)文獻相關(guān)性研究中的應(yīng)用[J]. 邱宇紅,郭繼軍. 現(xiàn)代圖書情報技術(shù). 2007(07)
[2]基于后綴樹的骨干網(wǎng)絡(luò)垃圾郵件檢測方法[J]. 鄭耀東,譚建龍,郭莉. 計算機工程與應(yīng)用. 2006(28)
[3]向量空間模型信息檢索技術(shù)討論[J]. 劉斌,陳樺. 情報雜志. 2006(07)
[4]基于后綴樹模型的文本實時分類系統(tǒng)的研究和實現(xiàn)[J]. 郭莉,張吉,譚建龍. 中文信息學(xué)報. 2005(05)
[5]基于向量空間模型的信息檢索系統(tǒng)的設(shè)計[J]. 包金龍. 情報雜志. 2005(07)
[6]基于N元漢字串模型的文本表示和實時分類的研究與實現(xiàn)[J]. 王映,常毅,譚建龍,白碩. 計算機工程與應(yīng)用. 2005(05)
[7]基于規(guī)則的自動分類在文本分類中的應(yīng)用[J]. 李渝勤,孫麗華. 中文信息學(xué)報. 2004(04)
[8]基于向量空間模型的文本自動分類系統(tǒng)的研究與實現(xiàn)[J]. 龐劍鋒,卜東波,白碩. 計算機應(yīng)用研究. 2001(09)
[9]獨立于語種的文本分類方法[J]. 黃萱菁,吳立德,石崎洋之,徐國偉. 中文信息學(xué)報. 2000(06)
[10]文檔中詞語權(quán)重計算方法的改進[J]. 魯松,李曉黎,白碩,王實. 中文信息學(xué)報. 2000(06)
碩士論文
[1]基于Agent專業(yè)搜索引擎的研究[D]. 鄒慶欣.大連海事大學(xué) 2008
[2]專業(yè)搜索引擎的數(shù)據(jù)存儲研究[D]. 陳小峰.南京師范大學(xué) 2007
[3]中國生物醫(yī)學(xué)工程文獻相關(guān)性數(shù)據(jù)庫建設(shè)研究[D]. 萬莉莉.中國協(xié)和醫(yī)科大學(xué) 2007
[4]搜索引擎中的數(shù)據(jù)存儲問題研究[D]. 何華.浙江大學(xué) 2005
本文編號:3454863
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/3454863.html
最近更新
教材專著