天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

阿爾茲海默癥知識圖譜構建及知識發(fā)現

發(fā)布時間:2022-02-14 13:04
  阿爾茲海默癥是一種常見的老年疾病。據報道在2015年間阿爾茲海默癥導致了190萬人的死亡,并且該疾病的治療費用較高。到目前為止,還未有有效治療或控制該疾病的相關報道。為了找到有效的治療方法,大量生物醫(yī)學實驗在不斷的進行中,大量研究論文不斷涌現。然而,2018年1月新英格蘭雜志宣布,最有可能的特效藥臨床試驗失敗。因此,有必要對過去該疾病的研究思路重新梳理、分析并發(fā)現新研究方向。本文針對PubMed數據庫中,從2000年到2019年共132,749篇與阿爾茲海默癥相關的摘要數據,采用機器學習方法進行知識抽取,構建阿爾茲海默癥的知識圖譜并進行知識發(fā)現。知識圖譜的構建模型如下:首先從PubMed數據庫下載阿爾茲海默癥文獻數據,并提取摘要;然后基于主題模型、詞向量模型、聚類模型以及命名實體識別的方法,抽取出實體、實體之間的關系以及實體屬性等知識;最終利用圖數據庫將抽取的知識進行存儲和展示。同時從時間維度出發(fā),根據實體在時間維度上的變化實現相關知識發(fā)現。實驗最終識別出16類,共計775個實體。通過實體在文獻中的共現情況,定義了“治療”、“引發(fā)”、“并發(fā)癥”、“行為”、“診斷”和“研究區(qū)域”六種關系... 

【文章來源】:吉林大學吉林省211工程院校985工程院校教育部直屬院校

【文章頁數】:65 頁

【學位級別】:碩士

【部分圖文】:

阿爾茲海默癥知識圖譜構建及知識發(fā)現


知識圖譜框架圖

框架圖,主題,框架圖,模型


第2章知識圖譜相關理論和技術8(2)從狄利克雷分布α中取樣生成文檔的主題分布。(3)從主題的多項式分布中取樣生成文檔的第j個單詞的主題,。(4)從狄利克雷分布β中取樣生成主題,對應的詞語分布,。(5)從詞語的多項式分布,中采用最終生成詞語,。圖2.2主題模型框架圖通過主題模型的框架圖可以得到聯合概率分布公式(2.1),其中(|α)表示主題采樣的過程,具體為根據先驗分布參數α對主題進行采樣,(|,)表示采樣單詞的過程,即根據確定的主題z和單詞分布的先驗分布參數β對單詞進行采樣。(,|,)=(|,)(|)…………………………………………(2.1)

模型結構,單詞,向量


第2章知識圖譜相關理論和技術11本體構建本質是將實體進行規(guī)范化,明確定義實體及實體之間的關系。本體構建可以通過多種方式完成,例如人工手動編輯構建,或者可以通過計算機輔助,以數據驅動方式自動構建。對于領域知識圖譜,一般是領域研究人員人工構建。質量評估是對構建的知識圖譜的一個評價過程,即量化融合后的知識圖譜的可信度,主要思想是通過將置信度較低的數據進行丟棄,保留置信度較高的數據,從而保障融合后的數據的質量水平。在知識融合過程中,實體對齊的一種實現方式是采用Word2vec與聚類算法結合。Word2vec模型是一個基于三層神經網絡的詞向量模型,是由Mikolov于2013年提出的[52],通過非監(jiān)督訓練將文本中的每個單詞映射到一個k維向量空間,并把每個單詞在這個k維空間的表示組合在一起作為該單詞的向量表示,其中詞向量的含義是語義越相近在向量維度上的距離越相近。Word2vec的具體實現結構有兩種,分別為skip-gram模型和連續(xù)詞袋模型(ContinuousBagofWords,CBOW),這兩種結構構建形式類似,均由輸入層、投影層和輸出層構成,具體的結構如圖2.3所示。圖2.3CBOW和Skip-gram模型結構圖CBOW模型是一個基于上下文預測當前的目標單詞向量模型,輸入層中w(t-2)、w(t-1)、w(t+1)、w(t+2)表示的需要計算的目標單詞w(t)的上下文單詞對應的向量表示,隱層主

【參考文獻】:
期刊論文
[1]信息組織4.0:變革歷程和未來圖景[J]. 魏敏.  國家圖書館學刊. 2018(01)
[2]淺談大數據時代背景下企業(yè)檔案工作[J]. 張琳.  辦公室業(yè)務. 2018(02)
[3]基于WLabeled-LDA模型的文本分類研究[J]. 卜天然.  長春師范大學學報. 2017(04)
[4]知識圖譜技術綜述[J]. 徐增林,盛泳潘,賀麗榮,王雅芳.  電子科技大學學報. 2016(04)
[5]無指導的中文開放式實體關系抽取[J]. 秦兵,劉安安,劉挺.  計算機研究與發(fā)展. 2015(05)
[6]阿爾茲海默病的研究現狀[J]. 李潤輝.  沈陽醫(yī)學院學報. 2013(03)
[7]老年癡呆的發(fā)病機理及治療策略[J]. 張均田.  藥學學報. 2000(08)

碩士論文
[1]基于吉布斯采樣的模體識別算法研究[D]. 戈魯寧.西安電子科技大學 2010



本文編號:3624611

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3624611.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶7eefe***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com