天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于sentence2vec的疾病提前診斷和風(fēng)險預(yù)測

發(fā)布時間:2021-01-20 11:17
  在這個信息化的時代,隨著醫(yī)療技術(shù)以及科學(xué)技術(shù)的迅猛發(fā)展,智慧醫(yī)療、互聯(lián)網(wǎng)醫(yī)療等新概念隨之被提出,利用數(shù)據(jù)驅(qū)動來對醫(yī)療數(shù)據(jù)進(jìn)行分析方法也應(yīng)運而生。因此,建立完整的電子健康記錄(Electronic Healthcare Records,EHR)系統(tǒng)顯得越來越重要。人們通過對獲取到的醫(yī)療數(shù)據(jù)進(jìn)行合理的分析,可以對其進(jìn)行預(yù)測建模,從而實現(xiàn)對于疾病的提前診斷;蛘咄ㄟ^對病人的EHR數(shù)據(jù)來對其身體健康狀況進(jìn)行分析,從而預(yù)測該患者在將來患有某種疾病的風(fēng)險。電子健康記錄(EHR)系統(tǒng)和其他的健康數(shù)字化系統(tǒng)一樣,可以使醫(yī)療保健變得更為高效、安全、智能。電子健康記錄與自然語言處理相結(jié)合,可以減少人類去做常規(guī)、耗時、高重復(fù)型的工作,騰出來的人員可以被重新部署,以便于支持更為高端的工作,大大推動了醫(yī)療保健事業(yè)的發(fā)展。但是也有很多原因使得我們在EHR數(shù)據(jù)集上進(jìn)行疾病風(fēng)險預(yù)測仍然面臨很多的挑戰(zhàn)。比如說EHR數(shù)據(jù)集中相關(guān)字段的缺失,可能導(dǎo)致我們提取到特征不完整。另外,由于人工失誤,錯記、漏記、甚至多記可能給我們分析數(shù)據(jù)造成噪聲,影響我們對特征的提取。因此,能夠高效分析電子醫(yī)療健康記錄對于提升醫(yī)療衛(wèi)生水平至關(guān)重要。... 

【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:53 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于sentence2vec的疾病提前診斷和風(fēng)險預(yù)測


EHR原始數(shù)據(jù)集

實例圖,模型結(jié)構(gòu),上下文,中心詞


2.1.1 word2vec 之 CBOWCBOW 的思想其實非常的簡單,我們會先設(shè)定一個上下文窗口的大小,然后根據(jù)已經(jīng)選定的上下文單詞對中心詞進(jìn)行預(yù)測 就比如說圖 2.3 所示:white cat jumping in theP(wt-3|wt) P(wt-2|wt)P(wt-1|wt)P(wt+1|wt)P(wt+2|wt)amudP(wt+3|wt)圖 2.3 word2vec 之 CBOW 實例圖我們設(shè)定上下文窗口大小為 3,將{ a , white , cat , in , the , mud }這些詞作為上下文,預(yù)測出中心詞 jumping 但是需要注意的一點就是,中心詞與被上下文單詞的距離遠(yuǎn)近是不考慮的,它們是被同等對待

模型圖,模型,單詞,窗口大小


華 中 科 技 大 學(xué) 碩 士 學(xué) 位 論 文大小,最后根據(jù)選定的中間詞來預(yù)測窗口大小內(nèi)上下文單詞 我們還是介紹基于multi-word context 的 skip-gram 模型,此時的模型結(jié)構(gòu)如下圖 2.5 所示,我們假設(shè)輸入的單詞為 X,設(shè)置的上下文窗口大小為 C,對此對應(yīng)的輸出為 y1,y2,…yc,,值得注意的是,這個時候 y1,y2,…yc彼此之間仍然是相互獨立的


本文編號:2988946

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2988946.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶eafa0***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com