天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 管理論文 > 社區(qū)管理論文 >

在線醫(yī)療社區(qū)問答文本的知識圖譜構(gòu)建研究

發(fā)布時間:2021-04-06 09:53
  【目的/意義】針對醫(yī)療問答社區(qū)數(shù)據(jù)量大、規(guī)范性差、數(shù)據(jù)稀疏等特性,綜合利用雙向長短記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM)、條件隨機場(CRF)、雙向門控循環(huán)單元(BiGRU)等深度學(xué)習(xí)模型,對社區(qū)文本的實體識別及關(guān)系抽取方法進(jìn)行研究。【方法/過程】首先,對實體作了進(jìn)一步細(xì)分,利用BiLSTM-CRF模型對BIO標(biāo)注的數(shù)據(jù)集進(jìn)行實體識別,實驗發(fā)現(xiàn)細(xì)分實體比未細(xì)分實體在結(jié)果上表現(xiàn)更好;接著利用BiGRU-Attention模型抽取各實體間的關(guān)系,實驗結(jié)果顯示,該模型無論是在準(zhǔn)確率、召回率還是F值上都比BiLSTM-Attention抽取模型有較大的提升;最后利用Neo4j圖數(shù)據(jù)庫構(gòu)建了一個可視化的知識圖譜!窘Y(jié)果/結(jié)論】本研究將非結(jié)構(gòu)化的社區(qū)文本轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),在醫(yī)療社區(qū)的智能知識服務(wù)、知識表示、個性化知識推薦等方面具有推動作用!緞(chuàng)新/局限】在醫(yī)療實體識別過程中將實體進(jìn)行細(xì)分,成功構(gòu)建了基于在線醫(yī)療社區(qū)問答文本的乳腺癌知識圖譜。但由于某些關(guān)系樣本量較少,對整體關(guān)系抽取的評價指標(biāo)存在一定的影響。 

【文章來源】:情報科學(xué). 2021,39(03)北大核心CSSCI

【文章頁數(shù)】:10 頁

【部分圖文】:

在線醫(yī)療社區(qū)問答文本的知識圖譜構(gòu)建研究


GRU模型內(nèi)部結(jié)構(gòu)圖Figure6InternalstructurediagramofGRUmodel隱藏層各個參數(shù)可由以下公式計算得出:

實體關(guān)系圖,實體關(guān)系,酸牛奶,乳腺癌


幕埃?切枰?固?瘟頻?梢遠(yuǎn)喑緣憒笤嫻摹?…表6關(guān)系抽取標(biāo)注示例Table6Anexampleofrelationextractionandannotation實體1乳腺癌乳腺增生乳腺癌…實體2乳頭溢液乳癖消酸牛奶…關(guān)系DCSMIDRD…實驗語句女39歲乳腺癌出現(xiàn)腫塊到乳頭溢液需要多久。一般3到5年的時間的,每個人一樣的女47歲乳腺增生六味地黃丸可以吃嗎?可口服乳癖散結(jié)膠囊和枸櫞酸他莫昔芬片乳癖消治療。女32歲我乳腺癌患者低級別原位癌做了保乳手術(shù)放療33次可以吃酸牛奶嗎?可以吃酸牛奶…圖8BiGRU-Attention實體關(guān)系抽取結(jié)果Figure8BiGRU-Attentionentityrelationshipextractionresults·TheoryResearch·INFORMATIONSCIENCEVol.39,No.3March,2021--56

框架圖,知識圖,社區(qū),文本


?飛窬???RNN以及其他深度學(xué)習(xí)模型的效果,表明了深度學(xué)習(xí)模型在關(guān)系抽取任務(wù)中的有效性。Zhou等【11】將注意力機制引入關(guān)系抽取模型中,提出BiLSTM-Attention模型,在公開數(shù)據(jù)集SeValE-2010上進(jìn)行試驗,結(jié)果顯示該模型取得了較之其他模型較高的F1值。而張?zhí)m霞等【12】提出BiGRU-雙層Attention的模型,用于抽取中文文本的人物關(guān)系,結(jié)果與未加入Attention層的數(shù)據(jù)進(jìn)行對比發(fā)現(xiàn),該模型在準(zhǔn)確率、召回率上都有顯著提升,說明Attention層在關(guān)系抽取上具有突出表現(xiàn)。圖1在線醫(yī)療社區(qū)問答文本知識圖譜構(gòu)建框架Figure1TheconstructionframeworkoftheonlinemedicalcommunityQ&AtextKnowledgeGraphNeo4j圖數(shù)據(jù)庫能夠?qū)⒆R別出的實體及關(guān)系以知識圖譜的方式進(jìn)行可視化展示,通過查詢語句獲知具體醫(yī)療實體間的不同關(guān)系,對個性化醫(yī)療,便捷醫(yī)療查詢具有極大的幫助。結(jié)合知識圖譜,利用深度學(xué)習(xí)挖掘醫(yī)療社區(qū)文本的實體及關(guān)系的研究并不多,通過融合相關(guān)模型及方法,本文綜合利用雙向長短記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM)、條件隨機場(CRF)、雙向門控循環(huán)單元(BiGRU)等深度學(xué)習(xí)模型,對社區(qū)文本的實體識別及關(guān)系抽取方法進(jìn)行了研究并成功構(gòu)建了知識圖譜。2整體框架和模型設(shè)計2..1研究框架在線醫(yī)療社區(qū)領(lǐng)域,圖1展示了一種基于深度學(xué)習(xí)的知識圖譜構(gòu)建框架,成功將知識圖譜與在線醫(yī)療社區(qū)問答文本相融合。無論是從研究角度還是應(yīng)用角度,都是一次創(chuàng)新。首先對獲取的文本進(jìn)行清洗和標(biāo)注處理;然后利用BiLSTM-CRF模型對在線醫(yī)療社區(qū)問答文本進(jìn)行實體識別,在此任務(wù)中加入細(xì)分實體,提高了實體識別的效果,也為接下來的關(guān)系抽取提供了更加準(zhǔn)確的輸入;接著利用BiGRU-A

【參考文獻(xiàn)】:
期刊論文
[1]在線醫(yī)療問答文本的命名實體識別[J]. 楊文明,褚偉杰.  計算機系統(tǒng)應(yīng)用. 2019(02)
[2]基于GRU-Attention的中文文本分類[J]. 孫明敏.  現(xiàn)代信息科技. 2019(03)
[3]基于深度學(xué)習(xí)的文本表示方法[J]. 李楓林,柯佳.  情報科學(xué). 2019(01)
[4]基于電子病歷的實體識別和知識圖譜構(gòu)建的研究[J]. 黃夢醒,李夢龍,韓惠蕊.  計算機應(yīng)用研究. 2019(12)
[5]基于雙向GRU神經(jīng)網(wǎng)絡(luò)和雙層注意力機制的中文文本中人物關(guān)系抽取研究[J]. 張?zhí)m霞,胡文心.  計算機應(yīng)用與軟件. 2018(11)
[6]在線醫(yī)療文本中的實體識別研究[J]. 蘇婭,劉杰,黃亞樓.  北京大學(xué)學(xué)報(自然科學(xué)版). 2016(01)
[7]電子病歷命名實體識別和實體關(guān)系抽取研究綜述[J]. 楊錦鋒,于秋濱,關(guān)毅,蔣志鵬.  自動化學(xué)報. 2014(08)
[8]電子病歷中命名實體的智能識別[J]. 葉楓,陳鶯鶯,周根貴,李昊旻,李瑩.  中國生物醫(yī)學(xué)工程學(xué)報. 2011(02)



本文編號:3121234

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/shequguanli/3121234.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶19bf5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com