天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向中醫(yī)文本的關(guān)系抽取技術(shù)研究

發(fā)布時(shí)間:2021-11-04 21:34
  隨著時(shí)代的進(jìn)步創(chuàng)新,自然語(yǔ)言處理技術(shù)也逐漸的應(yīng)用到中醫(yī)領(lǐng)域。其中關(guān)系抽取旨在挖掘和抽取實(shí)體間的關(guān)系,或通過(guò)預(yù)定義的關(guān)系抽取目標(biāo)實(shí)體的對(duì)應(yīng)屬性。研究?jī)?nèi)容總體上圍繞“實(shí)體”和“關(guān)系”兩個(gè)概念展開(kāi)。因此課題的內(nèi)容主要包含以下兩個(gè)部分:首先研究中醫(yī)文本實(shí)體識(shí)別的方法。基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)方法比較依賴于人工特征的選擇,需要手動(dòng)從文本中選取各種能夠高效表征任務(wù)的特征,并將這些特征融入進(jìn)模型所能識(shí)別的特征向量中,后來(lái)又提出了一種不僅能夠保留句子的上下文關(guān)聯(lián)信息,同時(shí)也可以提取相應(yīng)屬性特征的神經(jīng)網(wǎng)絡(luò)——雙向長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò)。研究表明,該神經(jīng)網(wǎng)絡(luò)對(duì)于時(shí)間序列的標(biāo)注通常可以取得很好的效果。課題采用了雙向長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò)和條件隨機(jī)場(chǎng)相結(jié)合的模型來(lái)實(shí)現(xiàn)對(duì)于中醫(yī)文本實(shí)體對(duì)的識(shí)別。其次研究中醫(yī)文本實(shí)體關(guān)系抽取的方法。傳統(tǒng)的基于機(jī)器學(xué)習(xí)的實(shí)體關(guān)系抽取方法需要手動(dòng)選取一些離散特征。針對(duì)不同領(lǐng)域的文本,專業(yè)性強(qiáng),更多的是依賴領(lǐng)域?qū)<业慕?jīng)驗(yàn)與判斷。由于特征類型的選取直接影響到最終的抽取結(jié)果,很多時(shí)候,無(wú)法預(yù)知預(yù)先定義的特征是否有效,特征數(shù)量的選取也沒(méi)有既定的規(guī)范,實(shí)際應(yīng)用起來(lái)也是難度很大。近年來(lái)新提出的基于深度學(xué)習(xí)原理的關(guān)... 

【文章來(lái)源】:華北理工大學(xué)河北省

【文章頁(yè)數(shù)】:62 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

面向中醫(yī)文本的關(guān)系抽取技術(shù)研究


sigmod函數(shù)圖

函數(shù)圖像,函數(shù),權(quán)重參數(shù)


值域的兩端且十分平緩,表明輸入值對(duì)神經(jīng)元的刺激較小,該區(qū)域也被稱為神的抑制區(qū)[32]。該激活函數(shù)也有許多的不足,并不適合所有的神經(jīng)網(wǎng)絡(luò)。函數(shù)兩梯度十分小,接近于 0,只有在原點(diǎn)兩端,函數(shù)的梯度才有明顯的變化。神經(jīng)訓(xùn)練過(guò)程中,通過(guò)反向傳播跟新模型中的權(quán)重參數(shù)時(shí),過(guò)程中經(jīng)過(guò) Sigmod 函,容易造成權(quán)重參數(shù)不能有效的降低模型的損失函數(shù),這樣對(duì)于權(quán)重的更新也了意義,這樣的現(xiàn)象叫做梯度彌散。函數(shù)圖像不是以 0 為中心的,這樣會(huì)使權(quán)重更新效率降低。Sigmod 函數(shù)要進(jìn)數(shù)運(yùn)算,這個(gè)對(duì)于計(jì)算機(jī)來(lái)說(shuō)是耗時(shí)較長(zhǎng)。.2 tanh 函數(shù)函數(shù)公式:xxxxeeeexxx cosh()sinh()tanh( )函數(shù)圖如下圖 2:

函數(shù)


圖 3 ReLU 函數(shù)Fig.3 ReLU function diagramReLU(Rectified Linear Unit)函數(shù)是目前應(yīng)用較為廣泛一個(gè)激活函數(shù),相od 函數(shù)和tanh 函數(shù),它有以下幾個(gè)優(yōu)點(diǎn):1)在輸入為正數(shù)的時(shí)候,不存在梯度飽和問(wèn)題;2)計(jì)算速度要快很多。ReLU 函數(shù)只有線性關(guān)系,不管是前向傳播還是反都比 Sigmod 和 tanh 要快很多。同樣,ReLU 函數(shù)也存在如下缺點(diǎn):1)當(dāng)輸入的值比零小,激活函數(shù)的輸出恒為零,通常這意味著函數(shù)對(duì)于負(fù)為零。在前向傳播過(guò)程中,并不會(huì)引起太大的問(wèn)題。但是到了反向傳播過(guò)程為負(fù),梯度就會(huì)只能為0 ,這個(gè)和sigmod 函數(shù)、tanh 函數(shù)有一樣的問(wèn)題;2)ReLU 函數(shù)的輸出要么是 0,要么是正數(shù),這也就是說(shuō),ReLU 函數(shù)也不心的函數(shù)。

【參考文獻(xiàn)】:
期刊論文
[1]關(guān)系抽取技術(shù)的研究[J]. 趙立鵬,張若偉.  計(jì)算機(jī)產(chǎn)品與流通. 2018(09)
[2]論中醫(yī)“證”及“辨證論治”[J]. 朱敬,朱翰學(xué).  中華中醫(yī)藥雜志. 2017(01)
[3]實(shí)體詞語(yǔ)義信息對(duì)中文實(shí)體關(guān)系抽取的作用研究[J]. 段利國(guó),徐慶,李愛(ài)萍,崔敏君.  計(jì)算機(jī)應(yīng)用研究. 2017(01)
[4]基于減法聚類的合并最優(yōu)路徑層次聚類算法[J]. 朱琪,張會(huì)福,楊宇波,楊泉清.  計(jì)算機(jī)工程. 2015(06)
[5]信息抽取研究綜述[J]. 郭喜躍,何婷婷.  計(jì)算機(jī)科學(xué). 2015(02)
[6]基于群體智能的半結(jié)構(gòu)化藏文文本聚類算法[J]. 康健,喬少杰,格桑多吉,韓楠,洪西進(jìn),尼瑪扎西,范小剛.  模式識(shí)別與人工智能. 2014(07)
[7]面向大數(shù)據(jù)集的有效聚類算法[J]. 古凌嵐.  計(jì)算機(jī)工程與設(shè)計(jì). 2014(06)
[8]一種改進(jìn)的文化螢火蟲算法[J]. 袁鋒,陳守強(qiáng),劉弘,鐘安帥.  計(jì)算機(jī)仿真. 2014(06)
[9]基于凸組合核函數(shù)的中文領(lǐng)域?qū)嶓w關(guān)系抽取[J]. 陳鵬,郭劍毅,余正濤,線巖團(tuán),嚴(yán)馨,魏斯超.  中文信息學(xué)報(bào). 2013(05)
[10]高效挖掘高血壓醫(yī)案關(guān)聯(lián)規(guī)則的模型構(gòu)建[J]. 袁鋒,陳守強(qiáng).  計(jì)算機(jī)工程與應(yīng)用. 2011(36)

博士論文
[1]中醫(yī)醫(yī)案文本挖掘的若干關(guān)鍵技術(shù)研究[D]. 袁鋒.山東師范大學(xué) 2016
[2]基于文本的領(lǐng)域本體學(xué)習(xí)方法及其應(yīng)用研究[D]. 于娟.大連理工大學(xué) 2010
[3]面向本體學(xué)習(xí)的粒計(jì)算方法研究[D]. 邱桃榮.北京交通大學(xué) 2009
[4]文本挖掘在中醫(yī)藥中的若干應(yīng)用研究[D]. 周雪忠.浙江大學(xué) 2004

碩士論文
[1]基于特征向量的人物關(guān)系抽取方法研究[D]. 范少帥.華東交通大學(xué) 2015



本文編號(hào):3476453

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3476453.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶dc90e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com