基于深度強(qiáng)化學(xué)習(xí)的中醫(yī)序貫診療方案優(yōu)化方法研究
發(fā)布時(shí)間:2021-08-03 07:25
序貫診療是慢性疾病臨床診斷與治療主要方法,包括多階段的臨床診療決策過(guò)程,是一種復(fù)雜的決策優(yōu)化問(wèn)題。鑒于中醫(yī)處方的復(fù)雜性和個(gè)體性,針對(duì)慢性疾病的中醫(yī)診療過(guò)程包含迭代式的四診信息采集、疾病狀態(tài)或診斷判別和處方?jīng)Q策等主要環(huán)節(jié),更是一種典型的復(fù)雜序貫診療過(guò)程。因此,進(jìn)行有效中醫(yī)序貫診療方案的發(fā)現(xiàn)和智能應(yīng)用是中醫(yī)臨床人工智能的核心問(wèn)題,但由于該問(wèn)題的計(jì)算復(fù)雜性和對(duì)完整閉環(huán)數(shù)據(jù)的要求,以往中醫(yī)臨床數(shù)據(jù)挖掘研究很少涉及該方面的研究。隨著高質(zhì)量中醫(yī)臨床數(shù)據(jù)的積累和近年來(lái)強(qiáng)化學(xué)習(xí)方法(特別是深度強(qiáng)化學(xué)習(xí))的快速發(fā)展,開(kāi)展基于強(qiáng)化學(xué)習(xí)的中醫(yī)序貫診療方案優(yōu)化成為可能。本文提出了一種基于深度強(qiáng)化學(xué)習(xí)方法的中醫(yī)序貫診療方案優(yōu)化模型(AlphaPrescriber),該模型能夠?qū)崿F(xiàn)根據(jù)觀察得到的患者癥狀體征信息,進(jìn)行處方推薦,動(dòng)態(tài)形成優(yōu)化的中醫(yī)序貫診療方案,為中醫(yī)個(gè)體化處方推薦的人工智能應(yīng)用提供基礎(chǔ)。主要研究工作包括以下幾個(gè)方面:首先,結(jié)合中醫(yī)診療過(guò)程中缺乏自然存在的強(qiáng)化學(xué)習(xí)“環(huán)境”問(wèn)題,提出HH深度中醫(yī)治療人工環(huán)境模型(HU HE Deep TCM Treatment Artificial Environmen...
【文章來(lái)源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:83 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-3機(jī)器學(xué)習(xí)的分類(lèi)??
1以是一組有限的狀態(tài);??2>4是一組有限的行為(或者^^是該狀態(tài)下可使用的有限的一組行動(dòng));??3)Ps〇,s')?=?Pr(st+i?=?s|st?=?s,?at?=?a)是由行動(dòng)a導(dǎo)致的一個(gè)狀態(tài)轉(zhuǎn)移概智能體在時(shí)間/的狀態(tài)是^在行動(dòng)a之后,會(huì)在時(shí)間/+1到達(dá)狀態(tài)s'的概4)/?a(s,s')是在狀態(tài)轉(zhuǎn)移后得到的直接獎(jiǎng)勵(lì)(或期望的直接獎(jiǎng)勵(lì));??5)y?e?[0,1]是折現(xiàn)系數(shù),體現(xiàn)未來(lái)獎(jiǎng)勵(lì)與直接獎(jiǎng)勵(lì)在現(xiàn)值上的差異。??強(qiáng)化學(xué)習(xí)以如圖2-5所示的方式轉(zhuǎn)換為馬爾科夫決策過(guò)程。假設(shè)模型中的,身處某個(gè)環(huán)境中(例如《打磚塊》游戲)。這個(gè)環(huán)境處于某個(gè)特定的狀態(tài)(例拍的位置、球的位置與方向,每個(gè)磚塊存在與否)。智能體可以在這個(gè)環(huán)境某些特定的動(dòng)作(例如,向左或向右移動(dòng)拍子)。這些動(dòng)作有時(shí)候會(huì)帶來(lái)獎(jiǎng)勵(lì)(上升)。行為改變環(huán)境,并帶來(lái)新的狀態(tài),智能體可以再執(zhí)行另一個(gè)動(dòng)作。作的規(guī)則(或者順序)被稱(chēng)為策略。通常來(lái)說(shuō),環(huán)境在一定程度上是隨機(jī)的,著下一狀態(tài)也是隨機(jī)的(例如,當(dāng)球拍漏接了球,球拍再次發(fā)射一個(gè)球,它隨機(jī)的方向)?傊,狀態(tài)與動(dòng)作的集合,以及改變狀態(tài)的規(guī)則,共同組成馬爾可夫決策過(guò)程。??
在簡(jiǎn)化版的誤差曲線中,能迅速找到唯一的誤差最小時(shí)的V。然而實(shí)際情況??中,有很多誤差曲線都呈水平狀態(tài)。不同的取初始化的位置,將會(huì)帶來(lái)不同的下??降區(qū)域,從而帶來(lái)不同的F解。如圖2-7所示,PF的全局最優(yōu)解(Global?minima)??在最低位置,而其它的解是局部最優(yōu)(Localminima)。全局最優(yōu)解是理想的求解目??標(biāo),然而很多時(shí)候,得到的是局部最優(yōu)解,這也無(wú)可避免。盡管如此,雖然不是全??局最優(yōu),但是神經(jīng)網(wǎng)絡(luò)也能使局部最優(yōu)解足夠優(yōu)秀,以至于也能出色的完成的指定??的任務(wù)%。??cost??W??圖2-7?cost函數(shù)曲線2??Figure?2-7?Cost?function?curve?2??17??
【參考文獻(xiàn)】:
期刊論文
[1]關(guān)于在“最優(yōu)化方法”中引入智能優(yōu)化算法的思考[J]. 孫靖,查明明. 科教文匯(上旬刊). 2018(10)
[2]近5年腰椎間盤(pán)突出癥的中醫(yī)治療綜述[J]. 王鳳德,呂計(jì)寶,韋英才. 中醫(yī)外治雜志. 2018(02)
[3]主流深度學(xué)習(xí)框架對(duì)比[J]. 加日拉·買(mǎi)買(mǎi)提熱衣木,常富蓉,劉晨,要秀宏. 電子技術(shù)與軟件工程. 2018(07)
[4]基于云推理模型的深度強(qiáng)化學(xué)習(xí)探索策略研究[J]. 李晨溪,曹雷,陳希亮,張永亮,徐志雄,彭輝,段理文. 電子與信息學(xué)報(bào). 2018(01)
[5]雙人博弈問(wèn)題中的蒙特卡洛樹(shù)搜索算法的改進(jìn)[J]. 季輝,丁澤軍. 計(jì)算機(jī)科學(xué). 2018(01)
[6]一種基于深度強(qiáng)化學(xué)習(xí)的調(diào)度優(yōu)化方法[J]. 鄧志龍,張琦瑋,曹皓,谷志陽(yáng). 西北工業(yè)大學(xué)學(xué)報(bào). 2017(06)
[7]卷積神經(jīng)網(wǎng)絡(luò)概述[J]. 侯宇昆. 中國(guó)新通信. 2017(09)
[8]深度強(qiáng)化學(xué)習(xí)綜述[J]. 劉全,翟建偉,章宗長(zhǎng),鐘珊,周倩,章鵬,徐進(jìn). 計(jì)算機(jī)學(xué)報(bào). 2018(01)
[9]深度強(qiáng)化學(xué)習(xí)綜述:兼論計(jì)算機(jī)圍棋的發(fā)展[J]. 趙冬斌,邵坤,朱圓恒,李棟,陳亞冉,王海濤,劉德榮,周彤,王成紅. 控制理論與應(yīng)用. 2016(06)
[10]基于強(qiáng)化學(xué)習(xí)的匯流瓶頸區(qū)可變限速策略研究[J]. 段薈,劉攀,李志斌,湯斗南. 交通運(yùn)輸系統(tǒng)工程與信息. 2015(01)
博士論文
[1]POMDP近似解法研究及在中醫(yī)診療方案優(yōu)化中的應(yīng)用[D]. 馮奇.北京交通大學(xué) 2011
碩士論文
[1]基于深度強(qiáng)化學(xué)習(xí)的股市投資模型構(gòu)建及實(shí)證研究[D]. 滿(mǎn)奇.廣東財(cái)經(jīng)大學(xué) 2017
[2]一種生產(chǎn)銷(xiāo)售系統(tǒng)的生產(chǎn)及庫(kù)存控制優(yōu)化研究[D]. 宋聰穎.合肥工業(yè)大學(xué) 2017
[3]基于動(dòng)機(jī)的強(qiáng)化學(xué)習(xí)及其應(yīng)用研究[D]. 魯成祥.曲阜師范大學(xué) 2016
[4]基于強(qiáng)化學(xué)習(xí)的電子銷(xiāo)售市場(chǎng)動(dòng)態(tài)定價(jià)研究[D]. 王金田.合肥工業(yè)大學(xué) 2009
本文編號(hào):3319217
【文章來(lái)源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:83 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-3機(jī)器學(xué)習(xí)的分類(lèi)??
1以是一組有限的狀態(tài);??2>4是一組有限的行為(或者^^是該狀態(tài)下可使用的有限的一組行動(dòng));??3)Ps〇,s')?=?Pr(st+i?=?s|st?=?s,?at?=?a)是由行動(dòng)a導(dǎo)致的一個(gè)狀態(tài)轉(zhuǎn)移概智能體在時(shí)間/的狀態(tài)是^在行動(dòng)a之后,會(huì)在時(shí)間/+1到達(dá)狀態(tài)s'的概4)/?a(s,s')是在狀態(tài)轉(zhuǎn)移后得到的直接獎(jiǎng)勵(lì)(或期望的直接獎(jiǎng)勵(lì));??5)y?e?[0,1]是折現(xiàn)系數(shù),體現(xiàn)未來(lái)獎(jiǎng)勵(lì)與直接獎(jiǎng)勵(lì)在現(xiàn)值上的差異。??強(qiáng)化學(xué)習(xí)以如圖2-5所示的方式轉(zhuǎn)換為馬爾科夫決策過(guò)程。假設(shè)模型中的,身處某個(gè)環(huán)境中(例如《打磚塊》游戲)。這個(gè)環(huán)境處于某個(gè)特定的狀態(tài)(例拍的位置、球的位置與方向,每個(gè)磚塊存在與否)。智能體可以在這個(gè)環(huán)境某些特定的動(dòng)作(例如,向左或向右移動(dòng)拍子)。這些動(dòng)作有時(shí)候會(huì)帶來(lái)獎(jiǎng)勵(lì)(上升)。行為改變環(huán)境,并帶來(lái)新的狀態(tài),智能體可以再執(zhí)行另一個(gè)動(dòng)作。作的規(guī)則(或者順序)被稱(chēng)為策略。通常來(lái)說(shuō),環(huán)境在一定程度上是隨機(jī)的,著下一狀態(tài)也是隨機(jī)的(例如,當(dāng)球拍漏接了球,球拍再次發(fā)射一個(gè)球,它隨機(jī)的方向)?傊,狀態(tài)與動(dòng)作的集合,以及改變狀態(tài)的規(guī)則,共同組成馬爾可夫決策過(guò)程。??
在簡(jiǎn)化版的誤差曲線中,能迅速找到唯一的誤差最小時(shí)的V。然而實(shí)際情況??中,有很多誤差曲線都呈水平狀態(tài)。不同的取初始化的位置,將會(huì)帶來(lái)不同的下??降區(qū)域,從而帶來(lái)不同的F解。如圖2-7所示,PF的全局最優(yōu)解(Global?minima)??在最低位置,而其它的解是局部最優(yōu)(Localminima)。全局最優(yōu)解是理想的求解目??標(biāo),然而很多時(shí)候,得到的是局部最優(yōu)解,這也無(wú)可避免。盡管如此,雖然不是全??局最優(yōu),但是神經(jīng)網(wǎng)絡(luò)也能使局部最優(yōu)解足夠優(yōu)秀,以至于也能出色的完成的指定??的任務(wù)%。??cost??W??圖2-7?cost函數(shù)曲線2??Figure?2-7?Cost?function?curve?2??17??
【參考文獻(xiàn)】:
期刊論文
[1]關(guān)于在“最優(yōu)化方法”中引入智能優(yōu)化算法的思考[J]. 孫靖,查明明. 科教文匯(上旬刊). 2018(10)
[2]近5年腰椎間盤(pán)突出癥的中醫(yī)治療綜述[J]. 王鳳德,呂計(jì)寶,韋英才. 中醫(yī)外治雜志. 2018(02)
[3]主流深度學(xué)習(xí)框架對(duì)比[J]. 加日拉·買(mǎi)買(mǎi)提熱衣木,常富蓉,劉晨,要秀宏. 電子技術(shù)與軟件工程. 2018(07)
[4]基于云推理模型的深度強(qiáng)化學(xué)習(xí)探索策略研究[J]. 李晨溪,曹雷,陳希亮,張永亮,徐志雄,彭輝,段理文. 電子與信息學(xué)報(bào). 2018(01)
[5]雙人博弈問(wèn)題中的蒙特卡洛樹(shù)搜索算法的改進(jìn)[J]. 季輝,丁澤軍. 計(jì)算機(jī)科學(xué). 2018(01)
[6]一種基于深度強(qiáng)化學(xué)習(xí)的調(diào)度優(yōu)化方法[J]. 鄧志龍,張琦瑋,曹皓,谷志陽(yáng). 西北工業(yè)大學(xué)學(xué)報(bào). 2017(06)
[7]卷積神經(jīng)網(wǎng)絡(luò)概述[J]. 侯宇昆. 中國(guó)新通信. 2017(09)
[8]深度強(qiáng)化學(xué)習(xí)綜述[J]. 劉全,翟建偉,章宗長(zhǎng),鐘珊,周倩,章鵬,徐進(jìn). 計(jì)算機(jī)學(xué)報(bào). 2018(01)
[9]深度強(qiáng)化學(xué)習(xí)綜述:兼論計(jì)算機(jī)圍棋的發(fā)展[J]. 趙冬斌,邵坤,朱圓恒,李棟,陳亞冉,王海濤,劉德榮,周彤,王成紅. 控制理論與應(yīng)用. 2016(06)
[10]基于強(qiáng)化學(xué)習(xí)的匯流瓶頸區(qū)可變限速策略研究[J]. 段薈,劉攀,李志斌,湯斗南. 交通運(yùn)輸系統(tǒng)工程與信息. 2015(01)
博士論文
[1]POMDP近似解法研究及在中醫(yī)診療方案優(yōu)化中的應(yīng)用[D]. 馮奇.北京交通大學(xué) 2011
碩士論文
[1]基于深度強(qiáng)化學(xué)習(xí)的股市投資模型構(gòu)建及實(shí)證研究[D]. 滿(mǎn)奇.廣東財(cái)經(jīng)大學(xué) 2017
[2]一種生產(chǎn)銷(xiāo)售系統(tǒng)的生產(chǎn)及庫(kù)存控制優(yōu)化研究[D]. 宋聰穎.合肥工業(yè)大學(xué) 2017
[3]基于動(dòng)機(jī)的強(qiáng)化學(xué)習(xí)及其應(yīng)用研究[D]. 魯成祥.曲阜師范大學(xué) 2016
[4]基于強(qiáng)化學(xué)習(xí)的電子銷(xiāo)售市場(chǎng)動(dòng)態(tài)定價(jià)研究[D]. 王金田.合肥工業(yè)大學(xué) 2009
本文編號(hào):3319217
本文鏈接:http://sikaile.net/zhongyixuelunwen/3319217.html
最近更新
教材專(zhuān)著