基于層次化邏輯隱馬爾可夫模型的任務(wù)規(guī)劃識(shí)別方法研究
發(fā)布時(shí)間:2021-03-19 21:01
意圖識(shí)別是一類重要的認(rèn)知行為,也是作戰(zhàn)仿真系統(tǒng)建模的重要環(huán)節(jié)。任務(wù)規(guī)劃識(shí)別是意圖識(shí)別問(wèn)題中比較復(fù)雜、比較重要的一類問(wèn)題。研究任務(wù)規(guī)劃識(shí)別是研究人的行為建模的重要環(huán)節(jié),具有一定的理論研究?jī)r(jià)值,同時(shí)對(duì)提高仿真系統(tǒng)的可信性具有重要的意義。論文以邏輯隱馬爾可夫模型為基礎(chǔ),結(jié)合作戰(zhàn)仿真系統(tǒng)中任務(wù)規(guī)劃問(wèn)題所具有的層級(jí)結(jié)構(gòu)明顯、關(guān)系數(shù)據(jù)多等特點(diǎn),給出解決任務(wù)規(guī)劃識(shí)別問(wèn)題的模型、算法以及算法評(píng)價(jià)方法。論文主要工作如下:第一,將邏輯隱馬爾可夫模型與層次化馬爾可夫模型相結(jié)合,提出層次化邏輯隱馬爾可夫模型(Hierarchical Logical Hidden Markov Model,Hi LHMM),提高模型對(duì)復(fù)雜層次化任務(wù)的描述能力,并對(duì)前向算法和后向算法、Viterbi算法以及Baum-Welch算法進(jìn)行了適應(yīng)性的推廣和改進(jìn),分別用于評(píng)估、極大似然狀態(tài)估計(jì)以及參數(shù)估計(jì)。第二,為減小計(jì)算量,提高識(shí)別效率,提出與一致性匹配相結(jié)合的方法,將得到的觀測(cè)序列與任務(wù)庫(kù)中的任務(wù)進(jìn)行一致性匹配,從而縮小識(shí)別算法的搜索空間;提出情景驅(qū)動(dòng)的層次化邏輯隱馬爾可夫模型(Environment Driven Hi LHMM,...
【文章來(lái)源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:82 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
意圖識(shí)別在OODA環(huán)中的位置
P1S1A1A2S2A1A3A4P1S1A1A2S2A1A3A4c) 來(lái)自―稍微有序‖任務(wù)庫(kù) d) 來(lái)自―完全無(wú)序‖任務(wù)庫(kù)圖 4.7 時(shí)序約束不同的任務(wù)庫(kù)中的任務(wù)舉例根據(jù)前面提到的控制變量的思想,我們?cè)诜治霾煌惴ㄔ诓煌瑫r(shí)序約束強(qiáng)度下的性能表現(xiàn)時(shí),將各個(gè)任務(wù)庫(kù)中,控制任務(wù)深度為 3,每個(gè)任務(wù)庫(kù)中包括 10 個(gè)不同的任務(wù)。然后分別隨機(jī)執(zhí)行這 4 個(gè)任務(wù)庫(kù),可以得到一組N 個(gè)帶標(biāo)簽的觀測(cè)序列,這里取 N 100,就形成了識(shí)別算法的一組測(cè)試集,這個(gè)測(cè)試集中,每個(gè)數(shù)據(jù)包括一個(gè)觀測(cè)序列,所執(zhí)行的任務(wù)名,任務(wù)所屬的任務(wù)庫(kù)。重復(fù) 10 組這樣的實(shí)驗(yàn),得到如下的實(shí)驗(yàn)結(jié)果:1. “完全有序”任務(wù)庫(kù)10 次實(shí)驗(yàn)中,得到不同算法的性能指標(biāo)如圖 4.8 所示,而不同算法在識(shí)別―完全有序‖任務(wù)庫(kù)中任務(wù)時(shí)的評(píng)價(jià)指標(biāo)平均值如下表 4.1 所示:
國(guó)防科技大學(xué)研究生院碩士學(xué)位論文從假設(shè)檢驗(yàn)的結(jié)果可以看出,在―完全有序‖的任務(wù)庫(kù),Hi LHMM 識(shí)別的準(zhǔn)確度要比 LHMM 好。2. “比較有序”任務(wù)庫(kù)當(dāng)任務(wù)的執(zhí)行出現(xiàn)了不受時(shí)序約束的情況,任務(wù)執(zhí)行的過(guò)程中就增加了不確定性。而情景驅(qū)動(dòng)模型的引入,就是為了降低這種不確定性。在后面三個(gè)包含了無(wú)序的任務(wù)執(zhí)行的任務(wù)庫(kù)中,我們將 ED-Hi LHMM 算法的性能也與 LHMM 比較。10 次實(shí)驗(yàn)中,不同算法在識(shí)別―比較有序‖任務(wù)庫(kù)中任務(wù)時(shí)的評(píng)價(jià)指標(biāo)如圖 4.9所示,指標(biāo)平均值如下表 4.2 所示,而表 4.3 給出了假設(shè)檢驗(yàn)的統(tǒng)計(jì)量。
【參考文獻(xiàn)】:
期刊論文
[1]融合神經(jīng)元激勵(lì)機(jī)制的機(jī)器人情景學(xué)習(xí)與行為控制[J]. 劉冬,叢明,高森,韓曉東,杜宇. 機(jī)器人. 2014(05)
[2]HTN規(guī)劃及其復(fù)雜度分析[J]. 陳藹祥,柴嘯龍,胡桂武. 計(jì)算機(jī)工程與應(yīng)用. 2008(16)
[3]基于分層貝葉斯網(wǎng)絡(luò)的計(jì)劃識(shí)別方法[J]. 柴慧敏,王寶樹. 系統(tǒng)工程與電子技術(shù). 2008(05)
[4]多Agent戰(zhàn)術(shù)意圖識(shí)別的知識(shí)組織與問(wèn)題求解[J]. 曾鵬,吳玲達(dá),陳文偉. 計(jì)算機(jī)科學(xué). 2007(07)
[5]戰(zhàn)術(shù)任務(wù)規(guī)劃系統(tǒng)研究[J]. 周銳,成曉靜,陳宗基. 控制與決策. 2004(04)
博士論文
[1]面向計(jì)算機(jī)生成兵力的意圖識(shí)別建模與推理方法研究[D]. 岳師光.國(guó)防科學(xué)技術(shù)大學(xué) 2016
[2]基于情景記憶的機(jī)器人認(rèn)知行為學(xué)習(xí)與控制方法[D]. 劉冬.大連理工大學(xué) 2014
[3]蟻群優(yōu)化理論在無(wú)人機(jī)戰(zhàn)術(shù)控制中的應(yīng)用研究[D]. 陳巖.國(guó)防科學(xué)技術(shù)大學(xué) 2007
碩士論文
[1]基于HTN方法的記憶機(jī)器人任務(wù)規(guī)劃研究[D]. 張麗.哈爾濱工業(yè)大學(xué) 2010
本文編號(hào):3090222
【文章來(lái)源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:82 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
意圖識(shí)別在OODA環(huán)中的位置
P1S1A1A2S2A1A3A4P1S1A1A2S2A1A3A4c) 來(lái)自―稍微有序‖任務(wù)庫(kù) d) 來(lái)自―完全無(wú)序‖任務(wù)庫(kù)圖 4.7 時(shí)序約束不同的任務(wù)庫(kù)中的任務(wù)舉例根據(jù)前面提到的控制變量的思想,我們?cè)诜治霾煌惴ㄔ诓煌瑫r(shí)序約束強(qiáng)度下的性能表現(xiàn)時(shí),將各個(gè)任務(wù)庫(kù)中,控制任務(wù)深度為 3,每個(gè)任務(wù)庫(kù)中包括 10 個(gè)不同的任務(wù)。然后分別隨機(jī)執(zhí)行這 4 個(gè)任務(wù)庫(kù),可以得到一組N 個(gè)帶標(biāo)簽的觀測(cè)序列,這里取 N 100,就形成了識(shí)別算法的一組測(cè)試集,這個(gè)測(cè)試集中,每個(gè)數(shù)據(jù)包括一個(gè)觀測(cè)序列,所執(zhí)行的任務(wù)名,任務(wù)所屬的任務(wù)庫(kù)。重復(fù) 10 組這樣的實(shí)驗(yàn),得到如下的實(shí)驗(yàn)結(jié)果:1. “完全有序”任務(wù)庫(kù)10 次實(shí)驗(yàn)中,得到不同算法的性能指標(biāo)如圖 4.8 所示,而不同算法在識(shí)別―完全有序‖任務(wù)庫(kù)中任務(wù)時(shí)的評(píng)價(jià)指標(biāo)平均值如下表 4.1 所示:
國(guó)防科技大學(xué)研究生院碩士學(xué)位論文從假設(shè)檢驗(yàn)的結(jié)果可以看出,在―完全有序‖的任務(wù)庫(kù),Hi LHMM 識(shí)別的準(zhǔn)確度要比 LHMM 好。2. “比較有序”任務(wù)庫(kù)當(dāng)任務(wù)的執(zhí)行出現(xiàn)了不受時(shí)序約束的情況,任務(wù)執(zhí)行的過(guò)程中就增加了不確定性。而情景驅(qū)動(dòng)模型的引入,就是為了降低這種不確定性。在后面三個(gè)包含了無(wú)序的任務(wù)執(zhí)行的任務(wù)庫(kù)中,我們將 ED-Hi LHMM 算法的性能也與 LHMM 比較。10 次實(shí)驗(yàn)中,不同算法在識(shí)別―比較有序‖任務(wù)庫(kù)中任務(wù)時(shí)的評(píng)價(jià)指標(biāo)如圖 4.9所示,指標(biāo)平均值如下表 4.2 所示,而表 4.3 給出了假設(shè)檢驗(yàn)的統(tǒng)計(jì)量。
【參考文獻(xiàn)】:
期刊論文
[1]融合神經(jīng)元激勵(lì)機(jī)制的機(jī)器人情景學(xué)習(xí)與行為控制[J]. 劉冬,叢明,高森,韓曉東,杜宇. 機(jī)器人. 2014(05)
[2]HTN規(guī)劃及其復(fù)雜度分析[J]. 陳藹祥,柴嘯龍,胡桂武. 計(jì)算機(jī)工程與應(yīng)用. 2008(16)
[3]基于分層貝葉斯網(wǎng)絡(luò)的計(jì)劃識(shí)別方法[J]. 柴慧敏,王寶樹. 系統(tǒng)工程與電子技術(shù). 2008(05)
[4]多Agent戰(zhàn)術(shù)意圖識(shí)別的知識(shí)組織與問(wèn)題求解[J]. 曾鵬,吳玲達(dá),陳文偉. 計(jì)算機(jī)科學(xué). 2007(07)
[5]戰(zhàn)術(shù)任務(wù)規(guī)劃系統(tǒng)研究[J]. 周銳,成曉靜,陳宗基. 控制與決策. 2004(04)
博士論文
[1]面向計(jì)算機(jī)生成兵力的意圖識(shí)別建模與推理方法研究[D]. 岳師光.國(guó)防科學(xué)技術(shù)大學(xué) 2016
[2]基于情景記憶的機(jī)器人認(rèn)知行為學(xué)習(xí)與控制方法[D]. 劉冬.大連理工大學(xué) 2014
[3]蟻群優(yōu)化理論在無(wú)人機(jī)戰(zhàn)術(shù)控制中的應(yīng)用研究[D]. 陳巖.國(guó)防科學(xué)技術(shù)大學(xué) 2007
碩士論文
[1]基于HTN方法的記憶機(jī)器人任務(wù)規(guī)劃研究[D]. 張麗.哈爾濱工業(yè)大學(xué) 2010
本文編號(hào):3090222
本文鏈接:http://sikaile.net/kejilunwen/jingguansheji/3090222.html
最近更新
教材專著