基于狀態(tài)空間劃分的預(yù)測狀態(tài)表示模型獲取研究
發(fā)布時間:2020-05-05 10:34
【摘要】:預(yù)測狀態(tài)表示(Predictive State Representation, PSR)方法是對動態(tài)系統(tǒng)建模的有效方法。相比其它建模方法,PSR具有表征能力強、模型易于學(xué)習(xí)等優(yōu)點,可以有效地解決局部可觀測問題。但傳統(tǒng)的研究方法大都是在整體狀態(tài)空間上獲取系統(tǒng)的PSR模型,計算復(fù)雜、模型獲取相對困難,已有相關(guān)算法通常僅適用于規(guī)模較小的系統(tǒng)。 在本文工作中,通過研究系統(tǒng)狀態(tài)空間劃分機制,將整個狀態(tài)空間劃分為多個子狀態(tài)空間,降低了獲取系統(tǒng)PSR模型的難度,進而提出基于狀態(tài)空間劃分的PSR模型算法及基于狀態(tài)空間劃分的轉(zhuǎn)移預(yù)測狀態(tài)表示(Transformed Predictive State Representation, TPSR)模型獲取算法,實現(xiàn)了較大規(guī)模系統(tǒng)中系統(tǒng)PSR模型的獲取。 本文主要研究內(nèi)容及成果包括以下幾個方面: (1)提出狀態(tài)空間劃分機制。通常情況下,系統(tǒng)的狀態(tài)數(shù)量會隨著系統(tǒng)規(guī)模的增大而增多,從而增加了獲取系統(tǒng)整體的PSR模型的難度。本文根據(jù)landmark的特性,以landmark為劃分狀態(tài)空間的臨界點,把整體狀態(tài)空間劃分為幾個規(guī)模較小的子狀態(tài)空間。進行狀態(tài)空間劃分后,只需分別獲取狀態(tài)數(shù)量一般都小于整體狀態(tài)空間的狀態(tài)數(shù)量的各個子狀態(tài)空間對應(yīng)的PSR模型,降低了模型獲取的難度。 (2)提出一種基于狀態(tài)空間劃分的PSR模型獲取算法。該算法根據(jù)狀態(tài)空間劃分機制,將較大規(guī)模系統(tǒng)的整體狀態(tài)空間劃分為幾個較小的子狀態(tài)空間,進而學(xué)習(xí)各子狀態(tài)空間對應(yīng)的PSR模型;并根據(jù)這些子狀態(tài)空間的PSR模型,構(gòu)建系統(tǒng)整體的PSR模型后,可對任意事件進行預(yù)測。實驗仿真結(jié)果表明所提算法是有效的。 (3)提出基于狀態(tài)空間劃分的TPSR模型獲取算法。隨著系統(tǒng)規(guī)模的增大,發(fā)現(xiàn)檢驗核這一過程的時間復(fù)雜度和計算量通常也相應(yīng)增大,為了進一步減小模型獲取的復(fù)雜性,本文在對狀態(tài)空間劃分后,通過引入主成分分析(Principal Component Analysis, PC A)方法,提出基于狀態(tài)空間劃分的TPSR模型獲取算法。該算法使用PCA方法對各個子狀態(tài)空間的經(jīng)歷-檢驗矩陣進行降維,直接利用降維后的矩陣獲取各個子狀態(tài)空間的TPSR模型,無需發(fā)現(xiàn)檢驗核,簡化了模型學(xué)習(xí)過程。實驗仿真結(jié)果表明了所提算法的有效性。
【學(xué)位授予單位】:廈門大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:N945.12
本文編號:2649992
【學(xué)位授予單位】:廈門大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:N945.12
【參考文獻】
相關(guān)期刊論文 前6條
1 楊基棟;;EM算法理論及其應(yīng)用[J];安慶師范學(xué)院學(xué)報(自然科學(xué)版);2009年04期
2 劉云龍;李人厚;;發(fā)現(xiàn)和學(xué)習(xí)不可復(fù)位動態(tài)系統(tǒng)的預(yù)測狀態(tài)表示的一種新算法[J];電子學(xué)報;2009年01期
3 劉云龍;吉國力;;預(yù)測狀態(tài)表示模型的復(fù)位算法[J];計算機學(xué)報;2012年05期
4 劉云龍;李人厚;劉建書;;基于PSR模型的規(guī)劃算法[J];控制與決策;2009年02期
5 王愛平;張功營;劉方;;EM算法研究與應(yīng)用[J];計算機技術(shù)與發(fā)展;2009年09期
6 劉云龍;李人厚;劉建書;;基于預(yù)測狀態(tài)表示的Q學(xué)習(xí)算法[J];西安交通大學(xué)學(xué)報;2008年12期
,本文編號:2649992
本文鏈接:http://sikaile.net/projectlw/xtxlw/2649992.html
最近更新
教材專著