片段平穩(wěn)的多擺臂決策問(wèn)題中改進(jìn)的偏移檢測(cè)框架
發(fā)布時(shí)間:2021-02-18 05:25
在研究序列決策的問(wèn)題中,多擺臂決策算法(MAB)是常用的方法之一,旨在極小化累計(jì)遺憾(regret)的條件下,做出最優(yōu)的選擇。在不平穩(wěn)的數(shù)據(jù)流中,潛在的偏移會(huì)增加決策方案的探索成本。故本文主要研究在非平穩(wěn)場(chǎng)景下,如何有效的檢測(cè)偏移,降低其對(duì)決策結(jié)果的非預(yù)期影響,從而控制累計(jì)遺憾的上界。已有的研究中描述了在非平穩(wěn)場(chǎng)景下序列數(shù)據(jù)的統(tǒng)計(jì)特征,例如分段常數(shù)均值。但是在實(shí)際情況下,數(shù)據(jù)分布的變化不只局限于此。本文首次在MAB問(wèn)題中討論了兩個(gè)新的變化(1)連續(xù)且分段線性均值(2)分段常數(shù)方差和分段常數(shù)均值。本文主要利用統(tǒng)計(jì)學(xué)習(xí)理論中模型評(píng)估與選擇的界定方法和收斂性質(zhì)去完成自適應(yīng)的概念偏移檢測(cè)任務(wù),進(jìn)而提出了新的偏移檢測(cè)算法:基于SVM估計(jì)器計(jì)算樣本損失(sigmoid損失或分段線性損失),利用樣本損失檢驗(yàn)局部數(shù)據(jù)間的趨勢(shì)偏移,從而實(shí)現(xiàn)較優(yōu)的累計(jì)遺憾。另外,考慮在離群值存在的情況下,許多傳統(tǒng)的識(shí)別變點(diǎn)的檢測(cè)方法效果不佳甚至失效。通常,傳統(tǒng)方法會(huì)把這些離群值錯(cuò)判為變點(diǎn)來(lái)完成檢測(cè)任務(wù)。為了克服這個(gè)問(wèn)題,本文著重于區(qū)分離群點(diǎn)和變點(diǎn)(或趨勢(shì)偏移)兩者之間的區(qū)別。針對(duì)異常值的存在,本文提出了兩種新的算法:基于...
【文章來(lái)源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
主要符號(hào)對(duì)照表
第一章 引言
§1.1 MAB問(wèn)題背景
§1.2 片段平穩(wěn)的MAB問(wèn)題
§1.3 存在噪音擾動(dòng)的MAB問(wèn)題
§1.4 伴自適應(yīng)偏移檢測(cè)的MAB算法
§1.5 針對(duì)有異常值存在的MAB算法
§1.6 文獻(xiàn)綜述
§1.7 本文主要的貢獻(xiàn)
第二章 基礎(chǔ)知識(shí)
§2.1 MAB中的基本設(shè)定
§2.2 片段平穩(wěn)環(huán)境
§2.3 自適應(yīng)概念偏移檢測(cè)
§2.4 存在異常值的變點(diǎn)檢測(cè)方法
第三章 改進(jìn)的MAB算法框架
§3.1 AD-UCB算法框架
§3.2 存在異常值的CPD算法框架
§3.2.1 伴截?cái)鄵p失函數(shù)的CD-UCB
§3.2.2 伴偏移軌跡識(shí)別的CD-UCB
第四章 改進(jìn)的MAB算法性能分析
§4.1 自適應(yīng)概念偏移檢測(cè)
§4.2 存在異常值的檢測(cè)算法
第五章 實(shí)驗(yàn)結(jié)果
§5.1 自適應(yīng)的概念偏移檢測(cè)
§5.1.1 模擬實(shí)驗(yàn)
§5.1.2 真實(shí)數(shù)據(jù)實(shí)驗(yàn)
§5.2 存在異常值的變點(diǎn)檢測(cè)
§5.2.1 模擬實(shí)驗(yàn)一
§5.2.2 模擬實(shí)驗(yàn)二
§5.2.3 真實(shí)數(shù)據(jù)實(shí)驗(yàn)
第六章 結(jié)論
附錄A 相關(guān)數(shù)學(xué)公式和證明
§A.1 定理 4.1.1 分步證明
§A.1.1 引理 4.1.2
§A.1.2 引理 4.1.3
§A.1.3 引理 4.1.4
§A.1.4 引理 4.1.5
§A.1.5 定理 4.1.1
§A.2 定理 4.2.1 分步證明
§A.2.1 引理 4.2.2
§A.2.2 引理 4.2.3
§A.2.3 引理 4.2.4
§A.2.4 引理 4.2.5
§A.2.5 定理 4.2.1
參考文獻(xiàn)
致謝
本文編號(hào):3039098
【文章來(lái)源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
主要符號(hào)對(duì)照表
第一章 引言
§1.1 MAB問(wèn)題背景
§1.2 片段平穩(wěn)的MAB問(wèn)題
§1.3 存在噪音擾動(dòng)的MAB問(wèn)題
§1.4 伴自適應(yīng)偏移檢測(cè)的MAB算法
§1.5 針對(duì)有異常值存在的MAB算法
§1.6 文獻(xiàn)綜述
§1.7 本文主要的貢獻(xiàn)
第二章 基礎(chǔ)知識(shí)
§2.1 MAB中的基本設(shè)定
§2.2 片段平穩(wěn)環(huán)境
§2.3 自適應(yīng)概念偏移檢測(cè)
§2.4 存在異常值的變點(diǎn)檢測(cè)方法
第三章 改進(jìn)的MAB算法框架
§3.1 AD-UCB算法框架
§3.2 存在異常值的CPD算法框架
§3.2.1 伴截?cái)鄵p失函數(shù)的CD-UCB
§3.2.2 伴偏移軌跡識(shí)別的CD-UCB
第四章 改進(jìn)的MAB算法性能分析
§4.1 自適應(yīng)概念偏移檢測(cè)
§4.2 存在異常值的檢測(cè)算法
第五章 實(shí)驗(yàn)結(jié)果
§5.1 自適應(yīng)的概念偏移檢測(cè)
§5.1.1 模擬實(shí)驗(yàn)
§5.1.2 真實(shí)數(shù)據(jù)實(shí)驗(yàn)
§5.2 存在異常值的變點(diǎn)檢測(cè)
§5.2.1 模擬實(shí)驗(yàn)一
§5.2.2 模擬實(shí)驗(yàn)二
§5.2.3 真實(shí)數(shù)據(jù)實(shí)驗(yàn)
第六章 結(jié)論
附錄A 相關(guān)數(shù)學(xué)公式和證明
§A.1 定理 4.1.1 分步證明
§A.1.1 引理 4.1.2
§A.1.2 引理 4.1.3
§A.1.3 引理 4.1.4
§A.1.4 引理 4.1.5
§A.1.5 定理 4.1.1
§A.2 定理 4.2.1 分步證明
§A.2.1 引理 4.2.2
§A.2.2 引理 4.2.3
§A.2.3 引理 4.2.4
§A.2.4 引理 4.2.5
§A.2.5 定理 4.2.1
參考文獻(xiàn)
致謝
本文編號(hào):3039098
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3039098.html
最近更新
教材專著