基于平臺無關(guān)強化學(xué)習(xí)的自適應(yīng)流媒體傳輸研究
發(fā)布時間:2021-04-20 16:20
隨著互聯(lián)網(wǎng)產(chǎn)業(yè)的飛速發(fā)展和網(wǎng)絡(luò)帶寬的不斷提升,流媒體服務(wù)越來越受到互聯(lián)網(wǎng)用戶的歡迎,如何使得用戶群體獲得更好的服務(wù)是流媒體技術(shù)的發(fā)展目標。由于網(wǎng)絡(luò)可用帶寬受限或不穩(wěn)定,流媒體的下載與播放過程中需要根據(jù)網(wǎng)絡(luò)環(huán)境和用戶本身的需求進行自適應(yīng)控制,以保證用戶能夠獲得最大的體驗質(zhì)量(Quality of Experience,QoE)。本文研究基于HTTP動態(tài)自適應(yīng)流媒體技術(shù),采用深度強化學(xué)習(xí)的方法優(yōu)化QoE問題。本文的貢獻主要包括:(1)綜合考慮了流媒體切片質(zhì)量、碼率切換平穩(wěn)度和中斷時間的影響構(gòu)建QoE問題模型,針對現(xiàn)有研究中基于網(wǎng)絡(luò)可用帶寬預(yù)測方法的缺陷,本文采用深度強化學(xué)習(xí)的方法規(guī)避了帶寬預(yù)測不準確的問題,兼顧了當前碼率選擇策略對未來的影響,獲得長時間段內(nèi)最優(yōu)的碼率選擇策略。(2)考慮了在CDN與P2P混合網(wǎng)絡(luò)結(jié)構(gòu)作為流媒體服務(wù)器的場景,針對該場景下客戶端與多個服務(wù)器之間QoE的優(yōu)化問題建模進行了改進,兼顧了客戶端在多個節(jié)點服務(wù)器之間切換造成的時延。(3)考慮了深度神經(jīng)網(wǎng)絡(luò)在計算和存儲資源受限的客戶端部署問題,研究了深度神經(jīng)網(wǎng)絡(luò)剪枝技術(shù),提出了一種權(quán)重冗余度近似計算方法,在保證輸出準確率的...
【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
縮略語和術(shù)語
第一章 緒論
1.1. 研究背景
1.2. 研究現(xiàn)狀
1.2.1. DASH流媒體傳輸自適應(yīng)碼率算法
1.2.2. 客戶端資源受限場景下神經(jīng)網(wǎng)絡(luò)的壓縮
1.2.3. 研究現(xiàn)狀小結(jié)
1.3. 本文研究內(nèi)容與成果
1.4. 本文章節(jié)安排
第二章 基于強化學(xué)習(xí)的自適應(yīng)流媒體傳輸
2.1. 自適應(yīng)流媒體傳輸問題模型
2.1.1. 流媒體播放系統(tǒng)模型
2.1.2. QoE問題的定義
2.2. 利用深度強化學(xué)習(xí)優(yōu)化QOE
2.2.1. 深度強化學(xué)習(xí)算法
2.2.2. 基于A3C的 QoE的優(yōu)化算法
2.2.3. 對多種碼率支持的改進
2.3. 本章小結(jié)
第三章 多服務(wù)器環(huán)境下的流媒體自適應(yīng)傳輸
3.1. CDN與 P2P結(jié)構(gòu)下的自適應(yīng)流媒體傳輸模型
3.1.1. CDN結(jié)構(gòu)
3.1.2. P2P結(jié)構(gòu)
3.1.3. CDN與 P2P混合的結(jié)構(gòu)
3.1.4. CDN與 P2P混合網(wǎng)絡(luò)結(jié)構(gòu)下的客戶端
3.2. CDN與 P2P結(jié)構(gòu)下的自適應(yīng)流媒體傳輸
3.3. 本章小結(jié)
第四章 神經(jīng)網(wǎng)絡(luò)剪枝
4.1. 問題模型
4.1.1. 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
4.1.2. 剪枝策略
4.1.3. 權(quán)重剪枝計算模型
4.2. 基于強化學(xué)習(xí)的自動化剪枝
4.2.1. DDPG算法
4.2.2. 壓縮率策略的訓(xùn)練
4.3. 權(quán)重冗余度近似計算
4.4. 本章小結(jié)
第五章 流媒體播放的系統(tǒng)實現(xiàn)與實驗結(jié)果
5.1. 系統(tǒng)結(jié)構(gòu)與實現(xiàn)
5.1.1. 平臺無關(guān)
5.1.2. 服務(wù)器設(shè)置
5.1.3. 客戶端設(shè)置
5.2. 神經(jīng)網(wǎng)絡(luò)剪枝實驗結(jié)果
5.2.1. 參數(shù)設(shè)置
5.2.2. 模型準確率與壓縮率
5.2.3. 加速實驗結(jié)果
5.3.單服務(wù)器場景的實驗
5.3.1. 仿真網(wǎng)絡(luò)帶寬狀態(tài)下的對比
5.3.2. 真實采樣網(wǎng)絡(luò)帶寬狀態(tài)下對比
5.4.真實環(huán)境中多服務(wù)器場景的實驗
5.5. 本章總結(jié)
第六章 總結(jié)與展望
6.1. 研究成果總結(jié)
6.2. 研究成果的局限性與展望
致謝
參考文獻
作者簡介
【參考文獻】:
期刊論文
[1]流媒體分發(fā)系統(tǒng)關(guān)鍵技術(shù)綜述[J]. 楊戈,廖建新,朱曉民,樊秀梅. 電子學(xué)報. 2009(01)
博士論文
[1]P2P流媒體內(nèi)容分發(fā)與服務(wù)關(guān)鍵技術(shù)研究[D]. 吳杰.復(fù)旦大學(xué) 2008
本文編號:3150009
【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
縮略語和術(shù)語
第一章 緒論
1.1. 研究背景
1.2. 研究現(xiàn)狀
1.2.1. DASH流媒體傳輸自適應(yīng)碼率算法
1.2.2. 客戶端資源受限場景下神經(jīng)網(wǎng)絡(luò)的壓縮
1.2.3. 研究現(xiàn)狀小結(jié)
1.3. 本文研究內(nèi)容與成果
1.4. 本文章節(jié)安排
第二章 基于強化學(xué)習(xí)的自適應(yīng)流媒體傳輸
2.1. 自適應(yīng)流媒體傳輸問題模型
2.1.1. 流媒體播放系統(tǒng)模型
2.1.2. QoE問題的定義
2.2. 利用深度強化學(xué)習(xí)優(yōu)化QOE
2.2.1. 深度強化學(xué)習(xí)算法
2.2.2. 基于A3C的 QoE的優(yōu)化算法
2.2.3. 對多種碼率支持的改進
2.3. 本章小結(jié)
第三章 多服務(wù)器環(huán)境下的流媒體自適應(yīng)傳輸
3.1. CDN與 P2P結(jié)構(gòu)下的自適應(yīng)流媒體傳輸模型
3.1.1. CDN結(jié)構(gòu)
3.1.2. P2P結(jié)構(gòu)
3.1.3. CDN與 P2P混合的結(jié)構(gòu)
3.1.4. CDN與 P2P混合網(wǎng)絡(luò)結(jié)構(gòu)下的客戶端
3.2. CDN與 P2P結(jié)構(gòu)下的自適應(yīng)流媒體傳輸
3.3. 本章小結(jié)
第四章 神經(jīng)網(wǎng)絡(luò)剪枝
4.1. 問題模型
4.1.1. 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
4.1.2. 剪枝策略
4.1.3. 權(quán)重剪枝計算模型
4.2. 基于強化學(xué)習(xí)的自動化剪枝
4.2.1. DDPG算法
4.2.2. 壓縮率策略的訓(xùn)練
4.3. 權(quán)重冗余度近似計算
4.4. 本章小結(jié)
第五章 流媒體播放的系統(tǒng)實現(xiàn)與實驗結(jié)果
5.1. 系統(tǒng)結(jié)構(gòu)與實現(xiàn)
5.1.1. 平臺無關(guān)
5.1.2. 服務(wù)器設(shè)置
5.1.3. 客戶端設(shè)置
5.2. 神經(jīng)網(wǎng)絡(luò)剪枝實驗結(jié)果
5.2.1. 參數(shù)設(shè)置
5.2.2. 模型準確率與壓縮率
5.2.3. 加速實驗結(jié)果
5.3.單服務(wù)器場景的實驗
5.3.1. 仿真網(wǎng)絡(luò)帶寬狀態(tài)下的對比
5.3.2. 真實采樣網(wǎng)絡(luò)帶寬狀態(tài)下對比
5.4.真實環(huán)境中多服務(wù)器場景的實驗
5.5. 本章總結(jié)
第六章 總結(jié)與展望
6.1. 研究成果總結(jié)
6.2. 研究成果的局限性與展望
致謝
參考文獻
作者簡介
【參考文獻】:
期刊論文
[1]流媒體分發(fā)系統(tǒng)關(guān)鍵技術(shù)綜述[J]. 楊戈,廖建新,朱曉民,樊秀梅. 電子學(xué)報. 2009(01)
博士論文
[1]P2P流媒體內(nèi)容分發(fā)與服務(wù)關(guān)鍵技術(shù)研究[D]. 吳杰.復(fù)旦大學(xué) 2008
本文編號:3150009
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3150009.html
最近更新
教材專著