基于深度強化學(xué)習(xí)的智能教室控制模型設(shè)計與實現(xiàn)
發(fā)布時間:2023-05-08 02:34
近年來,隨著物聯(lián)網(wǎng)相關(guān)技術(shù)的不斷發(fā)展,智能教室,作為物聯(lián)網(wǎng)技術(shù)重要應(yīng)用之一,得到了學(xué)術(shù)界和產(chǎn)業(yè)界的廣泛關(guān)注。不斷進(jìn)步的智能教室相關(guān)產(chǎn)品,給教室的布置、控制和使用帶來了很大的便利,吸引很多高校開始建設(shè)智能教室項目。在使用中發(fā)現(xiàn),隨著設(shè)備控制的集中化、遠(yuǎn)程化,教室內(nèi)設(shè)備依然需要使用者根據(jù)親身的感受進(jìn)行手動的控制。智能教室控制的核心,即對室內(nèi)設(shè)備的智能化控制,要有效應(yīng)對教室內(nèi)環(huán)境的多變問題、設(shè)備多樣化問題、用戶行為習(xí)慣等多種挑戰(zhàn)。為了解決智能教室控制的難題,本研究首先通過智能教室數(shù)據(jù)收集系統(tǒng)采集目標(biāo)的環(huán)境數(shù)據(jù),并結(jié)合高校數(shù)據(jù)庫相關(guān)信息,對數(shù)據(jù)進(jìn)行預(yù)處理及分析,形成結(jié)構(gòu)化的教室原始數(shù)據(jù)集;谠紨(shù)據(jù)集,本文提出了利用深度強化學(xué)習(xí)(Deep Reinforcement Learning,DRL)解決智能教室控制問題。借助強化學(xué)習(xí)平臺及深度學(xué)習(xí)框架,綜合多種智能教室環(huán)境參數(shù),利用深度Q網(wǎng)絡(luò)算法(Deep Q-Learning,DQN)的訓(xùn)練方式對智能教室控制模型進(jìn)行訓(xùn)練。完成訓(xùn)練的模型能夠根據(jù)當(dāng)前教室的各項環(huán)境參數(shù),結(jié)合教室當(dāng)前狀態(tài),對教室內(nèi)的設(shè)備進(jìn)行有效控制,繼而起到智能化控制教室設(shè)備,優(yōu)化室...
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 課題研究背景及意義
1.2 智能教室國內(nèi)外現(xiàn)狀
1.3 課題研究目標(biāo)及內(nèi)容
1.4 論文組織結(jié)構(gòu)
1.5 本章小結(jié)
2 相關(guān)技術(shù)介紹
2.1 智能教室簡介
2.2 數(shù)據(jù)存儲技術(shù)
2.2.1 MySQL數(shù)據(jù)庫
2.2.2 數(shù)據(jù)庫性能優(yōu)化技術(shù)
2.3 深度學(xué)習(xí)
2.4 強化學(xué)習(xí)
2.4.1 馬爾科夫決策過程
2.4.2 Q-Learning算法
2.5 深度強化學(xué)習(xí)
2.6 開源深度學(xué)習(xí)框架Tensorflow
2.7 OpenAI Gym平臺
2.8 本章小結(jié)
3 智能教室控制系統(tǒng)結(jié)構(gòu)
3.1 智能教室控制系統(tǒng)總體架構(gòu)
3.2 智能教室數(shù)據(jù)收集及控制系統(tǒng)
3.3 本章小結(jié)
4 智能教室數(shù)據(jù)存儲與預(yù)處理
4.1 數(shù)據(jù)收集
4.2 數(shù)據(jù)存儲
4.3 數(shù)據(jù)預(yù)處理
4.3.1 數(shù)據(jù)預(yù)處理技術(shù)
4.3.2 異源數(shù)據(jù)預(yù)處理
4.4 針對DQN的數(shù)據(jù)再處理
4.5 數(shù)據(jù)集分析
4.6 使用者環(huán)境感受分析
4.7 本章小結(jié)
5 基于DQN的智能教室控制模型研究
5.1 問題建模
5.1.1 狀態(tài)建模
5.1.2 動作空間建模
5.1.3 回報建模
5.2 基于深度強化學(xué)習(xí)的模型訓(xùn)練過程設(shè)計
5.3 基于DQN的智能教室控制模型預(yù)訓(xùn)練
5.3.1 算法流程
5.3.2 網(wǎng)絡(luò)結(jié)構(gòu)
5.4 基于DQN的智能教室控制模型再訓(xùn)練
5.4.1 模型遷移
5.4.2 算法流程
5.5 本章小結(jié)
6 實驗結(jié)果及分析
6.1 實驗環(huán)境及部署
6.2 實驗設(shè)計
6.3 實驗結(jié)果
6.4 實驗結(jié)果分析
6.5 與其他控制方法的表現(xiàn)對比
6.6 本章小結(jié)
7 總結(jié)與展望
7.1 總結(jié)
7.2 工作展望
參考文獻(xiàn)
攻讀碩士期間發(fā)表的論文
致謝
本文編號:3811810
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 課題研究背景及意義
1.2 智能教室國內(nèi)外現(xiàn)狀
1.3 課題研究目標(biāo)及內(nèi)容
1.4 論文組織結(jié)構(gòu)
1.5 本章小結(jié)
2 相關(guān)技術(shù)介紹
2.1 智能教室簡介
2.2 數(shù)據(jù)存儲技術(shù)
2.2.1 MySQL數(shù)據(jù)庫
2.2.2 數(shù)據(jù)庫性能優(yōu)化技術(shù)
2.3 深度學(xué)習(xí)
2.4 強化學(xué)習(xí)
2.4.1 馬爾科夫決策過程
2.4.2 Q-Learning算法
2.5 深度強化學(xué)習(xí)
2.6 開源深度學(xué)習(xí)框架Tensorflow
2.7 OpenAI Gym平臺
2.8 本章小結(jié)
3 智能教室控制系統(tǒng)結(jié)構(gòu)
3.1 智能教室控制系統(tǒng)總體架構(gòu)
3.2 智能教室數(shù)據(jù)收集及控制系統(tǒng)
3.3 本章小結(jié)
4 智能教室數(shù)據(jù)存儲與預(yù)處理
4.1 數(shù)據(jù)收集
4.2 數(shù)據(jù)存儲
4.3 數(shù)據(jù)預(yù)處理
4.3.1 數(shù)據(jù)預(yù)處理技術(shù)
4.3.2 異源數(shù)據(jù)預(yù)處理
4.4 針對DQN的數(shù)據(jù)再處理
4.5 數(shù)據(jù)集分析
4.6 使用者環(huán)境感受分析
4.7 本章小結(jié)
5 基于DQN的智能教室控制模型研究
5.1 問題建模
5.1.1 狀態(tài)建模
5.1.2 動作空間建模
5.1.3 回報建模
5.2 基于深度強化學(xué)習(xí)的模型訓(xùn)練過程設(shè)計
5.3 基于DQN的智能教室控制模型預(yù)訓(xùn)練
5.3.1 算法流程
5.3.2 網(wǎng)絡(luò)結(jié)構(gòu)
5.4 基于DQN的智能教室控制模型再訓(xùn)練
5.4.1 模型遷移
5.4.2 算法流程
5.5 本章小結(jié)
6 實驗結(jié)果及分析
6.1 實驗環(huán)境及部署
6.2 實驗設(shè)計
6.3 實驗結(jié)果
6.4 實驗結(jié)果分析
6.5 與其他控制方法的表現(xiàn)對比
6.6 本章小結(jié)
7 總結(jié)與展望
7.1 總結(jié)
7.2 工作展望
參考文獻(xiàn)
攻讀碩士期間發(fā)表的論文
致謝
本文編號:3811810
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3811810.html
最近更新
教材專著