強化學習在用戶學習中的應用研究
發(fā)布時間:2022-02-14 05:11
當用戶每次上網(wǎng)檢索網(wǎng)頁時,他訪問的這些網(wǎng)頁都是與某些特定的主題有關(guān)的。目前大多數(shù)搜索引擎都對用戶的興趣不敏感。一個改良的用戶界面應該根據(jù)用戶描述排序所有的檢索結(jié)果。另外,搜索引擎每次根據(jù)用戶當前輸入的幾個關(guān)鍵詞檢索到的信息常常偏離用戶的實際需要;能否快速準確地學習用戶,掌握用戶的興趣需求在特定領(lǐng)域的搜索引擎中變得尤為重要,它直接關(guān)系到用戶對該檢索工具的信賴程度。從而,一種采用高效的學習用戶興趣的學習算法的軟件在特定領(lǐng)域的檢索引擎中變得越來越重要。由于這些基本問題以及對特定領(lǐng)域的信息學習的需要,本文以強化學習的時間差分法和向量表示為基礎,提出了一種高效的學習用戶興趣的策略,并設計了一個學習用戶興趣的用戶界面。該策略的主要特點是,使用向量表示用戶模型和文檔信息,從宏觀和微觀角度分析學習模型和強化學習的映射關(guān)系,并采用了跟蹤用戶的隱式反饋學習和包含輸入和選擇J勝的顯式反饋學習方法,向量的歸一化處理,以及結(jié)合面向用戶興趣學習的實際問題對問題相關(guān)的幾個算法作了擴充。最后我們做了一個的實驗,結(jié)果發(fā)現(xiàn):在使用木論文的學習策略學習用戶興趣后,得到的用戶模型在整體性、精確性和逼近目標的速度L<...
【文章來源】:太原理工大學山西省211工程院校
【文章頁數(shù)】:73 頁
【學位級別】:碩士
【文章目錄】:
第一章 緒論
1.1 個性化,學習用戶研究的必要性
1.2 論文研究的內(nèi)容和組織
第二章 強化學習概述
2.1 強化學習的概念及其相關(guān)內(nèi)容
2.2 強化學習的應用--典型的系統(tǒng)介紹
2.2.1 backgammon
2.2.2 WAIR
2.2.3 Webwatcher
第三章 相關(guān)的理論與技術(shù)
3.1 AGENT的概念及其基本特征
3.2 KQML
3.3 文檔的向量模型及其更新策略
第四章 用戶AGENT系統(tǒng)模型
4.1 基于多AGENT的PSBA系統(tǒng)構(gòu)架
4.2 文檔的向量描述
4.3 用戶模型
4.4 強化學習與學習模型的映射
4.4.1 宏觀的映射
4.4.2 微觀的映射
第五章 用戶AGENT的實現(xiàn)
5.1 用戶界面的設計
5.2 用戶模型
5.3 文檔向量類及其文檔向量表示的實現(xiàn)
5.4 用戶學習評估算法實現(xiàn)
5.5 文檔與用戶模型的匹配度計算
5.6 與其他AGENT通信的實現(xiàn)
第六章 試驗結(jié)果
6.1 實驗的設置
6.2 試驗結(jié)果
第七章 結(jié)束語
附錄1
附錄2
致謝
參考文獻
【參考文獻】:
期刊論文
[1]智能網(wǎng)站Agents的研究[J]. 殷信義,劉錦高,吳添華,何煒麗,Mohammed. 計算機應用研究. 2002(01)
[2]提高強化學習速度的方法研究[J]. 張汝波. 計算機工程與應用. 2001(22)
[3]一種基于強化學習的學習Agent[J]. 李寧,高陽,陸鑫,陳世福. 計算機研究與發(fā)展. 2001(09)
[4]一個個性化的信息搜集Agent的設計與實現(xiàn)[J]. 潘金貴,胡學聯(lián),李俊,張靈玲. 軟件學報. 2001(07)
[5]基于Markov對策的多Agent強化學習模型及算法研究[J]. 高陽,周志華,何佳洲,陳世福. 計算機研究與發(fā)展. 2000(03)
[6]面向Internet的個性化智能信息檢索[J]. 汪曉巖,胡慶生,李斌,莊鎮(zhèn)泉. 計算機研究與發(fā)展. 1999(09)
本文編號:3624228
【文章來源】:太原理工大學山西省211工程院校
【文章頁數(shù)】:73 頁
【學位級別】:碩士
【文章目錄】:
第一章 緒論
1.1 個性化,學習用戶研究的必要性
1.2 論文研究的內(nèi)容和組織
第二章 強化學習概述
2.1 強化學習的概念及其相關(guān)內(nèi)容
2.2 強化學習的應用--典型的系統(tǒng)介紹
2.2.1 backgammon
2.2.2 WAIR
2.2.3 Webwatcher
第三章 相關(guān)的理論與技術(shù)
3.1 AGENT的概念及其基本特征
3.2 KQML
3.3 文檔的向量模型及其更新策略
第四章 用戶AGENT系統(tǒng)模型
4.1 基于多AGENT的PSBA系統(tǒng)構(gòu)架
4.2 文檔的向量描述
4.3 用戶模型
4.4 強化學習與學習模型的映射
4.4.1 宏觀的映射
4.4.2 微觀的映射
第五章 用戶AGENT的實現(xiàn)
5.1 用戶界面的設計
5.2 用戶模型
5.3 文檔向量類及其文檔向量表示的實現(xiàn)
5.4 用戶學習評估算法實現(xiàn)
5.5 文檔與用戶模型的匹配度計算
5.6 與其他AGENT通信的實現(xiàn)
第六章 試驗結(jié)果
6.1 實驗的設置
6.2 試驗結(jié)果
第七章 結(jié)束語
附錄1
附錄2
致謝
參考文獻
【參考文獻】:
期刊論文
[1]智能網(wǎng)站Agents的研究[J]. 殷信義,劉錦高,吳添華,何煒麗,Mohammed. 計算機應用研究. 2002(01)
[2]提高強化學習速度的方法研究[J]. 張汝波. 計算機工程與應用. 2001(22)
[3]一種基于強化學習的學習Agent[J]. 李寧,高陽,陸鑫,陳世福. 計算機研究與發(fā)展. 2001(09)
[4]一個個性化的信息搜集Agent的設計與實現(xiàn)[J]. 潘金貴,胡學聯(lián),李俊,張靈玲. 軟件學報. 2001(07)
[5]基于Markov對策的多Agent強化學習模型及算法研究[J]. 高陽,周志華,何佳洲,陳世福. 計算機研究與發(fā)展. 2000(03)
[6]面向Internet的個性化智能信息檢索[J]. 汪曉巖,胡慶生,李斌,莊鎮(zhèn)泉. 計算機研究與發(fā)展. 1999(09)
本文編號:3624228
本文鏈接:http://sikaile.net/jiaoyulunwen/jiaoyutizhilunwen/3624228.html
最近更新
教材專著