個性化網(wǎng)絡(luò)信息檢索系統(tǒng)的研究與實現(xiàn)
發(fā)布時間:2020-12-30 20:05
提出了一種個性化網(wǎng)絡(luò)信息檢索系統(tǒng)(Personalized Internet Information Retrieval System,以下簡稱PIIRS),將網(wǎng)絡(luò)信息查詢與收集有機(jī)結(jié)合起來,建立面向用戶興趣的新型信息服務(wù)系統(tǒng)。PIIRS系統(tǒng)實現(xiàn)自動識別用戶興趣,自動生成用戶角色模型,幫助用戶生成檢索請求,向用戶推送信息等。同時,系統(tǒng)能根據(jù)用戶興趣模型判斷返回結(jié)果和用戶興趣的匹配程度,并且實現(xiàn)全文提供功能。 論文分三個部分,共十一章。第一部分(第一章和第二章)為總論,首先論述了因特網(wǎng)信息資源開發(fā)利用的現(xiàn)狀,分析了其中存在問題(第一章)。在此基礎(chǔ)上分析了個性化信息檢索的業(yè)務(wù)流程,給出了PIIRS系統(tǒng)的設(shè)計思想和原則,提出了PIIRS系統(tǒng)的整體結(jié)構(gòu),并對可行性進(jìn)行了分析。第二部分(第三章至第六章)為關(guān)鍵技術(shù)研究,對用戶建模技術(shù)、機(jī)器學(xué)習(xí)、搜索引擎技術(shù)、智能代理技術(shù)、WEB網(wǎng)頁識別技術(shù)、信息過濾技術(shù)、數(shù)據(jù)挖掘技術(shù)、人機(jī)交互技術(shù)等相關(guān)技術(shù)進(jìn)行研究和分析。第三部分(第七章至第十一章)為具體實現(xiàn)部分,詳細(xì)地介紹了PIIRS系統(tǒng)的五個子系統(tǒng)的結(jié)構(gòu)與技術(shù)實現(xiàn),五個子系統(tǒng)分別為:用戶需求與興趣描述...
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院文獻(xiàn)情報中心)北京市
【文章頁數(shù)】:153 頁
【學(xué)位級別】:博士
【文章目錄】:
第一章 研究背景
第一節(jié) 因特網(wǎng)信息資源
一、 因特網(wǎng)的興起與發(fā)展
二、 因特網(wǎng)信息資源的現(xiàn)狀
第二節(jié) 因特網(wǎng)信息的獲取方式及存在的問題
一、 傳統(tǒng)的網(wǎng)絡(luò)信息檢索工具
二、 瀏覽器方式
三、 搜索引擎
四、 新興的網(wǎng)上智能檢索系統(tǒng)
第二章 個性化網(wǎng)絡(luò)信息檢索系統(tǒng)的分析與設(shè)計
第一節(jié) 個性化網(wǎng)絡(luò)信息檢索系統(tǒng)的目標(biāo)與意義
一、 個性化網(wǎng)絡(luò)信息檢索系統(tǒng)的目標(biāo)
二、 個性化網(wǎng)絡(luò)信息檢索系統(tǒng)的研究意義
第二節(jié) 個性化網(wǎng)絡(luò)信息檢索系統(tǒng)的分析與設(shè)計
一、 系統(tǒng)需求分析與業(yè)務(wù)流程
二、 PIIRS系統(tǒng)設(shè)計思想和原則
三、 PIIRS系統(tǒng)總體設(shè)計
四、 可行性分析
第三章 用戶建模技術(shù)
第一節(jié) 用戶興趣與信息需求
一、 獲得用戶興趣與信息需求的方式
二、 用戶興趣與信息需求分析
第二節(jié) 機(jī)器學(xué)習(xí)
一、 機(jī)器學(xué)習(xí)系統(tǒng)模型
二、 機(jī)器學(xué)習(xí)的方法
第三節(jié) 用戶模型
一、 相關(guān)性及用戶模型
二、 信息檢索中的用戶需求及用戶建模
三、 基于用戶模型的學(xué)習(xí)方法
第四章 因特網(wǎng)信息資源的發(fā)現(xiàn)和收集技術(shù)
第一節(jié) 搜索引擎
一、 搜索引擎及其構(gòu)成
二、 搜索引擎的主要技術(shù)
第二節(jié) 元搜索引擎
一、 元搜索引擎及其構(gòu)成
二、 元搜索引擎的主要技術(shù)
第三節(jié) 智能代理
一、 智能代理簡介
二、 智能代理技術(shù)
第四節(jié) WEB網(wǎng)頁識別
一、 Web文檔預(yù)處理
二、 文檔特征的提取
三、 文檔表示
第五章 因特網(wǎng)信息資源過濾技術(shù)與挖掘技術(shù)
第一節(jié) 信息過濾技術(shù)
一、 信息過濾的方法
二、 信息過濾算法
第二節(jié) 因特網(wǎng)信息資源的挖掘技術(shù)研究
一、 Web信息挖掘概述(Web Mining)
二、 網(wǎng)絡(luò)信息挖掘中的技術(shù)研究
第六章 人機(jī)交互技術(shù)
第一節(jié) 用戶界面
一、 用戶界面概述
二、 用戶界面技術(shù)應(yīng)用
第二節(jié) 自然語言理解
一、 自然語言理解概述
二、 自然語言理解的應(yīng)用
第三節(jié) 推拉技術(shù)(PUSH—PULL)
一、 信息推送模式
二、 信息拉取模式
三、 信息推拉模式
四、 智能信息推拉技術(shù)
第七章 用戶需求與興趣描述子系統(tǒng)的設(shè)計與實現(xiàn)
第一節(jié) 系統(tǒng)功能
一、 用戶界面
二、 知識庫
三、 查詢模塊
第二節(jié) 用戶建模的具體實現(xiàn)
一、 用戶模型設(shè)計
二、 主要模塊的框架設(shè)計
三、 數(shù)據(jù)結(jié)構(gòu)
四、 主要模塊的實現(xiàn)
第八章 信息采集子系統(tǒng)的設(shè)計與實現(xiàn)
第一節(jié) 系統(tǒng)功能
一、 URL初始化
二、 Web頁面的獲取
三、 頁面分析
四、 下載
五、 網(wǎng)頁信息的更新與維護(hù)
六、 搜索控制
第二節(jié) ROBOT引擎的技術(shù)實現(xiàn)
一、 Robot引擎流程
二、 Wininet API函數(shù)
三、 關(guān)鍵技術(shù)的實現(xiàn)
四、 主要界面
第九章 信息呈現(xiàn)與反饋子系統(tǒng)的設(shè)計與實現(xiàn)
第一節(jié) 系統(tǒng)功能
一、 結(jié)果顯示
二、 推送服務(wù)
三、 用戶反饋
四、 用戶潛在需求挖掘
五、 用戶行為監(jiān)測
第二節(jié) 信息呈現(xiàn)與反饋子系統(tǒng)的實現(xiàn)
一、 信息呈現(xiàn)與反饋子系統(tǒng)的構(gòu)成
二、 設(shè)計思想
三、 算法描述及主要函數(shù)
四、 結(jié)果顯示界面
五、 其他顯示界面
第三節(jié) 數(shù)據(jù)結(jié)構(gòu)
一、 筆記本設(shè)計
二、 用戶信息集合
三、 用戶行為
四、 用戶興趣相關(guān)度
五、 其他數(shù)據(jù)表
第十章 主題挖掘子系統(tǒng)的設(shè)計與實現(xiàn)
第一節(jié) 系統(tǒng)功能
一、 系統(tǒng)自動挖掘
二、 主題歸類
三、 文檔訓(xùn)練
第二節(jié) 主題挖掘功能
一、 預(yù)處理
二、 分詞
三、 文檔訓(xùn)練
第三節(jié) 數(shù)據(jù)結(jié)構(gòu)
第四節(jié) 文檔訓(xùn)練的技術(shù)實現(xiàn)
一、 文檔訓(xùn)練功能說明
二、 涉及的數(shù)據(jù)庫表
三、 主要界面
第十一章 管理和調(diào)度子系統(tǒng)的設(shè)計與實現(xiàn)
第一節(jié) 建立初始URL庫的目的
第二節(jié) 初始URL庫的結(jié)構(gòu)
第三節(jié) 網(wǎng)址分類體系
一、 按網(wǎng)絡(luò)資源類型分類的體系
二、 按內(nèi)容的分類體系
第四節(jié) 初始URL庫與各個模塊的關(guān)系
一、 與知識庫的關(guān)系
二、 與Robot的聯(lián)系
三、 與信息呈現(xiàn)與反饋模塊的聯(lián)系
第五節(jié) 模塊的主要函數(shù)
一、 GetURL()
二、 AddURL()
三、 DeleteURL()
結(jié)束語
參考文獻(xiàn)
發(fā)表論著目錄
致謝
【參考文獻(xiàn)】:
期刊論文
[1]Agent在智能信息檢索中的應(yīng)用研究[J]. 馮永杰,孟賓,翟玉慶. 計算機(jī)應(yīng)用研究. 2002(02)
[2]元搜索引擎及其主要技術(shù)[J]. 李廣建,黃崑. 情報科學(xué). 2002(02)
[3]面向內(nèi)容的信息服務(wù)研究[J]. 史田華,甘利人. 圖書情報工作. 2002(02)
[4]基于Web挖掘的智能門戶搜索引擎的研究[J]. 李巖,陳新中,楊炳儒. 計算機(jī)工程與應(yīng)用. 2002(04)
[5]智能網(wǎng)站Agents的研究[J]. 殷信義,劉錦高,吳添華,何煒麗,Mohammed. 計算機(jī)應(yīng)用研究. 2002(01)
[6]基于內(nèi)容的網(wǎng)頁特征提取[J]. 張義忠,趙明生,朱精南. 計算機(jī)工程與應(yīng)用. 2001(10)
[7]無詞典高頻字串快速提取和統(tǒng)計算法研究[J]. 韓客松,王永成,陳桂林. 中文信息學(xué)報. 2001(02)
[8]Web網(wǎng)頁識別算法研究[J]. 韓彬斌,王培康. 情報學(xué)報. 2001(01)
[9]HTML文檔的模糊檢索模型[J]. 丁永生,周斌,楊文春. 計算機(jī)工程與應(yīng)用. 2001(03)
[10]信息檢索向量空間模型中特征提取的研究[J]. 陶躍華,王錫鋼,王云愛. 云南師范大學(xué)學(xué)報(自然科學(xué)版). 2000(06)
本文編號:2948228
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院文獻(xiàn)情報中心)北京市
【文章頁數(shù)】:153 頁
【學(xué)位級別】:博士
【文章目錄】:
第一章 研究背景
第一節(jié) 因特網(wǎng)信息資源
一、 因特網(wǎng)的興起與發(fā)展
二、 因特網(wǎng)信息資源的現(xiàn)狀
第二節(jié) 因特網(wǎng)信息的獲取方式及存在的問題
一、 傳統(tǒng)的網(wǎng)絡(luò)信息檢索工具
二、 瀏覽器方式
三、 搜索引擎
四、 新興的網(wǎng)上智能檢索系統(tǒng)
第二章 個性化網(wǎng)絡(luò)信息檢索系統(tǒng)的分析與設(shè)計
第一節(jié) 個性化網(wǎng)絡(luò)信息檢索系統(tǒng)的目標(biāo)與意義
一、 個性化網(wǎng)絡(luò)信息檢索系統(tǒng)的目標(biāo)
二、 個性化網(wǎng)絡(luò)信息檢索系統(tǒng)的研究意義
第二節(jié) 個性化網(wǎng)絡(luò)信息檢索系統(tǒng)的分析與設(shè)計
一、 系統(tǒng)需求分析與業(yè)務(wù)流程
二、 PIIRS系統(tǒng)設(shè)計思想和原則
三、 PIIRS系統(tǒng)總體設(shè)計
四、 可行性分析
第三章 用戶建模技術(shù)
第一節(jié) 用戶興趣與信息需求
一、 獲得用戶興趣與信息需求的方式
二、 用戶興趣與信息需求分析
第二節(jié) 機(jī)器學(xué)習(xí)
一、 機(jī)器學(xué)習(xí)系統(tǒng)模型
二、 機(jī)器學(xué)習(xí)的方法
第三節(jié) 用戶模型
一、 相關(guān)性及用戶模型
二、 信息檢索中的用戶需求及用戶建模
三、 基于用戶模型的學(xué)習(xí)方法
第四章 因特網(wǎng)信息資源的發(fā)現(xiàn)和收集技術(shù)
第一節(jié) 搜索引擎
一、 搜索引擎及其構(gòu)成
二、 搜索引擎的主要技術(shù)
第二節(jié) 元搜索引擎
一、 元搜索引擎及其構(gòu)成
二、 元搜索引擎的主要技術(shù)
第三節(jié) 智能代理
一、 智能代理簡介
二、 智能代理技術(shù)
第四節(jié) WEB網(wǎng)頁識別
一、 Web文檔預(yù)處理
二、 文檔特征的提取
三、 文檔表示
第五章 因特網(wǎng)信息資源過濾技術(shù)與挖掘技術(shù)
第一節(jié) 信息過濾技術(shù)
一、 信息過濾的方法
二、 信息過濾算法
第二節(jié) 因特網(wǎng)信息資源的挖掘技術(shù)研究
一、 Web信息挖掘概述(Web Mining)
二、 網(wǎng)絡(luò)信息挖掘中的技術(shù)研究
第六章 人機(jī)交互技術(shù)
第一節(jié) 用戶界面
一、 用戶界面概述
二、 用戶界面技術(shù)應(yīng)用
第二節(jié) 自然語言理解
一、 自然語言理解概述
二、 自然語言理解的應(yīng)用
第三節(jié) 推拉技術(shù)(PUSH—PULL)
一、 信息推送模式
二、 信息拉取模式
三、 信息推拉模式
四、 智能信息推拉技術(shù)
第七章 用戶需求與興趣描述子系統(tǒng)的設(shè)計與實現(xiàn)
第一節(jié) 系統(tǒng)功能
一、 用戶界面
二、 知識庫
三、 查詢模塊
第二節(jié) 用戶建模的具體實現(xiàn)
一、 用戶模型設(shè)計
二、 主要模塊的框架設(shè)計
三、 數(shù)據(jù)結(jié)構(gòu)
四、 主要模塊的實現(xiàn)
第八章 信息采集子系統(tǒng)的設(shè)計與實現(xiàn)
第一節(jié) 系統(tǒng)功能
一、 URL初始化
二、 Web頁面的獲取
三、 頁面分析
四、 下載
五、 網(wǎng)頁信息的更新與維護(hù)
六、 搜索控制
第二節(jié) ROBOT引擎的技術(shù)實現(xiàn)
一、 Robot引擎流程
二、 Wininet API函數(shù)
三、 關(guān)鍵技術(shù)的實現(xiàn)
四、 主要界面
第九章 信息呈現(xiàn)與反饋子系統(tǒng)的設(shè)計與實現(xiàn)
第一節(jié) 系統(tǒng)功能
一、 結(jié)果顯示
二、 推送服務(wù)
三、 用戶反饋
四、 用戶潛在需求挖掘
五、 用戶行為監(jiān)測
第二節(jié) 信息呈現(xiàn)與反饋子系統(tǒng)的實現(xiàn)
一、 信息呈現(xiàn)與反饋子系統(tǒng)的構(gòu)成
二、 設(shè)計思想
三、 算法描述及主要函數(shù)
四、 結(jié)果顯示界面
五、 其他顯示界面
第三節(jié) 數(shù)據(jù)結(jié)構(gòu)
一、 筆記本設(shè)計
二、 用戶信息集合
三、 用戶行為
四、 用戶興趣相關(guān)度
五、 其他數(shù)據(jù)表
第十章 主題挖掘子系統(tǒng)的設(shè)計與實現(xiàn)
第一節(jié) 系統(tǒng)功能
一、 系統(tǒng)自動挖掘
二、 主題歸類
三、 文檔訓(xùn)練
第二節(jié) 主題挖掘功能
一、 預(yù)處理
二、 分詞
三、 文檔訓(xùn)練
第三節(jié) 數(shù)據(jù)結(jié)構(gòu)
第四節(jié) 文檔訓(xùn)練的技術(shù)實現(xiàn)
一、 文檔訓(xùn)練功能說明
二、 涉及的數(shù)據(jù)庫表
三、 主要界面
第十一章 管理和調(diào)度子系統(tǒng)的設(shè)計與實現(xiàn)
第一節(jié) 建立初始URL庫的目的
第二節(jié) 初始URL庫的結(jié)構(gòu)
第三節(jié) 網(wǎng)址分類體系
一、 按網(wǎng)絡(luò)資源類型分類的體系
二、 按內(nèi)容的分類體系
第四節(jié) 初始URL庫與各個模塊的關(guān)系
一、 與知識庫的關(guān)系
二、 與Robot的聯(lián)系
三、 與信息呈現(xiàn)與反饋模塊的聯(lián)系
第五節(jié) 模塊的主要函數(shù)
一、 GetURL()
二、 AddURL()
三、 DeleteURL()
結(jié)束語
參考文獻(xiàn)
發(fā)表論著目錄
致謝
【參考文獻(xiàn)】:
期刊論文
[1]Agent在智能信息檢索中的應(yīng)用研究[J]. 馮永杰,孟賓,翟玉慶. 計算機(jī)應(yīng)用研究. 2002(02)
[2]元搜索引擎及其主要技術(shù)[J]. 李廣建,黃崑. 情報科學(xué). 2002(02)
[3]面向內(nèi)容的信息服務(wù)研究[J]. 史田華,甘利人. 圖書情報工作. 2002(02)
[4]基于Web挖掘的智能門戶搜索引擎的研究[J]. 李巖,陳新中,楊炳儒. 計算機(jī)工程與應(yīng)用. 2002(04)
[5]智能網(wǎng)站Agents的研究[J]. 殷信義,劉錦高,吳添華,何煒麗,Mohammed. 計算機(jī)應(yīng)用研究. 2002(01)
[6]基于內(nèi)容的網(wǎng)頁特征提取[J]. 張義忠,趙明生,朱精南. 計算機(jī)工程與應(yīng)用. 2001(10)
[7]無詞典高頻字串快速提取和統(tǒng)計算法研究[J]. 韓客松,王永成,陳桂林. 中文信息學(xué)報. 2001(02)
[8]Web網(wǎng)頁識別算法研究[J]. 韓彬斌,王培康. 情報學(xué)報. 2001(01)
[9]HTML文檔的模糊檢索模型[J]. 丁永生,周斌,楊文春. 計算機(jī)工程與應(yīng)用. 2001(03)
[10]信息檢索向量空間模型中特征提取的研究[J]. 陶躍華,王錫鋼,王云愛. 云南師范大學(xué)學(xué)報(自然科學(xué)版). 2000(06)
本文編號:2948228
本文鏈接:http://sikaile.net/tushudanganlunwen/2948228.html
最近更新
教材專著