面向教育資源的智能搜索平臺的研究與應用
本文關(guān)鍵詞:面向教育資源的智能搜索平臺的研究與應用,由筆耕文化傳播整理發(fā)布。
【摘要】:本文以“基于云平臺的網(wǎng)絡影視在線教育培訓關(guān)鍵技術(shù)研究與應用”項目為背景,研究基于文本的教育資源智能搜索相關(guān)技術(shù),主要包括教育資源的搜索和教育資源的自動分類兩方面內(nèi)容。在搜索方面,本文重點對Solr搜索引擎的內(nèi)置評分規(guī)則進行了分析研究,針對不同檢索域權(quán)重相同造成標題和標簽較高的資源表征能力沒有被充分利用而使前排搜索結(jié)果準確率低的問題,賦予資源標題和標簽較高的域激勵因子來更新標準化因子,并利用標簽關(guān)鍵字的優(yōu)先級信息建立新的詞頻統(tǒng)計模型,有效改進了資源的綜合評分規(guī)則,提高了前排搜索結(jié)果的準確率。在分類方面,本文重點對基于文本的自動分類算法進行了研究改進,利用資源標題、簡介大綱和標簽中特征項詞頻的加權(quán)和構(gòu)造特征項詞頻過渡模型,利用標簽中特征項的位置信息建立重要度系數(shù),將兩者結(jié)合提出了一種新的文本量化模型,利用資源的文本量化結(jié)果初始化SVM分類算法訓練分類模型,實現(xiàn)了資源的多類分類,最終達到了整合資源類別結(jié)構(gòu)的目的。論文首先概述了搜索引擎、文本量化、特征選擇、文本分類算法等相關(guān)理論技術(shù)。其次,對面向教育資源的智能搜索平臺進行了整體設計,對平臺中基于Solr的垂直搜索引擎系統(tǒng)和基于SVM的資源自動分類系統(tǒng)的設計與實現(xiàn)進行了詳細闡述,對Solr搜索引擎技術(shù)、中文分詞技術(shù)和SVM的訓練過程進行了探索研究。再次,重點對基于關(guān)鍵字優(yōu)先級改進的Solr評分規(guī)則和基于向量空間模型改進的資源自動分類算法進行了詳細論述。然后,分別對系統(tǒng)的檢索和分類功能進行了實驗測試和結(jié)果分析。最后,對論文中的各項工作進行了總結(jié)。
【關(guān)鍵詞】:智能搜索 教育資源 評分規(guī)則 自動分類 TF-IDF
【學位授予單位】:北京理工大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP393.09
【目錄】:
- 摘要5-6
- Abstract6-10
- 第1章 緒論10-16
- 1.1 研究背景和目的10-11
- 1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢11-13
- 1.3 研究內(nèi)容13-14
- 1.4 本文組織結(jié)構(gòu)14-16
- 第2章 相關(guān)理論與技術(shù)16-22
- 2.1 搜索引擎16-17
- 2.2 文本自動分類17-21
- 2.2.1 文本量化19
- 2.2.2 特征選擇19-20
- 2.2.3 文本自動分類算法20-21
- 2.2.4 分類性能評估標準21
- 2.3 本章小結(jié)21-22
- 第3章 面向教育資源的智能搜索平臺設計與實現(xiàn)22-38
- 3.1 面向教育資源的智能搜索平臺設計22-24
- 3.2 基于Solr的垂直搜索引擎系統(tǒng)24-35
- 3.2.1 Solr搜索引擎研究24-28
- 3.2.2 中文分詞研究28-30
- 3.2.3 基于Solr的檢索系統(tǒng)設計30-32
- 3.2.4 基于Solr的檢索系統(tǒng)實現(xiàn)32-35
- 3.3 基于SVM的資源自動分類系統(tǒng)35-37
- 3.4 本章小結(jié)37-38
- 第4章 Solr評分規(guī)則和分類算法的改進38-46
- 4.1 基于關(guān)鍵字優(yōu)先級改進的搜索評分規(guī)則38-41
- 4.1.1 Solr評分公式研究38-39
- 4.1.2 Solr評分規(guī)則改進與實現(xiàn)39-41
- 4.2 基于向量空間模型改進的資源自動分類算法41-45
- 4.2.1 向量空間模型研究41-42
- 4.2.2 TF-IDF公式改進42-44
- 4.2.3 資源自動分類算法實現(xiàn)44-45
- 4.3 本章小結(jié)45-46
- 第5章 實驗結(jié)果及分析46-62
- 5.1 實驗數(shù)據(jù)集46-47
- 5.2 資源檢索實驗結(jié)果及分析47-52
- 5.2.1 評估標準47
- 5.2.2 運行效果47-49
- 5.2.3 結(jié)果對比49-52
- 5.3 資源自動分類實驗結(jié)果及分析52-61
- 5.3.1 評估標準52
- 5.3.2 對比算法和參數(shù)設定52-53
- 5.3.3 實驗結(jié)果與分析53-61
- 5.4 本章小結(jié)61-62
- 結(jié)論62-63
- 參考文獻63-67
- 攻讀學位期間發(fā)表論文與研究成果清單67-68
- 致謝68
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 侯大銀;;智能搜索:夢想照進現(xiàn)實[J];互聯(lián)網(wǎng)周刊;2009年03期
2 黃昆;;聰明萬事通,智能搜索引路[J];中國計算機用戶;2006年47期
3 ;智能搜索:學習型組織的推動力[J];計算機與網(wǎng)絡;2006年10期
4 ;企業(yè)級市場:智能搜索的獨角戲?[J];計算機與網(wǎng)絡;2006年11期
5 王淑英;張明;劉云;;移動Agent在智能搜索中的應用[J];中小企業(yè)管理與科技(下旬刊);2011年04期
6 朱貴憲;蘆艷芳;;用于智能搜索的無線通信系統(tǒng)設計[J];煤炭技術(shù);2011年09期
7 翁代云;楊莉;;基于語義Web的智能搜索的研究[J];科技風;2013年06期
8 葉慶衛(wèi),陳濤;企業(yè)信息智能搜索的研究與應用[J];管理信息系統(tǒng);1998年09期
9 晏俊德,李雪蓮,胡慶倫;基于個人定制的智能搜索助手的研究[J];沈陽工業(yè)大學學報;2000年01期
10 楊明莉;陳義輝;;基于概念的語義智能搜索模型體系結(jié)構(gòu)的研究[J];商場現(xiàn)代化;2009年05期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 何盈捷;馮月利;王珊;;Peer-to-Peer環(huán)境下基于內(nèi)容的智能搜索[A];第二十一屆中國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2004年
2 王雪萍;楊青;黃祖鋒;;P2P網(wǎng)絡中基于蟻群算法的智能搜索研究[A];2006全國復雜網(wǎng)絡學術(shù)會議論文集[C];2006年
3 丁曉安;徐伯夏;;基于智能搜索功能的Android平臺手機拼車系統(tǒng)設計[A];全國第五屆信號和智能信息處理與應用學術(shù)會議?(第一冊)[C];2011年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 ;智能搜索:結(jié)果最優(yōu)化 價值最大化[N];中國計算機報;2006年
2 鄧健;智能搜索為信息共享提速[N];計算機世界;2006年
3 記者 莫小松 常鑫 通訊員 郝晉薇;廣西交通網(wǎng)設交管問答智能搜索[N];法制日報;2010年
4 中國電信上海研究院 邢青;移動智能搜索 所需即所得[N];人民郵電;2011年
5 潘z,
本文編號:361768
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/361768.html