學(xué)前教育多媒體資源搜索服務(wù)系統(tǒng)設(shè)計
本文關(guān)鍵詞:學(xué)前教育多媒體資源搜索服務(wù)系統(tǒng)設(shè)計
更多相關(guān)文章: 文本分類 多媒體資源檢索 噪音過濾 學(xué)前教育
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,形形色色的學(xué)前教育機(jī)構(gòu)或者個人在Internet上發(fā)布了各自的學(xué)前教育資源。這些資源的豐富程度超過了以往的任何單個單位的資源,它幾乎能夠提供已有的關(guān)于學(xué)前教育的所有資源。在現(xiàn)代社會條件下,如果某一學(xué)前教育機(jī)構(gòu)不能有效的整合網(wǎng)絡(luò)中的網(wǎng)頁資源,那么該機(jī)構(gòu)的發(fā)展將會受到極大的限制。同樣的,如果家長不能有效的獲取自己想要的學(xué)前教育資源,其家庭學(xué)前教育水平就無法充分地得到信息化給教育帶來的便利性。 本文設(shè)計了一個基于學(xué)前教育主題的多媒體資源檢索系統(tǒng),主要實現(xiàn)了網(wǎng)頁中提取多媒體資源,多媒體相關(guān)文本信息解析,基于文本的學(xué)前教育主題類多媒體資源自動分類以及網(wǎng)頁中多媒體類噪音的過濾,為學(xué)前教育領(lǐng)域的相關(guān)人員提供主題多媒體資源檢索服務(wù)。 首先,我們對系統(tǒng)作了一番需求分析,簡要地介紹了系統(tǒng)設(shè)計的時代背景和多媒體資源的一些特點。在此基礎(chǔ)上,我們進(jìn)一步闡釋了系統(tǒng)設(shè)計的目標(biāo)內(nèi)容和實現(xiàn)方案。 接著,我們詳細(xì)介紹了多媒體檢索及其相關(guān)技術(shù)的研究現(xiàn)狀,并就多媒體檢索領(lǐng)域的一些關(guān)鍵性的技術(shù)(如主題蜘蛛、自動分類、網(wǎng)頁去噪等)研究作了詳細(xì)的描述。 隨后,我們先從整體上介紹了系統(tǒng)的結(jié)構(gòu)并對各部分的功能逐個進(jìn)行詳細(xì)說明。在此基礎(chǔ)上我們就系統(tǒng)數(shù)據(jù)庫設(shè)計作了必要的說明。 然后,我們分別就系統(tǒng)中涉及到的兩個關(guān)鍵算法:基于TFIDF和空間向量模型(Vector Space Model, VSM)的多媒體類資源自動分類算法和學(xué)前教育主題下多媒體類噪音資源過濾算法作了分別的介紹。在介紹分類算法的實現(xiàn)過程中,我們詳細(xì)地介紹了從訓(xùn)練集整理到分類器評價過程中的每個步驟,包括其中遇到的困難和解決方法。在過濾算法中,我們首先分析統(tǒng)計了學(xué)前教育領(lǐng)域內(nèi)主題相關(guān)資源與非主題相關(guān)資源之間的差異,總結(jié)出非主題相關(guān)資源所具有的一系列的特點,在此基礎(chǔ)上設(shè)計了基于規(guī)則的多媒體類噪音過濾算法。 此后,為檢驗上述兩個算法的實際使用效果,我們利用自己設(shè)計的網(wǎng)絡(luò)蜘蛛爬取了一定量的多媒體資源及其相關(guān)信息,使用這些數(shù)據(jù)從不同的角度測試兩個算法的效果。實驗數(shù)據(jù)表明這兩個算法在基于學(xué)前教育主題的多媒體檢索系統(tǒng)中能夠取得較為滿意的效果。 最后,我們就系統(tǒng)設(shè)計工作中存在的不足和其它有待于改進(jìn)的地方作了必要地闡述。
【關(guān)鍵詞】:文本分類 多媒體資源檢索 噪音過濾 學(xué)前教育
【學(xué)位授予單位】:南京師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.3;G434
【目錄】:
- 摘要3-4
- Abstract4-6
- 目錄6-8
- 第1章 緒論8-13
- 1.1 研究背景8
- 1.2 研究現(xiàn)狀8-11
- 1.2.1 國外研究現(xiàn)狀9
- 1.2.2 國內(nèi)研究現(xiàn)狀9-10
- 1.2.3 多媒體技術(shù)發(fā)展趨勢10-11
- 1.3 本文的主要工作11
- 1.4 論文創(chuàng)新點概述11-12
- 1.5 文章結(jié)構(gòu)安排12-13
- 第2章 系統(tǒng)分析13-22
- 2.1 需求分析13-14
- 2.1.1 我國學(xué)前教育發(fā)展概況13
- 2.1.2 學(xué)前教育類多媒體資源的教學(xué)意義13-14
- 2.1.3 通用搜索引擎的局限性14
- 2.2 多媒體資源特點分析14-18
- 2.2.1 多媒體資源類型及特點14-15
- 2.2.2 網(wǎng)頁中多媒體數(shù)量統(tǒng)計15-16
- 2.2.3 多媒體資源的HTML表示16-17
- 2.2.4 多媒體元數(shù)據(jù)描述17-18
- 2.3 系統(tǒng)設(shè)計18-21
- 2.3.1 設(shè)計目標(biāo)18
- 2.3.2 設(shè)計內(nèi)容18-19
- 2.3.3 系統(tǒng)實現(xiàn)方案19-21
- 2.4 本章小結(jié)21-22
- 第3章 相關(guān)技術(shù)研究22-30
- 3.1 主題蜘蛛22-23
- 3.1.1 主題蜘蛛的運行方式22
- 3.1.2 魚群算法22-23
- 3.2 文本信息抽取23-24
- 3.2.1 網(wǎng)頁文本的特點23-24
- 3.2.2 一般處理方法24
- 3.2.3 相關(guān)的開源組件24
- 3.3 文本分類24-26
- 3.3.1 國外Web文本自動分類24-25
- 3.3.2 國內(nèi)Web文本自動分類25-26
- 3.4 噪音過濾26
- 3.5 多媒體信息系統(tǒng)檢索技術(shù)研究26-29
- 3.5.1 基于文本的多媒體資源檢索27
- 3.5.2 基于內(nèi)容的多媒體資源檢索27-29
- 3.6 本章小結(jié)29-30
- 第4章 系統(tǒng)體系結(jié)構(gòu)設(shè)計30-43
- 4.1 系統(tǒng)總體設(shè)計30-31
- 4.2 數(shù)據(jù)庫設(shè)計31-32
- 4.3 系統(tǒng)核心算法設(shè)計32-42
- 4.3.1 基于文本的多媒體自動分類算法32-39
- 4.3.2 多媒體類網(wǎng)頁噪音過濾算法設(shè)計39-42
- 4.4 本章小結(jié)42-43
- 第5章 數(shù)據(jù)處理過程和實驗結(jié)果分析43-50
- 5.1 實驗環(huán)境說明43
- 5.2 系統(tǒng)取得的數(shù)據(jù)43-44
- 5.2.1 系統(tǒng)多媒體資源類別說明43
- 5.2.2 數(shù)據(jù)統(tǒng)計43-44
- 5.3 基于規(guī)則的多媒體類噪音過濾算法過濾效果分析44-46
- 5.3.1 選取的多媒體總數(shù)及各類別的多媒體的總數(shù)44
- 5.3.2 各類別的過濾概率44-45
- 5.3.3 去噪算法有待于改進(jìn)的地方45-46
- 5.4 基于TFIDF和空間向量模型的自動分類算法設(shè)計46-49
- 5.4.1 與學(xué)前教育主題相關(guān)度較高的關(guān)鍵詞統(tǒng)計46-47
- 5.4.2 維度對準(zhǔn)確率和消耗時間的影響47-48
- 5.4.3 待改進(jìn)的地方48-49
- 5.5 本章小結(jié)49-50
- 第6章 工作總結(jié)與展望50-52
- 6.1 本文總結(jié)50-51
- 6.1.1 改進(jìn)抽取資源的方法50
- 6.1.2 設(shè)計多媒體噪音的過濾方法50
- 6.1.3 基于文本的多媒體資源自動分類50-51
- 6.2 后期工作安排51-52
- 參考文獻(xiàn)52-55
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 彭玉容;楊捧;高媛;;農(nóng)業(yè)搜索引擎的發(fā)展現(xiàn)狀及關(guān)鍵技術(shù)研究[J];安徽農(nóng)業(yè)科學(xué);2010年20期
2 謝超;陳毓芬;;洛陽多媒體旅游信息系統(tǒng)設(shè)計與實現(xiàn)[J];測繪科學(xué);2008年01期
3 孟祥增;;多媒體網(wǎng)絡(luò)教學(xué)資源的內(nèi)容特征提取與搜索研究[J];電化教育研究;2007年12期
4 駱秀曼;;淺談多媒體技術(shù)在幼兒教育中的應(yīng)用[J];黑龍江科技信息;2009年05期
5 李曉黎,劉繼敏,史忠植;概念推理網(wǎng)及其在文本分類中的應(yīng)用[J];計算機(jī)研究與發(fā)展;2000年09期
6 王本年,高陽,陳世福,謝俊元;Web智能研究現(xiàn)狀與發(fā)展趨勢[J];計算機(jī)研究與發(fā)展;2005年05期
7 張鷹;;基于CRP理念的學(xué)習(xí)化社區(qū)網(wǎng)絡(luò)建構(gòu)[J];江蘇廣播電視大學(xué)學(xué)報;2010年01期
8 錢功偉;倪林;曹榮;;基于網(wǎng)頁鏈接和內(nèi)容分析的改進(jìn)PageRank算法[J];計算機(jī)工程與應(yīng)用;2007年21期
9 方加沛;黃戰(zhàn);;基于單類別文檔分類的主題爬蟲[J];計算機(jī)工程與應(yīng)用;2010年16期
10 王麗坤;王宏;陸玉昌;;文本挖掘及其關(guān)鍵技術(shù)與方法[J];計算機(jī)科學(xué);2002年12期
,本文編號:1084038
本文鏈接:http://sikaile.net/jiaoyulunwen/wangluojiaoyulunwen/1084038.html