面向情報(bào)學(xué)研究生教育領(lǐng)域的垂直搜索引擎研究
發(fā)布時(shí)間:2017-07-02 21:17
本文關(guān)鍵詞:面向情報(bào)學(xué)研究生教育領(lǐng)域的垂直搜索引擎研究
更多相關(guān)文章: 情報(bào)學(xué)研究生教育 垂直搜索引擎 聚類(lèi)
【摘要】:目前網(wǎng)絡(luò)上存在很多各種類(lèi)型的情報(bào)學(xué)研究生教育資源:各高校研究生網(wǎng)站、高校圖書(shū)館網(wǎng)站、科研院所網(wǎng)站、研究生論壇、情報(bào)學(xué)專(zhuān)家和學(xué)者的個(gè)人網(wǎng)頁(yè)或博客等等。面對(duì)大量的情報(bào)學(xué)研究生教育資源,用戶(hù)很難定位自己所需要的信息。情報(bào)學(xué)研究生教育垂直搜索引擎能整合這些繁雜、散亂無(wú)序的網(wǎng)絡(luò)資源。 垂直搜索引擎專(zhuān)注具體深入的縱向服務(wù),致力于某一特定領(lǐng)域內(nèi)信息的全面和內(nèi)容的深入,對(duì)于領(lǐng)域外的信息不收錄,情報(bào)學(xué)研究生教育垂直搜索是針對(duì)通用搜索引擎信息量大、查詢(xún)不準(zhǔn)確等問(wèn)題提出來(lái)的,其特點(diǎn)就是“專(zhuān)”“精”“深”且具有行業(yè)色彩,它是與通用搜索引擎截然不同的引擎類(lèi)型。 傳統(tǒng)搜索引擎的檢索返回結(jié)果太多,不知道從哪開(kāi)始瀏覽,查準(zhǔn)率低,垂直搜索雖面向主題排除了很多閑雜信息,但為了更好的使用戶(hù)定位自己所需要的信息,對(duì)搜索結(jié)果進(jìn)行聚類(lèi)是非常重要的。情報(bào)學(xué)研究生教育涉及范圍廣資源種類(lèi)多,例如培養(yǎng)機(jī)構(gòu)包括高校教學(xué)院系、科研院所、高校圖書(shū)館等,情報(bào)學(xué)又是圖書(shū)館和文獻(xiàn)學(xué)、計(jì)算機(jī)和通訊科學(xué)、管理和系統(tǒng)科學(xué)等領(lǐng)域的交叉產(chǎn)物,導(dǎo)致培養(yǎng)內(nèi)容和方式豐富,所以用戶(hù)面對(duì)搜索結(jié)果將無(wú)從下手,在搜索引擎中應(yīng)用聚類(lèi)技術(shù),能使經(jīng)過(guò)處理后的搜索結(jié)果以一種超鏈接的層次類(lèi)目方式提交給用戶(hù),內(nèi)容相似的搜索結(jié)果被劃分為一個(gè)類(lèi)目,這樣,搜索結(jié)果就被有效地組織起來(lái),用戶(hù)就可以快速地了解搜索結(jié)果的整體分布情況,并快速定位自已需要的結(jié)果。 本文就面向情報(bào)學(xué)研究生教育領(lǐng)域的垂直搜索引擎提出了構(gòu)建策略,實(shí)現(xiàn)了此系統(tǒng)的五大模塊:爬蟲(chóng)模塊、網(wǎng)頁(yè)信息分析處理模塊、建立索引模塊、用戶(hù)檢索接口模塊、聚類(lèi)模塊。并對(duì)垂直索引的主題過(guò)濾、面向情報(bào)學(xué)研究生教育領(lǐng)域的專(zhuān)業(yè)分詞、聚類(lèi)模塊的實(shí)現(xiàn)等作了大量實(shí)驗(yàn)。 本文分為七章,文第一章介紹,垂直搜索引擎的研究意義和背景,提出了面向此領(lǐng)域的垂直搜索引擎的技術(shù)結(jié)構(gòu);第二章詳細(xì)論述了垂直搜索引擎與通用搜索引擎的不同;第三章采用文獻(xiàn)計(jì)量學(xué)的關(guān)鍵詞分析法,對(duì)情報(bào)學(xué)研究生教育相關(guān)學(xué)術(shù)論文進(jìn)行關(guān)鍵詞分析,統(tǒng)計(jì)出情報(bào)學(xué)研究培養(yǎng)領(lǐng)域的高頻詞和熱點(diǎn)詞,更新分詞詞典,為情報(bào)學(xué)研究生教育領(lǐng)域的分詞詞典提供了專(zhuān)業(yè)分詞;第四章研究了我國(guó)情報(bào)學(xué)核心網(wǎng)站基于關(guān)鍵詞的搜索引擎優(yōu)化的統(tǒng)計(jì),分析了我國(guó)情報(bào)學(xué)核心網(wǎng)站的結(jié)構(gòu)特點(diǎn),有利于選取和合適的網(wǎng)站進(jìn)行垂直搜索引擎的構(gòu)建;第五章提出了構(gòu)建此領(lǐng)域垂直搜索引擎的五大模塊;第六章具體實(shí)現(xiàn)了垂直搜索引擎的構(gòu)建,并實(shí)現(xiàn)了聚類(lèi)顯示;第七章作出了總結(jié)和展望。
【關(guān)鍵詞】:情報(bào)學(xué)研究生教育 垂直搜索引擎 聚類(lèi)
【學(xué)位授予單位】:山東理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類(lèi)號(hào)】:G643;G350;G353.21
【目錄】:
- 摘要3-5
- Abstract5-7
- 目錄7-10
- 圖表目錄10-11
- 第1章 緒論11-17
- 1.1 研究背景與意義11-12
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀12-13
- 1.3 主要研究?jī)?nèi)容及思路13-16
- 1.4 本章小結(jié)16-17
- 第2章 搜索引擎原理17-22
- 2.1 通用搜索引擎的介紹17-19
- 2.1.1 通用搜索引擎的結(jié)構(gòu)17-18
- 2.1.2 通用搜索引擎的進(jìn)展18
- 2.1.3 通用搜索引擎的類(lèi)型18-19
- 2.2 垂直搜索引擎的介紹19-21
- 2.2.1 垂直搜索引擎的意義19-20
- 2.2.2 垂直搜索引擎的結(jié)構(gòu)20-21
- 2.3 本章小結(jié)21-22
- 第3章 情報(bào)學(xué)研究生教育領(lǐng)域熱點(diǎn)研究22-31
- 3.1 情報(bào)學(xué)研究生教育領(lǐng)域熱點(diǎn)研究的背景22-23
- 3.2 數(shù)據(jù)來(lái)源和格式分析23-25
- 3.2.1 數(shù)據(jù)來(lái)源23
- 3.2.2 格式分析23
- 3.2.3 關(guān)鍵詞提取23-25
- 3.2.4 行列轉(zhuǎn)化25
- 3.3 關(guān)鍵詞統(tǒng)計(jì)分析25-28
- 3.4 共詞聚類(lèi)分析28-29
- 3.5 本章小結(jié)29-31
- 第4章 情報(bào)學(xué)研究生教育領(lǐng)域網(wǎng)站的搜索引擎優(yōu)化分析31-39
- 4.1 搜索引擎優(yōu)化的重要性31
- 4.2 研究對(duì)象選擇31-32
- 4.3 基于關(guān)鍵詞的搜索引擎優(yōu)化評(píng)測(cè)32-37
- 4.3.1 關(guān)鍵詞詞組數(shù)量的統(tǒng)計(jì)33-34
- 4.3.2 關(guān)鍵詞詞組密度的統(tǒng)計(jì)34-35
- 4.3.3 關(guān)鍵詞分布統(tǒng)計(jì)35-37
- 4.4 本章小結(jié)37-39
- 第5章 情報(bào)學(xué)研究生教育領(lǐng)域垂直搜索引擎模塊設(shè)計(jì)39-46
- 5.1 爬蟲(chóng)模塊與技術(shù)要求39-41
- 5.1.1 網(wǎng)絡(luò)爬蟲(chóng)的結(jié)構(gòu)和策略39-40
- 5.1.2 開(kāi)源爬蟲(chóng)技術(shù)40-41
- 5.2 網(wǎng)頁(yè)信息分析處理模塊41-43
- 5.2.1 基于網(wǎng)頁(yè)內(nèi)容的消重41-42
- 5.2.2 文本信息處理42-43
- 5.3 索引模塊43
- 5.4 檢索接口模塊43-44
- 5.5 聚類(lèi)模塊44-45
- 5.5.1 聚類(lèi)的算法44-45
- 5.5.2 聚類(lèi)的工具和系統(tǒng)45
- 5.6 本章小結(jié)45-46
- 第6章 情報(bào)學(xué)研究生教育領(lǐng)域垂直搜索引擎構(gòu)建46-53
- 6.1 開(kāi)發(fā)平臺(tái)和環(huán)境準(zhǔn)備46
- 6.2 Nutch的基本配置46-47
- 6.3 主題的過(guò)濾實(shí)現(xiàn)47-48
- 6.4 分詞詞典的擴(kuò)展48-49
- 6.5 索引的構(gòu)建和索引接口49
- 6.6 客戶(hù)端接口建立49-51
- 6.7 聚類(lèi)模塊的實(shí)現(xiàn)51-52
- 6.8 本章小結(jié)52-53
- 第7章 總結(jié)與展望53-54
- 7.1 全文總結(jié)53
- 7.2 創(chuàng)新與展望53-54
- 參考文獻(xiàn)54-57
- 致謝57-58
- 攻讀碩士學(xué)位期間的科研情況58-59
- 附錄59-60
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前6條
1 楊堅(jiān)爭(zhēng);李朝平;;垂直搜索引擎及其應(yīng)用[J];電子商務(wù);2006年10期
2 儲(chǔ)節(jié)旺;郭春俠;;共詞分析法的基本原理及EXCEL實(shí)現(xiàn)[J];情報(bào)科學(xué);2011年06期
3 馬媛;趙海軍;;中外情報(bào)學(xué)專(zhuān)業(yè)研究生教育比較研究[J];情報(bào)資料工作;2006年02期
4 張雁;彭s,
本文編號(hào):511300
本文鏈接:http://sikaile.net/jiaoyulunwen/yjsjy/511300.html
最近更新
教材專(zhuān)著