主題web搜索引擎優(yōu)化和實現(xiàn)的研究.pdf
本文關(guān)鍵詞:主題WEB搜索引擎優(yōu)化與實現(xiàn)研究,,由筆耕文化傳播整理發(fā)布。
文檔介紹:
主題WEB搜索引擎優(yōu)化與實現(xiàn)研究摘的快速發(fā)展,特別是全球最大的分布式信息數(shù)據(jù)庫。一方面網(wǎng)絡(luò)的信息量迅速猛增,為資源的共建共享提供了良好的平臺,另一方面又使有用信息的索取和查詢變得越來越困難。用戶獲得的信息往往不及時,不準確,并且有大量的冗余無關(guān)信息。因此在20世紀90年代開始,產(chǎn)生了搜索引擎技術(shù),并隨著需要,逐漸向?qū)n}型,個性化方向發(fā)展。如何加強主題搜索引擎技術(shù)的研究,實現(xiàn)更有效的信息獲取,是當前搜索引擎發(fā)展的一個重要方向。本文在對搜索引擎技術(shù)討論的基礎(chǔ)上,對Web主題搜索引擎技術(shù)的優(yōu)化和實現(xiàn)進行了研究。主要工作如下:(1)概述了通用搜索引擎的發(fā)展、分類以及它的結(jié)構(gòu)和工作原理。(2)分析了主題Web搜索的發(fā)展現(xiàn)狀、研究背景,主題搜索引擎和通用搜索引擎的差異;對主題Web搜索的關(guān)鍵技術(shù)和主題網(wǎng)絡(luò)蜘蛛進行了討論。(3)分析了網(wǎng)絡(luò)蜘蛛的Best-First搜索算法,并對算法進行了優(yōu)化;分析了頁面中存在著的動態(tài)鏈接和靜態(tài)鏈接等多種鏈接情況,討論了在網(wǎng)頁中通過對動態(tài)鏈接的解析,更全面的抓取頁面中存在的網(wǎng)絡(luò)鏈接。(4)基于上述研究,實現(xiàn)了一個主題WEB挖掘系統(tǒng)(TWMS,Topic Web MiningSystem)。給出了系統(tǒng)設(shè)計結(jié)構(gòu)圖,系統(tǒng)實現(xiàn)的關(guān)鍵技術(shù)和方法,并對系統(tǒng)進行了測試。關(guān)...
內(nèi)容來自轉(zhuǎn)載請標明出處.
本文關(guān)鍵詞:主題WEB搜索引擎優(yōu)化與實現(xiàn)研究,由筆耕文化傳播整理發(fā)布。
本文編號:109146
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/109146.html