當(dāng)前位置：主頁 > 科技論文 > 搜索引擎論文 >

智能搜索引擎信息過濾機制研究

發(fā)布時間：2016-06-22 22:05

本文關(guān)鍵詞：智能搜索引擎信息過濾機制研究，由筆耕文化傳播整理發(fā)布。

選填,簡要介紹文檔的主要內(nèi)容,方便文檔被更多人瀏覽和下載。

圖書與情報

學(xué)術(shù)方陣

２００７年第４期

智能搜索引擎信息過濾機制研究

張摘

帆

林

建（華中師范大學(xué)信息管理系

湖北武漢

４３００７９）

要：智能搜索引擎是人工智能技術(shù)和傳統(tǒng)搜索引擎技術(shù)相結(jié)合的產(chǎn)物。面對信息無時無刻不在進行更替的網(wǎng)絡(luò)環(huán)境，智能搜索引擎具有

自然語言過濾智能化、多文檔處理智能化、用戶服務(wù)智能化等信息處理機制。為促進智能搜索引擎發(fā)展，應(yīng)重視用戶建模技術(shù)研究，加強基于多

Ａｇｅｎｔ智能搜索引擎系統(tǒng)的研制與實踐，加大智能搜索引擎關(guān)鍵技術(shù)研究力度。

關(guān)鍵詞：智能搜索引擎中圖分類號：ＴＰ３９１．３

信息過濾自然語言理解人工智能

文章編號：１００３－６９３８（２００７）０４－００５２－０５

文獻標(biāo)識碼：Ａ

ＲｅｓｅａｒｃｈｏｎＦｉｌｔｅｒｉｎｇＭｅｃｈａｎｉｓｍｉｎＩｎｔｅｌｌｉｇｅｎｔＳｅａｒｃｈＥｎｇｉｎｅ

ＺｈａｎｇＦａｎ

ＬｉｎＪｉａｎ（ＤｅｐａｒｔｍｅｎｔｏｆＩｎｆｏｒｍａｔｉｏｎＭａｎａｇｅｍｅｎｔ，ＨｕａＺｈｏｎｇＮｏｒｍａｌＵｎｉｖｅｒｓｉｔｙ，Ｗｕｈａｎ，，Ｈｕｂｅｉ，４３００７９）

Ａｂｓｔｒａｃｔ：Ｉｎｔｅｌｌｉｇｅｎｔｓｅａｒｃｈｅｎｇｉｎｅｉｓａｐｒｏｄｕｃｔｔｈａｔｃｏｍｂｉｎｅｓｔｈｅｔｒａｄｉｔｉｏｎａｌｓｅａｒｃｈｅｎｇｉｎｅｔｅｃｈｎｏｌｏｇｙａｎｄａｒｔｉｆｉｃｉａｌｉｎｔｅｌｌｉｇｅｎｃｅｔｅｃｈｎｏｌｏｇｙ．Ｆａｃｉｎｇｔｈｅｉｎｃｅｓｓａｎｔｌｙｉｎｆｏｒｍａｔｉｏｎｃｈａｎｇｉｎｇｏｆｅｎｖｉｒｏｎｍｅｎｔａｌｎｅｔｗｏｒｋ，ｔｈｅｉｎｔｅｌｌｉｇｅｎｔｓｅａｒｃｈｅｎｇｉｎｅｃａｎｓｏｌｖｅｔｈｅｐｒｏｂｌｅｍｂｙｔｈｅｍｅｃｈａｎｉｓｍｔｈａｔｉｎｔｅｌｌｉｇｅｎｔｆｉｌｔｅｒｓｏｆｎａｔｕｒａｌｌａｎｇｕａｇｅ，ｉｎｔｅｌｌｉｇｅｎｔｍｕｌｔｉ－ｄｏｃｕｍｅｎｔｐｒｏｃｅｓｓｉｎｇａｎｄｉｎｔｅｌｌｉｇｅｎｔｃｕｓｔｏｍｅｒｓｅｒｖｉｃｅｓ．Ｔｏｐｒｏｍｏｔｅｔｈｅｄｅｖｅｌｏｐｍｅｎｔｏｆｉｎｔｅｌｌｉｇｅｎｔｓｅａｒｃｈｅｎｇｉｎｅｓ，ｗｅｓｈｏｕｌｄｐａｙｍｏｒｅａｔｔｅｎｔｉｏｎｏｎｕｓｅｒｍｏｄｅｌｉｎｇｔｅｃｈｎｏｌｏｇｙ，ｅｎｈａｎｃｅｓｅａｒｃｈｅｎｇｉｎｅｒｅｓｅａｒｃｈｂａｓｅｄｏｎＭｕｌｔｉ－ＡｇｅｎｔＳｙｓｔｅｍａｎｄｐｒａｃｔｉｃｅｉｎｔｅｎｓｉｆｉｅｄｒｅｓｅａｒｃｈｉｎｋｅｙｔｅｃｈｎｏｌｏｇｉｅｓｏｆｓｍａｒｔｓｅａｒｃｈｅｎｇｉｎｅ．Ｋｅｙｗｏｒｄｓ：ｉｎｔｅｌｌｉｇｅｎｔｓｅａｒｃｈｅｎｇｉｎｅ；ｉｎｆｏｒｍａｔｉｏｎｆｉｌｔｅｒｉｎｇ；ｎａｔｕｒａｌｌａｎｇｕａｇｅｕｎｄｅｒｓｔａｎｄｉｎｇ；ａｒｔｉｆｉｃｉａｌｉｎｔｅｌｌｉｇｅｎｃｅＣＬＣｎｕｍｂｅｒ：ＴＰ３９１．３

Ｄｏｃｕｍｅｎｔｃｏｄｅ：Ａ

（２００７）０４－００５２－０５ＡｒｔｉｃｌｅＩＤ：１００３－６９３８

２０世紀(jì)８０年代以來，國內(nèi)外種類繁多的搜索引擎，如

攔Ｇｏｏｇｌｅ、Ａｌｔａｖｉｓｔａ、Ｓｏｈｕ等在為用戶提供瀏覽和查詢信息、截與過濾不良信息和無用信息方面起到了一定的作用，成為廣大網(wǎng)絡(luò)用戶獲取網(wǎng)絡(luò)信息的首選工具。但是，隨著網(wǎng)絡(luò)信息的爆炸性增長及用戶信息需求的個性化發(fā)展，搜索引擎簡單的過濾網(wǎng)絡(luò)信息狀況已難以滿足用戶精確查詢信息的需要。百度、天網(wǎng)三大中文搜索引擎杜亞軍等人曾對Ｇｏｏｇｌｅ中文、

的智能性進行過測試，［１］測試結(jié)果表明，基于關(guān)鍵詞的搜索引擎在“容錯性”（用戶檢索結(jié)果集與其真正需要的匹配程度）、“適語性”（查詢的結(jié)果與查詢概念書面用語的耦合程度）及“個性化”（針對不同用戶提供針對性信息）等方面的智能較差，并指明上述三個引擎均未能滿足及要“適應(yīng)性”“個別性”求，惟有百度對用戶的誤輸入有一定的辨別能力。

由此可見，傳統(tǒng)的基于Ｗｅｂ搜索引擎雖然在索引庫構(gòu)建上不完全一致，但其缺陷大致相同。其一，查詢效率低下，主要體現(xiàn)在和兩個方面。筆者最近做了一“大海撈針”“資源漏檢”個簡單的實驗，利用Ｇｏｏｇｌｅ引擎查詢有關(guān)的研究信“基因”息，點擊后系統(tǒng)反饋有２５，１００，０００個網(wǎng)頁。假設(shè)一秒鐘瀏覽一個網(wǎng)頁，則需要６９６２個小時查閱完這些結(jié)果信息。在網(wǎng)絡(luò)信息爆炸性增長的今天，不可能有用戶會花費這么多的時間與精力來瀏覽搜索到的每一個網(wǎng)頁，何況大部分網(wǎng)頁內(nèi)容和查詢意圖并不相關(guān)，因此，要獲得真正需要的信息宛如大海撈針。是指傳統(tǒng)搜索引擎由于不能理解和聯(lián)想用戶“資源漏檢”的檢索需要而致使信息丟失的現(xiàn)象。筆者使用一詞進“紅薯”行檢索時，雖然獲得了數(shù)量巨大的結(jié)果網(wǎng)頁，但是仍然丟失了以白薯、地瓜、紅苕、番薯等同義概念和近意概念為標(biāo)引詞的

基金項目：本文系國家社科基金項目（０６ＢＴＱ０２４）研究成果之一。收稿日期：２００６－１２－２９；責(zé)任編輯：王景發(fā)

５２

本文關(guān)鍵詞：智能搜索引擎信息過濾機制研究，由筆耕文化傳播整理發(fā)布。

本文編號：60305

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/sousuoyinqinglunwen/60305.html

上一篇：大學(xué)生搜索引擎使用行為調(diào)查與評價研究.doc.doc
下一篇：學(xué)術(shù)搜索引擎Google Scholar和Microsoft Academic Search的比較研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

智能搜索引擎信息過濾機制研究