天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

搜索引擎存在的弊端_搜索引擎原理及存在問(wèn)題 投稿:蔣鐔镢 X

發(fā)布時(shí)間:2016-11-30 16:27

  本文關(guān)鍵詞:搜索引擎原理及存在問(wèn)題,由筆耕文化傳播整理發(fā)布。


搜索引擎原理及存在問(wèn)題 投稿:蔣鐔镢

摘要本文主要是對(duì)搜索引擎的工作原理以及所存在的問(wèn)題進(jìn)行分析,同時(shí)指出了以后搜索引擎的發(fā)展主要是根據(jù)用戶(hù)作為中心來(lái)提出更為個(gè)性化的服務(wù)。關(guān)鍵詞搜索引擎;工作原理;存在問(wèn)題;中圖分類(lèi)號(hào):TP3文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1671-7597(2014)20-0…

我國(guó)許多著名的風(fēng)景名勝自然景觀與歷史文化相得益彰,在欣賞美景的同時(shí),一邊閱讀古今文學(xué)名家留在這里的詩(shī)文,一邊探訪(fǎng)點(diǎn)綴于名勝之間的書(shū)法摩崖碑刻,會(huì)讓我們更加深切感受到名勝獨(dú)特的自然之美與人文之韻。受浙江書(shū)法同道的邀請(qǐng),吳老師再次走進(jìn)了位于浙江樂(lè)清的雁蕩…

黃易,字大易,號(hào)小松,曾在山東做官,是一位水利專(zhuān)家。他精通書(shū)畫(huà),好考古,尤善篆刻,被后人列為“西泠八家”之一。黃易是浙派鼻祖丁敬的入室弟子,年輕的時(shí)候陪伴老師左右,并得到老師的器重和真?zhèn),再加上自己的努力,使他很早就躋身一流印家之列。如果說(shuō),丁敬是浙…

  摘 要 本文主要是對(duì)搜索引擎的工作原理以及所存在的問(wèn)題進(jìn)行分析,同時(shí)指出了以后搜索引擎的發(fā)展主要是根據(jù)用戶(hù)作為中心來(lái)提出更為個(gè)性化的服務(wù)。

  關(guān)鍵詞 搜索引擎;工作原理;存在問(wèn)題;
  中圖分類(lèi)號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-7597(2014)20-0237-01
  由于網(wǎng)絡(luò)信息在不斷飛速的發(fā)展,一定程度上人們對(duì)信息獲取的方式得到了極大的改變,但是針對(duì)浩如煙海的網(wǎng)絡(luò)信息,怎樣才能夠方便以及更加迅速的獲取信息已經(jīng)成為人們比較關(guān)注的一個(gè)問(wèn)題,由于各類(lèi)搜索引擎的層出不窮,并且得到了比較快速的發(fā)展。本文主要介紹的就是搜索引擎的原理以及所存在的問(wèn)題。
  1 工作原理
  在一九九零年,加拿大某一所計(jì)算機(jī)學(xué)院的老師對(duì)A reh ie軟件進(jìn)行了開(kāi)發(fā)。并且在一定程度上對(duì)各個(gè)FTP主機(jī)中分布的文件服務(wù)進(jìn)行相應(yīng)的提供以及查找,把這個(gè)軟件進(jìn)一步的公認(rèn)為現(xiàn)代搜索引擎的鼻祖。所以就導(dǎo)致各種不同的搜索引擎應(yīng)運(yùn)而生,例如一些比較著名的百度、搜狐、網(wǎng)易以及天網(wǎng)等等。結(jié)合技術(shù)的相關(guān)原理,針對(duì)檢索的方式,搜索引擎可以進(jìn)一步的劃分為兩種引擎,一種是獨(dú)立型搜索引擎,另外一種就是元搜索引擎。
  1)獨(dú)立型搜索引擎。針對(duì)獨(dú)立型搜索引擎而言,它在一定程度上又稱(chēng)為單一搜索引擎,其特點(diǎn)就是都具有一個(gè)與數(shù)據(jù)庫(kù)能夠綁在一起的檢索系統(tǒng),并且同時(shí)還具有自動(dòng)檢索程序,能夠?qū)ntemet的內(nèi)容進(jìn)行搜集,針對(duì)所找到的信息資源能夠送回集中管理的數(shù)據(jù)庫(kù)。獨(dú)立型搜索引擎系統(tǒng)在一定的程度上能夠統(tǒng)一的分為兩個(gè)部分構(gòu)成:第一是分析索引模塊;第二是檢索服務(wù)模塊等。
  針對(duì)分析索引模塊而言,能夠在一定的程度上把Robot程序能夠采集到的信息進(jìn)行相應(yīng)的比較以及分析,對(duì)那些內(nèi)容比較相似的轉(zhuǎn)載網(wǎng)頁(yè)進(jìn)行有效的刪除以及沒(méi)有添加任何的修改,然后對(duì)一些能夠留存的網(wǎng)頁(yè)信息,把HTML等相關(guān)標(biāo)志的符號(hào)進(jìn)行有效的剔除,對(duì)網(wǎng)頁(yè)源文件內(nèi)容特征代表的關(guān)鍵詞進(jìn)行提取,在一定的程度上能夠匯集成索引數(shù)據(jù)庫(kù),并且進(jìn)一步的順著鏈接對(duì)網(wǎng)上新加入的主頁(yè)跟蹤,為其建立相應(yīng)的索引。
  針對(duì)檢索模塊而言,主要分為四個(gè)內(nèi)容:一是對(duì)界面進(jìn)行檢索,對(duì)用戶(hù)提交的相關(guān)檢索要求進(jìn)行接收。二是檢索過(guò)程中的策略,針對(duì)用戶(hù)所提交的檢索要求,在一定的程度上編成計(jì)算機(jī)能夠執(zhí)行的規(guī)范化檢索式。三是對(duì)檢索進(jìn)行相應(yīng)的執(zhí)行,,結(jié)合用戶(hù)上交的檢索式,可以到索引數(shù)據(jù)庫(kù)中進(jìn)行相應(yīng)的搜索。四是檢索的結(jié)果,把檢索到的一些資料進(jìn)行整理以及組織后,在一定的程度上按照順序給用戶(hù)進(jìn)行提供。
  2)元搜索引擎。針對(duì)元搜索引擎而言,它沒(méi)有屬于自己的資源數(shù)據(jù)庫(kù),它屬于中間代理的角色,是由許多個(gè)相對(duì)比較獨(dú)立型的搜索引擎聚集到一起的,并且還在一定的程度上能夠?qū)Χ鄠(gè)搜索引擎上的資源庫(kù)進(jìn)行共享,同時(shí)還能夠提供相對(duì)統(tǒng)一的界面,為用戶(hù)在一定的程度上提供信息服務(wù)智能化的檢索
  系統(tǒng)。
  2 所存在的問(wèn)題
  由于互聯(lián)網(wǎng)的不斷發(fā)展,在網(wǎng)絡(luò)方面搜索引擎已經(jīng)是使用率最高的服務(wù)項(xiàng)目之一。然而,一些大量的信息增長(zhǎng)和人們所獲得的信息之間存在的矛盾也是不斷增加,同時(shí),搜索引擎所出現(xiàn)的問(wèn)題也不斷的顯現(xiàn)出來(lái),主要有以下幾點(diǎn)。
  1)信息質(zhì)量控制不好。在對(duì)網(wǎng)絡(luò)信息質(zhì)量控制的過(guò)程中由于信息的冗余很大,而且覆蓋又十分有效,因此,在質(zhì)量控制過(guò)程中存在著欠缺,同時(shí)對(duì)于層次比較深的Web文檔挖掘并不夠,對(duì)于一些層次比較深的網(wǎng)頁(yè)被遺漏掉,并且,大多的垃圾網(wǎng)頁(yè)同時(shí)也被采集到。一些網(wǎng)頁(yè)雖然并沒(méi)有出現(xiàn)搜索的詞,然而其內(nèi)容卻是和搜索的詞比較相似,但是,搜索引擎卻是沒(méi)有辦法搜到這些的網(wǎng)頁(yè)。所以,信息在查準(zhǔn)的過(guò)程中比較低、誤檢率以及漏檢率比較高。
  2)占據(jù)的CPU以及網(wǎng)絡(luò)寬帶比較大。由于信息數(shù)據(jù)庫(kù)的不斷膨大,在對(duì)信息進(jìn)行搜集以及數(shù)據(jù)庫(kù)進(jìn)行維護(hù)的過(guò)程中將會(huì)占據(jù)很多的CPU資源以及網(wǎng)絡(luò)寬帶。在此之外,在進(jìn)行檢索的過(guò)程中存在著很多的重復(fù)性也會(huì)對(duì)寬帶資源進(jìn)行額外的消耗,并且,在對(duì)網(wǎng)頁(yè)進(jìn)行轉(zhuǎn)載以及鏡像網(wǎng)頁(yè)也將會(huì)導(dǎo)致出現(xiàn)重復(fù)性的檢索工作,進(jìn)而導(dǎo)致出現(xiàn)寬帶消耗的額外增加。
  3)數(shù)據(jù)庫(kù)更新比較困難。在搜索引擎的數(shù)據(jù)庫(kù)中,存在著更新困難以及所提供的信息滯后等情況。搜索引擎只是能夠經(jīng)過(guò)系統(tǒng)的管理人員來(lái)確定出一定時(shí)間之內(nèi)的跟蹤信息,并不能夠保證信息能進(jìn)行及時(shí)的更新,進(jìn)而就會(huì)導(dǎo)致出現(xiàn)死鏈的情況。與此同時(shí),由于網(wǎng)絡(luò)的信息量在不斷的加大,將會(huì)致使數(shù)據(jù)庫(kù)出現(xiàn)膨脹,最終也將會(huì)導(dǎo)致檢索的速度被降低。
  4)搜索引擎之間缺乏合作。對(duì)于每一個(gè)搜索引擎來(lái)講都是有著自己的一個(gè)檢索規(guī)則,用戶(hù)的查詢(xún)接口不論是在方法上面還是在技術(shù)上面,每一個(gè)搜索引擎將會(huì)給出一種不同的實(shí)現(xiàn)方式,并不是統(tǒng)一的,用戶(hù)在使用不同的搜索引擎的時(shí)候所適應(yīng)的過(guò)程也并不相同。所以,對(duì)搜索引擎的使用方便性以及用戶(hù)的有好性都是需要進(jìn)行改進(jìn)。
  5)搜索的結(jié)果比較單一。所有的人在用同一個(gè)搜索引擎對(duì)一個(gè)詞進(jìn)行搜索的過(guò)程中其所得到的結(jié)果都是相同的,在搜索的過(guò)程中搜索引擎并不會(huì)考慮到性別以及年齡等用戶(hù)對(duì)信息的需求,同時(shí)也不會(huì)做到采用記錄來(lái)對(duì)用戶(hù)的行為日志進(jìn)行查詢(xún)。因此,可以在搜索引擎的系統(tǒng)當(dāng)中增加一種用戶(hù)的行為分析模塊,以此來(lái)對(duì)用戶(hù)進(jìn)行了解以及分析,從而使信息數(shù)據(jù)庫(kù)能夠具有個(gè)性化,在用戶(hù)進(jìn)行搜索的過(guò)程中通過(guò)對(duì)個(gè)性信息數(shù)據(jù)的調(diào)用,以此使搜索能夠滿(mǎn)足每一個(gè)用戶(hù)的需要。
  3 結(jié)束語(yǔ)
  21世紀(jì)科技創(chuàng)新也進(jìn)一步的強(qiáng)調(diào)以人為本,所以在發(fā)展搜索引擎的過(guò)程中,也主要是圍繞著用戶(hù),讓其搜索引擎在一定的程度上對(duì)用戶(hù)的行為以及用戶(hù)的習(xí)慣進(jìn)行關(guān)注,也就是讓搜索引擎學(xué)習(xí)人類(lèi)的思維,同時(shí)還能夠進(jìn)行自適應(yīng)的一個(gè)
  過(guò)程。
  參考文獻(xiàn)
  [1]佘正平.搜索引擎原理及存在問(wèn)題[J].圖書(shū)情報(bào)論壇,2006,12(24):120-124.
  [2]楊衛(wèi)明.獨(dú)立式搜索引擎原理及存在問(wèn)題分析[A].重慶計(jì)算機(jī)學(xué)會(huì).2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C].重慶計(jì)算機(jī)學(xué)會(huì).2008,12(24):114-116.
  [3]陳鑫,常致全.智能化搜索引擎原理及實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用,2003,12(24):136-138.

摘要本文主要是對(duì)搜索引擎的工作原理以及所存在的問(wèn)題進(jìn)行分析,同時(shí)指出了以后搜索引擎的發(fā)展主要是根據(jù)用戶(hù)作為中心來(lái)提出更為個(gè)性化的服務(wù)。關(guān)鍵詞搜索引擎;工作原理;存在問(wèn)題;中圖分類(lèi)號(hào):TP3文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1671-7597(2014)20-0…

摘要本文主要是對(duì)搜索引擎的工作原理以及所存在的問(wèn)題進(jìn)行分析,同時(shí)指出了以后搜索引擎的發(fā)展主要是根據(jù)用戶(hù)作為中心來(lái)提出更為個(gè)性化的服務(wù)。關(guān)鍵詞搜索引擎;工作原理;存在問(wèn)題;中圖分類(lèi)號(hào):TP3文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1671-7597(2014)20-0…

摘要本文主要是對(duì)搜索引擎的工作原理以及所存在的問(wèn)題進(jìn)行分析,同時(shí)指出了以后搜索引擎的發(fā)展主要是根據(jù)用戶(hù)作為中心來(lái)提出更為個(gè)性化的服務(wù)。關(guān)鍵詞搜索引擎;工作原理;存在問(wèn)題;中圖分類(lèi)號(hào):TP3文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1671-7597(2014)20-0…

本文由第一文庫(kù)網(wǎng)()首發(fā),轉(zhuǎn)載請(qǐng)保留網(wǎng)址和出處!

>> 查看更多相關(guān)文檔

免費(fèi)下載文檔:


  本文關(guān)鍵詞:搜索引擎原理及存在問(wèn)題,由筆耕文化傳播整理發(fā)布。



本文編號(hào):199630

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/199630.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)e0633***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com