73垂直搜索引擎的現(xiàn)狀與發(fā)展探究
本文關(guān)鍵詞:垂直搜索引擎的現(xiàn)狀與發(fā)展探究,由筆耕文化傳播整理發(fā)布。
第28卷第3期2010年3月Vol.28,No.;垂直搜索引擎的現(xiàn)狀與發(fā)展探究;王文鈞,李;(長春理工大學圖書館,吉林長春130022);摘要:本文首先介紹了垂直搜索引擎的概況和特點,對;文獻標識碼:A;文章編號:1007-7634(2010)03-0;CurrentSituationandDevel;WANGWen-Jun,LIWei;(Libraryof
第28卷第3期2010年3月Vol.28,No.3March,2010
垂直搜索引擎的現(xiàn)狀與發(fā)展探究
王文鈞,李
巍
(長春理工大學圖書館,吉林長春130022)
摘要:本文首先介紹了垂直搜索引擎的概況和特點,對其與綜合搜索引擎的關(guān)系以及國內(nèi)外垂直搜索引擎的現(xiàn)狀做了總結(jié),最后論述了它的發(fā)展方向。關(guān)鍵詞:垂直搜索引擎;綜合搜索引擎;結(jié)構(gòu)化信息中圖分類號:G250.73
文獻標識碼:A
文章編號:1007-7634(2010)03-0477-04
CurrentSituationandDevelopmentoftheVerticalSearchEngines
WANGWen-Jun,LIWei
(LibraryofChangchunUniversityofScienceandTechnology,Changchun130022,China)Abstract:Thisarticlefirstlyintroducedtheverticalsearchengine'sprofileandcharacteristics,summarizedtherelationshipbetweenthecomprehensivesearchengineandtheverticalsearchengine'sstatusofdomesticandforeign,finallyitdiscussesthedirectionofit'sdevelopment.Keywords:verticalsearchengine;comprehensivesearchengine;structuredinformation
目前,網(wǎng)上綜合性的傳統(tǒng)搜索引擎發(fā)展日益成熟,能夠較好地滿足廣大用戶的檢索需求。但網(wǎng)絡(luò)技術(shù)發(fā)展與網(wǎng)絡(luò)信息增長迅速,網(wǎng)絡(luò)信息的用戶也越來越多,相比之下,綜合搜索引擎在索引數(shù)據(jù)庫建設(shè)、信息收集等方面存在很多不足,導(dǎo)致了信息查準率低、有用信息含量低等問題。尤其在滿足用戶的專業(yè)檢索需求時這些問題更為突出,這樣難以滿足專業(yè)人士的檢索需求。因此,應(yīng)開發(fā)搜索質(zhì)量更準確、相關(guān)性更復(fù)雜的搜索引擎,以追求在某一學科或某一行業(yè)領(lǐng)域有最佳的檢索效率及效果,各種垂直搜索引擎隨之產(chǎn)生。垂直搜索引擎的應(yīng)運而生,成為搜索引擎發(fā)展史上的一塊里程碑。
應(yīng)用于搜索某一學科領(lǐng)域或某一類信息(如圖像、影像)的專業(yè)搜索引擎,又稱為專題搜索引擎、專門搜索引擎,是搜索引擎的細分和延伸【1】。是專為查詢某一學科或主題的信息而產(chǎn)生的查詢工具,是相對綜合搜索引擎的信息量大、查詢不準確、深度不夠等提出來的新的搜索引擎服務(wù)模式。
⑴垂直搜索引擎的特點。垂直搜索引擎抓取的
數(shù)據(jù)來源于垂直搜索引擎關(guān)注的行業(yè)站點:例如:找工作的搜索引擎的數(shù)據(jù)來源于:
,www.zhaoping.com,等等;
⑵垂直搜索引擎的搜索行為是基于結(jié)構(gòu)化數(shù)
據(jù)和元數(shù)據(jù)的結(jié)構(gòu)化搜索,抓取的數(shù)據(jù)傾向于結(jié)構(gòu)化數(shù)據(jù)和元數(shù)據(jù):例如:比如在某個購物類的垂直搜索引擎上輸入“mp3”,就會出現(xiàn)該產(chǎn)品的相關(guān)屬性如:內(nèi)存,尺寸、大小、電池型號、價格、生產(chǎn)廠家等相
。1971-),
1垂直搜索引擎概述
垂直搜索引擎(VerticalSearchEngine)是指
收稿日期:2009-10-05
作者簡介:王文鈞(1971-),女,山西人,館員,碩士研究生,主要從事網(wǎng)絡(luò)信息檢索和文檢課教學研究;李
女,吉林人,講師,博士生,主要從事公共管理研究.
478
關(guān)技術(shù)屬性,有的還提供比價服務(wù)。
情報科學28卷
評價,同時允許用戶定制自己的搜索需求;還充分考慮了多種中文的需求,能夠支持主流的中文編碼標準,包括GBK、GB2312、BIG5,并且能夠在不同的編碼之間轉(zhuǎn)換,更加符合中文用戶的搜索習慣;在檢索功能方面支持布爾邏輯檢索;搜索速度快,平均響應(yīng)間低于0.15秒【3】。其他垂直搜索引擎還有比價購物類搜索引擎,供求信息類搜索引擎、工作類搜索引擎、博客類搜索引擎等等,更貼切地滿足用戶需求。
⑶不同于傳統(tǒng)廣告收費的新模式。由于數(shù)據(jù)來
源得到了詳細劃分,使得用戶在使用垂直搜索引擎時一方面操作簡單,另一方面,通常使用垂直搜索引擎的用戶目標性都比較明確,購買的可能性相對比較大。企業(yè)針對這種用戶在廣告投放或者其它方面進行合作,顯然更為準確有效,所以垂直搜索采用每行動成本的收費模式【6】。
垂直搜索引擎和綜合搜索引擎都是幫助網(wǎng)絡(luò)用戶查找網(wǎng)絡(luò)相關(guān)信息的工具,這是它們最重要的相同點。起初,人們對搜索引擎的要求是從網(wǎng)絡(luò)上如何找到更多的信息,隨著網(wǎng)絡(luò)信息的迅速膨脹,發(fā)展到如何找到準確、有用的信息。這正是綜合搜索引擎面臨的最大挑戰(zhàn),垂直搜索引擎能解決以上問題,它專門用來檢索某一主題范圍或某一類型信息,追求專業(yè)性與服務(wù)深度【4】。垂直搜索引擎與綜合搜索引擎相比,信息服務(wù)模式有所變化,它更加注重信息的專深性,更體現(xiàn)“以人為本”的理念。它們之間最大區(qū)別是垂直搜索引擎對網(wǎng)頁信息進行了結(jié)構(gòu)化信息抽取,也就是將網(wǎng)頁的非結(jié)構(gòu)化數(shù)據(jù)抽取成特定的結(jié)構(gòu)化信息數(shù)據(jù)。
2006年以來,國內(nèi)垂直搜索引擎與相關(guān)行業(yè)相
結(jié)合,在房地產(chǎn)、IT信息、招聘、購物、生活服務(wù)及證券投資方面發(fā)展迅猛。但是盡管國內(nèi)的垂直搜索引擎發(fā)展較快,但與國外的相比,無論是在數(shù)據(jù)挖掘、開放接口、信息共享等技術(shù)層面還是在行業(yè)經(jīng)驗上都還有很多差距,這就大大的限制了垂直搜索引擎的發(fā)展,使得專業(yè)化搜索服務(wù)還無法在社會的各個領(lǐng)域得到廣泛發(fā)展。國外的垂直搜索引擎正處于一個蓬勃發(fā)展的時期,各種專業(yè)搜索引擎層出不窮,許多專門領(lǐng)域都有自己的垂直搜索引擎,以下幾個是最有代表性的。
LIBClient-IRISWeb系統(tǒng)是NorthCarolina大
學計算機科學系和法學院聯(lián)合開發(fā)研制的,可以用自然語言對網(wǎng)上的法律信息進行全文檢索,使得用戶獲得全面高質(zhì)的法律專業(yè)信息的效率大大提高;
2國內(nèi)外垂直搜索引擎現(xiàn)狀
根據(jù)易觀國際對2008年第1、2季度中國搜索引擎市場的季度監(jiān)測研究表明,2008年上半年,中國搜索引擎市場規(guī)模為21.5億元,到2008年底,中國搜索引擎市場規(guī)模達到53.2億元。其中,各類異軍突起的垂直搜索引擎占了相當大的分量。
垂直搜索引擎的應(yīng)用領(lǐng)域很多,比如找工作的搜索、旅游搜索、醫(yī)藥搜索、圖書搜索、購物搜索,各行各業(yè)都可以進一步細化成各類的垂直搜索引擎,相比綜合性的搜索引擎,垂直搜索引擎更能匹配大眾在某些方面的一些特定需求。國內(nèi)最具有代表性的是賽迪IT羅盤(),它是由賽迪網(wǎng)推出的國內(nèi)第一個中文IT垂直搜索引擎,是中文領(lǐng)域首個真正意義上的垂直搜索引擎。目前收錄了2萬多條IT網(wǎng)址和數(shù)百萬IT網(wǎng)頁數(shù)據(jù),涵蓋了IT領(lǐng)域的絕大多數(shù)網(wǎng)絡(luò)信息資源。同以往搜索引擎不同的是,賽迪“IT羅盤”提供經(jīng)過人工加工和精選的網(wǎng)頁檢索功能,而且網(wǎng)站目錄也全部經(jīng)過人工分類、整理,收錄了大量經(jīng)過嚴格過濾和人工加工的網(wǎng)站,分類科學,查詢簡捷;充分融入了人性化的設(shè)計,為用戶提供開放的接口,允許用戶參與網(wǎng)站
Elsevier的Scirus系統(tǒng)是一種專為搜索高度相關(guān)的
科學信息而設(shè)計的搜索引擎,是目前互聯(lián)網(wǎng)上最全面、綜合性最強的科技文獻門戶網(wǎng)站之一。它只面向包含有科學內(nèi)容的網(wǎng)站。WallStreetResearch
Network是由美國WSRN公司開發(fā)建立的經(jīng)濟與
財經(jīng)類的專業(yè)搜索引擎,專門檢索經(jīng)濟研究、工商企業(yè)、市場新聞、共同基金、投資中介商和經(jīng)濟研究出版物等各類信息【8】。在國外,垂直搜索引擎已經(jīng)開始向行業(yè)收費。以旅行網(wǎng)站Expedia為例,當有旅行者通過Expedia搜索向美國航空公司訂票的時候,依照二者的合作協(xié)議,前者將向后者收取一定的服務(wù)費,從幾美元到幾十美元不等【9】。
目前垂直搜索引擎主要盈利模式是基于競價排名的廣告模式,具體廣告在向垂直搜索引擎購買該項服務(wù)后,通過注冊一定數(shù)量的關(guān)鍵詞,按照付費最高者排名靠前的原則,購買了同一關(guān)鍵詞的網(wǎng)站按不同的順序進行排名,這就帶來了一系列問題。出價高的網(wǎng)頁排列在前,出價少的就必然排列在后,一味地根據(jù)廣告費用來決定頁面的排列方式,這將會帶來用戶的不信任,但是如果沒有廣告收入,對垂直搜索行業(yè)也是無法承受的【12】。
3期垂直搜索引擎的現(xiàn)狀與發(fā)展探究479
公眾免費開放。中國雅虎的“一頁搜索”,就是一個智
3垂直搜索引擎的發(fā)展
垂直搜索引擎從誕生開始就被人們關(guān)注,從理論上來說,它的查準率應(yīng)該比綜合搜索引擎高的多。經(jīng)過幾年的發(fā)展,垂直搜索引擎已經(jīng)以其智能化、個性化、精確化、專業(yè)化等特點得到越來越多的網(wǎng)絡(luò)用戶的認可。但是,其數(shù)量和規(guī)模還遠遠不夠,而且在信息服務(wù)方面還有待深入和加強,隨著新技術(shù)的發(fā)展和門檻的降低,垂直搜索引擎將向著以下適應(yīng)不同用戶需求的方向不斷發(fā)展。
能化搜索,搜集并分析使用者的搜索意圖,提供優(yōu)化后的搜索結(jié)果;然后通過這個整合平臺,把綜合搜索和垂直搜索整合到一起,使搜索化繁為簡,引領(lǐng)了搜索引擎的又一個發(fā)展。再例如Healthline的醫(yī)療垂直搜索平臺使用組合語義查尋技術(shù)和全面消費健康分類學,分類數(shù)據(jù)由超過850,000項醫(yī)療相關(guān)元數(shù)據(jù),和50000條相互關(guān)連的醫(yī)療概念組成。這些獨特資源使Healthline翻譯每天用戶使用語言以便精確地匹配醫(yī)療術(shù)語,使得消費者能迅速從結(jié)果中判斷確切的需要信息【9】。
⑴目錄精細化方向發(fā)展。由于垂直搜索引擎相
對于綜合搜索引擎的最大優(yōu)勢,是對信息進行深度的、精細化的處理。與早期的網(wǎng)址分類搜索引擎相似,但垂直搜索引擎只選定了某一特定行業(yè)或某一主題進行目錄的細化分類,結(jié)合機器抓取行業(yè)相關(guān)站點的信息提供專業(yè)化的搜索服務(wù)。這種專業(yè)化的分類目錄,很容易讓用戶迅速知道自己要找的是什么,并且按目錄點擊就能找到。looksmart在日本推出了專門搜索飲食方面文章的垂直搜索引擎
⑶向交易平臺發(fā)展。垂直搜索引擎由于自身對行業(yè)的專注,使得它可以提供行業(yè)信息深度和廣度
的整合提供更加細致周到的服務(wù)。對消費領(lǐng)域可以推出針對某一行業(yè)的搜索交易平臺。搜索交易平臺提供行業(yè)內(nèi)商家和顧客直接溝通、咨詢不再需要轉(zhuǎn)到第三方平臺再進行交易。搜索交易平臺有可能發(fā)展成ebay,taobao那樣的購物平臺,如餐飲搜索引擎
gudumami.cn上你可以搜索到幾乎任何一種飯店的
菜。垂直搜索交易平臺和一般的垂直搜索平臺最大的區(qū)別在于數(shù)據(jù)源的來源和服務(wù)的專業(yè)化。就象比較購物網(wǎng)站,其主要功能是通過對網(wǎng)上購物信息的采集和整理,提供商品和商家的各種信息供消費者進行比較,包括商品種類、價格、經(jīng)銷商等信息,從而為消費者提供網(wǎng)上購物參考。我國網(wǎng)絡(luò)購物搜索引擎經(jīng)過近10年來的發(fā)展,取得了快速的發(fā)展,未來兩三年內(nèi)將步入快速上升期【5】。
LooksmartJapanesefood,Looksmart又推出了多達19個獨立的垂直搜索引擎,分別涉足汽車、城市、教
育、健康、家庭生活、賺錢、音樂、娛樂、運動、時尚、科技、游戲、旅行等。還有比如作為電子書搜索引擎的愛搜書,它不僅提供全方位的電子書精準搜索,而且還為讀者提供了一套全面的閱讀服務(wù),只要是愛看書的讀者到這個平臺一定不會漫無目的,因為這個平臺包含了許多個分類頻道,想看什么直接進去看就會一目了然,都是垂直搜索引擎進行目錄細化分類的結(jié)果。未來的垂直搜索引擎將會更加精細的劃分不同的行業(yè),用戶想要什么就可以得到什么【10】。
⑷本地搜索。來自咨詢機構(gòu)TheKelseyGroup
數(shù)據(jù)表明全球本地搜索的市場規(guī)模在2006年就達到41億美元,2011年將達到111億美元,年均復(fù)合增長率為22.3%。到目前為止,各大搜索引擎
⑵深度挖掘分析元數(shù)據(jù)。其特點是:元數(shù)據(jù)模
型再組織、再整合、深度數(shù)據(jù)挖掘、互動性。通過對元數(shù)據(jù)信息進入深度加工,該類垂直搜索引擎為用戶提供綜合搜索引擎無法做到的專業(yè)性、功能性、關(guān)聯(lián)性,有的加入了用戶信息管理以及信息發(fā)布互動功能,能很好地滿足了用戶對專業(yè)性、準確性、功能性、個性化的需求。目前網(wǎng)上的深度挖掘型垂直搜索引擎涉及領(lǐng)域已經(jīng)相當廣,一些發(fā)展的相當成熟。行業(yè)從業(yè)人員非常關(guān)注行業(yè)的歷史發(fā)展、最新動向、趨勢等話題。垂直搜索引擎集中了行業(yè)海量的信息和數(shù)據(jù),基于這些信息和數(shù)據(jù)的商務(wù)智能分析,將為行業(yè)創(chuàng)造非常有價值的信息增值服務(wù)。目前,各個垂直搜索引擎開始加強數(shù)據(jù)分析功能,分析的結(jié)果尚未向
Google、Yahoo、MSN都推出了本地搜索而且都相對
成熟。本地搜索的關(guān)鍵需求在于人們大多是在本地購物、就餐、娛樂、健身、修車、工作等。國內(nèi)的幾大綜合搜索引擎的本地搜索從2005年初開始到現(xiàn)在仍停留在地圖+黃頁+公交指路的地圖搜索水平階段。國內(nèi)做本地搜索的citysee等同樣沒提供地圖定位功能?傮w來說國內(nèi)的本地搜索在數(shù)據(jù)挖掘、開放接口、信息共享方面和國外相比存在很大差距,國外的垂直搜索已經(jīng)形成了事實上的數(shù)據(jù)供應(yīng)鏈關(guān)系。當然隨著國內(nèi)垂直搜索的發(fā)展,各種合作肯定會使本地搜索能提供好的服務(wù)。以目前最火爆的酷訊搜房為例,利用GPS、衛(wèi)星地圖等定位技術(shù)和地圖搜索方式讓用戶得到的地理信息更加確鑿,終于成為行業(yè)
480
楷模。
情報科學28卷
工智能技術(shù)和數(shù)據(jù)庫技術(shù)的發(fā)展,應(yīng)用越來越廣泛。未來的搜索也必然是以滿足各類互聯(lián)網(wǎng)用戶的需求
4結(jié)論
為目的,這決定了它的更直觀、精準、智能化、人性化的發(fā)展方向。垂直搜索引擎的目標是幫助用戶解決問題,而不只是向通用搜索引擎一樣發(fā)現(xiàn)信息,,這一點是垂直搜索引擎的終極目標。在未來幾年,垂直搜索引擎將會有更大的發(fā)展空間和機會。
參考文獻
1李曉明,等.搜索引擎原理技術(shù)與系統(tǒng)[M].北京.科學出版
社,2007:2-7.
垂直搜索引擎概念的提出,可以簡單的說成是搜索引擎領(lǐng)域的行業(yè)化分工。眾多專業(yè)性網(wǎng)站、行業(yè)網(wǎng)站獨立服務(wù)于互聯(lián)網(wǎng)的成功,恰恰證明了互聯(lián)網(wǎng)的格局應(yīng)該是多方面的。通用搜索引擎的性質(zhì),決定了其不能滿足特殊領(lǐng)域、特殊人群的精準化信息需求服務(wù)。市場需求多元化決定了搜索引擎的服務(wù)模式必將出現(xiàn)細分,針對不同行業(yè)提供更加精確的行業(yè)服務(wù)模式。可以說通用搜索引擎的發(fā)展為垂直搜索引擎的出現(xiàn)提供了良好的市場空間,勢必將出現(xiàn)垂直搜索引擎在互聯(lián)網(wǎng)中占據(jù)部分市場的趨勢,也是搜索引擎行業(yè)細分化的必然趨勢。
網(wǎng)易新搜索引擎的構(gòu)架師之一周楓認為,未來的搜索應(yīng)該是簡單、直觀、智能,同時也是個性化與人性化的統(tǒng)一,這比較全面地概括了未來搜索的方向。因此垂直搜索引擎還要逐步實現(xiàn)支持自然語言檢索,實現(xiàn)基本的人機對話;提供交叉語言檢索;支持跨平臺多語言的文檔處理;擴大檢索范圍;建立用戶反饋機制,增強用戶與搜索引擎的交互;用戶界面也朝著智能化、個性化方向發(fā)展等。
垂直引擎作為整個Internet信息海洋中獲取行業(yè)信息的有力工具之一,將隨著計算機網(wǎng)絡(luò)技術(shù)、人
2羅麗珊.垂直搜索引擎發(fā)展概述[J].圖書館學研究,2006,(12):68-70,55.
3吳右昕.網(wǎng)絡(luò)搜索引擎的發(fā)展趨勢分析[J].當代傳播,2007,(3):73-74.
4陳新顏.垂直搜索引擎辨析[J].現(xiàn)代情報,2004,(9):133-134.5Pratt.MarkK..QualityOverQuantity[J].Computerworld,2008,7(42):35-35.
6Notess,GregR..CustomSearchEngines[J].ComputersinLibraries,2008,5(28):16-17.
7楊皖蘇.垂直搜索引擎發(fā)展策略探討[J].商業(yè)時代,2009,(23):94-95.
8HollyG.Withspecialtysearchengines[J].TeacherLi-brarian,2004,32(2):50.9王
瓊.搜索引擎的四大發(fā)展趨勢[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2005,
(3):29-30.
10何東炯.搜索無所不在.軟件世界[J].2005,(9):52-54.
(責任編輯:劉鳳勤)
(上接第399頁)
KnowledgeNetworks,networksinAction[M].Berlin,Heidel-berg,NewYork,Tokyo:Springer-Verlag,1995:159-174.7AndreasSeufert,etal.Towardsknowledgenetworking[J].Jour-nalofknowledgeManagement1999,3(3):180-190.
8JarvenpaaSK,TanriverdiH.LeadingVirtualKnowledgeNet-works[J].OrganizationalDynamics,2003,31(4):403-412.9CarleyKM.InformationTechnologyandKnowledgeDistribu-tioninC31teams[A].Proceedingsofthe2002CommandandControlResearchandTechnologySymposium[C].Vienna,2002.10
CarleyKM.ComputationalOrganizationScience:Anew
Frontier[A].ProceedingsoftheNationalAcademyofSci-encesoftheUnitedStatesofAmerica[C].America,2002,(5):7257-7262.
11WangJ.AKnowledgeNetworkConstructedbyIntegrating
Classification,thesaurus,andmetadataindigitallibrary[J].In-ternationalInformation&LibraryReview,2003,35383-397.
12趙蓉英,邱均平.知識網(wǎng)絡(luò)研究(Ⅱ):知識網(wǎng)絡(luò)的概念、內(nèi)
涵和特征[J].情報學報,2007,(6):470-476.
(2-4):
13張樹良,冷伏海.基于文獻的知識發(fā)現(xiàn)的應(yīng)用進展研究[J].
情報學報,2006,(6):700-712.
(責任編輯:孫曉明)
三億文庫3y.uu456.com包含各類專業(yè)文獻、應(yīng)用寫作文書、外語學習資料、專業(yè)論文、生活休閑娛樂、行業(yè)資料、73垂直搜索引擎的現(xiàn)狀與發(fā)展探究等內(nèi)容。
下載地址:73垂直搜索引擎的現(xiàn)狀與發(fā)展探究.Doc
【】最新搜索
垂直搜索引擎的現(xiàn)狀與發(fā)展探究
分析老公出軌的表現(xiàn),挽留他該說什么話
耐堿玻璃纖維化學分析ppt_圖文
食堂采購驗收單
同煤集團召開
河北省辛集中學08—09學年高三第一學期第二次階段考試(語文
讀《致青年教師》——“你一定能寫好的!”
imail8.22
必修一閱讀專練2含答案,40分鐘
圖解駕照扣分最新規(guī)定 搶黃燈要被扣6分
本文關(guān)鍵詞:垂直搜索引擎的現(xiàn)狀與發(fā)展探究,由筆耕文化傳播整理發(fā)布。
本文編號:103313
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/103313.html