天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

搜索引擎結(jié)果排序中模糊聚類算法及推薦技術(shù)的應(yīng)用

發(fā)布時間:2014-09-16 15:55
【摘要】 如今互聯(lián)網(wǎng)上資源的豐富和人們對互聯(lián)網(wǎng)的依賴,使得人們在瀏覽網(wǎng)絡(luò)資源的同時想的更多的是如何能快速、準確地從互聯(lián)網(wǎng)上獲取對自己有用的信息。搜索引擎系統(tǒng)就成為了最受歡迎的獲取網(wǎng)絡(luò)資源的工具。然而,人們在體驗搜索引擎系統(tǒng)帶來方便時,也體會到了要獲取準確、有用的網(wǎng)絡(luò)資源所帶來的困難。目前的搜索引擎主要的思路是將查詢關(guān)鍵詞與互聯(lián)網(wǎng)上的資源進行匹配,再返回檢索結(jié)果。但查詢的關(guān)鍵詞含有多種語義,從而使得檢索的結(jié)果存在著主題漂移的現(xiàn)象。而且用戶需要在檢索結(jié)果中進行不斷的篩選,以此來尋找有用的資料,這使得用戶需要耗費大量的時間在檢索結(jié)果上。為了解決以上問題,本文提出了一種基于模糊聚類算法的搜索引擎結(jié)果排序新方法,即IPCM算法。為了優(yōu)化檢索結(jié)果的排序,本文將傳統(tǒng)的推薦技術(shù)進行了融合,形成了融合推薦算法。并將IPCM算法和融合推薦算法相結(jié)合,應(yīng)用到搜索引擎結(jié)果排序中。并通過實驗驗證了算法的可行性和優(yōu)越性。本文有以下三個創(chuàng)新點:(1)提出了一種改進的PCM算法,即IPCM算法。本文為了克服了PCM算法對初始值敏感的問題,將用戶的興趣愛好模型作為IPCM算法的初始矩陣。以用戶興趣愛好為模型的初始矩陣符合用戶檢索的習慣,使IPCM算法在更新聚類中心和更新分類矩陣收斂之后所得到的結(jié)果更符合用戶所查詢的主題,防止了主題漂移。(2)將傳統(tǒng)推薦技術(shù)進行融合形成了一種融合推薦算法。對于傳統(tǒng)推薦的技術(shù),采取取長補短的方法,對基于用戶協(xié)同過濾推薦技術(shù)、基于內(nèi)容的推薦技術(shù)這兩種技術(shù)進行融合,并將融合推薦算法運用到搜索引擎中。該融合推薦算法對搜索引擎結(jié)果排序有較好的優(yōu)化能力。而且,當使用IPCM算法出現(xiàn)錯誤時,融合推薦算法在一定程度上對搜索引擎結(jié)果排序進行了彌補。(3)提出了一種基于模糊聚類算法及融合推薦算法的搜索引擎結(jié)果排序新方法。該算法是將IPCM算法和融合推薦算法進行結(jié)合后,應(yīng)用到搜索引擎結(jié)果排序中。算法避免了檢索主題的漂移問題,提高了搜索引擎檢索的效率。 還原
 
【關(guān)鍵詞】 搜索引擎; 模糊聚類; 初始矩陣; 推薦技術(shù); 用戶興趣愛好;

    現(xiàn)階段,用戶對于搜索結(jié)果的要求不滿足于單一結(jié)果的呈現(xiàn),而是希望搜索結(jié)果更具個性化,搜索結(jié)果能夠按照一定的主次順序排列出來,給用戶多種選擇;谀:垲愃惴巴扑]技術(shù)的搜索引擎結(jié)果能夠進一步細化搜索數(shù)據(jù),從而使用戶從中挑選最符合心理預(yù)期的內(nèi)容,這兩項技術(shù)的應(yīng)用能夠在一定程度上保障搜索數(shù)據(jù)的準確性。
  1 搜索引擎結(jié)果排序所依托的技術(shù)項目內(nèi)容提要
  1.1 模糊聚類算法
  模糊聚類算法分析是數(shù)據(jù)挖掘領(lǐng)域的核心技術(shù)之一。模糊C-均值聚類算法是一種基于原型的聚類算法。從以往綜合搜索引擎技術(shù)的發(fā)展過程來看,它能夠解決大量數(shù)據(jù)的復(fù)雜形態(tài)處理問題。模糊聚類算法具有操作簡單、手段高效、數(shù)據(jù)適應(yīng)性強等執(zhí)行特征[1]。從近年來國內(nèi)相關(guān)領(lǐng)域的研究資料中可以看到,模糊聚類算法分析是搜索引擎技術(shù)環(huán)節(jié)中使用最為頻繁的算法和研究內(nèi)容。
  1.2 推薦技術(shù)
  將傳統(tǒng)推薦技術(shù)與搜索引擎結(jié)果排序進行整合,有效避免了推薦技術(shù)在實踐過程中的信息繁雜性,優(yōu)化了搜索結(jié)果的精準度。推薦技術(shù)是針對用戶的所搜索的關(guān)鍵詞而擴展而來的綜合信息推薦技術(shù),它是一種收集并整合信息的過程,同時具有一定的復(fù)雜性[2]。正是這些特點的存在,使得傳統(tǒng)推薦技術(shù)出現(xiàn)了種種問題,即用戶還需要在繁雜的數(shù)據(jù)中搜索與目標對象有關(guān)的數(shù)據(jù),這就影響搜索數(shù)據(jù)信息的及時性。
  2 通過多種技術(shù)的整合能夠解決搜索引擎結(jié)果單一化的問題
  在目前,諸多應(yīng)用領(lǐng)域都采取有效的搜索本文由筆耕文化傳播http://www.bigengculture.com/收集整理方式進行整合與提取信息,以便于實現(xiàn)數(shù)據(jù)互通的效果。在一般搜索引擎上,只要采用相同的關(guān)鍵詞,則大家所搜索到的詞條結(jié)果是一致的。但正是這種搜索引擎結(jié)果的單一性,使得搜索被業(yè)界技術(shù)工作者萌生了進一步開發(fā)搜索技術(shù)的想法,使其能夠滿足用戶的個性化需求。基于此,基于模糊聚類算法及推薦技術(shù)的搜索引擎結(jié)果排序研究被更多的專業(yè)人士所關(guān)注,并且取得了良好的研究成果。從實踐應(yīng)用來看,該項技術(shù)整合理念與研究內(nèi)容較為可行。
  2.1 探究模糊聚類算法的應(yīng)用對于搜索引擎結(jié)果排序的影響
  模糊聚類算法的實際應(yīng)用對于搜索引擎結(jié)果的正確排序有著極為深遠的影響。從操作步驟來看,模糊聚類算法的實踐應(yīng)用過程中被業(yè)界所看重的關(guān)鍵研究內(nèi)容有四點:1)如何對FCM算法中目標函數(shù)恰當定義使該目標函數(shù)既能反映有關(guān)“數(shù)據(jù)距離”的要求原則,又能體現(xiàn)各個特征以及不同樣本的重要性,模糊聚類算法的應(yīng)用使搜索引擎結(jié)果更加有序;2)無論FCM算法中目標函數(shù)如何定義,均會有相應(yīng)的聚類原型與之對應(yīng),從而收斂速度甚至聚類效果必然依賴初始劃分,如何建立一種基于模糊理論的聚類算法來規(guī)避聚類原型的問題,即從根本上解決對初始劃分的敏感性,只有這樣,才能解決搜索引擎結(jié)果的精準度問題;3)如何恰當?shù)娜タ坍嫲氡O(jiān)督FCM算法,使監(jiān)督樣本既能體現(xiàn)其典型性,又不失其局限性;4)如何減少FCM算法的計算量問題,該項問題是否能夠處理的得當,不僅關(guān)系到搜索引擎結(jié)果排序的質(zhì)量,而且對于用戶執(zhí)行搜索任務(wù)的體驗感受有著直接影響[3]。總之,模糊聚類算法與搜索引擎結(jié)果排序之間有著細微的關(guān)聯(lián)。
  2.2 探究推薦技術(shù)的應(yīng)用對于搜索引擎結(jié)果排序的影響
  推薦技術(shù)的應(yīng)用能夠最大化的豐富搜索引擎結(jié)果排序的內(nèi)容,使得用戶的搜索結(jié)果更具個性化的特點,以便于用戶從中挑選中最為合適的搜索內(nèi)容,提高搜索效率[4]。一般情況下,如果系統(tǒng)所推薦的項目是以文本的方式呈現(xiàn),那么文本詞匯就是系統(tǒng)執(zhí)行搜索的主要依據(jù)。系統(tǒng)通過詞條特點將搜索引擎檢索的結(jié)果進行分類,從而將數(shù)據(jù)按照一定的次序排列出來,用戶就可以根據(jù)排序結(jié)果選擇與搜索關(guān)鍵詞最為貼切的項目,直至完成搜索任務(wù);谟脩舻南到y(tǒng)過濾推薦技術(shù)是現(xiàn)代網(wǎng)絡(luò)信息處理環(huán)節(jié)中最為高校的一種搜索技術(shù),它具有很重要的現(xiàn)實意義。
  3 基于模糊聚類算法與推薦技術(shù)應(yīng)用模式下的搜索引擎結(jié)果排序研究
  解決搜索結(jié)果單一的方法是提供個性化服務(wù),并依托模糊聚類算法和推薦技術(shù)等內(nèi)容共同實現(xiàn)智能搜索,將搜索結(jié)果按照一定的順次呈現(xiàn)給用戶[5]。另外,在實踐過程中,也可以通過Web數(shù)據(jù)挖掘技術(shù),構(gòu)建完整的用戶模型,包括用戶背景、搜索行為、查詢風格等等,通過這些細節(jié)的實施與完善,為用戶提供更多個性化服務(wù),同時使得搜索引擎結(jié)果排序更為精準,提升用戶搜索的效率。
  4 結(jié)束語
  通過對搜索引擎結(jié)果排序所依托的技術(shù)項目的研究,分別闡述模糊聚類算法及推薦技術(shù)的概念及特點,進一步探究模糊聚類算法的應(yīng)用對于搜索引擎結(jié)果排序的影響,以及推薦技術(shù)的應(yīng)用對于搜索引擎結(jié)果排序的影響,并且細致分析了在二者共同作用下搜索引擎結(jié)果排序的變動。從各項研究內(nèi)容中我們可以明確一個問題,即搜索引擎結(jié)果排序方式受到了模糊聚類算法與推薦技術(shù)等現(xiàn)代化手段的影響,其應(yīng)用結(jié)果較為顯著,值得在相關(guān)技術(shù)領(lǐng)域中推廣實施。

    參考文獻:



本文編號:9008

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/9008.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3757a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com