Google搜索引擎的數(shù)學(xué)模型及其應(yīng)用
本文關(guān)鍵詞:Google搜索引擎的數(shù)學(xué)模型及其應(yīng)用,由筆耕文化傳播整理發(fā)布。
數(shù)學(xué)建模競賽
第36卷第3期
‘一……。May
201oJoumaIIofSouthw西est南Un民iv族ers大ity學(xué)fo學(xué)r
N報ati。on自al然itie苧s.
N學(xué)at版ural
1ScienceEdition
文章編號:1003-2843(2010)03-0480--07
Google搜索引擎的數(shù)學(xué)模型及其應(yīng)用
趙國,宋建成
(西南民族大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院,四川成都610041)
摘要:該文在闡明Google搜索引擎中關(guān)鍵的頁面等級算法(PageRallk)原理的基礎(chǔ)上,,分析了PageRank算法的隨機(jī)沖浪模型,并著重討論相應(yīng)的數(shù)學(xué)模型在足球隊排名問題(1993年全國大學(xué)生數(shù)學(xué)建模競賽B題)中的應(yīng)用.具體做法是綜合考慮各隊的比賽成績,為每支球隊計算相應(yīng)的等級分(Rank),然后根據(jù)各隊的等級分高低來確定名次.考慮到競技比賽結(jié)果的不確定性,最后建立了等級分的隨機(jī)沖浪模型.分析表明等級分排名結(jié)果具有良好的參數(shù)穩(wěn)定性,并且可以成功地處理數(shù)據(jù)缺損方面的困難.
關(guān)鍵詞:搜索引擎;GooglePageRank算法;隨機(jī)沖浪模型;足球隊排名問題中圖分類號:0141.4
文獻(xiàn)標(biāo)識碼:A
1
引言
據(jù)統(tǒng)計,在短短20多年的時間里,Intemet中產(chǎn)生的信息量相當(dāng)于人類過去100年產(chǎn)生的信息總量,而且
Internet上的信息量正以幾何級數(shù)遞增.搜索引擎已經(jīng)成為人們進(jìn)行Internet信息資源搜索必不可少的工具.在
眾多的搜索引擎中,Google搜索引擎以其雄厚的技術(shù)為支撐,憑借其強(qiáng)大的檢索功能和高質(zhì)量的檢索服務(wù),逐
漸脫穎而出.Google搜索引擎是由斯坦福大學(xué)SergeyBrin和LawrencePage共同設(shè)計的…,它是目前功能最強(qiáng)的搜索引擎.通過對80億網(wǎng)頁進(jìn)行整理,Google可為世界各地的用戶提供所需的搜索結(jié)果,而且搜索速度極快,
通常不到半秒,每天可提供約3億次查詢服務(wù).
圖1
Google搜索引擎的工作原理示意圖
圖2Intemet網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)
Google的優(yōu)勢在于掌握的信息量以及檢索模型和檢索速度.傳統(tǒng)的搜索引擎在很大程度上取決于文字在
網(wǎng)頁上出現(xiàn)的頻率.Google使用PageRank技術(shù)檢查整個網(wǎng)絡(luò)鏈接結(jié)構(gòu),并確定哪些網(wǎng)頁重要性最高.然后進(jìn)
行超文本匹配分析(HypeneXtMatchingAnalysis),以確定哪些網(wǎng)頁與正在執(zhí)行的特定搜索相關(guān).在綜合考慮整體
收稿日期:2010.03.13
作者簡介:趙國(1979.),男,碩士,西南民族大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院講師,主要研究方向為金融數(shù)學(xué)、數(shù)學(xué)模型
基金項目:西南民族大學(xué)青年項目.
本文關(guān)鍵詞:Google搜索引擎的數(shù)學(xué)模型及其應(yīng)用,由筆耕文化傳播整理發(fā)布。
本文編號:199066
本文鏈接:http://sikaile.net/kejilunwen/yysx/199066.html