百度的大數(shù)據(jù)實(shí)踐
本文關(guān)鍵詞:百度的大數(shù)據(jù)實(shí)踐
更多相關(guān)文章: 搜索引擎 海量數(shù)據(jù) 互聯(lián)網(wǎng) 百度 用戶 數(shù)據(jù)應(yīng)用 關(guān)鍵詞 網(wǎng)頁數(shù)據(jù)庫 信息 數(shù)據(jù)產(chǎn)品
【摘要】:正互聯(lián)網(wǎng)搜索引擎從第一天開始就是大數(shù)據(jù)應(yīng)用,互聯(lián)網(wǎng)產(chǎn)生了海量數(shù)據(jù),如何從中找到需要的信息就是一個(gè)大數(shù)據(jù)的命題。搜索引擎正好解決這一問題,網(wǎng)絡(luò)爬蟲首先從數(shù)以千億級(jí)的網(wǎng)頁中搜集信息,建立網(wǎng)頁數(shù)據(jù)庫。當(dāng)用戶以關(guān)鍵詞查找信息時(shí),搜索引擎會(huì)在數(shù)據(jù)庫中進(jìn)行搜尋,如果找到與用戶查詢語句相符的網(wǎng)站,便采用排序算法——通常根據(jù)網(wǎng)頁中關(guān)鍵詞的匹配程
【作者單位】: 百度公司;
【關(guān)鍵詞】: 搜索引擎 海量數(shù)據(jù) 互聯(lián)網(wǎng) 百度 用戶 數(shù)據(jù)應(yīng)用 關(guān)鍵詞 網(wǎng)頁數(shù)據(jù)庫 信息 數(shù)據(jù)產(chǎn)品
【分類號(hào)】:F49
【正文快照】: 互聯(lián)網(wǎng)搜索引擎從第一天開始就是大數(shù)據(jù)應(yīng)用,互聯(lián)網(wǎng)產(chǎn)生了海量數(shù)據(jù),如何從中找到需要的信息就是一個(gè)大數(shù)據(jù)的命題。搜索引擎正好解決這一問題,網(wǎng)絡(luò)爬蟲首先從數(shù)以千億級(jí)的網(wǎng)頁中搜集信息,建立網(wǎng)頁數(shù)據(jù)庫。當(dāng)用戶以關(guān)鍵詞查找信息時(shí),搜索引擎會(huì)在數(shù)據(jù)庫中進(jìn)行搜尋,如果找到與
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前10條
1 董曉常;;百度關(guān)口[J];互聯(lián)網(wǎng)周刊;2006年36期
2 袁學(xué)倫;;百度:創(chuàng)新團(tuán)隊(duì)推動(dòng)戰(zhàn)略變身[J];經(jīng)理人;2008年10期
3 ;百度推出老年搜索頻道[J];天津社會(huì)保險(xiǎn);2009年03期
4 張健敏;;微軟"必應(yīng)" 有求"必應(yīng)"乎?[J];上海信息化;2009年07期
5 ;百度不完全批判[J];互聯(lián)網(wǎng)天地;2010年02期
6 ;到互聯(lián)網(wǎng)去,啟動(dòng)汽車營(yíng)銷“搜索”引擎[J];廣告大觀(綜合版);2009年06期
7 王新業(yè);;淘寶 VS 百度死磕 C2C[J];企業(yè)文化;2009年07期
8 李娜;;淘寶VS百度:緣何死磕C2C[J];品牌;2009年05期
9 林濤;;谷歌逼近百度[J];中國(guó)企業(yè)家;2009年08期
10 賈玉文;;國(guó)內(nèi)搜索引擎SWOT戰(zhàn)略分析——以百度公司為例[J];生產(chǎn)力研究;2009年22期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 包木春;;淺談互聯(lián)網(wǎng)情報(bào)信息收集[A];第二十次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2005年
2 張冠群;杜建清;楊家海;;基于搜索引擎的網(wǎng)站流量估算模型[A];2009年全國(guó)開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2009年
3 彭軻;廖聞劍;;淺析搜索引擎[A];中國(guó)通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
4 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國(guó)中醫(yī)藥信息研究會(huì)第二屆理事大會(huì)暨學(xué)術(shù)交流會(huì)議論文匯編[C];2003年
5 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年
6 鄧長(zhǎng)壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
7 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語言信息處理、第二屆全國(guó)多語言知識(shí)庫建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
8 陳沛;;搜索的未來[A];全國(guó)第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年
9 張t$t$;陳華;姜曉寧;;農(nóng)業(yè)電子圖書館在網(wǎng)絡(luò)搜索引擎沖擊下如何發(fā)展的幾點(diǎn)思考[A];中國(guó)農(nóng)業(yè)信息科技創(chuàng)新與學(xué)科發(fā)展大會(huì)論文匯編[C];2007年
10 褚蓓蓓;劉丹;;垂直搜索引擎:搜索引擎發(fā)展方向[A];2007年河北省電子學(xué)會(huì)、河北省計(jì)算機(jī)學(xué)會(huì)、河北省自動(dòng)化學(xué)會(huì)、河北省人工智能學(xué)會(huì)、河北省計(jì)算機(jī)輔助設(shè)計(jì)研究會(huì)、河北省軟件行業(yè)協(xié)會(huì)聯(lián)合學(xué)術(shù)年會(huì)論文集[C];2007年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 加貝;百度谷歌風(fēng)景獨(dú)好 搜索引擎“冬泳”正酣[N];證券日?qǐng)?bào);2008年
2 本報(bào)記者 何苗;李彥宏 專注于簡(jiǎn)單管理[N];中華工商時(shí)報(bào);2009年
3 本報(bào)記者 郭川;移動(dòng)搜索要跳出傳統(tǒng)互聯(lián)網(wǎng)模式[N];人民郵電;2009年
4 見習(xí)記者 張惠;谷歌退出?中國(guó)搜索市場(chǎng)前路難測(cè)[N];中國(guó)商報(bào);2010年
5 本報(bào)記者 姜靖;雷鳴:四年躋身數(shù)字音樂三甲[N];科技日?qǐng)?bào);2009年
6 本報(bào)記者 李新國(guó);傳統(tǒng)搜索變身挑戰(zhàn)互聯(lián)網(wǎng)[N];南京日?qǐng)?bào);2006年
7 本報(bào)記者 張明;谷歌攻城計(jì)[N];中國(guó)經(jīng)營(yíng)報(bào);2009年
8 加貝;李開復(fù)入主三年有余 谷歌中國(guó)變化幾多?[N];證券日?qǐng)?bào);2009年
9 何軍;“鳳巢”現(xiàn)身 助中國(guó)企業(yè)過冬[N];證券日?qǐng)?bào);2009年
10 ;“搜索引擎”為學(xué)術(shù)造假提供了便利[N];遼寧日?qǐng)?bào);2010年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年
2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年
5 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
7 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評(píng)估研究[D];吉林大學(xué);2010年
8 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年
9 鄭文良;基于簡(jiǎn)單本體的農(nóng)業(yè)P2P搜索引擎關(guān)鍵技術(shù)研究[D];沈陽農(nóng)業(yè)大學(xué);2013年
10 白玉琪;空間信息搜索引擎研究[D];中國(guó)科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 郝金隆;網(wǎng)絡(luò)原創(chuàng)文章優(yōu)先的搜索引擎排序算法研究[D];重慶大學(xué);2007年
2 徐坤;基于關(guān)系數(shù)據(jù)庫搜索引擎的研究[D];長(zhǎng)春理工大學(xué);2008年
3 何華;搜索引擎中的數(shù)據(jù)存儲(chǔ)問題研究[D];浙江大學(xué);2005年
4 李玨伶;搜索引擎網(wǎng)頁相關(guān)性評(píng)估方法設(shè)計(jì)及其在rank模型上的應(yīng)用[D];北京交通大學(xué);2011年
5 劉宇波;面向可下載資源的WEB搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];湖南大學(xué);2005年
6 余光莉;基于互聯(lián)網(wǎng)的交互式積累式WebTRIZ系統(tǒng)[D];天津大學(xué);2005年
7 薛云;Internet上元搜索引擎的研究與設(shè)計(jì)[D];太原理工大學(xué);2003年
8 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年
9 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實(shí)現(xiàn)和優(yōu)化[D];吉林大學(xué);2011年
10 董晨;基于模糊聚類的個(gè)性化搜索引擎的研究[D];福州大學(xué);2005年
,本文編號(hào):937150
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/937150.html