天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于HMM的主題垂直搜索引擎技術(shù)研究

發(fā)布時(shí)間:2017-09-28 21:04

  本文關(guān)鍵詞:基于HMM的主題垂直搜索引擎技術(shù)研究


  更多相關(guān)文章: HMM 垂直搜索引擎 主題頁面


【摘要】:計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,對(duì)于搜索引擎技術(shù)也提出了更高的要求。文章主要以垂直搜索引擎的主題網(wǎng)頁抓取策略為研究?jī)?nèi)容,從提高主題網(wǎng)頁抓取的準(zhǔn)確度和效率出發(fā),引入隱馬爾科夫模型,并重點(diǎn)討論了該模型具體應(yīng)用策略和過程,該模型的應(yīng)用方法不僅分析了網(wǎng)頁內(nèi)容,還考慮網(wǎng)頁上下文鏈接距離結(jié)構(gòu),在一定程度上提高了主題頁面抓取的精度。
【作者單位】: 陜西國(guó)防工業(yè)職業(yè)技術(shù)學(xué)院;
【關(guān)鍵詞】HMM 垂直搜索引擎 主題頁面
【基金】:網(wǎng)編課程項(xiàng)目教學(xué)應(yīng)用平臺(tái)開發(fā)(編號(hào)Gfy11-05)
【分類號(hào)】:TP391.3
【正文快照】: 1引言1.1網(wǎng)絡(luò)爬蟲體系結(jié)構(gòu)網(wǎng)絡(luò)爬行是指搜索引擎從網(wǎng)絡(luò)上查找并搜集網(wǎng)頁的過程,其目標(biāo)是盡可能快速、有效,多量的搜集與用戶需求相關(guān)的有用網(wǎng)頁及網(wǎng)頁間的鏈接結(jié)構(gòu)。網(wǎng)絡(luò)爬蟲,是在HTTP協(xié)議訪問標(biāo)準(zhǔn)下,跟隨網(wǎng)絡(luò)鏈接遍歷網(wǎng)絡(luò)空間信息的程序[1]。一個(gè)典型網(wǎng)絡(luò)爬蟲體系結(jié)構(gòu)主要由

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫 前2條

1 劉金紅;陸余良;;主題網(wǎng)絡(luò)爬蟲研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2007年10期

2 杜世平;;多觀測(cè)序列HMM2的Baum-Welch算法[J];生物數(shù)學(xué)學(xué)報(bào);2007年04期

【共引文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫 前10條

1 王正;陸余良;劉金紅;施凡;;基于Lucene的互聯(lián)網(wǎng)文獻(xiàn)信息檢索系統(tǒng)的研究[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年05期

2 毛曉蛟;;搜索引擎中網(wǎng)絡(luò)蜘蛛的研究與實(shí)現(xiàn)[J];電腦編程技巧與維護(hù);2010年18期

3 唐波;;網(wǎng)絡(luò)爬蟲的設(shè)計(jì)與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2009年11期

4 周民;邱雅;王華彬;;網(wǎng)絡(luò)輿情分析中智能爬蟲的設(shè)計(jì)[J];電腦知識(shí)與技術(shù);2011年33期

5 王巖;;搜索引擎中網(wǎng)絡(luò)爬蟲技術(shù)的發(fā)展[J];電信快報(bào);2008年10期

6 黃敏;;網(wǎng)絡(luò)輿情熱點(diǎn)挖掘算法研究與實(shí)現(xiàn)[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年06期

7 屠要峰;錢煜明;;一種基于海量數(shù)據(jù)的信息云系統(tǒng)及其關(guān)鍵技術(shù)研究[J];電信科學(xué);2012年12期

8 趙前東;葉猛;;微博熱點(diǎn)話題檢測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];電視技術(shù);2013年03期

9 嚴(yán)磊;馬勇男;丁賓;鄭濤;;垂直搜索引擎之主題網(wǎng)絡(luò)爬蟲[J];福建電腦;2013年03期

10 翟東海;CUI Jing-jing;NIE Hong-yu;DU Jia;;New event detection based on sorted subtopic matching algorithm[J];Journal of Chongqing University(English Edition);2013年04期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫 前2條

1 吳晨生;劉彥君;張魯冀;董曉晴;;科普搜索的研究與實(shí)現(xiàn)[A];數(shù)字博物館研究與實(shí)踐(2009)[C];2010年

2 單鐵城;張安妮;馬德輝;;基于爬蟲改進(jìn)算法的個(gè)性化搜索引擎應(yīng)用研究[A];戰(zhàn)略性新興產(chǎn)業(yè)與科技支撐——2012年山東省科協(xié)學(xué)術(shù)年會(huì)論文集[C];2012年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前3條

1 田俊華;基于本體知識(shí)庫的教學(xué)資源自動(dòng)采集技術(shù)研究[D];南京師范大學(xué);2011年

2 萬源;基于語義統(tǒng)計(jì)分析的網(wǎng)絡(luò)輿情挖掘技術(shù)研究[D];武漢理工大學(xué);2012年

3 葉飛;高階隱馬氏模型算法理論若干問題的研究[D];上海大學(xué);2012年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 陳可欽;基于垂直搜索引擎的主題爬蟲算法的研究[D];中南林業(yè)科技大學(xué);2009年

2 華大年;手機(jī)產(chǎn)品信息垂直搜索引擎系統(tǒng)設(shè)計(jì)與開發(fā)[D];武漢理工大學(xué);2011年

3 喬宇;一種基于主題數(shù)據(jù)的存取調(diào)度模型的研究[D];北京郵電大學(xué);2011年

4 郭艷芬;林業(yè)主題搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];北京林業(yè)大學(xué);2011年

5 連惠杰;基于主題的教育信息定向采集系統(tǒng)[D];南京理工大學(xué);2011年

6 陳宗利;面向SNS的社會(huì)網(wǎng)絡(luò)數(shù)據(jù)抓取與經(jīng)驗(yàn)性分析[D];長(zhǎng)安大學(xué);2011年

7 盧凡;基于領(lǐng)域本體的主題爬蟲系統(tǒng)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2011年

8 任曉霞;BBS輿情智能分析系統(tǒng)研究與實(shí)現(xiàn)[D];沈陽理工大學(xué);2011年

9 楊哲;基于Groovy的分布式網(wǎng)絡(luò)爬蟲系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西南交通大學(xué);2010年

10 王燕;網(wǎng)站敏感信息監(jiān)視系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];解放軍信息工程大學(xué);2008年

【二級(jí)參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫 前7條

1 何強(qiáng),毛士藝,張有為;多觀察序列連續(xù)隱含馬爾柯夫模型的無溢出參數(shù)重估[J];電子學(xué)報(bào);2000年10期

2 李盛韜,趙章界,余智華;基于主題的Web信息采集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2003年17期

3 李衛(wèi);劉建毅;何華燦;王樅;;基于主題的智能Web信息采集系統(tǒng)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用研究;2006年02期

4 杜世平,李海;二階隱馬爾可夫模型及其在計(jì)算語言學(xué)中的應(yīng)用[J];四川大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年02期

5 楊靜化,張琪;馬爾可夫藥物動(dòng)力學(xué)模型B[J];生物數(shù)學(xué)學(xué)報(bào);1998年02期

6 石峰,莫忠息,張楚瑜;隱馬爾可夫模型—改進(jìn)的預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)方法[J];生物數(shù)學(xué)學(xué)報(bào);2004年02期

7 傅向華,馮博琴,馬兆豐,何明;可在線增量自學(xué)習(xí)的聚焦爬行方法[J];西安交通大學(xué)學(xué)報(bào);2004年06期

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫 前10條

1 胡華梁;何進(jìn);鐘元生;;圖書垂直搜索引擎的設(shè)計(jì)[J];計(jì)算機(jī)與現(xiàn)代化;2007年08期

2 鄭凱明;李義杰;;垂直搜索引擎及其應(yīng)用價(jià)值[J];信息技術(shù);2008年04期

3 許鑫;黃仲清;;垂直搜索引擎應(yīng)用中的若干策略探討——以12580餐飲垂直搜索為例[J];現(xiàn)代圖書情報(bào)技術(shù);2009年02期

4 祝奕;;垂直搜索引擎的構(gòu)建與應(yīng)用[J];信息與電腦(理論版);2010年01期

5 張美芳;張迎春;;淺議垂直搜索引擎服務(wù)市場(chǎng)的商業(yè)模式[J];現(xiàn)代商業(yè);2010年06期

6 焦龍;;垂直搜索引擎在旅游企業(yè)中應(yīng)用的探索[J];商場(chǎng)現(xiàn)代化;2010年08期

7 趙宏中;李亞;;垂直搜索引擎應(yīng)用研究[J];現(xiàn)代商貿(mào)工業(yè);2010年04期

8 陳高維;鄧天權(quán);曾云磊;王維國(guó);張龍;;基于垂直搜索引擎的旅游線路評(píng)價(jià)模型的設(shè)計(jì)[J];科技創(chuàng)新導(dǎo)報(bào);2010年18期

9 劉小強(qiáng);;二手轉(zhuǎn)讓及房產(chǎn)租售垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];三門峽職業(yè)技術(shù)學(xué)院學(xué)報(bào);2010年03期

10 鄭凱明;;垂直搜索引擎應(yīng)用研究[J];赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年02期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫 前4條

1 褚蓓蓓;劉丹;;垂直搜索引擎:搜索引擎發(fā)展方向[A];2007年河北省電子學(xué)會(huì)、河北省計(jì)算機(jī)學(xué)會(huì)、河北省自動(dòng)化學(xué)會(huì)、河北省人工智能學(xué)會(huì)、河北省計(jì)算機(jī)輔助設(shè)計(jì)研究會(huì)、河北省軟件行業(yè)協(xié)會(huì)聯(lián)合學(xué)術(shù)年會(huì)論文集[C];2007年

2 林歡歡;王文杰;史忠植;;移動(dòng)環(huán)境下垂直搜索引擎[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

3 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[A];第26屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年

4 毛華揚(yáng);劉衛(wèi);;會(huì)計(jì)信息搜索方法研究[A];第十屆全國(guó)會(huì)計(jì)信息化年會(huì)論文集[C];2011年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫 前1條

1 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學(xué)技術(shù)情報(bào)研究所 周峻松;用開源軟件建垂直搜索引擎[N];計(jì)算機(jī)世界;2010年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前3條

1 王曄;垂直搜索引擎若干問題研究[D];復(fù)旦大學(xué);2011年

2 胡宜敏;農(nóng)業(yè)垂直搜索引擎語義化若干問題的研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年

3 王桂紅;農(nóng)產(chǎn)品市場(chǎng)價(jià)格web信息分析方法研究[D];沈陽農(nóng)業(yè)大學(xué);2013年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 崔詩遠(yuǎn);基于垂直搜索引擎的旅行社網(wǎng)絡(luò)營(yíng)銷[D];青島大學(xué);2009年

2 翟曉玲;面向?qū)W科的基礎(chǔ)教育資源垂直搜索引擎的研究與實(shí)現(xiàn)[D];東北師范大學(xué);2009年

3 王嘉杰;面向博客領(lǐng)域的垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2009年

4 劉明君;垂直搜索引擎?zhèn)鞑W(xué)特征及應(yīng)用研究[D];華中科技大學(xué);2008年

5 黎斌;可擴(kuò)展分布式垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2008年

6 李春燕;企業(yè)信息垂直搜索引擎的研究與實(shí)現(xiàn)[D];中國(guó)地質(zhì)大學(xué)(北京);2010年

7 石占偉;垃圾頁面檢測(cè)及其在垂直搜索引擎中的應(yīng)用[D];燕山大學(xué);2010年

8 張楠;面向汽車主題的垂直搜索引擎研究與實(shí)現(xiàn)[D];西南交通大學(xué);2010年

9 陳向東;寵物用品垂直搜索引擎研究與設(shè)計(jì)[D];西北農(nóng)林科技大學(xué);2010年

10 周佳慶;實(shí)時(shí)垂直搜索引擎數(shù)據(jù)抓取調(diào)度研究[D];浙江大學(xué);2010年

,

本文編號(hào):938037

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/938037.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶05ebf***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com