天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

一種新的Web鏈接提取模型

發(fā)布時(shí)間:2018-07-20 09:34
【摘要】:以搜索引擎鏈接提取模塊所要求的容錯(cuò)性、正確性、全面性、高效性和可擴(kuò)展性為目標(biāo),提出了一種新的鏈接提取模型的設(shè)計(jì)思路。該模型將鏈接提取過程劃分為信息提取、信息加工、信息分析和信息儲存。信息的獲取是通過HTM L(hypertex t m arkup language)文法分析方法從文檔中得到初始統(tǒng)一資源地址(un iform resourceiden tifier,UR I)數(shù)據(jù);信息加工階段通過運(yùn)用UR I解析算法對初始數(shù)據(jù)進(jìn)行精練;然后在信息分析過程中進(jìn)一步加以篩選和過濾;最后將結(jié)果存儲在一個(gè)靈活的數(shù)據(jù)結(jié)構(gòu)中。通過對比測試證實(shí)這種新的鏈接提取模式比傳統(tǒng)方法在各項(xiàng)指標(biāo)上均具有明顯優(yōu)勢。
[Abstract]:Aiming at the fault tolerance, correctness, comprehensiveness, efficiency and expansibility required by the search engine link extraction module, a new design idea of link extraction model is proposed. The model divides the link extraction process into information extraction, information processing, information analysis and information storage. The acquisition of information is to obtain the initial uniform resource address (un iform resourceiden tifier) I) data from the document by the HTML (hypertex t m arkup language) grammar analysis method, and to refine the initial data by using the UR I parse algorithm in the information processing stage. Then the information is filtered and filtered in the process of information analysis. Finally, the results are stored in a flexible data structure. The comparison test shows that the new link extraction model has obvious advantages over the traditional method in each index.
【作者單位】: EECS
【分類號】:TP393.092

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 孟濤,閆宏飛,李曉明;一種評價(jià)搜索引擎信息覆蓋率的模型及其驗(yàn)證[J];電子學(xué)報(bào);2003年08期

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王新華;周峰;孫樹文;李劍鋒;;軟PLC編譯系統(tǒng)的開發(fā)與實(shí)現(xiàn)[J];北京工業(yè)大學(xué)學(xué)報(bào);2008年11期

2 李峰;基于自底向上的語法制導(dǎo)定義的實(shí)現(xiàn)[J];重慶交通學(xué)院學(xué)報(bào);2004年03期

3 秦飛舟;;基于編譯原理的四則混合運(yùn)算器的實(shí)現(xiàn)[J];電腦知識與技術(shù);2008年15期

4 呂映芝;上下文無關(guān)文法與無限狀態(tài)自動(dòng)機(jī)[J];電子學(xué)報(bào);1996年08期

5 晏興學(xué);正規(guī)式與正規(guī)文法的等價(jià)性及轉(zhuǎn)化算法[J];甘肅高師學(xué)報(bào);2001年05期

6 金毅;陸蓓;王小華;;一種較少狀態(tài)數(shù)的LR分析器[J];杭州電子科技大學(xué)學(xué)報(bào);2006年03期

7 李曉明,朱家稷,閆宏飛;互聯(lián)網(wǎng)上主題信息的一種收集與處理模型及其應(yīng)用[J];計(jì)算機(jī)研究與發(fā)展;2003年12期

8 李恩有,張祥,吳成柯,劉靜;基于一實(shí)際應(yīng)用系統(tǒng)的I860XR匯編程序及鏈接程序設(shè)計(jì)[J];計(jì)算機(jī)研究與發(fā)展;1997年06期

9 張偉,,王巖;前后文無關(guān)和有關(guān)問題的語法分析規(guī)范化算法的研究與設(shè)計(jì)[J];吉林工業(yè)大學(xué)學(xué)報(bào);1995年02期

10 馬吉明,韓麗,甘勇;自動(dòng)機(jī)到正規(guī)表達(dá)式的重構(gòu)方法研究[J];計(jì)算機(jī)工程與應(yīng)用;2004年23期

相關(guān)博士學(xué)位論文 前1條

1 敖麗敏;交互式過程性知識表示與獲取及其實(shí)現(xiàn)的研究[D];中國農(nóng)業(yè)大學(xué);2005年

相關(guān)碩士學(xué)位論文 前10條

1 王浩;基于XML的開放式工業(yè)機(jī)器人解釋器的研究[D];華南理工大學(xué);2010年

2 宋雙;基于Berkeley DB的圖像信息索引機(jī)制的設(shè)計(jì)與實(shí)現(xiàn)[D];南京航空航天大學(xué);2009年

3 李霞;一種Fortran語言源到源轉(zhuǎn)換模型的研究與實(shí)現(xiàn)[D];解放軍信息工程大學(xué);2001年

4 高賓;基于PC的開放式數(shù)控系統(tǒng)中的PLC系統(tǒng)研究[D];北京工業(yè)大學(xué);2001年

5 韓紅軍;基于控制流圖的Java語言動(dòng)態(tài)例化的研究[D];北京工業(yè)大學(xué);2002年

6 朱騰輝;實(shí)時(shí)繪制語言的研究[D];中國科學(xué)院研究生院(軟件研究所);2003年

7 胡銦;工業(yè)色譜儀嵌入式系統(tǒng)軟件開發(fā)與研究[D];南京工業(yè)大學(xué);2004年

8 李巍巍;Z規(guī)格說明中集合論算子的自動(dòng)求精研究及實(shí)現(xiàn)[D];沈陽工業(yè)大學(xué);2005年

9 張洪濤;JAVA下實(shí)現(xiàn)LL(1)動(dòng)作文法編譯器的自動(dòng)生成器[D];吉林大學(xué);2005年

10 張玲;智能信息采集搜索策略研究[D];湖南大學(xué);2004年

【二級參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 閆宏飛,李曉明;關(guān)于中國Web的大小、形狀和結(jié)構(gòu)[J];計(jì)算機(jī)研究與發(fā)展;2002年08期

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張繼剛;搜索引擎使用技巧[J];網(wǎng)絡(luò)與信息;1999年09期

2 ;關(guān)鍵詞搜索[J];每周電腦報(bào);2000年38期

3 陳冰;;餓狼一樣的網(wǎng)站提交工具——“提交餓狼”[J];科學(xué)之友;2000年07期

4 許斗;從Google看新一代搜索引擎的發(fā)展趨向[J];蕪湖職業(yè)技術(shù)學(xué)院學(xué)報(bào);2001年01期

5 周毅華;從搜索引擎的分類看其應(yīng)用技巧[J];圖書館理論與實(shí)踐;2002年06期

6 鄒小筑;搜索引擎的選擇與使用技巧[J];圖書館學(xué)研究;2002年05期

7 林燕;Google搜索引擎的搜索功能與使用技巧[J];河北科技圖苑;2003年05期

8 林中;GOOGLE搜索引擎的關(guān)鍵詞檢索[J];中國信息導(dǎo)報(bào);2003年03期

9 封劍待封喉;吸星大法“搜”天下 笑傲網(wǎng)絡(luò)任我行——搜索引擎絕對專題[J];網(wǎng)絡(luò)與信息;2003年07期

10 閆凡蕾;建設(shè)站內(nèi)搜索的好幫手——Search Engine Maker[J];少年電世界;2003年08期

相關(guān)會(huì)議論文 前10條

1 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年

2 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國中醫(yī)藥信息研究會(huì)第二屆理事大會(huì)暨學(xué)術(shù)交流會(huì)議論文匯編[C];2003年

3 鄧長壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年

4 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年

5 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年

6 姚樹宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國開放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集[C];2005年

7 倪俊峰;;基于黃頁搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年

8 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2010年

9 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年

10 楊萌;李春麗;朱明;;網(wǎng)絡(luò)搜索技術(shù)下的編輯工作[A];學(xué)報(bào)編輯論叢(第十一集)[C];2003年

相關(guān)重要報(bào)紙文章 前10條

1 李一鑫;搜索排名的紅與黑[N];財(cái)經(jīng)時(shí)報(bào);2007年

2 周文林;搜狗3.0能否撼動(dòng)搜索市場[N];經(jīng)濟(jì)參考報(bào);2007年

3 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財(cái)經(jīng)日報(bào);2005年

4 賽迪顧問股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;搜索,還是門戶[N];中國計(jì)算機(jī)報(bào);2005年

5 陳珊;浙江移動(dòng)推出手機(jī)搜索引擎服務(wù)[N];人民郵電;2005年

6 趙法忠;搜索引擎還需悠著點(diǎn)[N];中國經(jīng)營報(bào);2005年

7 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報(bào);2006年

8 本報(bào)記者  趙曉輝 孟昭麗;搜索引擎駛?cè)搿氨茱L(fēng)港”[N];中國證券報(bào);2006年

9 孫t;搜索引擎驚喜侵權(quán)官司止于“避風(fēng)港”?[N];第一財(cái)經(jīng)日報(bào);2006年

10 姜蕊;問天下誰識搜索?[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2006年

相關(guān)博士學(xué)位論文 前10條

1 岑榮偉;基于用戶行為分析的搜索引擎評價(jià)研究[D];清華大學(xué);2010年

2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年

3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年

4 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年

5 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年

6 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評估研究[D];吉林大學(xué);2010年

7 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年

8 白玉琪;空間信息搜索引擎研究[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2003年

9 費(fèi)巍;搜索引擎檢索功能的性能評價(jià)研究[D];武漢大學(xué);2010年

10 黃河;農(nóng)業(yè)復(fù)雜自適應(yīng)搜索模型研究及實(shí)現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2010年

相關(guān)碩士學(xué)位論文 前10條

1 薛云;Internet上元搜索引擎的研究與設(shè)計(jì)[D];太原理工大學(xué);2003年

2 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年

3 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實(shí)現(xiàn)和優(yōu)化[D];吉林大學(xué);2011年

4 董晨;基于模糊聚類的個(gè)性化搜索引擎的研究[D];福州大學(xué);2005年

5 封俊;基于Hadoop的分布式搜索引擎研究與實(shí)現(xiàn)[D];太原理工大學(xué);2010年

6 李浩;分布式教育網(wǎng)信息檢索系統(tǒng)的研究和實(shí)現(xiàn)[D];華南理工大學(xué);2010年

7 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年

8 李建平;智能化WEB信息搜索引擎的研究與實(shí)現(xiàn)[D];大慶石油學(xué)院;2003年

9 田生偉;基于涉農(nóng)詞典的搜索引擎的研究與實(shí)踐[D];新疆大學(xué);2004年

10 歐建斌;基于Web挖掘與信息分類的個(gè)性化搜索引擎研究[D];暨南大學(xué);2010年



本文編號:2133118

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2133118.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9c791***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com
91插插插外国一区二区婷婷| 老司机精品视频免费入口| 中文日韩精品视频在线| 国产日韩欧美一区二区| 亚洲午夜精品视频观看| 亚洲中文字幕在线综合视频| 精品欧美日韩一区二区三区| 日本不卡在线一区二区三区| 午夜亚洲少妇福利诱惑| 国产精品九九九一区二区| 粉嫩内射av一区二区| 97人妻精品一区二区三区男同| 99久只有精品免费视频播放| 91偷拍与自偷拍精品| 最新日韩精品一推荐日韩精品| 亚洲人妻av中文字幕| 亚洲av熟女国产一区二区三区站| 国产一区日韩二区欧美| 欧美日韩一区二区三区色拉拉| 又大又紧又硬又湿又爽又猛| 国产午夜福利不卡片在线观看| 中国一区二区三区不卡| 国产精品熟女在线视频| 亚洲妇女黄色三级视频| 久久99亚洲小姐精品综合| 免费人妻精品一区二区三区久久久 | 91插插插外国一区二区婷婷| 亚洲精品熟女国产多毛| 亚洲伦理中文字幕在线观看| 欧美日韩精品一区二区三区不卡| 深夜视频在线观看免费你懂| 日韩欧美三级中文字幕| 亚洲一区精品二人人爽久久| 欧美黑人精品一区二区在线| 国产精品午夜福利在线观看| 国产欧美日韩精品自拍| 91欧美日韩一区人妻少妇| 99福利一区二区视频| 欧美日韩国产的另类视频| 国产又色又爽又黄又大| 小黄片大全欧美一区二区|