面向數碼商品垂直搜索引擎原型系統的設計與實現
本文關鍵詞:面向數碼商品垂直搜索引擎原型系統的設計與實現,,由筆耕文化傳播整理發(fā)布。
《西南交通大學》 2014年
面向數碼商品垂直搜索引擎原型系統的設計與實現
楊靜嫻
【摘要】:隨著互聯網技術的快速發(fā)展,用戶的檢索需求也在不斷的變更,面對用戶越來越個性化和專業(yè)化的檢索需求,傳統的綜合搜索引擎已經逐漸滿足不了信息檢索用戶的需求,用戶開始偏向使用更加專業(yè)化、行業(yè)化、個性化的垂直搜索引擎。垂直搜索引擎發(fā)展持續(xù)增快,用戶逐漸增多,它所涉及的領域也越來越多,在日常生活中,垂直搜索引擎的發(fā)展使用戶能夠快速、精準地定位檢索信息,擺脫“信息迷航”和“信息過載”所帶來的困擾,以“專、精、深”為檢索特點的垂直搜索引擎從而成為了目前搜索引擎的發(fā)展方向。 現在越來越多的用戶通過互聯網來了解和購買數碼商品,一方面促進了數碼商品電子商務的發(fā)展,另一方面用戶對搜索引擎的服務也有了越來越高的要求。摒棄大量的冗余數據和廣告信息,垂直搜索引擎針對特定領域、特定人群或特定需求提供信息和相關服務的特點與數碼商品檢索的需求很好地契合。 本文設計并實現了一款面向數碼商品垂直搜索引擎的原型系統,以高效搜索為實現目標,應用垂直搜索引擎和Hadoop云計算平臺的相關理論和技術予以實現。本文在掌握網絡爬蟲和MapReduce的工作原理和相關技術之后,編寫實現了數碼商品的網絡爬蟲:在分析和掌握基于網頁結構的信息抽取方式和基于正則表達式的信息抽取方式基礎上,編程實現了信息抽取功能;在分析和掌握信息索引的相關原理和技術之后,設計信息索引結構、改進西南交通大學分詞系統和TF-IDF算法,結合MapReduce編程模型實現了數碼商品信息的索引功能;運用JSP技術實現用戶查詢頁面設計。該原型系統實現了設計中所有需求的功能,滿足了用戶檢索數碼商品的需求,具有一定的實際應用價值。
【關鍵詞】:
【學位授予單位】:西南交通大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP391.3
【目錄】:
下載全文 更多同類文獻
CAJ全文下載
(如何獲取全文? 歡迎:購買知網充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻】
中國期刊全文數據庫 前10條
1 李建江;崔健;王聃;嚴林;黃義雙;;MapReduce并行編程模型研究綜述[J];電子學報;2011年11期
2 汲業(yè);陳燕;楊健;慕蓉;;生活服務領域垂直搜索引擎的設計與實現[J];計算機工程;2010年24期
3 王新;劉曉霞;;基于關聯規(guī)則挖掘的垂直元搜索引擎研究[J];計算機工程;2011年04期
4 黃承慧;印鑒;侯昉;;一種結合詞項語義信息和TF-IDF方法的文本相似度量方法[J];計算機學報;2011年05期
5 譚龍江;;基于搜索引擎優(yōu)化的網絡宣傳機模型[J];計算機應用;2010年08期
6 劉運強;;垂直搜索引擎的研究與設計[J];計算機應用與軟件;2010年07期
7 黃蔚;劉忠;劉全;;RL_Spider:一種自主垂直搜索引擎網絡爬蟲[J];計算機應用與軟件;2011年12期
8 張思發(fā);馬永格;;面向地學信息領域垂直搜索引擎設計與實現[J];計算機工程與應用;2012年33期
9 馮汝偉;謝強;丁秋林;;基于文本聚類與分布式Lucene的知識檢索[J];計算機應用;2013年01期
10 李璋;杜慧敏;張麗果;;基于分布式存儲的正則表達式匹配算法設計與實現[J];計算機科學;2013年03期
【共引文獻】
中國期刊全文數據庫 前10條
1 杜玉輝;蔣姣麗;;大數據背景:高速公路收費系統數據的現狀、分析與展望[J];電腦知識與技術;2012年15期
2 于海寧;張宏莉;方濱興;余翔湛;;物聯網中物理實體搜索服務的研究[J];電信科學;2012年10期
3 李建敦;彭俊杰;張武;;云存儲中一種基于布局的虛擬磁盤節(jié)能調度方法[J];電子學報;2012年11期
4 黃曉斌;鐘輝新;;大數據時代企業(yè)競爭情報研究的創(chuàng)新與發(fā)展[J];圖書與情報;2012年06期
5 袁磊;趙俊三;李紅波;;物聯網空間數據倉庫框架體系及關鍵技術分析[J];地理信息世界;2013年01期
6 成靜靜;喻朝新;;基于云計算的大數據統一分析平臺研究與設計[J];廣東通信技術;2013年01期
7 陳云海;黃蘭秋;;大數據處理對電子商務的影響研究[J];電信科學;2013年03期
8 吳建軍;;網絡輿情的云計算監(jiān)測模式分析與實現[J];電訊技術;2013年04期
9 馬建光;姜巍;;大數據的概念、特征及其應用[J];國防科技;2013年02期
10 李亮;;全臺網環(huán)境下的云視頻素材轉碼系統的設計[J];電視技術;2013年10期
中國重要會議論文全文數據庫 前5條
1 韓子揚;李貴;李征宇;王鳳英;;基于分布式結構的Deep Web結構化數據抽取系統[A];第九屆沈陽科學學術年會論文集[C];2012年
2 韓子揚;李貴;李征宇;王鳳英;;基于分布式結構的Deep Web結構化數據抽取系統[A];第九屆沈陽科學學術年會論文集(信息科學與工程技術分冊)[C];2012年
3 生昕格;;基于hadoop的交通云數據處理平臺設計[A];第七屆中國智能交通年會優(yōu)秀論文集——智能交通應用[C];2012年
4 陳德華;解維;李悅;;面向大規(guī)模圖數據的分布式并行聚類算法研究[A];第29屆中國數據庫學術會議論文集(B輯)(NDBC2012)[C];2012年
5 Junjie Wang;Depeng Dang;Pengxia Zhou;Hongjie Wang;Xue Jiang;Shihang Huang;;Crawling Strategy Based on Domain Ontology of Emergency Plans[A];2013教育技術與信息系統國際會議論文集[C];2013年
中國博士學位論文全文數據庫 前10條
1 劉娜;文本自動摘要和信息抽取方法及其應用研究[D];大連海事大學;2012年
2 王靜;基于本體的中醫(yī)文獻診療信息的智能檢索示范研究[D];中國中醫(yī)科學院;2012年
3 王秀紅;文本相似度計算核函數的構造及其在分布式信息檢索中的應用研究[D];江蘇大學;2012年
4 彭菲菲;網絡熱點話題發(fā)現的關鍵技術研究[D];中國礦業(yè)大學(北京);2012年
5 俞唯仁;普適的結構相似度在大規(guī)模網絡中的計算優(yōu)化技術研究[D];東華大學;2012年
6 何文娜;大數據時代基于物聯網和云計算的地質信息化研究[D];吉林大學;2013年
7 朱朝勇;基于本體的知識庫分類研究[D];中國科學技術大學;2013年
8 韓海雯;MapReduce計算任務調度的資源配置優(yōu)化研究[D];華南理工大學;2013年
9 周勇;基于并行計算的數據流處理方法研究[D];大連理工大學;2013年
10 蔣鴻玲;基于流量的僵尸網絡檢測方法研究[D];南開大學;2013年
中國碩士學位論文全文數據庫 前10條
1 馮葉磊;基于隱語義的中醫(yī)藥文獻搜索引擎[D];浙江大學;2011年
2 孫華昱;Lucene在醫(yī)學影像資源檢索平臺中的應用[D];沈陽工業(yè)大學;2011年
3 周兵;基于分布式精準采集的垂直搜索引擎的研究與實現[D];北京郵電大學;2011年
4 何忠育;分布式社會網絡分析支撐系統研究與應用[D];廣東工業(yè)大學;2011年
5 徐風;移動公司云計算平臺原型的構建與測試[D];中南大學;2010年
6 廖玉蘭;基于分布式的決策樹方法研究[D];電子科技大學;2011年
7 王毅;基于Hadoop的Slope One及其改進算法實現[D];西南交通大學;2011年
8 杜洪偉;軟件安全領域垂直搜索引擎的優(yōu)化設計與實現[D];天津大學;2010年
9 李銳鑫;Web視頻資源的智能發(fā)現關鍵技術研究[D];哈爾濱工業(yè)大學;2010年
10 詹恒飛;分布式圖片搜索引擎設計與實現[D];國防科學技術大學;2010年
【二級參考文獻】
中國期刊全文數據庫 前10條
1 趙洋;滕桂法;張玉新;何冬梅;;基于Internet的農業(yè)信息垂直搜索引擎的設計[J];河北農業(yè)大學學報;2009年06期
2 劉挺;馬金山;;漢語自動句法分析的理論與方法[J];當代語言學;2009年02期
3 尹國定,衛(wèi)紅;云計算——實現概念計算的方法[J];東南大學學報(自然科學版);2003年04期
4 蔣明原;孔令德;寧靜靜;;一種海量數據下的Lucene全文檢索解決方案[J];電腦開發(fā)與應用;2011年04期
5 曹宇;尹剛;李翔;程榮斌;王懷民;;聚類搜索引擎研究進展淺析[J];電腦知識與技術;2011年22期
6 吳吉義;平玲娣;潘雪增;李卓;;云計算:從概念到平臺[J];電信科學;2009年12期
7 鐘偉彬;周梁月;潘軍彪;文錦軍;;云計算終端的現狀和發(fā)展趨勢[J];電信科學;2010年03期
8 傅巍瑋;李仁發(fā);劉鈺峰;黃松立;;基于Solr的分布式實時搜索模型研究與實現[J];電信科學;2011年11期
9 葉允明,于水,馬范援,宋暉,張嶺;分布式Web Crawler的研究:結構、算法和策略[J];電子學報;2002年S1期
10 寧煥生;張瑜;劉芳麗;劉文明;渠慎豐;;中國物聯網信息服務系統研究[J];電子學報;2006年S1期
中國博士學位論文全文數據庫 前1條
1 應曉敏;面向Internet個性化服務的用戶建模技術研究[D];中國人民解放軍國防科學技術大學;2003年
中國碩士學位論文全文數據庫 前6條
1 杜超華;基于本體的省情網垂直搜索引擎研究[D];華中師范大學;2007年
2 萬至臻;基于MapReduce模型的并行計算平臺的設計與實現[D];浙江大學;2008年
3 王濤;基于行業(yè)的個性化搜索引擎的應用[D];北方工業(yè)大學;2008年
4 劉胤;深度包檢測技術的研究與設計[D];貴州大學;2008年
5 黃曉云;基于HDFS的云存儲服務系統研究[D];大連海事大學;2010年
6 張潔坤;時空高效的正則表達式匹配算法研究[D];湖南大學;2010年
【相似文獻】
中國期刊全文數據庫 前10條
1 顧鵬堯;;讓搜索引擎更好地服務于教育教學[J];科學24小時;2003年Z1期
2 陳新顏;垂直搜索引擎辨析[J];現代情報;2004年09期
3 胡文勝;;垂直搜索助號碼百事通與商務領航[J];每周電腦報;2006年32期
4 胡潔;丁寧;關靜;曹福年;張磊;;基于“PUBMED+PDF”的醫(yī)學垂直搜索引擎的實踐[J];信息系統工程;2009年05期
5 一林;;垂直搜索:前進路上的喜與憂[J];互聯網天地;2010年02期
6 牟思;;基于垂直搜索引擎的學校網站的研究與建設[J];中國教育技術裝備;2011年21期
7 田野;垂直搜索火熱為哪般[J];中國計算機用戶;2005年37期
8 胡文勝;;垂直搜索助號碼百事通與商務領航[J];每周電腦報;2006年31期
9 邊凱;;你會搜索嗎?[J];中國計算機用戶;2007年23期
10 宿建光;;指點通:移動垂直搜索的創(chuàng)新者[J];通信世界;2007年03期
中國重要會議論文全文數據庫 前3條
1 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設計與實現[A];第26屆中國數據庫學術會議論文集(B輯)[C];2009年
2 林歡歡;王文杰;史忠植;;移動環(huán)境下垂直搜索引擎[A];第三屆全國信息檢索與內容安全學術會議論文集[C];2007年
3 王旭;杜軍平;;質檢總局互聯網輿情監(jiān)控系統中聚焦爬蟲的研究[A];中國電子學會第十七屆信息論學術年會論文集[C];2010年
中國重要報紙全文數據庫 前10條
1 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學技術情報研究所 周峻松;[N];計算機世界;2010年
2 王艷;[N];中國旅游報;2000年
3 賽迪網 方剛;[N];中國計算機報;2000年
4 王靖;[N];人民日報海外版;2000年
5 記者 王滸;[N];中國旅游報;2009年
6 本報記者 王宏;[N];中國計算機報;2001年
7 徐瑾 張玉;[N];人民郵電;2009年
8 本報記者 王曉雁;[N];法制日報;2009年
9 記者 吳德群;[N];深圳特區(qū)報;2009年
10 本報記者 胡鈺;[N];華夏時報;2009年
中國博士學位論文全文數據庫 前5條
1 王曄;垂直搜索引擎若干問題研究[D];復旦大學;2011年
2 吳羽;面向時間敏感對象的垂直搜索引擎關鍵技術研究[D];浙江大學;2011年
3 胡宜敏;農業(yè)垂直搜索引擎語義化若干問題的研究與實現[D];中國科學技術大學;2012年
4 汲業(yè);面向圖像的垂直搜索引擎關鍵技術研究[D];大連海事大學;2013年
5 李傳席;基于本體的自適應Web信息抽取方法研究[D];中國科學技術大學;2012年
中國碩士學位論文全文數據庫 前10條
1 李春燕;企業(yè)信息垂直搜索引擎的研究與實現[D];中國地質大學(北京);2010年
2 齊鵬;垂直搜索引擎分類索引系統的設計與實現[D];大連海事大學;2010年
3 張楠;面向汽車主題的垂直搜索引擎研究與實現[D];西南交通大學;2010年
4 陳向東;寵物用品垂直搜索引擎研究與設計[D];西北農林科技大學;2010年
5 周佳慶;實時垂直搜索引擎數據抓取調度研究[D];浙江大學;2010年
6 華大年;手機產品信息垂直搜索引擎系統設計與開發(fā)[D];武漢理工大學;2011年
7 薛萍;基于教育領域的垂直搜索引擎的研究與實現[D];天津師范大學;2011年
8 馮效棟;垂直搜索引擎技術在網絡輿情巡控中的研究與應用[D];中國海洋大學;2010年
9 張贏;個性化多媒體資源垂直搜索引擎技術研究[D];華東交通大學;2009年
10 李海升;垂直搜索引擎的研究與實現[D];西安電子科技大學;2009年
本文關鍵詞:面向數碼商品垂直搜索引擎原型系統的設計與實現,由筆耕文化傳播整理發(fā)布。
本文編號:60767
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/60767.html