政策信息垂直搜索引擎研究與實(shí)現(xiàn)
本文選題:垂直搜索引擎 切入點(diǎn):政策信息 出處:《河北經(jīng)貿(mào)大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
【摘要】:隨著信息時(shí)代的深入人心與互聯(lián)網(wǎng)技術(shù)的飛躍式發(fā)展,人們已經(jīng)把從網(wǎng)絡(luò)信息的海洋中搜尋出對自己有用的信息作為最主要的信息獲取途徑,互聯(lián)網(wǎng)中的搜索服務(wù)在人們?nèi)粘9ぷ骱蜕钪邪l(fā)揮著無可取代的作用。人們利用百度、谷歌、雅虎、必應(yīng)等搜索引擎在互聯(lián)網(wǎng)中尋找信息,這類通用搜索引擎已經(jīng)極大地縮短了我們定位有用信息的時(shí)間,但對于搜索特定主題的需求來說,通用搜索引擎返回的結(jié)果往往無序、分散。而垂直搜索引擎旨在為用戶提供特定主題的相關(guān)服務(wù)與信息,滿足用戶特定需求。為了制定造福社會和服務(wù)大眾的政策文件,決策者不僅要把握社會需求,而且需要遍覽當(dāng)前已出臺文件為制定新政策提供依據(jù)。因此,面向政策信息的垂直搜索引擎能夠夠滿足政策制定者的需要。本文以我國人社領(lǐng)域各級政府部門的官方網(wǎng)站作為實(shí)驗(yàn)數(shù)據(jù),在對垂直搜索引擎關(guān)鍵技術(shù)進(jìn)行深入研究的基礎(chǔ)上,結(jié)合用戶需求,完成了一個(gè)面向政策信息的垂直搜索引擎。本文詳細(xì)闡述了政策信息垂直搜索引擎的相關(guān)理論基礎(chǔ)和研究過程。首先,本文介紹了完成該垂直搜索引擎所利用的關(guān)鍵技術(shù)即主題爬蟲技術(shù)、網(wǎng)頁信息抽取技術(shù)、語句相似度比較、全文檢索技術(shù)等;然后在開源網(wǎng)絡(luò)爬蟲框架WebMagic的基礎(chǔ)上,針對某一類網(wǎng)站集合設(shè)計(jì)了專用的解析器;本文還提出了基于語義相似度的政策樹生長模型;最后,本文詳細(xì)闡述了政策信息垂直搜索引擎的實(shí)現(xiàn),并進(jìn)行了系統(tǒng)測試。
[Abstract]:With the leap forward development of the information age and the popularity of Internet technology, people have put the network information from the sea to search for useful information on their own as the main access to information, Internet search services in people's daily work and life plays an irreplaceable role. People use Baidu, Google, YAHOO, Bing and other search engines to find information on the Internet, the general search engine has greatly shortened the time we locate the useful information, but for searching topic specific needs, return to the general search engine often results in disorder, scattered. The vertical search engine to provide specific topics for user information and related services and meet the specific needs of the user. In order to make the benefit of the community and public service policy documents, policy makers should not only grasp the needs of society, but also need to see The current has issued a document to provide the basis for the development of the new policy. Therefore, the vertical search engine oriented policy information to meet the needs of policy makers. Based on China's social field of government departments at all levels on the official website as the experimental data, based on the in-depth study of key technology of vertical search engine, combined with the needs of users, completed a policy oriented information vertical search engine. This paper describes the policy information vertical search engine related theory and research process. Firstly, this paper introduces the vertical search engine is the key technology that the theme crawler technology, web information extraction technology, similarity comparison, full-text retrieval technology; then based on the open source web crawler framework WebMagic, according to a website set is designed with a special parser; this paper also put forward the base of Yu Yuyi In the end, the implementation of the policy information vertical search engine is described in detail, and the system test is carried out.
【學(xué)位授予單位】:河北經(jīng)貿(mào)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 肖冬梅;垂直搜索引擎研究[J];圖書館學(xué)研究;2003年02期
2 楊堅(jiān)爭;李朝平;;垂直搜索引擎及其應(yīng)用[J];電子商務(wù);2006年10期
3 羅麗姍;;垂直搜索引擎發(fā)展概述[J];圖書館學(xué)研究;2006年12期
4 嚴(yán)宏偉;何俊;;基于房源分析系統(tǒng)的垂直搜索引擎關(guān)鍵技術(shù)的探討[J];中國科技信息;2007年05期
5 胡華梁;何進(jìn);鐘元生;;圖書垂直搜索引擎的設(shè)計(jì)[J];計(jì)算機(jī)與現(xiàn)代化;2007年08期
6 鄭凱明;李義杰;;垂直搜索引擎及其應(yīng)用價(jià)值[J];信息技術(shù);2008年04期
7 畢建濤;霍云福;;垂直搜索引擎贏利模式探討[J];大連大學(xué)學(xué)報(bào);2008年03期
8 許鑫;黃仲清;;垂直搜索引擎應(yīng)用中的若干策略探討——以12580餐飲垂直搜索為例[J];現(xiàn)代圖書情報(bào)技術(shù);2009年02期
9 孔祥春;李義杰;鄭凱明;;垂直搜索引擎應(yīng)用研究[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2009年07期
10 楊皖蘇;閆冬;;垂直搜索引擎發(fā)展策略探討[J];商業(yè)時(shí)代;2009年23期
相關(guān)會議論文 前4條
1 褚蓓蓓;劉丹;;垂直搜索引擎:搜索引擎發(fā)展方向[A];2007年河北省電子學(xué)會、河北省計(jì)算機(jī)學(xué)會、河北省自動化學(xué)會、河北省人工智能學(xué)會、河北省計(jì)算機(jī)輔助設(shè)計(jì)研究會、河北省軟件行業(yè)協(xié)會聯(lián)合學(xué)術(shù)年會論文集[C];2007年
2 林歡歡;王文杰;史忠植;;移動環(huán)境下垂直搜索引擎[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
3 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
4 毛華揚(yáng);劉衛(wèi);;會計(jì)信息搜索方法研究[A];第十屆全國會計(jì)信息化年會論文集[C];2011年
相關(guān)重要報(bào)紙文章 前10條
1 北大縱橫管理顧問公司高級顧問戴曉東;“商搜”變法 垂直搜索引擎的春天還遠(yuǎn)嗎?[N];中國經(jīng)營報(bào);2006年
2 王艷;垂直搜索引擎市場看好[N];中國旅游報(bào);2000年
3 王靖;賽迪網(wǎng)推出垂直搜索引擎[N];人民日報(bào)海外版;2000年
4 楊國民;國內(nèi)生物醫(yī)藥行業(yè) 垂直搜索引擎誕生[N];經(jīng)濟(jì)日報(bào);2007年
5 本報(bào)記者 王曉雁;垂直搜索引擎著作權(quán)之爭未破題[N];法制日報(bào);2009年
6 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學(xué)技術(shù)情報(bào)研究所 周峻松;用開源軟件建垂直搜索引擎[N];計(jì)算機(jī)世界;2010年
7 中新;生意寶推“生意搜”攪局電子商務(wù)搜索市場[N];經(jīng)理日報(bào);2008年
8 源訊 編譯;搜索巨頭的下一步[N];計(jì)算機(jī)世界;2006年
9 賽迪網(wǎng) 方剛;不只是網(wǎng)站才垂直[N];中國計(jì)算機(jī)報(bào);2000年
10 ;沱沱網(wǎng)“亮劍”國際消費(fèi)電子博覽會 專業(yè)服務(wù)帶來B2B差異化變革[N];中國貿(mào)易報(bào);2007年
相關(guān)博士學(xué)位論文 前5條
1 王曄;垂直搜索引擎若干問題研究[D];復(fù)旦大學(xué);2011年
2 吳羽;面向時(shí)間敏感對象的垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年
3 胡宜敏;農(nóng)業(yè)垂直搜索引擎語義化若干問題的研究與實(shí)現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2012年
4 陳竹敏;面向垂直搜索引擎的主題爬行技術(shù)研究[D];山東大學(xué);2008年
5 王桂紅;農(nóng)產(chǎn)品市場價(jià)格web信息分析方法研究[D];沈陽農(nóng)業(yè)大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 韓冰;垂直搜索引擎?zhèn)性化推薦研究與應(yīng)用[D];大連理工大學(xué);2009年
2 關(guān)小敏;垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2012年
3 吳燕瑋;基于行業(yè)知識垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2012年
4 柳力麗;旅游垂直搜索引擎的品牌傳播研究[D];西南大學(xué);2015年
5 錢永杰;面向網(wǎng)絡(luò)文學(xué)的垂直搜索引擎的研究與實(shí)現(xiàn)[D];曲阜師范大學(xué);2015年
6 袁鳳云;垂直搜索引擎關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
7 任睿麗;面向旅游業(yè)的垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
8 張高偉;基于ElasticSearch的分布式視頻垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2014年
9 朱鵬;英文語料庫垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2015年
10 楊小丹;面向教育資源c\索引擎的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2015年
,本文編號:1562909
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1562909.html