天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于本體的新聞主題搜索研究

發(fā)布時(shí)間:2019-04-16 19:46
【摘要】:近年來(lái),Internet發(fā)展迅速并已滲透到生活的各個(gè)角落,Internet上蘊(yùn)藏著大量的各類(lèi)新聞信息,傳統(tǒng)的新聞獲取方式受到極大的挑戰(zhàn),人們進(jìn)入了一個(gè)“信息爆炸”、“新聞過(guò)剩”,而“新聞知識(shí)匱乏”的時(shí)代,通用搜索引擎在一定程度上解決了上述問(wèn)題。由于Web的動(dòng)態(tài)性和規(guī)模越來(lái)越大,通用搜索引擎索引數(shù)據(jù)庫(kù)的索引逃逸子空間不斷擴(kuò)大,其查詢接口也很難滿足特定用戶的查詢請(qǐng)求。因此,新聞主題搜索引擎應(yīng)運(yùn)而生。 目前,Internet已成為人們獲取新聞的重要來(lái)源,如何從大量的新聞網(wǎng)站中準(zhǔn)確、快速地找到所需要的新聞已成為新聞搜索引擎的首要目標(biāo),為實(shí)現(xiàn)該目標(biāo),本文嘗試在新聞主題搜索引擎中加入語(yǔ)義概念,試圖通過(guò)本體在語(yǔ)義方面的強(qiáng)大表達(dá)能力并借助于局部上下文信息,來(lái)增強(qiáng)搜索引擎的語(yǔ)義理解能力及查詢精度。 由新聞主題搜索引擎入手來(lái)研究專(zhuān)業(yè)搜索引擎,這種構(gòu)想也會(huì)對(duì)專(zhuān)業(yè)搜索引擎的發(fā)展產(chǎn)生一定的影響。為實(shí)現(xiàn)上述目標(biāo),本文主要做了如下兩方面的工作: 1.構(gòu)建新聞?lì)I(lǐng)域本體。首先,,介紹了構(gòu)建新聞?lì)I(lǐng)域本體的意義和策略,將軟件工程學(xué)的思想融入到新聞?lì)I(lǐng)域本體的構(gòu)建過(guò)程當(dāng)中;然后,詳細(xì)論述了領(lǐng)域本體的構(gòu)建過(guò)程,并對(duì)每步都做了較詳細(xì)的分析;最后,根據(jù)本文算法的需要,利用本體構(gòu)建工具protégé3.3.1并參照其他領(lǐng)域本體的構(gòu)建方法構(gòu)建了一個(gè)簡(jiǎn)單的新聞?lì)I(lǐng)域本體。 2.設(shè)計(jì)并實(shí)現(xiàn)了新聞主題搜索引擎,詳細(xì)介紹了該系統(tǒng)的功能及構(gòu)成模塊,給出了新聞主題搜索引擎的語(yǔ)義檢索模型。將本文提出的基于本體和局部上下文分析的查詢擴(kuò)展方法應(yīng)用于該系統(tǒng),重點(diǎn)論述了查詢擴(kuò)展方法中的語(yǔ)義擴(kuò)展、擴(kuò)展詞的篩選等關(guān)鍵技術(shù)。最后對(duì)實(shí)驗(yàn)的結(jié)果進(jìn)行分析并加以總結(jié),驗(yàn)證了該方法的有效性。
[Abstract]:In recent years, Internet has developed rapidly and has penetrated into every corner of life. Internet contains a large number of news information of all kinds, and the traditional way of obtaining news has been greatly challenged, and people have entered a "information explosion" and "news surplus." In the era of lack of news knowledge, the general search engine solved the above problems to a certain extent. Because of the dynamic and larger scale of Web, the index escape subspace of general search engine index database is expanding constantly, and its query interface is difficult to satisfy the query request of specific users. Therefore, news topic search engine emerges as the times require. At present, Internet has become an important source for people to obtain news. How to accurately and quickly find the required news from a large number of news websites has become the primary goal of news search engines, and in order to achieve this goal, This paper attempts to add semantic concepts to the news topic search engine and try to enhance the semantic understanding ability and query precision of the search engine by means of the strong semantic expression ability of ontology and local context information. From the news subject search engine to study the professional search engine, this concept will also have a certain impact on the development of professional search engine. In order to achieve the above-mentioned objectives, the following two aspects of work have been done in this paper: 1. Construct news domain ontology. Firstly, this paper introduces the significance and strategy of constructing news domain ontology, and integrates the idea of software engineering into the construction process of news domain ontology. Then, the construction process of domain ontology is discussed in detail, and every step is analyzed in detail. Finally, according to the need of this algorithm, a simple news domain ontology is constructed by using the ontology building tool Prod 茅 g 茅 3.3.1 and referring to other domain ontology construction methods. 2. A news topic search engine is designed and implemented. The function and composition module of the system are introduced in detail. The semantic retrieval model of news topic search engine is given. In this paper, the query extension method based on ontology and local context analysis is applied to the system, and the key technologies such as semantic extension, extension word selection and so on are discussed in detail. Finally, the experimental results are analyzed and summarized to verify the effectiveness of the method.
【學(xué)位授予單位】:蘭州理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類(lèi)號(hào)】:TP391.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李文駿;崔志明;;基于搜索引擎的Deep Web數(shù)據(jù)源發(fā)現(xiàn)技術(shù)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2008年08期

2 李莉;高慶獅;;一種基于語(yǔ)義單元的查詢擴(kuò)展方法[J];計(jì)算機(jī)科學(xué);2008年02期

3 鄒良群;周春雷;;基于搜索引擎的公開(kāi)情報(bào)自動(dòng)化搜集模型[J];電腦知識(shí)與技術(shù);2008年26期

4 裴飛;洪宇;孫常龍;姚建民;朱巧明;;基于Web的查詢擴(kuò)展[J];電腦知識(shí)與技術(shù);2011年06期

5 張繼剛;搜索引擎使用技巧[J];網(wǎng)絡(luò)與信息;1999年09期

6 ;關(guān)鍵詞搜索[J];每周電腦報(bào);2000年38期

7 陳冰;;餓狼一樣的網(wǎng)站提交工具——“提交餓狼”[J];科學(xué)之友;2000年07期

8 許斗;從Google看新一代搜索引擎的發(fā)展趨向[J];蕪湖職業(yè)技術(shù)學(xué)院學(xué)報(bào);2001年01期

9 周毅華;從搜索引擎的分類(lèi)看其應(yīng)用技巧[J];圖書(shū)館理論與實(shí)踐;2002年06期

10 鄒小筑;搜索引擎的選擇與使用技巧[J];圖書(shū)館學(xué)研究;2002年05期

相關(guān)會(huì)議論文 前10條

1 鄧長(zhǎng)壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年

2 彭軻;廖聞劍;;淺析搜索引擎[A];中國(guó)通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年

3 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國(guó)中醫(yī)藥信息研究會(huì)第二屆理事大會(huì)暨學(xué)術(shù)交流會(huì)議論文匯編[C];2003年

4 維尼拉·木沙江;吐?tīng)柡椤の崴韭?;維、哈、柯文搜索引擎中網(wǎng)頁(yè)爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年

5 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年

6 姚樹(shù)宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國(guó)開(kāi)放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集[C];2005年

7 倪俊峰;;基于黃頁(yè)搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年

8 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2010年

9 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年

10 楊萌;李春麗;朱明;;網(wǎng)絡(luò)搜索技術(shù)下的編輯工作[A];學(xué)報(bào)編輯論叢(第十一集)[C];2003年

相關(guān)重要報(bào)紙文章 前10條

1 李一鑫;搜索排名的紅與黑[N];財(cái)經(jīng)時(shí)報(bào);2007年

2 周文林;搜狗3.0能否撼動(dòng)搜索市場(chǎng)[N];經(jīng)濟(jì)參考報(bào);2007年

3 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財(cái)經(jīng)日?qǐng)?bào);2005年

4 賽迪顧問(wèn)股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;搜索,還是門(mén)戶[N];中國(guó)計(jì)算機(jī)報(bào);2005年

5 陳珊;浙江移動(dòng)推出手機(jī)搜索引擎服務(wù)[N];人民郵電;2005年

6 趙法忠;搜索引擎還需悠著點(diǎn)[N];中國(guó)經(jīng)營(yíng)報(bào);2005年

7 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報(bào);2006年

8 本報(bào)記者  趙曉輝 孟昭麗;搜索引擎駛?cè)搿氨茱L(fēng)港”[N];中國(guó)證券報(bào);2006年

9 孫t;搜索引擎驚喜侵權(quán)官司止于“避風(fēng)港”?[N];第一財(cái)經(jīng)日?qǐng)?bào);2006年

10 姜蕊;問(wèn)天下誰(shuí)識(shí)搜索?[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2006年

相關(guān)博士學(xué)位論文 前10條

1 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年

2 李群;主題搜索引擎聚類(lèi)算法的研究[D];北京林業(yè)大學(xué);2011年

3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年

4 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年

5 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年

6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年

7 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評(píng)估研究[D];吉林大學(xué);2010年

8 李莎莎;面向搜索引擎的自然語(yǔ)言處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

9 白玉琪;空間信息搜索引擎研究[D];中國(guó)科學(xué)院研究生院(遙感應(yīng)用研究所);2003年

10 費(fèi)巍;搜索引擎檢索功能的性能評(píng)價(jià)研究[D];武漢大學(xué);2010年

相關(guān)碩士學(xué)位論文 前10條

1 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實(shí)現(xiàn)和優(yōu)化[D];吉林大學(xué);2011年

2 薛云;Internet上元搜索引擎的研究與設(shè)計(jì)[D];太原理工大學(xué);2003年

3 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年

4 董晨;基于模糊聚類(lèi)的個(gè)性化搜索引擎的研究[D];福州大學(xué);2005年

5 盧葦;基于雙語(yǔ)翻譯搜索引擎的智能用戶接口的研究[D];武漢理工大學(xué);2009年

6 封俊;基于Hadoop的分布式搜索引擎研究與實(shí)現(xiàn)[D];太原理工大學(xué);2010年

7 李浩;分布式教育網(wǎng)信息檢索系統(tǒng)的研究和實(shí)現(xiàn)[D];華南理工大學(xué);2010年

8 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年

9 李建平;智能化WEB信息搜索引擎的研究與實(shí)現(xiàn)[D];大慶石油學(xué)院;2003年

10 田生偉;基于涉農(nóng)詞典的搜索引擎的研究與實(shí)踐[D];新疆大學(xué);2004年



本文編號(hào):2459046

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2459046.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶67481***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com