基于組合條件的Web信息搜索方法
本文關(guān)鍵詞:基于組合條件的Web信息搜索方法
更多相關(guān)文章: Web搜索 中心語 修飾語 實(shí)體
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,Web信息呈現(xiàn)了爆發(fā)式的增長。面對海量的Web信息,用戶主動獲取信息的方式通常為提交關(guān)鍵詞句到搜索引擎,從搜索引擎返回的網(wǎng)頁集合中獲取信息。這種方式通?梢詽M足當(dāng)搜索詞句較為簡單(僅包含關(guān)鍵字或短語)時的搜索需求。然而當(dāng)搜索請求包含多個條件以及復(fù)雜的語法時搜索引擎所返回的結(jié)果常常是不準(zhǔn)確和不全面的。其原因除了用戶對搜索引擎的使用不熟練,無法準(zhǔn)確的描述其所需要搜索獲得的信息外,還包含(1)部分搜索語句包含了多個修飾條件,搜索引擎無法準(zhǔn)確解析用戶的真正查詢意圖;(2)用戶的搜索目標(biāo)需要從多個網(wǎng)頁中綜合分析才可以得到最終結(jié)果,而目前搜索引擎返回的搜索結(jié)果是單個網(wǎng)頁的集合。此外,當(dāng)用戶提交的搜索語句包含多個搜索條件時,其期望搜索結(jié)果往往是一個實(shí)體集合,而現(xiàn)階段,用戶為了得到該實(shí)體集合,通常的做法是逐頁瀏覽,并分析判斷某個實(shí)體是否符合搜索條件,浪費(fèi)了大量的時間和精力。針對以上問題,本文提出了解決方案。本文主要貢獻(xiàn)如下:(1)研究了基于組合條件Web搜索語句和搜索結(jié)果中實(shí)體之間的上下位關(guān)系,對組合條件搜索語句中的各個要素進(jìn)行了分析、總結(jié)、抽象。定義了基于組合條件Web搜索語句的概念模型,對基于組合條件的Web搜索語句的語義進(jìn)行了結(jié)構(gòu)化描述,并對搜索過程和結(jié)果集進(jìn)行了闡釋。(2)提出了基于組合條件Web搜索策略:將組合條件Web搜索語句分割為一個中心語和多個修飾語,利用分割后的中心語和修飾語將搜索語句重寫為多個子搜索語句;谥貙懞蟮淖铀阉髡Z句,利用搜索引擎找到子搜索語句對應(yīng)的網(wǎng)頁。研究并歸納了網(wǎng)頁中實(shí)體的存在形式,以此為依據(jù),從頁面中初步提取實(shí)體并獲取實(shí)體的百科頁面,從中定位實(shí)體的屬性。根據(jù)修飾語,中心語,結(jié)合每個實(shí)體對應(yīng)的百科頁面,對實(shí)體進(jìn)行篩選,過濾,得到最終的搜索結(jié)果(實(shí)體集合)。(3)基于所提出的基于組合條件Web搜索策略實(shí)現(xiàn)了原型系統(tǒng)。由于沒有發(fā)現(xiàn)相關(guān)的數(shù)據(jù)集,本文分別基于中文和英文創(chuàng)建了測試數(shù)據(jù)集,根據(jù)數(shù)據(jù)集對原型系統(tǒng)進(jìn)行了功能測試和性能測試,證明了所提出方法的有效性。
【學(xué)位授予單位】:天津理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP393.09;TP391.3
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 ;多媒體互聯(lián)網(wǎng)信息搜索技術(shù)[J];電腦與電信;2012年Z1期
2 李琳;;多媒體互聯(lián)網(wǎng)信息搜索技術(shù)探析[J];電腦開發(fā)與應(yīng)用;2013年06期
3 倪元;;中英文圖片及信息搜索技巧[J];專用汽車;2014年04期
4 劉宏;黃世祥;;移動互聯(lián)網(wǎng)下信息搜索趨勢及問題的研究[J];長春理工大學(xué)學(xué)報(社會科學(xué)版);2014年05期
5 王欽國;;基于榜樣的學(xué)習(xí)方式在《信息搜索與分析》教學(xué)中的應(yīng)用[J];中國信息技術(shù)教育;2009年24期
6 郭慶琳,樊孝忠;知識信息搜索和獲取技術(shù)的研究[J];北京工業(yè)大學(xué)學(xué)報;2003年04期
7 李俊慧;個人信息搜索會否陷入隱私困境[J];電腦知識與技術(shù);2004年36期
8 王曉丹;孫嬌梅;;淺議互聯(lián)網(wǎng)信息搜索技術(shù)的發(fā)展[J];應(yīng)用能源技術(shù);2008年05期
9 郭從穎;;企業(yè)信息搜索方案初探[J];信息技術(shù)與標(biāo)準(zhǔn)化;2010年08期
10 王劍;王健;高秉博;;基于時空感知能力的農(nóng)業(yè)信息搜索技術(shù)研究[J];南方農(nóng)業(yè)學(xué)報;2013年01期
中國重要會議論文全文數(shù)據(jù)庫 前9條
1 王智斌;許儉;周皓峰;汪衛(wèi);施伯樂;;基于作者權(quán)威度分析的網(wǎng)絡(luò)社區(qū)信息搜索方法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2007年
2 吳穎華;周皓峰;王晨;汪衛(wèi);施伯樂;;有效提取Web權(quán)威資源[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年
3 張宜;靳桂明;;突發(fā)公共衛(wèi)生事件中互聯(lián)網(wǎng)醫(yī)藥信息搜索與啟示[A];中華醫(yī)院管理學(xué)會第十屆全國醫(yī)院感染管理學(xué)術(shù)年會論文匯編[C];2003年
4 董紅斌;蘇中濱;;基于Mobile Agent的信息搜索技術(shù)[A];全國計算機(jī)網(wǎng)絡(luò)應(yīng)用年會論文集(2001)[C];2001年
5 樸秀峰;李凌霞;;移動Agent技術(shù)在電子商務(wù)中的應(yīng)用[A];2006北京地區(qū)高校研究生學(xué)術(shù)交流會——通信與信息技術(shù)會議論文集(下)[C];2006年
6 羅英偉;汪小林;張穎;丁力;曲磊;叢升日;許卓群;;基于Agent的WebGIS信息搜索與分布計算模型[A];中國圖象圖形學(xué)會第十屆全國圖像圖形學(xué)術(shù)會議(CIG’2001)和第一屆全國虛擬現(xiàn)實(shí)技術(shù)研討會(CVR’2001)論文集[C];2001年
7 孫慶洲;劉永芳;韓仁生;;建議成本對決策者決策信息加工方式的影響及其作用機(jī)制[A];心理學(xué)與創(chuàng)新能力提升——第十六屆全國心理學(xué)學(xué)術(shù)會議論文集[C];2013年
8 劉鵬元;;詢問式搜索請求的模式分析[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
9 封紅蓮;顧惠忠;;人機(jī)界面中的信息設(shè)計研究[A];第十四屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2008年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 鄭杏果;Pocaca:垂直商務(wù)搜索異軍突起[N];中國計算機(jī)報;2006年
2 王新禧;沒有網(wǎng)絡(luò)就沒有生活[N];中國電腦教育報;2005年
3 王金元;Google搜索業(yè)務(wù)延伸 主宰圖書信息搜索[N];市場報;2004年
4 鯤;電子商務(wù)有我精彩[N];中國財經(jīng)報;2000年
5 山東高密一中 張鐵龍;信息搜索大提速[N];中國電腦教育報;2004年
6 ;企業(yè)信息搜索無用?[N];網(wǎng)絡(luò)世界;2007年
7 曾婭;日本“信息大航海計劃”開始征集參與企業(yè)[N];人民郵電;2007年
8 本報實(shí)習(xí)記者 陳張杰;電話搜索開辟信息搜索新領(lǐng)域[N];通信信息報;2005年
9 本報記者 楊春暉;搜索返現(xiàn)金能讓用戶上癮?[N];中國計算機(jī)報;2008年
10 博士 劉保華;一切皆“智能”[N];中國計算機(jī)報;2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 張星;市場機(jī)遇信息搜索的社會網(wǎng)絡(luò)模式及其系統(tǒng)的研究[D];華中科技大學(xué);2009年
2 舒永鋼;WebGIS旅游信息搜索功用研究及應(yīng)用[D];浙江工商大學(xué);2012年
3 王煉;網(wǎng)絡(luò)環(huán)境下基于消費(fèi)者搜索的市場預(yù)測研究[D];西南交通大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 汪麗芳;容遲網(wǎng)絡(luò)中一種基于平穩(wěn)分布的信息搜索方法的研究[D];合肥工業(yè)大學(xué);2016年
2 雷鵬飛;基于組合條件的Web信息搜索方法[D];天津理工大學(xué);2016年
3 王彥杰;手機(jī)生活信息搜索系統(tǒng)設(shè)計與實(shí)現(xiàn)[D];北京郵電大學(xué);2011年
4 趙喜燕;基于不確定信息的個人信息搜索方法研究[D];天津理工大學(xué);2014年
5 肖潔;基于移動agent的web信息搜索的研究[D];大連海事大學(xué);2006年
6 郭楊;移動Agent技術(shù)在Web信息搜索上的研究[D];大連海事大學(xué);2008年
7 尹鵬;一種基于XML的信息搜索技術(shù)[D];東北師范大學(xué);2006年
8 李靜;數(shù)字圖書館中信息搜索關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2010年
9 馮思平;Web招標(biāo)信息搜索及管理系統(tǒng)的設(shè)計[D];電子科技大學(xué);2009年
10 李賢兵;圖紙信息搜索及BOM表建立技術(shù)的研究[D];大連理工大學(xué);2004年
,本文編號:1140045
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1140045.html