基于組合條件的Web信息搜索方法
本文關鍵詞:基于組合條件的Web信息搜索方法
【摘要】:隨著互聯(lián)網技術的迅猛發(fā)展,Web信息呈現了爆發(fā)式的增長。面對海量的Web信息,用戶主動獲取信息的方式通常為提交關鍵詞句到搜索引擎,從搜索引擎返回的網頁集合中獲取信息。這種方式通常可以滿足當搜索詞句較為簡單(僅包含關鍵字或短語)時的搜索需求。然而當搜索請求包含多個條件以及復雜的語法時搜索引擎所返回的結果常常是不準確和不全面的。其原因除了用戶對搜索引擎的使用不熟練,無法準確的描述其所需要搜索獲得的信息外,還包含(1)部分搜索語句包含了多個修飾條件,搜索引擎無法準確解析用戶的真正查詢意圖;(2)用戶的搜索目標需要從多個網頁中綜合分析才可以得到最終結果,而目前搜索引擎返回的搜索結果是單個網頁的集合。此外,當用戶提交的搜索語句包含多個搜索條件時,其期望搜索結果往往是一個實體集合,而現階段,用戶為了得到該實體集合,通常的做法是逐頁瀏覽,并分析判斷某個實體是否符合搜索條件,浪費了大量的時間和精力。針對以上問題,本文提出了解決方案。本文主要貢獻如下:(1)研究了基于組合條件Web搜索語句和搜索結果中實體之間的上下位關系,對組合條件搜索語句中的各個要素進行了分析、總結、抽象。定義了基于組合條件Web搜索語句的概念模型,對基于組合條件的Web搜索語句的語義進行了結構化描述,并對搜索過程和結果集進行了闡釋。(2)提出了基于組合條件Web搜索策略:將組合條件Web搜索語句分割為一個中心語和多個修飾語,利用分割后的中心語和修飾語將搜索語句重寫為多個子搜索語句;谥貙懞蟮淖铀阉髡Z句,利用搜索引擎找到子搜索語句對應的網頁。研究并歸納了網頁中實體的存在形式,以此為依據,從頁面中初步提取實體并獲取實體的百科頁面,從中定位實體的屬性。根據修飾語,中心語,結合每個實體對應的百科頁面,對實體進行篩選,過濾,得到最終的搜索結果(實體集合)。(3)基于所提出的基于組合條件Web搜索策略實現了原型系統(tǒng)。由于沒有發(fā)現相關的數據集,本文分別基于中文和英文創(chuàng)建了測試數據集,根據數據集對原型系統(tǒng)進行了功能測試和性能測試,證明了所提出方法的有效性。
【學位授予單位】:天津理工大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP393.09;TP391.3
【相似文獻】
中國期刊全文數據庫 前10條
1 ;多媒體互聯(lián)網信息搜索技術[J];電腦與電信;2012年Z1期
2 李琳;;多媒體互聯(lián)網信息搜索技術探析[J];電腦開發(fā)與應用;2013年06期
3 倪元;;中英文圖片及信息搜索技巧[J];專用汽車;2014年04期
4 劉宏;黃世祥;;移動互聯(lián)網下信息搜索趨勢及問題的研究[J];長春理工大學學報(社會科學版);2014年05期
5 王欽國;;基于榜樣的學習方式在《信息搜索與分析》教學中的應用[J];中國信息技術教育;2009年24期
6 郭慶琳,樊孝忠;知識信息搜索和獲取技術的研究[J];北京工業(yè)大學學報;2003年04期
7 李俊慧;個人信息搜索會否陷入隱私困境[J];電腦知識與技術;2004年36期
8 王曉丹;孫嬌梅;;淺議互聯(lián)網信息搜索技術的發(fā)展[J];應用能源技術;2008年05期
9 郭從穎;;企業(yè)信息搜索方案初探[J];信息技術與標準化;2010年08期
10 王劍;王健;高秉博;;基于時空感知能力的農業(yè)信息搜索技術研究[J];南方農業(yè)學報;2013年01期
中國重要會議論文全文數據庫 前9條
1 王智斌;許儉;周皓峰;汪衛(wèi);施伯樂;;基于作者權威度分析的網絡社區(qū)信息搜索方法[A];第二十四屆中國數據庫學術會議論文集(技術報告篇)[C];2007年
2 吳穎華;周皓峰;王晨;汪衛(wèi);施伯樂;;有效提取Web權威資源[A];第二十一屆中國數據庫學術會議論文集(研究報告篇)[C];2004年
3 張宜;靳桂明;;突發(fā)公共衛(wèi)生事件中互聯(lián)網醫(yī)藥信息搜索與啟示[A];中華醫(yī)院管理學會第十屆全國醫(yī)院感染管理學術年會論文匯編[C];2003年
4 董紅斌;蘇中濱;;基于Mobile Agent的信息搜索技術[A];全國計算機網絡應用年會論文集(2001)[C];2001年
5 樸秀峰;李凌霞;;移動Agent技術在電子商務中的應用[A];2006北京地區(qū)高校研究生學術交流會——通信與信息技術會議論文集(下)[C];2006年
6 羅英偉;汪小林;張穎;丁力;曲磊;叢升日;許卓群;;基于Agent的WebGIS信息搜索與分布計算模型[A];中國圖象圖形學會第十屆全國圖像圖形學術會議(CIG’2001)和第一屆全國虛擬現實技術研討會(CVR’2001)論文集[C];2001年
7 孫慶洲;劉永芳;韓仁生;;建議成本對決策者決策信息加工方式的影響及其作用機制[A];心理學與創(chuàng)新能力提升——第十六屆全國心理學學術會議論文集[C];2013年
8 劉鵬元;;詢問式搜索請求的模式分析[A];內容計算的研究與應用前沿——第九屆全國計算語言學學術會議論文集[C];2007年
9 封紅蓮;顧惠忠;;人機界面中的信息設計研究[A];第十四屆全國圖象圖形學學術會議論文集[C];2008年
中國重要報紙全文數據庫 前10條
1 鄭杏果;Pocaca:垂直商務搜索異軍突起[N];中國計算機報;2006年
2 王新禧;沒有網絡就沒有生活[N];中國電腦教育報;2005年
3 王金元;Google搜索業(yè)務延伸 主宰圖書信息搜索[N];市場報;2004年
4 鯤;電子商務有我精彩[N];中國財經報;2000年
5 山東高密一中 張鐵龍;信息搜索大提速[N];中國電腦教育報;2004年
6 ;企業(yè)信息搜索無用?[N];網絡世界;2007年
7 曾婭;日本“信息大航海計劃”開始征集參與企業(yè)[N];人民郵電;2007年
8 本報實習記者 陳張杰;電話搜索開辟信息搜索新領域[N];通信信息報;2005年
9 本報記者 楊春暉;搜索返現金能讓用戶上癮?[N];中國計算機報;2008年
10 博士 劉保華;一切皆“智能”[N];中國計算機報;2010年
中國博士學位論文全文數據庫 前3條
1 張星;市場機遇信息搜索的社會網絡模式及其系統(tǒng)的研究[D];華中科技大學;2009年
2 舒永鋼;WebGIS旅游信息搜索功用研究及應用[D];浙江工商大學;2012年
3 王煉;網絡環(huán)境下基于消費者搜索的市場預測研究[D];西南交通大學;2014年
中國碩士學位論文全文數據庫 前10條
1 汪麗芳;容遲網絡中一種基于平穩(wěn)分布的信息搜索方法的研究[D];合肥工業(yè)大學;2016年
2 雷鵬飛;基于組合條件的Web信息搜索方法[D];天津理工大學;2016年
3 王彥杰;手機生活信息搜索系統(tǒng)設計與實現[D];北京郵電大學;2011年
4 趙喜燕;基于不確定信息的個人信息搜索方法研究[D];天津理工大學;2014年
5 肖潔;基于移動agent的web信息搜索的研究[D];大連海事大學;2006年
6 郭楊;移動Agent技術在Web信息搜索上的研究[D];大連海事大學;2008年
7 尹鵬;一種基于XML的信息搜索技術[D];東北師范大學;2006年
8 李靜;數字圖書館中信息搜索關鍵技術研究[D];復旦大學;2010年
9 馮思平;Web招標信息搜索及管理系統(tǒng)的設計[D];電子科技大學;2009年
10 李賢兵;圖紙信息搜索及BOM表建立技術的研究[D];大連理工大學;2004年
,本文編號:1140045
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1140045.html