穩(wěn)定的信息檢索方法及其在分布式環(huán)境下的應用.pdf 全文
本文關鍵詞:穩(wěn)定的信息檢索方法及其在分布式環(huán)境下的應用,由筆耕文化傳播整理發(fā)布。
中國科學院研究生院
博士學位論文
穩(wěn)定的信息檢索方法及其在分布式環(huán)境下的應用
姓名:楊志峰
申請學位級別:博士
專業(yè):計算機科學與技術
指導教師:白碩
座機電話號碼
摘要
摘要
隨著人類知識的增長和網(wǎng)絡應用的普及,以電子形式存在的自然語言信息的數(shù)量迅
速膨脹。 一力而,這種現(xiàn)象使人們可以方便快捷地獲取信息;另一方面,如果沒有合理
的榆索手段,人們將很難充分地利用這些數(shù)據(jù)。
信息檢索技術“J.以幫助人們有效地對大量文本數(shù)據(jù)進行檢索。但是,由于目前尚未
住自然語苦理解領域耿得突破,信息檢索方法主要利用統(tǒng)計手段。它常常依賴于特定的
經(jīng)驗參數(shù),參數(shù)優(yōu)化過程繁瑣,且不利用實際應用。本文試圖尋找一種較為穩(wěn)定的文本
檢索算法和WEB信息檢索方法,可以在不同的數(shù)據(jù)集和不同的檢索任務中都取得較好
的檢索效果。同時,它是一種平滑函數(shù),參數(shù)在一定范圍內(nèi)變動時不會對結果造成劇烈
中取得了滿意的成績,同時也在2001年TREC的數(shù)據(jù)集以及早期的數(shù)據(jù)集上取得了較
好的效果。本文在TREC檢索任務及其相關性判定的基礎上,探討了利用遺傳算法改善
檢索質量和進行參數(shù)優(yōu)化的可能性。在有相關性判定的遺傳算法中,通過謹慎地選擇遺
傳算子和遺傳算法的形式以提高算法的全局和局部搜索能力,并避免早熟現(xiàn)象,取得了
比手工調整結果更好的檢索效果。在無相關性判定的遺傳算法中,本文設計了投票算法
以產(chǎn)生偽
本文關鍵詞:穩(wěn)定的信息檢索方法及其在分布式環(huán)境下的應用,由筆耕文化傳播整理發(fā)布。
,本文編號:186365
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/186365.html