穩(wěn)定的信息檢索方法及其在分布式環(huán)境下的應(yīng)用.pdf 全文
本文關(guān)鍵詞:穩(wěn)定的信息檢索方法及其在分布式環(huán)境下的應(yīng)用,由筆耕文化傳播整理發(fā)布。
中國(guó)科學(xué)院研究生院
博士學(xué)位論文
穩(wěn)定的信息檢索方法及其在分布式環(huán)境下的應(yīng)用
姓名:楊志峰
申請(qǐng)學(xué)位級(jí)別:博士
專業(yè):計(jì)算機(jī)科學(xué)與技術(shù)
指導(dǎo)教師:白碩
座機(jī)電話號(hào)碼
摘要
摘要
隨著人類知識(shí)的增長(zhǎng)和網(wǎng)絡(luò)應(yīng)用的普及,以電子形式存在的自然語(yǔ)言信息的數(shù)量迅
速膨脹。 一力而,這種現(xiàn)象使人們可以方便快捷地獲取信息;另一方面,如果沒(méi)有合理
的榆索手段,人們將很難充分地利用這些數(shù)據(jù)。
信息檢索技術(shù)“J.以幫助人們有效地對(duì)大量文本數(shù)據(jù)進(jìn)行檢索。但是,由于目前尚未
住自然語(yǔ)苦理解領(lǐng)域耿得突破,信息檢索方法主要利用統(tǒng)計(jì)手段。它常常依賴于特定的
經(jīng)驗(yàn)參數(shù),參數(shù)優(yōu)化過(guò)程繁瑣,且不利用實(shí)際應(yīng)用。本文試圖尋找一種較為穩(wěn)定的文本
檢索算法和WEB信息檢索方法,可以在不同的數(shù)據(jù)集和不同的檢索任務(wù)中都取得較好
的檢索效果。同時(shí),它是一種平滑函數(shù),參數(shù)在一定范圍內(nèi)變動(dòng)時(shí)不會(huì)對(duì)結(jié)果造成劇烈
中取得了滿意的成績(jī),同時(shí)也在2001年TREC的數(shù)據(jù)集以及早期的數(shù)據(jù)集上取得了較
好的效果。本文在TREC檢索任務(wù)及其相關(guān)性判定的基礎(chǔ)上,探討了利用遺傳算法改善
檢索質(zhì)量和進(jìn)行參數(shù)優(yōu)化的可能性。在有相關(guān)性判定的遺傳算法中,通過(guò)謹(jǐn)慎地選擇遺
傳算子和遺傳算法的形式以提高算法的全局和局部搜索能力,并避免早熟現(xiàn)象,取得了
比手工調(diào)整結(jié)果更好的檢索效果。在無(wú)相關(guān)性判定的遺傳算法中,本文設(shè)計(jì)了投票算法
以產(chǎn)生偽
本文關(guān)鍵詞:穩(wěn)定的信息檢索方法及其在分布式環(huán)境下的應(yīng)用,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):186365
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/186365.html