從Web獲取部分整體關(guān)系語料的方法
【圖文】:
詢串關(guān)鍵詞的部分標(biāo)記為紅字,我們用斜體黑體表示這些匹配的部分。圖1中比較三種不同方法中獲取的部分整體關(guān)系語料中,含有部分整體關(guān)系語句的數(shù)量。由于人工構(gòu)造查詢方法獲取的部分整體關(guān)系語料是一種完全非結(jié)構(gòu)化的,因此不能利用查詢串提供的信息自動獲取其中的部分整體關(guān)系。圖2對比基于語料庫構(gòu)造查詢方法和意圖查詢方法獲取的部分整體關(guān)系數(shù)量。4.3 實(shí)驗(yàn)分析從圖1可以看出,在由返回的Top100項(xiàng)、Top200項(xiàng)、Top300項(xiàng)、Top400項(xiàng)和Top500項(xiàng)檢索結(jié)果組成的部分整體關(guān)系語料中,人工構(gòu)造查詢方法所獲取的各個語料中蘊(yùn)含部分整體關(guān)系的語句數(shù)量最少,意圖查詢方法獲取數(shù)量最多,且部分整體關(guān)系語料的規(guī)模越大,意圖查詢方法的優(yōu)勢越明顯。圖1 三種不同方法獲取的語料中含有部分整體關(guān)系的語句的數(shù)量在部分整體關(guān)系抽取難易方面
對于這種語料,我們能很容易的利用查詢串本身提供的信息,從中抽取出符合我們查詢本意的部分整體關(guān)系。通過圖2中的實(shí)驗(yàn)數(shù)據(jù)可以看出,對比基于語料庫構(gòu)造查詢方法,意圖查詢方法從獲取的部分整體關(guān)系語料中可以多獲取大約兩倍的部分整體關(guān)系。5 結(jié)束語目前人們使用搜索引擎作為從Web獲取知識的有效手段,但網(wǎng)上絕大多數(shù)搜索引擎都使用基于關(guān)鍵詞匹配的全文檢索技術(shù),不支持語義搜索。因?yàn)椴灰讓z索對象本身做出處理[4],我們只能對查詢串本身做出某些改變,使其接近我們需要的語義。故本文提出了一種新的用于從Web獲取部分整體關(guān)系語料的基于意圖的查詢構(gòu)造方法即意圖查詢方法。在查詢中加入與部分整體相關(guān)度高的語境詞,構(gòu)造新的查詢
【共引文獻(xiàn)】
相關(guān)期刊論文 前8條
1 余正濤,樊孝忠,宋麗榮;基于特定問題類別的漢語問答系統(tǒng)查詢擴(kuò)展[J];北京理工大學(xué)學(xué)報(bào);2005年10期
2 陳麗,于浩,鄭德權(quán),趙鐵軍;基于文本內(nèi)容的超鏈接分類研究[J];哈爾濱商業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年02期
3 鄭慶華,王朝靜,孫霞;一種基于結(jié)構(gòu)化語料庫的概念語義網(wǎng)絡(luò)自動生成算法[J];計(jì)算機(jī)研究與發(fā)展;2005年03期
4 張虎,鄭家恒,劉江;語料庫詞性標(biāo)注一致性檢查方法研究[J];中文信息學(xué)報(bào);2004年05期
5 康海燕,李彥芳,林培光,樊孝忠;信息檢索策略性能的云模型評價(jià)方法[J];中文信息學(xué)報(bào);2005年01期
6 呂碧波;趙軍;;基于相關(guān)文檔池建模的查詢擴(kuò)展[J];中文信息學(xué)報(bào);2006年03期
7 左家莉,王明文,王希;基于Markov網(wǎng)絡(luò)的信息檢索擴(kuò)展模型[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年S1期
8 李智,李敏強(qiáng);基金項(xiàng)目評審管理中智能交互式文檔檢索[J];研究與發(fā)展管理;2005年03期
相關(guān)博士學(xué)位論文 前3條
1 李智;機(jī)器學(xué)習(xí)方法及其在基金項(xiàng)目評審中的應(yīng)用研究[D];天津大學(xué);2004年
2 潘旭偉;集成情境知識管理中幾個關(guān)鍵技術(shù)的研究[D];浙江大學(xué);2005年
3 王樹梅;信息檢索相關(guān)技術(shù)研究[D];南京理工大學(xué);2007年
相關(guān)碩士學(xué)位論文 前9條
1 代學(xué)武;基于神經(jīng)網(wǎng)絡(luò)的用戶建模和Web信息過濾研究[D];西南師范大學(xué);2003年
2 杭月芹;基于文檔查詢信息的檢索系統(tǒng)研究與實(shí)現(xiàn)[D];揚(yáng)州大學(xué);2005年
3 吳煒;基于用戶日志的信息檢索研究[D];同濟(jì)大學(xué);2006年
4 張波;個性化Web搜索系統(tǒng)研究[D];燕山大學(xué);2006年
5 謝翠華;基于概念格的Web文本管理研究[D];揚(yáng)州大學(xué);2006年
6 盛俊;潛在語義的Markov網(wǎng)絡(luò)檢索模型的研究[D];江西師范大學(xué);2006年
7 余超;基于知網(wǎng)的詞匯語義計(jì)算研究及應(yīng)用[D];沈陽航空工業(yè)學(xué)院;2007年
8 藕軍;Deep Web搜索引擎的關(guān)鍵技術(shù)[D];合肥工業(yè)大學(xué);2007年
9 馮運(yùn);信息檢索中的查詢算法研究[D];湖南大學(xué);2007年
【二級參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 袁毓林;計(jì)算語言學(xué)的理論方法和研究取向[J];中國社會科學(xué);2001年04期
,本文編號:2568651
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2568651.html