基于用戶(hù)行為分析的搜索引擎自動(dòng)評(píng)價(jià)技術(shù)研究
本文關(guān)鍵詞:基于用戶(hù)行為分析的搜索引擎自動(dòng)評(píng)價(jià)技術(shù)研究,由筆耕文化傳播整理發(fā)布。
《北京郵電大學(xué)》 2013年
基于用戶(hù)行為分析的搜索引擎自動(dòng)評(píng)價(jià)技術(shù)研究
余錦秀
【摘要】:搜索引擎的出現(xiàn)徹底改變了人們獲取信息的方式,它能夠幫助用戶(hù)快速且準(zhǔn)確的從浩瀚的互聯(lián)網(wǎng)海洋中獲取全面的資料。如何對(duì)搜索引擎進(jìn)行改進(jìn)使其能更好的滿足用戶(hù)需求,一直以來(lái)都是信息檢索領(lǐng)域的研究熱點(diǎn)問(wèn)題之一,而搜索引擎改進(jìn)的核心問(wèn)題就是搜索引擎的評(píng)價(jià)問(wèn)題。 隨著互聯(lián)網(wǎng)信息的不斷增多以及計(jì)算機(jī)技術(shù)的不斷發(fā)展,傳統(tǒng)的耗時(shí)耗力的手動(dòng)評(píng)價(jià)方法已經(jīng)不能滿足實(shí)際需要了,提高搜索引擎評(píng)價(jià)方法的自動(dòng)化勢(shì)在必行。通過(guò)引入用戶(hù)行為分析來(lái)實(shí)現(xiàn)評(píng)價(jià)的自動(dòng)化是近年來(lái)的主要研究方向,此外,搜索引擎改進(jìn)的終極目標(biāo)也是為了更好的滿足用戶(hù)需要,所以了解用戶(hù)在使用搜索引擎時(shí)的行為習(xí)慣以及對(duì)搜索引擎的看法對(duì)于改進(jìn)搜索引擎評(píng)估都是至關(guān)重要的。因此我們發(fā)起了一項(xiàng)關(guān)于國(guó)內(nèi)用戶(hù)在使用搜索引擎時(shí)的行為習(xí)慣的調(diào)查問(wèn)卷,通過(guò)分析返回結(jié)果數(shù)據(jù),總結(jié)出了很多重要結(jié)論。 在調(diào)查結(jié)果的基礎(chǔ)上,本文提出了一種基于用戶(hù)行為分析的搜索引擎自動(dòng)評(píng)價(jià)技術(shù),構(gòu)建了一個(gè)搜索引擎自動(dòng)評(píng)價(jià)模型。該模型包括三個(gè)模塊:首先從網(wǎng)絡(luò)檢索日志中自動(dòng)提取查詢(xún)?cè)~以及相關(guān)用戶(hù)行為;然后用基于用戶(hù)行為的方法對(duì)查詢(xún)?cè)~進(jìn)行標(biāo)準(zhǔn)答案自動(dòng)標(biāo)注;最后通過(guò)傳統(tǒng)的檢索結(jié)果評(píng)估機(jī)制,MAP (Mean Average Precision,平均準(zhǔn)確率法)和NDCG (Normalize Discounted cumulative gain,歸一化折扣增益法)比較了該方法獲得的結(jié)果與標(biāo)準(zhǔn)答案結(jié)果的接近程度,其中標(biāo)準(zhǔn)答案通過(guò)人為標(biāo)注獲取。實(shí)驗(yàn)證明基于用戶(hù)行為的評(píng)估方法比傳統(tǒng)的基于點(diǎn)擊率的方法具有更高的準(zhǔn)確率。另外本文還將重復(fù)率的概念引入歸一化折扣增益法NDCG,提出一種改進(jìn)的搜索引擎檢索結(jié)果質(zhì)量評(píng)價(jià)機(jī)制。調(diào)查結(jié)果證明改進(jìn)的機(jī)制可使得出的評(píng)測(cè)結(jié)果更加準(zhǔn)確,并且具有更現(xiàn)實(shí)的意義。
【關(guān)鍵詞】:
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類(lèi)號(hào)】:TP391.3
【目錄】:
下載全文 更多同類(lèi)文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購(gòu)買(mǎi)知網(wǎng)充值卡、在線充值、在線咨詢(xún))
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前7條
1 石艷霞;信息檢索中“相關(guān)性”與“相關(guān)反饋”研究概述[J];晉圖學(xué)刊;2002年02期
2 陳艷;廖文杰;;基于信息技術(shù)接受模型的搜索引擎評(píng)價(jià)體系探討[J];江西圖書(shū)館學(xué)刊;2008年01期
3 程學(xué)旗;郭嘉豐;靳小龍;;網(wǎng)絡(luò)信息的檢索與挖掘回顧[J];中文信息學(xué)報(bào);2011年06期
4 錢(qián)喻鍔;淺談Internet上中文信息的搜索[J];思茅師范高等專(zhuān)科學(xué)校學(xué)報(bào);2003年03期
5 李雪冰;;網(wǎng)絡(luò)環(huán)境下的信息加工與查準(zhǔn)率和查全率[J];中國(guó)西部科技(學(xué)術(shù));2007年11期
6 黃凱寧;;基于層次分析的搜索引擎性能綜合評(píng)價(jià)[J];現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版);2008年11期
7 梁延華,王振興;Web搜索引擎評(píng)估技術(shù)研究[J];信息工程大學(xué)學(xué)報(bào);2004年01期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 王放;一種自治的分布式信息采集與檢索系統(tǒng)[D];四川大學(xué);2006年
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 朱旭娟,李曉華,沈蘭蓀;一種自適應(yīng)提取最優(yōu)特征維的相關(guān)反饋算法[J];電路與系統(tǒng)學(xué)報(bào);2004年01期
2 向俊;王靜;何一輝;;遠(yuǎn)程教學(xué)資源整合及檢索系統(tǒng)研究[J];廣西廣播電視大學(xué)學(xué)報(bào);2012年03期
3 徐建民;朱松;陳富節(jié);;術(shù)語(yǔ)相似度和術(shù)語(yǔ)相關(guān)度在檢索模型中的融合研究[J];計(jì)算機(jī)應(yīng)用;2007年12期
4 錢(qián)程;陽(yáng)小蘭;;一種支持Ajax框架的網(wǎng)絡(luò)爬蟲(chóng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)與數(shù)字工程;2012年04期
5 王元卓;靳小龍;程學(xué)旗;;網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J];計(jì)算機(jī)學(xué)報(bào);2013年06期
6 莫祖英;;信息檢索中的相關(guān)性[J];情報(bào)探索;2006年12期
7 孫鑫;信息檢索中相關(guān)性反饋用法研究[J];情報(bào)雜志;2005年03期
8 謝大吉;;網(wǎng)絡(luò)化制造資源主題搜索MRS系統(tǒng)的設(shè)計(jì)研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2011年09期
9 夏文秀;隨書(shū)光盤(pán)的上網(wǎng)管理及應(yīng)用實(shí)踐[J];圖書(shū)館學(xué)刊;2005年02期
10 張國(guó)海;馬曉英;閆立光;;基于熵權(quán)的搜索引擎評(píng)價(jià)指標(biāo)體系的構(gòu)建[J];圖書(shū)情報(bào)工作;2010年12期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 李金濤;用戶(hù)的思維能力對(duì)文獻(xiàn)數(shù)據(jù)庫(kù)檢索中反饋調(diào)整的影響研究[D];西南大學(xué);2011年
2 孫潔;3G業(yè)務(wù)使用影響因素的實(shí)證研究[D];南京大學(xué);2011年
3 周黛;工程新聞信息的規(guī);杉百|(zhì)量控制[D];華中科技大學(xué);2010年
4 胡陽(yáng);中文搜索引擎用戶(hù)檢索習(xí)慣問(wèn)卷調(diào)查分析[D];河北大學(xué);2011年
5 王東涵;熵的思想在搜索引擎質(zhì)量評(píng)價(jià)中的應(yīng)用[D];上海交通大學(xué);2012年
6 朱旭娟;一種基于內(nèi)容的壓縮域圖像檢索系統(tǒng)的開(kāi)發(fā)[D];北京工業(yè)大學(xué);2004年
7 殷亞玲;基于概念圖的相關(guān)反饋系統(tǒng)的研究與實(shí)現(xiàn)[D];西北大學(xué);2006年
8 張學(xué)軍;一種基于空間特征的圖象檢索方法研究[D];遼寧工程技術(shù)大學(xué);2006年
9 蔣明亮;基于CSCW的信息檢索技術(shù)應(yīng)用研究[D];廣東工業(yè)大學(xué);2007年
10 朱松;術(shù)語(yǔ)相似度和術(shù)語(yǔ)相關(guān)度的融合研究及應(yīng)用[D];河北大學(xué);2008年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 劉朝陽(yáng);自主計(jì)算:下一代網(wǎng)絡(luò)的帝國(guó)構(gòu)想[J];互聯(lián)網(wǎng)周刊;2001年26期
2 劉朝陽(yáng);“電子蜥蜴”邁出自主計(jì)算第二步(上)[J];互聯(lián)網(wǎng)周刊;2001年32期
3 董曉常;Web2.0互聯(lián)網(wǎng)再次喧囂[J];互聯(lián)網(wǎng)周刊;2005年24期
4 魏英,林懷忠,陳純;RSS標(biāo)準(zhǔn)在Internet環(huán)境下新聞發(fā)布系統(tǒng)中的應(yīng)用研究[J];計(jì)算機(jī)工程與應(yīng)用;2005年15期
5 歐陽(yáng)柳波,李學(xué)勇,李國(guó)徽,王鑫;專(zhuān)業(yè)搜索引擎搜索策略綜述[J];計(jì)算機(jī)工程;2004年13期
6 吳剛,王懷民,毛新軍;可成長(zhǎng)的分布式系統(tǒng)[J];計(jì)算機(jī)工程與科學(xué);2005年03期
7 魯耀斌,徐紅梅;技術(shù)接受模型及其相關(guān)理論的比較研究[J];科技進(jìn)步與對(duì)策;2005年10期
8 王林;搜索引擎的原理和發(fā)展[J];圖書(shū)館理論與實(shí)踐;2004年04期
9 李東旻;網(wǎng)站綜合評(píng)價(jià)指標(biāo)初探[J];情報(bào)理論與實(shí)踐;2005年03期
10 馮項(xiàng)云;檢索系統(tǒng)中的相關(guān)反饋機(jī)制[J];情報(bào)理論與實(shí)踐;1998年06期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 吳佳金;楊志豪;林原;林鴻飛;;基于改進(jìn)Pairwise損失函數(shù)的排序?qū)W習(xí)方法[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 顧珺;;基于Nutch的用戶(hù)行為分析搜索引擎的實(shí)現(xiàn)[J];科技資訊;2009年15期
2 龔俊;;基于用戶(hù)行為分析的個(gè)性化搜索引擎的構(gòu)思[J];寧波大紅鷹學(xué)院學(xué)報(bào);2010年03期
3 鄭雙陽(yáng);林錦賢;;基于用戶(hù)行為聚類(lèi)的搜索[J];計(jì)算機(jī)與數(shù)字工程;2009年12期
4 張繼剛;搜索引擎使用技巧[J];網(wǎng)絡(luò)與信息;1999年09期
5 ;關(guān)鍵詞搜索[J];每周電腦報(bào);2000年38期
6 陳冰;;餓狼一樣的網(wǎng)站提交工具——“提交餓狼”[J];科學(xué)之友;2000年07期
7 許斗;從Google看新一代搜索引擎的發(fā)展趨向[J];蕪湖職業(yè)技術(shù)學(xué)院學(xué)報(bào);2001年01期
8 周毅華;從搜索引擎的分類(lèi)看其應(yīng)用技巧[J];圖書(shū)館理論與實(shí)踐;2002年06期
9 鄒小筑;搜索引擎的選擇與使用技巧[J];圖書(shū)館學(xué)研究;2002年05期
10 林燕;Google搜索引擎的搜索功能與使用技巧[J];河北科技圖苑;2003年05期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 彭軻;廖聞劍;;淺析搜索引擎[A];中國(guó)通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
2 陳磊;茹立云;馬少平;;基于用戶(hù)日志挖掘的搜索引擎廣告效果分析[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年
3 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國(guó)中醫(yī)藥信息研究會(huì)第二屆理事大會(huì)暨學(xué)術(shù)交流會(huì)議論文匯編[C];2003年
4 岑榮偉;劉奕群;張敏;茹立云;馬少平;;網(wǎng)絡(luò)搜索引擎用戶(hù)行為分析和研究[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
5 鄧長(zhǎng)壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
6 維尼拉·木沙江;吐?tīng)柡椤の崴韭?;維、哈、柯文搜索引擎中網(wǎng)頁(yè)爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
7 余慧佳;劉奕群;張敏;茹立云;馬少平;;基于大規(guī)模日志分析的網(wǎng)絡(luò)搜索引擎用戶(hù)行為研究[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
8 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年
9 姚樹(shù)宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國(guó)開(kāi)放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集[C];2005年
10 倪俊峰;;基于黃頁(yè)搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 李一鑫;[N];財(cái)經(jīng)時(shí)報(bào);2007年
2 周文林;[N];經(jīng)濟(jì)參考報(bào);2007年
3 惠正一;[N];第一財(cái)經(jīng)日?qǐng)?bào);2005年
4 賽迪顧問(wèn)股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢(xún)中心 常燕杰;[N];中國(guó)計(jì)算機(jī)報(bào);2005年
5 陳珊;[N];人民郵電;2005年
6 趙法忠;[N];中國(guó)經(jīng)營(yíng)報(bào);2005年
7 金朝力;[N];北京商報(bào);2006年
8 本報(bào)記者 趙曉輝 孟昭麗;[N];中國(guó)證券報(bào);2006年
9 孫琎;[N];第一財(cái)經(jīng)日?qǐng)?bào);2006年
10 姜蕊;[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2006年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 岑榮偉;基于用戶(hù)行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年
2 李群;主題搜索引擎聚類(lèi)算法的研究[D];北京林業(yè)大學(xué);2011年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年
5 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
7 王镠璞;基于用戶(hù)體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評(píng)估研究[D];吉林大學(xué);2010年
8 李莎莎;面向搜索引擎的自然語(yǔ)言處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年
9 鄭文良;基于簡(jiǎn)單本體的農(nóng)業(yè)P2P搜索引擎關(guān)鍵技術(shù)研究[D];沈陽(yáng)農(nóng)業(yè)大學(xué);2013年
10 白玉琪;空間信息搜索引擎研究[D];中國(guó)科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 薛云;Internet上元搜索引擎的研究與設(shè)計(jì)[D];太原理工大學(xué);2003年
2 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年
3 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實(shí)現(xiàn)和優(yōu)化[D];吉林大學(xué);2011年
4 董晨;基于模糊聚類(lèi)的個(gè)性化搜索引擎的研究[D];福州大學(xué);2005年
5 封俊;基于Hadoop的分布式搜索引擎研究與實(shí)現(xiàn)[D];太原理工大學(xué);2010年
6 李浩;分布式教育網(wǎng)信息檢索系統(tǒng)的研究和實(shí)現(xiàn)[D];華南理工大學(xué);2010年
7 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年
8 李建平;智能化WEB信息搜索引擎的研究與實(shí)現(xiàn)[D];大慶石油學(xué)院;2003年
9 田生偉;基于涉農(nóng)詞典的搜索引擎的研究與實(shí)踐[D];新疆大學(xué);2004年
10 歐建斌;基于Web挖掘與信息分類(lèi)的個(gè)性化搜索引擎研究[D];暨南大學(xué);2010年
本文關(guān)鍵詞:基于用戶(hù)行為分析的搜索引擎自動(dòng)評(píng)價(jià)技術(shù)研究,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):57373
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/57373.html