最大和網(wǎng)絡(luò)搜索結(jié)果多樣性問(wèn)題及其貪婪策略分析
本文關(guān)鍵詞:最大和網(wǎng)絡(luò)搜索結(jié)果多樣性問(wèn)題及其貪婪策略分析,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,網(wǎng)民人數(shù)的不斷增多,互聯(lián)網(wǎng)資源庫(kù)中的信息也在呈指數(shù)倍地上漲,搜索引擎作為人們?cè)诤A啃畔⒅蝎@取有效信息的重要檢索工具正在受到越來(lái)越多人的青睞。在實(shí)際檢索過(guò)程中,用戶體驗(yàn)到搜索引擎帶來(lái)的便捷的同時(shí),也感受到了大量無(wú)效信息所帶來(lái)的困擾,用戶常常需要在龐大的結(jié)果集合中對(duì)信息進(jìn)行篩查、選擇或者細(xì)化檢索內(nèi)容,才能定位到自己感興趣的信息。一方面,由于用戶在關(guān)鍵詞的“輸入長(zhǎng)度”、信息結(jié)果的“瀏覽長(zhǎng)度”等方面具有“懶惰性”,利用關(guān)鍵詞對(duì)所需信息進(jìn)行查詢時(shí),用戶往往通過(guò)給定較少的關(guān)鍵詞,要求搜索引擎在結(jié)果的前幾頁(yè)顯示自己所需信息。另一方面,關(guān)鍵詞本身具有廣泛的語(yǔ)義、搜索系統(tǒng)一次呈現(xiàn)結(jié)果存在數(shù)量上的限制。因此,系統(tǒng)常常不能快速地呈現(xiàn)用戶的真實(shí)需求,返回多而繁雜的搜索結(jié)果集不僅耗費(fèi)了用戶大量的時(shí)間,還降低了用戶的搜索效率。論文從提高搜索引擎效率,提高用戶檢索滿意度的角度,考慮了不僅產(chǎn)生同搜索關(guān)鍵詞相關(guān),而且各個(gè)結(jié)果之間最好應(yīng)具有能夠覆蓋關(guān)鍵詞多個(gè)意義的網(wǎng)絡(luò)搜索結(jié)果呈現(xiàn)問(wèn)題,給出了該問(wèn)題的貪婪策略,分析證明了貪婪策略具有的近似性能比。論文的主要研究工作如下:1、本文從搜索結(jié)果集合的相關(guān)性和多樣化兩個(gè)角度出發(fā),建立了搜索結(jié)果多樣性問(wèn)題的數(shù)學(xué)模型。通過(guò)對(duì)問(wèn)題模型的求解分析,得出該問(wèn)題的算法結(jié)果集合,并將其與問(wèn)題的最優(yōu)結(jié)果集合進(jìn)行比較,證明策略的有效性。同時(shí),分析了余弦距離相似度條件下搜索結(jié)果多樣性問(wèn)題的近似性能比。2、用戶往往是通過(guò)對(duì)搜索結(jié)果集合進(jìn)行篩選而尋找到所需信息,對(duì)信息的篩選就是瀏覽信息的過(guò)程,瀏覽量越多,結(jié)果集合同關(guān)鍵詞的總體相關(guān)性就越高,但每條信息給用戶帶來(lái)的邊際滿意度隨之而降低。針對(duì)這一情況,運(yùn)用非負(fù)的單調(diào)次模集合函數(shù)度量搜索結(jié)果問(wèn)題的相關(guān)性,在此基礎(chǔ)上建立數(shù)學(xué)模型,設(shè)計(jì)了貪婪策略,研究了單調(diào)次模情形下的網(wǎng)絡(luò)搜索結(jié)果多樣性問(wèn)題,分析證明貪婪策略具有較好的近似性能比。3、在日新月異的網(wǎng)絡(luò)信息世界中,不同的時(shí)間點(diǎn)用戶對(duì)同一關(guān)鍵詞的信息需求可能會(huì)不一樣。為了滿足用戶不斷變化的信息需求,本文將通過(guò)對(duì)靜態(tài)結(jié)果集合中元素的調(diào)整,研究信息具有動(dòng)態(tài)性特征的網(wǎng)絡(luò)搜索結(jié)果有效呈現(xiàn)問(wèn)題。4、為了驗(yàn)證策略的有效性,我們根據(jù)近似思想對(duì)其進(jìn)行了仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,貪婪算法具有很好的理論近似比。本文的分析及結(jié)論豐富了現(xiàn)有的搜索結(jié)果多樣性問(wèn)題的研究,為相關(guān)問(wèn)題的進(jìn)一步深入探索奠定了理論基礎(chǔ),對(duì)實(shí)際搜索結(jié)果多樣性問(wèn)題具有一定的理論指導(dǎo)意義。
【關(guān)鍵詞】:多樣性 關(guān)鍵詞 貪婪 策略 近似比
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3
【目錄】:
- 摘要5-7
- abstract7-11
- 第一章 緒論11-22
- 1.1 研究背景及意義11-14
- 1.2 相關(guān)文獻(xiàn)綜述14-17
- 1.3 論文的主要工作17-19
- 1.4 論文的主要研究方法和研究框架19-22
- 1.4.1 論文的主要研究方法19-20
- 1.4.2 論文的研究框架20-22
- 第二章 最大和搜索結(jié)果多樣性問(wèn)題建模22-27
- 2.1 最大和搜索結(jié)果多樣性問(wèn)題的基本模型22-25
- 2.1.1 最大和搜索結(jié)果多樣性問(wèn)題的模型引入22-24
- 2.1.2 最大和搜索結(jié)果多樣性問(wèn)題的數(shù)學(xué)模型構(gòu)建24-25
- 2.2 最大和搜索結(jié)果多樣性問(wèn)題研究的相關(guān)引理25-26
- 2.3 本章小結(jié)26-27
- 第三章 基本模型的貪婪策略設(shè)計(jì)與分析27-39
- 3.1 基本模型的進(jìn)一步分析27-30
- 3.2 貪婪算法與近似比分析30-35
- 3.2.1 貪婪算法與一些性質(zhì)引理30-31
- 3.2.2 貪婪算法的近似性能31-35
- 3.3 基本模型下最大和搜索結(jié)果多樣性問(wèn)題的一般性應(yīng)用35-37
- 3.4 基本模型下最大和搜索結(jié)果多樣性問(wèn)題的算例分析37-39
- 第四章 單調(diào)次模度量相關(guān)性的最大和搜索結(jié)果多樣性問(wèn)題分析39-49
- 4.1 單調(diào)次模函數(shù)相關(guān)性質(zhì)39-40
- 4.1.1 次模函數(shù)的定義39
- 4.1.2 次模函數(shù)的類型39-40
- 4.1.3 單調(diào)次模函數(shù)表征相關(guān)性問(wèn)題的提出40
- 4.2 單調(diào)次模函數(shù)相關(guān)性條件下問(wèn)題的模型及分析40-48
- 4.2.1 單調(diào)次模函數(shù)相關(guān)性條件下的數(shù)學(xué)模型40-41
- 4.2.2 單調(diào)次模函數(shù)相關(guān)性條件下的貪婪算法與近似性能分析41-48
- 4.3 單調(diào)次模函數(shù)表征問(wèn)題相關(guān)性的兩個(gè)應(yīng)用48
- 4.4 本章小結(jié)48-49
- 第五章 動(dòng)態(tài)更新情形下最大和搜索結(jié)果多樣性問(wèn)題分析49-66
- 5.1 動(dòng)態(tài)更新情形下最大和搜索結(jié)果多樣性問(wèn)題的目標(biāo)49-50
- 5.2 更新規(guī)則50-51
- 5.3 動(dòng)態(tài)更新下的最大和搜索結(jié)果多樣性問(wèn)題的理論分析51-62
- 5.4 動(dòng)態(tài)更新下最大和搜索結(jié)果多樣性問(wèn)題的仿真分析62-65
- 5.5 本章小結(jié)65-66
- 第六章 結(jié)論與展望66-68
- 6.1 論文主要工作及結(jié)論66-67
- 6.2 有待進(jìn)一步研究的工作67-68
- 致謝68-69
- 參考文獻(xiàn)69-74
- 攻讀碩士學(xué)位期間取得的成果74-75
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 ;網(wǎng)絡(luò)搜索未來(lái)將出現(xiàn)三大趨勢(shì)[J];軟件世界;2009年07期
2 靳超;;網(wǎng)絡(luò)搜索技巧探究[J];青春歲月;2014年07期
3 ;誰(shuí)在制定“網(wǎng)絡(luò)搜索”的游戲規(guī)則[J];計(jì)算機(jī)與網(wǎng)絡(luò);2004年06期
4 廖艦;網(wǎng)絡(luò)搜索大家族[J];電腦愛好者;1999年12期
5 朝云;;有圖就能挖出真“像”[J];電腦愛好者;2014年08期
6 胡恒峰;;網(wǎng)絡(luò)搜索輕松搞定[J];科學(xué)24小時(shí);2006年10期
7 Tim Anderson;;網(wǎng)絡(luò)搜索存在安全缺陷[J];每周電腦報(bào);2006年39期
8 Jia Lynn Yang;;網(wǎng)絡(luò)搜索須謹(jǐn)慎[J];中國(guó)計(jì)算機(jī)用戶;2009年Z1期
9 羅勇;;搜索結(jié)果提前知[J];電腦迷;2010年23期
10 凱特·雷尼;;谷歌研發(fā)部主任:網(wǎng)絡(luò)搜索走向個(gè)性化[J];科技創(chuàng)業(yè);2010年02期
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 楊暉 上海市第二中級(jí)人民法院立案庭法官助理;對(duì)網(wǎng)絡(luò)搜索服務(wù)“中立性”商榷[N];上海法治報(bào);2014年
2 文/嵩文;中國(guó)搜索發(fā)力第三代網(wǎng)絡(luò)搜索[N];計(jì)算機(jī)世界;2004年
3 齊廣君;過(guò)分依賴網(wǎng)絡(luò)易形成思維惰性[N];石家莊日?qǐng)?bào);2008年
4 本報(bào)記者 任鴿;白領(lǐng)“賴”上網(wǎng)絡(luò)搜索[N];消費(fèi)日?qǐng)?bào);2009年
5 惠正一;微軟加強(qiáng)網(wǎng)絡(luò)搜索[N];第一財(cái)經(jīng)日?qǐng)?bào);2006年
6 薇言;可尋性與網(wǎng)絡(luò)搜索[N];中華讀書報(bào);2014年
7 ;網(wǎng)絡(luò)搜索急需尋求新突破[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2004年
8 車文秋;關(guān)注網(wǎng)絡(luò)搜索中的商標(biāo)問(wèn)題[N];中國(guó)知識(shí)產(chǎn)權(quán)報(bào);2006年
9 記者 車輝;網(wǎng)絡(luò)搜索欲破醫(yī)患信息不對(duì)稱[N];工人日?qǐng)?bào);2013年
10 張秋 本報(bào)記者 呂松華;陳沛以未來(lái)理念牽引中國(guó)搜索[N];大眾科技報(bào);2004年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 盧萬(wàn)媈;基于眼動(dòng)跟蹤的網(wǎng)絡(luò)搜索行為分析與預(yù)測(cè)[D];北京理工大學(xué);2015年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 史光燕;基于網(wǎng)絡(luò)搜索數(shù)據(jù)的消費(fèi)者信心指數(shù)預(yù)測(cè)[D];山東財(cái)經(jīng)大學(xué);2016年
2 唐一丁;網(wǎng)絡(luò)搜索數(shù)據(jù)在預(yù)測(cè)房地產(chǎn)價(jià)格指數(shù)中的應(yīng)用研究[D];吉林大學(xué);2016年
3 王希晶;基于網(wǎng)絡(luò)搜索的中國(guó)區(qū)域房?jī)r(jià)預(yù)測(cè)模型及應(yīng)用研究[D];南京大學(xué);2016年
4 袁艷;引入網(wǎng)絡(luò)關(guān)注度的汽車銷量預(yù)測(cè)[D];上海社會(huì)科學(xué)院;2016年
5 江夢(mèng)成;基于網(wǎng)絡(luò)搜索數(shù)據(jù)的消費(fèi)者信心指數(shù)分析[D];暨南大學(xué);2016年
6 李曉榮;最大和網(wǎng)絡(luò)搜索結(jié)果多樣性問(wèn)題及其貪婪策略分析[D];電子科技大學(xué);2016年
7 李元;基于網(wǎng)絡(luò)搜索的中國(guó)股票市場(chǎng)預(yù)測(cè)研究[D];南京大學(xué);2014年
8 國(guó)敏;基于網(wǎng)絡(luò)搜索技術(shù)的游客量預(yù)測(cè)方法研究[D];首都師范大學(xué);2012年
9 李一寧;對(duì)等點(diǎn)(P2P)網(wǎng)絡(luò)搜索技術(shù)的研究[D];上海交通大學(xué);2007年
10 樊國(guó)虎;網(wǎng)絡(luò)搜索數(shù)據(jù)與消費(fèi)者信心指數(shù)的相關(guān)性研究[D];吉林大學(xué);2014年
本文關(guān)鍵詞:最大和網(wǎng)絡(luò)搜索結(jié)果多樣性問(wèn)題及其貪婪策略分析,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):440390
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/440390.html