天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 文藝論文 > 廣告藝術論文 >

面向廣告搜索的高效索引結構

發(fā)布時間:2018-04-21 19:12

  本文選題:廣告搜索 + 分塊索引; 參考:《上海交通大學》2010年碩士論文


【摘要】: 近年來,互聯(lián)網(wǎng)已經(jīng)成為廣告業(yè)的一個重要媒體途徑。如今很多互聯(lián)網(wǎng)門戶網(wǎng)站與搜索引擎(例如Google,Yahoo,百度等)均已成為重要的廣告提供者之一。在互聯(lián)網(wǎng)廣告中,搜索廣告(Sponsored Search)是一個被普遍使用的模式。在搜索廣告的模式中,搜索引擎將推薦的廣告與用戶的查詢結果同時顯示。所顯示的廣告如與用戶需求相關,則有較大的概率被點擊,從而提高了用戶的滿意度,同時增加了廣告商與門戶網(wǎng)站的廣告收益。 廣告數(shù)據(jù)具有其自身的特殊性。相比于普通的文本數(shù)據(jù),廣告數(shù)據(jù)所包含的文本信息短少,其中一些競價詞出現(xiàn)的頻率很低。單純的文本匹配方法直接地根據(jù)文本包含關系返回結果,使得很大部分與用戶需求相關的廣告會因沒有包含特定的關鍵字而不能被搜索引擎返回,導致了搜索引擎返回結果數(shù)量的嚴重不足。因此廣告的搜索問題與傳統(tǒng)的文本搜索問題有很大的區(qū)別。現(xiàn)今的搜索引擎提供了更復雜的技術,例如對關鍵字的聚類、擴展以及對用戶查詢的改寫等,以返回更多符合用戶需求的廣告。然而這些復雜技術的使用,同時也對搜索引擎及其索引結構的效率提出了更高的要求。 本文主要基于搜索廣告的互聯(lián)網(wǎng)廣告模式,提出了適合廣告數(shù)據(jù)特性的分塊索引結構。通過統(tǒng)計、分析廣告數(shù)據(jù)中競價詞的出現(xiàn)與分布規(guī)律,并結合競價詞的聚類信息對廣告文本數(shù)據(jù)的索引結構進行研究和設計。此索引結構改進了傳統(tǒng)的倒排索引,將競價詞的聚類信息編碼,并將其作為索引詞項。根據(jù)競價詞之間的相關關系決定其在索引中的存儲方式,使得搜索引擎可以支持更加高效的查詢擴展操作。同時設計了相應的結果排序機制,使搜索引擎能夠在所返回的結果中選擇更加相關的廣告顯示給用戶。 相比于目前的廣告搜索系統(tǒng),本文針對廣告數(shù)據(jù)的特點提出了分塊索引結構的設計,其將廣告本文數(shù)據(jù)的索引與競價詞的層次化聚類結果相結合。本文中的實驗結果表明所提出的分塊索引結構可以高效地支持用戶查詢擴展操作,從而增加了搜索引擎能夠返回的相關結果數(shù)量,證實了分塊索引對廣告搜索問題的適用性及有效性。
[Abstract]:In recent years, the Internet has become an important media channel in the advertising industry. Today, many Internet portals and search engines (such as Google Yahoo, Baidu, etc.) have become important advertising providers. Search ads are a popular pattern in Internet advertising. In the search advertising mode, the search engine displays the recommended ads as well as the user's query results. If the displayed ads are related to the needs of the users, there is a greater probability of being clicked, thus increasing the satisfaction of the users and increasing the advertising revenue of advertisers and portals at the same time. Advertising data has its own particularity. Compared with ordinary text data, advertising data contains less text information, and some bidding words appear very frequently. The simple text matching method returns the results directly according to the text inclusion relationship, which makes most advertisements related to the user's requirements can not be returned by the search engine because they do not contain specific keywords. This results in a serious shortage of the number of results returned by the search engine. So the search problem of advertisement is very different from the traditional text search problem. Today's search engines provide more sophisticated techniques, such as clustering keywords, extending and rewriting user queries, to return more ads that meet users' needs. However, the use of these complex technologies also puts forward higher requirements for the efficiency of search engines and their index structures. Based on the Internet advertising model of search advertising, this paper proposes a block index structure suitable for advertising data characteristics. Through statistics, this paper analyzes the appearance and distribution of bidding words in advertising data, and studies and designs the index structure of advertisement text data by combining the clustering information of bidding words. This index structure improves the traditional inverted index, which encodes the clustering information of bidding words and takes it as an index word item. According to the correlation between the bidding words, the storage mode in the index is determined, which makes the search engine support more efficient query expansion operations. At the same time, the corresponding result sorting mechanism is designed, so that the search engine can select more relevant advertisement display to the user in the returned results. Compared with the current advertising search system, this paper proposes a design of block index structure according to the characteristics of advertising data, which combines the index of advertising data with the hierarchical clustering results of bidding words. The experimental results in this paper show that the proposed block index structure can efficiently support user query expansion operations, thus increasing the number of related results returned by search engines. The applicability and validity of block index to advertising search problem are verified.
【學位授予單位】:上海交通大學
【學位級別】:碩士
【學位授予年份】:2010
【分類號】:TP391.3

【共引文獻】

相關期刊論文 前10條

1 侯葉;郭寶龍;;基于圖切割的人體運動檢測[J];光電子.激光;2007年06期

2 吳金宇;金舒原;楊智;;基于網(wǎng)絡流的攻擊圖分析方法[J];計算機研究與發(fā)展;2011年08期

3 丁維;周長勝;崔凌云;馬志強;楊娜;;基于多級指引索引的高效技術[J];計算機與信息技術;2006年06期

4 侯葉;郭寶龍;;基于圖論的運動對象分割[J];吉林大學學報(工學版);2008年04期

5 劉小珠;彭智勇;陳旭;;高效的隨機訪問分塊倒排文件自索引技術[J];計算機學報;2010年06期

6 ;Combinatorial auction algorithm for project portfolio selection and scheduling to maximize the net present value[J];Journal of Zhejiang University-Science C(Computer & Electronics);2010年07期

7 劉松濤;殷福亮;;基于圖割的圖像分割方法及其新進展[J];自動化學報;2012年06期

8 郭寶龍;侯葉;;基于圖切割的圖像自動分割方法[J];模式識別與人工智能;2011年05期

9 趙姝;許顯勝;華波;張燕平;;收縮鄰居節(jié)點集方法求解有向網(wǎng)絡的最大流問題[J];模式識別與人工智能;2013年05期

10 壽涌毅;多項目資源配置的拉格朗日分解方法[J];數(shù)量經(jīng)濟技術經(jīng)濟研究;2004年08期

相關會議論文 前4條

1 左森;郭曉松;萬敬;郭君斌;;Graph Cuts及其在立體匹配中的應用[A];立體圖象技術及其應用研討會論文集[C];2005年

2 ;Improved Self-Indexing Inverted Files for Full-Text Retrieval[A];第四屆全國信息檢索與內容安全學術會議論文集(下)[C];2008年

3 劉小珠;孫莎;曾承;彭智勇;;基于緩存的倒排索引機制研究[A];第二十四屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2007年

4 連曉峰;竇麗華;陳杰;;基于圖割算法的全景圖像立體匹配[A];2007年中國智能自動化會議論文集[C];2007年

相關博士學位論文 前10條

1 韓守東;紋理建模與圖切分優(yōu)化方法研究[D];華中科技大學;2010年

2 侯葉;基于圖論的圖像分割技術研究[D];西安電子科技大學;2011年

3 孫運達;多視點非接觸式人體運動捕捉的研究[D];北京交通大學;2006年

4 譚志明;基于圖論的圖像分割及其嵌入式應用研究[D];上海交通大學;2007年

5 楊傳耀;中文信息檢索索引模型及相關技術研究[D];復旦大學;2007年

6 萬成凱;無標記人體運動捕捉及姿態(tài)估計的研究[D];北京交通大學;2009年

7 朱明杰;互聯(lián)網(wǎng)搜索系統(tǒng)中的高性能查詢問題研究[D];中國科學技術大學;2009年

8 劉江宇;交互式圖像分割:算法與系統(tǒng)[D];中國科學技術大學;2009年

9 吳煒;密文全文檢索系統(tǒng)中的索引機制研究[D];華中科技大學;2009年

10 路子峗;光流場計算及其若干優(yōu)化技術研究[D];合肥工業(yè)大學;2012年

相關碩士學位論文 前10條

1 馬靜;基于web的數(shù)字化資源全文檢索系統(tǒng)的設計與實現(xiàn)[D];西安電子科技大學;2010年

2 李春豐;面向動態(tài)文本的在線索引若干問題研究[D];廣東工業(yè)大學;2011年

3 蔣勵;關系數(shù)據(jù)庫中教育信息全文檢索效率的改進研究與實現(xiàn)[D];天津師范大學;2011年

4 潘勝一;基于倒排索引的壓縮算法性能研究[D];杭州電子科技大學;2009年

5 王盼;視頻中運動目標檢測與跟蹤技術研究[D];杭州電子科技大學;2009年

6 孫德才;相似字符串匹配過濾算法研究[D];湖南大學;2009年

7 徐璐;基于Lucene和文本圖像的全文檢索系統(tǒng)的研究與應用[D];北京郵電大學;2012年

8 王貽術;基于單目視覺的障礙物檢測與三維重建[D];浙江大學;2007年

9 郭琦娟;基于全文數(shù)據(jù)庫的全文檢索模型研究[D];中國石油大學;2007年

10 譚e,

本文編號:1783746


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/1783746.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶36f20***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com