天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于關鍵字搜索的廣告數據采集系統(tǒng)的設計與實現(xiàn)

發(fā)布時間:2017-03-30 15:00

  本文關鍵詞:基于關鍵字搜索的廣告數據采集系統(tǒng)的設計與實現(xiàn),由筆耕文化傳播整理發(fā)布。


【摘要】:如何提高用戶在使用搜索引擎的同時,對搜索引擎中所顯示的廣告進行有效的點擊,一直被各大搜索引擎公司所關注。每個搜索引擎都有自己所特有的廣告顯示方式,由于搜索引擎用戶存在的個體差異,不同的廣告顯示方式所帶來的廣告盈利必然是不同的,而搜索引擎公司對用戶點擊廣告的行為進行監(jiān)測會產生大量的數據。對如此龐大的數據進行有效的采集,觀察,分析,開發(fā)出可有效提高廣告被點擊率的顯示方式,提高搜索引擎公司的盈利額,是當今搜索廣告領域中激烈競爭的技術領域。 針對上述問題與現(xiàn)狀,論文擬實現(xiàn)一個可自動采集廣告數據并向使用者進行精確數據展示的Dashboard系統(tǒng),幫助工作人員脫離原先黑白的,枯燥的廣告數據采集界面。本文完成的主要工作分為三個部分,分別為: (1)定時的從半結構化數據集中獲取數據的流程結構設計與實現(xiàn),完成服務器的搭建工作,環(huán)境的部署和腳本程序的定時運行,使用Shell調用Pig腳本定時的從Hadoop分布式文件系統(tǒng)中對數據進行采集,分類等操作,將最后采集到的數據以文件的形式存儲在遠端grid服務器上; (2)將獲取的數據存儲到數據庫的本地服務端的設計與實現(xiàn),也就是將文本形式的數據文件從遠端grid服務器上同步到本地的數據服務器上,并在數據文件成功同步的前提下,把數據從文本的形式轉化為存儲在MySQL數據庫中的形式; (3)將存儲在數據庫中的關鍵字廣告數據進行展示的客戶端Web頁面的設計與實現(xiàn),采用當前流行的LAMP網站架構方案,以及Apache, HTML, CSS, JavaScript等Web技術來完成一系列的前端工作,提供給用戶一個可以通過圖形,表格等形式來查看數據以及分析數據的界面工具。 該采集系統(tǒng)可自動的完成數據采集、分類、存儲與展示等一系列工作,并通過色彩豐富的圖形進行數據展示和數據分析。使用者可查看大量關鍵字具體數值,也可以查看特定關鍵字的某個數值變化趨勢,甚至可以提供給使用者批量的數據查詢下載的功能,有效的提高了工作人員的工作效率,避免了技術人員的重復勞動,使非專業(yè)技術人員也可以方便快捷地獲取特定的數據信息。
【關鍵詞】:搜索引擎 廣告 點擊率 精準化 數據展示
【學位授予單位】:中國科學院大學(工程管理與信息技術學院)
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP274.2
【目錄】:
  • 摘要5-6
  • Abstract6-9
  • 第一章 緒論9-17
  • 1.1 研究背景與意義9
  • 1.2 本文相關研究進展9-14
  • 1.2.1 信息檢索的研究現(xiàn)狀10
  • 1.2.2 網絡廣告的發(fā)展現(xiàn)狀10-12
  • 1.2.3 可視化技術的發(fā)展12-14
  • 1.3 本文主要研究內容14-17
  • 第二章 廣告數據采集系統(tǒng)的需求分析和技術研究17-29
  • 2.1 何謂關鍵字以及關鍵字廣告17-19
  • 2.2 廣告系統(tǒng)參數19-20
  • 2.3 廣告數據采集系統(tǒng)的需求分析20-22
  • 2.3.1 系統(tǒng)的功能需求20-21
  • 2.3.2 系統(tǒng)的性能指標21-22
  • 2.4 Hadoop分布式系統(tǒng)基礎架構22-23
  • 2.4.1 HDFS系統(tǒng)22-23
  • 2.4.2 Pig平臺23
  • 2.5 LAMP網站架構方案23-27
  • 2.5.1 Linux操作系統(tǒng)24
  • 2.5.2 Apache服務器24-26
  • 2.5.3 MySQL技術26-27
  • 2.5.4 PHP編程語言27
  • 2.6 本章小結27-29
  • 第三章 廣告數據采集系統(tǒng)的總體架構和詳細設計29-45
  • 3.1 廣告數據采集系統(tǒng)的總體設計29-33
  • 3.1.1 系統(tǒng)的設計原則29-30
  • 3.1.2 系統(tǒng)的總體結構和工作流程30-32
  • 3.1.3 系統(tǒng)的模塊設計32-33
  • 3.2 系統(tǒng)運行環(huán)境設計33-34
  • 3.3 數據采集部分的詳細設計34-36
  • 3.3.1 數據采集部分的功能需求34
  • 3.3.2 數據采集部分的設計方案34-36
  • 3.4 數據存儲部分的詳細設計36-38
  • 3.4.1 數據存儲部分的設計需求36-37
  • 3.4.2 數據存儲部分的設計方案37-38
  • 3.5 應用層部分的詳細設計38-39
  • 3.5.1 應用層部分的設計需求38
  • 3.5.2 應用層部分的設計方案38-39
  • 3.6 本地數據庫的詳細設計39-43
  • 3.7 本章小結43-45
  • 第四章 廣告數據采集系統(tǒng)的具體實現(xiàn)45-57
  • 4.1 數據采集部分的具體實現(xiàn)45-53
  • 4.1.1 每日數據采集的具體實現(xiàn)45-51
  • 4.1.2 一周數據采集的具體實現(xiàn)51
  • 4.1.3 實時數據采集的具體實現(xiàn)51-53
  • 4.2 數據存儲部分的具體實現(xiàn)53-54
  • 4.3 應用層部分的具體實現(xiàn)54-56
  • 4.4 本章小結56-57
  • 第五章 廣告數據采集系統(tǒng)的測試與分析57-67
  • 5.1 系統(tǒng)運行環(huán)境的部署57-58
  • 5.2 系統(tǒng)功能的測試58-64
  • 5.3 系統(tǒng)性能的測試64-65
  • 5.4 本章小結65-67
  • 第六章 結論與展望67-69
  • 6.1 論文的工作總結67-68
  • 6.2 未來的工作展望68-69
  • 參考文獻69-71
  • 致謝71-73
  • 個人簡歷、在學期間發(fā)表的論文與研究成果73

【參考文獻】

中國期刊全文數據庫 前10條

1 張哲銘;;基于LAMP的臺達實驗室管理系統(tǒng)實現(xiàn)[J];電子技術;2013年06期

2 何瑾;劉潤華;吳敬;;基于開源思想的軟件應用開發(fā)[J];河北師范大學學報(自然科學版);2007年01期

3 左鳳朝;基于Web的數據庫訪問技術探析[J];計算機工程與應用;2002年15期

4 張金區(qū),王云鵬;PHP對數據庫的訪問技術及執(zhí)行效率的比較[J];計算機工程與應用;2005年09期

5 何躍;陳大勇;騰格爾;;基于Web數據挖掘的用戶瀏覽興趣路徑研究[J];計算機工程與應用;2012年07期

6 劉勘,周曉崢,周洞汝;數據可視化的研究與發(fā)展[J];計算機工程;2002年08期

7 黎永良,崔杜武;MVC設計模式的改進與應用[J];計算機工程;2005年09期

8 劉紅芝;;基于Apache+PHP+MySQL框架的圖書管理系統(tǒng)開發(fā)[J];江西圖書館學刊;2008年03期

9 王宏鑫;;關于網絡信息數據的多尺度表達模型研究[J];情報科學;2007年07期

10 趙鶴芹;;設計動態(tài)網站的最佳方案:Apache+PHP+MySQL[J];計算機工程與設計;2007年04期


  本文關鍵詞:基于關鍵字搜索的廣告數據采集系統(tǒng)的設計與實現(xiàn),,由筆耕文化傳播整理發(fā)布。



本文編號:277376

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/277376.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶8a2fc***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com