天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

郵址精確提取及郵件針對性發(fā)送系統(tǒng)開發(fā)

發(fā)布時間:2017-04-24 16:08

  本文關(guān)鍵詞:郵址精確提取及郵件針對性發(fā)送系統(tǒng)開發(fā),由筆耕文化傳播整理發(fā)布。


【摘要】:郵件針對性發(fā)送是以電子郵件為傳播載體的一種網(wǎng)絡(luò)營銷形式,應(yīng)用非常廣泛。對于郵件營銷來說,用戶郵箱地址的獲取至關(guān)重要,直接影響郵件營銷的效果。一方面,如果盲目地獲取大量郵箱地址,,不僅會造成資源的浪費,還會遭到用戶的反感。另一方面,如果僅僅通過電子郵件訂閱方式獲取用戶郵址,可能會錯失大量潛在客戶。因此,我們希望找到一種獲取潛在用戶郵址的方式,既能精準(zhǔn)地獲取目標(biāo)用戶的郵址,讓潛在客戶有機會獲取到感興趣的資訊信息,又可以最大限度地保證不打擾到其他用戶。 本系統(tǒng)旨在精確提取到潛在客戶的郵箱地址,主要包括郵址精確提取和郵件針對性發(fā)送兩大模塊。在郵址精確提取模塊,本系統(tǒng)采用基于搜索引擎關(guān)鍵字的搜索方式,提取到與該關(guān)鍵詞相關(guān)的郵箱地址,并且通過多種過濾方式及有效性檢測實現(xiàn)郵址的精準(zhǔn)提取。在郵件針對性發(fā)送模塊,系統(tǒng)首先向用戶試探性發(fā)送一封資訊信息,然后根據(jù)用戶退信、回復(fù)以及退訂標(biāo)記剔除非潛在客戶郵址,提高郵件發(fā)送的針對性。 為了提高系統(tǒng)的精準(zhǔn)性和針對性,本文主要做了以下幾點工作: 第一,通過鏈接過濾來提高郵址的精準(zhǔn)度。首先,本系統(tǒng)會對搜索引擎返回結(jié)果頁面上的無關(guān)鏈接進(jìn)行過濾,然后,本系統(tǒng)會將關(guān)鍵詞與獲取鏈接的標(biāo)題進(jìn)行匹配,進(jìn)一步過濾無關(guān)鏈接,從而提高郵址與輸入關(guān)鍵詞的相關(guān)度。 第二,采用多線程抓取提高郵址提取的效率。在獲取到超鏈接隊列后,本系統(tǒng)采用多線程技術(shù)實現(xiàn)批量工作的分配,提高了解析鏈接的效率。同時為了避免出現(xiàn)占用資源超過系統(tǒng)限制導(dǎo)致的程序假死狀態(tài),對多線程的數(shù)量做了限制。 第三,采用深度搜索技術(shù)。深度搜索即獲取搜索結(jié)果鏈接對應(yīng)頁面內(nèi)的鏈接以及其展開的下級鏈接的過程。用戶可以根據(jù)需要設(shè)置不同的搜索深度。但為了提高提取郵箱地址的相關(guān)度,本系統(tǒng)對搜索深度的最大值做了限制(最大搜索深度3)。 第四,對頁面進(jìn)行郵箱地址匹配時,采用HTMLParser與正則表達(dá)式結(jié)合的方式,提高了提取效率。和采用輸入流逐行匹配的方式相比,使用HTMLParser直接抽取純文本內(nèi)容進(jìn)行匹配的方式,效率更高。 第五,通過郵址糾錯、郵址校驗和郵址有效性檢測來提高郵址的質(zhì)量。 第六,系統(tǒng)可以實時標(biāo)記發(fā)送狀態(tài)、退信情況以及回復(fù)情況,并及時剔除非目標(biāo)用戶的郵址,提高后續(xù)郵件發(fā)送的精準(zhǔn)度。
【關(guān)鍵詞】:搜索引擎 郵址提取 HTML Parser 正則表達(dá)式 郵件發(fā)送
【學(xué)位授予單位】:浙江理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP393.098
【目錄】:
  • 摘要4-5
  • Abstract5-9
  • 第1章 緒論9-17
  • 1.1 課題研究的背景及意義9-11
  • 1.2 研究現(xiàn)狀11-15
  • 1.2.1 WEB 信息提取研究現(xiàn)狀11-12
  • 1.2.2 信息發(fā)送研究現(xiàn)狀12-15
  • 1.3 本文主要內(nèi)容15-16
  • 1.4 論文組織結(jié)構(gòu)16-17
  • 第2章 Web 信息提取及相關(guān)技術(shù)17-30
  • 2.1 Web 信息提取概述17-20
  • 2.1.1 Web 信息提取步驟17-18
  • 2.1.2 Web 信息提取分類18-20
  • 2.2 Web 頁面結(jié)構(gòu)20-24
  • 2.2.1 HTML 簡介21-22
  • 2.2.2 HTML 標(biāo)簽和特點22-23
  • 2.2.3 HTML 超鏈接標(biāo)記23-24
  • 2.3 HTML Parser 開源項目24-26
  • 2.3.1 HTML Parser 簡介24
  • 2.3.2 HTML Parser 相關(guān)類24-26
  • 2.4 正則表達(dá)式26-29
  • 2.4.1 正則表達(dá)式簡介26-28
  • 2.4.2 Java 中的正則表達(dá)式 API28-29
  • 2.5 HTML Parser 和正則表達(dá)式的結(jié)合29
  • 2.6 本章小結(jié)29-30
  • 第3章 郵件發(fā)送及相關(guān)技術(shù)30-37
  • 3.1 郵件發(fā)送相關(guān)原理30-34
  • 3.1.1 郵件系統(tǒng)概念30-31
  • 3.1.2 郵件發(fā)送相關(guān)協(xié)議31-34
  • 3.2 JavaMail API34-36
  • 3.2.1 JavaMail API 簡介34-35
  • 3.2.2 JavaMail API 核心類35-36
  • 3.3 本章小結(jié)36-37
  • 第4章 系統(tǒng)需求和總體設(shè)計分析37-43
  • 4.1 系統(tǒng)可行性分析37-38
  • 4.2 系統(tǒng)需求分析38-42
  • 4.2.1 郵址提取需求分析38-40
  • 4.2.2 郵件發(fā)送需求分析40-42
  • 4.3 系統(tǒng)的總體功能設(shè)計研究42
  • 4.4 本章小結(jié)42-43
  • 第5章 郵址精準(zhǔn)提取及郵件發(fā)送系統(tǒng)的實現(xiàn)43-62
  • 5.1 系統(tǒng)實現(xiàn)的基本思路43-45
  • 5.1.1 郵址提取實現(xiàn)思路43-44
  • 5.1.2 郵件發(fā)送實現(xiàn)思路44-45
  • 5.2 用戶郵址提取主要模塊的實現(xiàn)45-57
  • 5.2.1 獲取搜索引擎結(jié)果頁面45-47
  • 5.2.2 鏈接的過濾47-48
  • 5.2.3 底層鏈接的獲取48-50
  • 5.2.4 任務(wù)加入線程池50-51
  • 5.2.5 正則表達(dá)式匹配郵址51-52
  • 5.2.6 郵址導(dǎo)出52-56
  • 5.2.7 郵址有效性檢測56-57
  • 5.3 郵件發(fā)送主要模塊的實現(xiàn)57-61
  • 5.3.1 發(fā)送基本設(shè)置57
  • 5.3.2 收件人郵址載入57-58
  • 5.3.3 郵件內(nèi)容編輯58-59
  • 5.3.4 郵件發(fā)送59
  • 5.3.5 退信回復(fù)標(biāo)記59-61
  • 5.3.6 整理郵箱列表61
  • 5.4 本章小結(jié)61-62
  • 第6章 系統(tǒng)的基本功能演示及性能分析62-75
  • 6.1 系統(tǒng)的環(huán)境62-63
  • 6.2 系統(tǒng)基本功能演示63-69
  • 6.3 郵址提取的效果評價69-72
  • 6.3.1 信息提取的評價標(biāo)準(zhǔn)69-70
  • 6.3.2 系統(tǒng)提取郵址的效果70-72
  • 6.4 郵件發(fā)送效果分析72-74
  • 6.4.1 影響發(fā)送效果的重要因素73
  • 6.4.2 郵件追蹤技術(shù)73-74
  • 6.5 本章小結(jié)74-75
  • 第7章 總結(jié)與展望75-77
  • 7.1 結(jié)論75-76
  • 7.2 工作展望76-77
  • 參考文獻(xiàn)77-80
  • 致謝80-81
  • 攻讀碩士期間發(fā)表及錄用論文#@@

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 胡軍偉;秦奕青;張偉;;正則表達(dá)式在Web信息抽取中的應(yīng)用[J];北京信息科技大學(xué)學(xué)報(自然科學(xué)版);2011年06期

2 王改香;;搜索引擎的體系結(jié)構(gòu)與索引技術(shù)探析[J];長江大學(xué)學(xué)報(自然科學(xué)版);2011年03期

3 劉霞 ,李永剛;Java SMTP協(xié)議電子郵件傳送剖析[J];電腦編程技巧與維護(hù);2004年01期

4 孫衛(wèi)琴;;JavaMail API電子郵件的收發(fā)[J];電腦編程技巧與維護(hù);2007年12期

5 陳玉清;;基于Java的Web郵件系統(tǒng)的設(shè)計與實現(xiàn)[J];河南師范大學(xué)學(xué)報(自然科學(xué)版);2009年04期

6 楊寧;使用Java Mail API實現(xiàn)電子郵件客戶端[J];晉東南師范?茖W(xué)校學(xué)報;2004年02期

7 陳佳;吳軍華;;一種新的預(yù)測用戶瀏覽模式的度量方法[J];計算機工程與應(yīng)用;2010年10期

8 李晶;陳恩紅;;Web信息抽取[J];計算機科學(xué);2003年06期

9 冀高峰;湯庸;道煒;吳桂賓;黃帆;王鵬;;基于XML的自動學(xué)習(xí)Web信息抽取[J];計算機科學(xué);2008年03期

10 周明建,高濟,李飛;基于本體論的Web信息抽取[J];計算機輔助設(shè)計與圖形學(xué)學(xué)報;2004年04期

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前5條

1 郎鳳舉;基于熱點網(wǎng)站內(nèi)容分析的超鏈接提取研究[D];中國海洋大學(xué);2010年

2 王琳琳;基于HTML Parser的Web信息提取技術(shù)[D];北京郵電大學(xué);2007年

3 王花;Web信息抽取技術(shù)研究[D];西北農(nóng)林科技大學(xué);2010年

4 苗苗;基于頁面分塊的網(wǎng)頁內(nèi)容提取的研究與實現(xiàn)[D];武漢理工大學(xué);2010年

5 劉冉;基于搜索引擎的郵箱地址自動提取系統(tǒng)開發(fā)[D];浙江理工大學(xué);2013年


  本文關(guān)鍵詞:郵址精確提取及郵件針對性發(fā)送系統(tǒng)開發(fā),由筆耕文化傳播整理發(fā)布。



本文編號:324527

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/324527.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c6019***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com