基于郵件的行程信息歸并系統(tǒng)設(shè)計與實(shí)現(xiàn)
本文關(guān)鍵詞: 郵件解析 行程 訂票通知郵件 正則表達(dá)式 出處:《武漢理工大學(xué)》2014年碩士論文 論文類型:學(xué)位論文
【摘要】:互聯(lián)網(wǎng)的發(fā)展越來越貼近生活、服務(wù)生活,,越來越多的用戶使用互聯(lián)網(wǎng)預(yù)訂預(yù)定火車票、酒店、航班等等出行服務(wù)。作為訂票商會向用戶發(fā)送通知郵件以確認(rèn)訂票的相關(guān)信息。但是用戶從郵箱中查找到這些訂票郵件,以及從郵件中獲取信息是非常繁瑣、耗時的。特別是對于出行的用戶,多數(shù)時間使用手機(jī)接入互聯(lián)網(wǎng),在手機(jī)上操作和查找信息就變得更為不便。 本文設(shè)計和開發(fā)了一個用以幫助用戶整理行程的信息系統(tǒng)。用戶只需要將來自訂票商的通知郵件轉(zhuǎn)發(fā)到系統(tǒng)指定的郵箱,系統(tǒng)會自動的對郵件的內(nèi)容進(jìn)行解析和提取。此外,系統(tǒng)還會幫助用戶查找并添加與此次行程相關(guān)地點(diǎn)的天氣、出行路線等信息,減少用戶查詢,方便用戶使用,輔助用戶做出決策。 首先,當(dāng)前系統(tǒng)支持火車、酒店、航班三種出行類型的郵件。通過對訂票商郵件的查閱與分析,建立了分別描述這三類行程的數(shù)據(jù)模型。 在此基礎(chǔ)上,闡述了郵件的傳輸路徑和在傳輸過程中郵件內(nèi)容發(fā)生的變化,以及這些變化對郵件信息提取工作帶來的困難,提出了將HTML轉(zhuǎn)換成文本的方法解決這個問題,此方法會過濾掉郵件中會帶來不統(tǒng)一的數(shù)據(jù)內(nèi)容。 再次,為了從郵件中得到數(shù)據(jù)模型中描述的數(shù)據(jù)信息,設(shè)計一種從郵件中提取出信息的方案。該方案使用正則表達(dá)式從郵件中匹配關(guān)鍵的數(shù)據(jù)點(diǎn),并將這些數(shù)據(jù)點(diǎn)歸納、合并和補(bǔ)充成完整行程數(shù)據(jù)模型中描述的數(shù)據(jù)結(jié)構(gòu)。使用該方案完成本系統(tǒng)中郵件信息提取的關(guān)鍵功能模塊。 最后,設(shè)計了擁有高可擴(kuò)展性的工程架構(gòu),使其能夠快速對新的訂票郵件提供支持。
[Abstract]:The development of the Internet is becoming more and more close to life, service life, more and more users use the Internet to book train tickets, hotels, Travel services such as flights, etc. It is very cumbersome for users to find these booking emails from their mailboxes, and to get information from them, by sending notification emails to users to confirm the booking information. Time consuming. Especially for travelling users, most of the time they use their mobile phones to connect to the Internet, and it becomes more difficult to operate and find information on the mobile phones. This paper designs and develops an information system to help users organize their itinerary. Users only need to forward the notification mail from the booking agent to the mailbox specified by the system, and the system will automatically parse and extract the contents of the mail. The system will also help users to find and add information about the weather, travel routes and other places related to the trip, reduce user inquiries, facilitate the use of users, and assist users to make decisions. Firstly, the current system supports three types of mail: train, hotel and flight. On the basis of this, this paper expounds the transmission path of mail and the changes of mail content in the course of transmission, and the difficulties of these changes to the extraction of mail information, and puts forward the method of converting HTML into text to solve this problem. This method will filter out the message will bring inconsistent data content. Thirdly, in order to get the data information described in the data model, a scheme is designed to extract the information from the mail. The scheme uses regular expressions to match the key data points from the mail, and summarizes these data points. The data structure described in the complete travel data model is merged and added, and the key function module of mail information extraction in this system is completed by using this scheme. Finally, an engineering architecture with high scalability is designed to support new booking mail quickly.
【學(xué)位授予單位】:武漢理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP393.098
【參考文獻(xiàn)】
相關(guān)期刊論文 前9條
1 胡軍偉;秦奕青;張偉;;正則表達(dá)式在Web信息抽取中的應(yīng)用[J];北京信息科技大學(xué)學(xué)報(自然科學(xué)版);2011年06期
2 黃俊;殷衛(wèi)紅;;基于Postfix電子郵件系統(tǒng)的設(shè)計與實(shí)現(xiàn)[J];上海電力學(xué)院學(xué)報;2006年02期
3 朱玲;張啟宇;;電子郵件解析算法的研究與實(shí)現(xiàn)[J];華南金融電腦;2008年02期
4 文英;;面向?qū)ο蟮泥]件解析器的設(shè)計與實(shí)現(xiàn)[J];計算機(jī)與信息技術(shù);2006年10期
5 李春旺;;Web信息整合機(jī)制研究[J];圖書情報工作;2005年10期
6 張健;林麗麗;;基于SMTP、POP3協(xié)議的電子郵件自動收發(fā)系統(tǒng)的開發(fā)[J];微型電腦應(yīng)用;2007年04期
7 田純青;;利用Nginx實(shí)現(xiàn)基于URI的Web負(fù)載分配[J];現(xiàn)代計算機(jī)(專業(yè)版);2009年07期
8 楊波;;基于Linux系統(tǒng)的Postfix郵件管理系統(tǒng)的開發(fā)[J];一重技術(shù);2011年01期
9 凌質(zhì)億;劉哲星;曹蕾;;高并發(fā)環(huán)境下Apache與Nginx的I/O性能比較[J];計算機(jī)系統(tǒng)應(yīng)用;2013年06期
本文編號:1552589
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1552589.html