基于Fuzzy Bayesian的學(xué)習(xí)和推理方法在郵件系統(tǒng)中的應(yīng)用
本文選題:垃圾郵件過濾 + 樸素貝葉斯 ; 參考:《中國地質(zhì)大學(xué)(北京)》2017年碩士論文
【摘要】:近年來,隨著網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,越來越多的人選擇通過電子郵件(E-mail)這種簡易而又快捷的通信方式來與他人聯(lián)絡(luò)。但這種便利的通信手段有時會潛在著不良因素——垃圾郵件,它可能不僅給人們的生活與工作帶來困擾,也可能威脅著每個人的計(jì)算機(jī)系統(tǒng)或個人隱私的安全問題。因此尋找行之有效的垃圾郵件過濾方法已經(jīng)成為研究者們感興趣的一門研究課題。樸素貝葉斯分類算法是研究者們經(jīng)常使用的一種用于過濾垃圾郵件的辦法。它也是數(shù)據(jù)挖掘領(lǐng)域中簡單易懂的一種分類算法,然而這種算法大多數(shù)情況下處理的是離散型數(shù)據(jù)。因此為了讓樸素貝葉斯算法能夠靈活地應(yīng)對連續(xù)型數(shù)據(jù),在分類的過程中往往需要對數(shù)據(jù)進(jìn)行離散化處理。而模糊數(shù)學(xué)方面的相關(guān)理論恰恰可以用來解決這個問題。因此可以將二者結(jié)合來生成一個模糊貝葉斯混合模型,從而使整個分類模型去應(yīng)對更多不同類型的數(shù)據(jù),以此提高原有算法的分類性能。本課題研究了模糊貝葉斯混合模型在郵件系統(tǒng)中的應(yīng)用,期間主要完成了以下工作:1.了解樸素貝葉斯算法、模糊數(shù)學(xué)以及三角模糊數(shù)的基本概念,收集相關(guān)理論知識和有關(guān)研究成果。找出樸素貝葉斯算法存在的缺陷,從而解決樸素貝葉斯為什么能夠與模糊數(shù)學(xué)進(jìn)行混合的問題。2.創(chuàng)建模糊貝葉斯混合分類模型的過程中,在去模糊化階段引用了一種新的去模糊化方法“內(nèi)心法”,該方法利用了三角形的內(nèi)心來將三角模糊數(shù)轉(zhuǎn)換成精確值。3.了解郵件系統(tǒng)的邏輯和功能結(jié)構(gòu),并通過查閱資料熟悉郵件傳輸?shù)倪^程。4.收集郵件數(shù)據(jù)樣本,并分別構(gòu)造出用于分類的訓(xùn)練集和測試集。然后將混合分類模型應(yīng)用于系統(tǒng)的郵件分類模塊中,通過測試分析來總結(jié)混合模型性能。本文詳細(xì)闡述了以上工作內(nèi)容,同時總結(jié)、反思了研究中目前仍然存在的問題和需要改進(jìn)的地方。
[Abstract]:In recent years, with the rapid development of network technology, more and more people choose to communicate with others through E-mail, a simple and fast way of communication. However, this convenient means of communication is sometimes potentially a bad factor-spam. It may not only bring troubles to people's life and work, but also threaten everyone's computer system or personal privacy security problems. Therefore, the search for effective spam filtering methods has become an interesting research topic. Naive Bayes classification algorithm is often used by researchers to filter spam. It is also a simple and easy to understand classification algorithm in the field of data mining, but in most cases, this algorithm deals with discrete data. Therefore, in order to make naive Bayesian algorithm flexible to deal with continuous data, it is often necessary to discretize the data in the process of classification. The theory of fuzzy mathematics can be used to solve this problem. So we can combine the two to generate a fuzzy Bayesian mixed model, so that the whole classification model can deal with more different types of data, so as to improve the classification performance of the original algorithm. In this paper, the application of fuzzy Bayesian hybrid model in mail system is studied, and the following work is accomplished: 1. The basic concepts of naive Bayes algorithm, fuzzy mathematics and triangular fuzzy numbers are understood, and relevant theoretical knowledge and related research results are collected. Find out the defects of naive Bayes algorithm, and solve the problem of why naive Bayes can be mixed with fuzzy mathematics. In the process of creating a fuzzy Bayesian mixed classification model, a new de-fuzzification method, "inner method", is introduced in the de-fuzzification stage. This method uses the heart of a triangle to convert the triangular fuzzy number into an exact value .3. Understand the logic and functional structure of the mail system, and familiarize yourself with the mail transfer process. Collect mail data samples and construct training set and test set for classification respectively. Then the hybrid classification model is applied to the mail classification module of the system, and the performance of the hybrid model is summarized by test and analysis. In this paper, the above work is described in detail, at the same time, the problems still existing in the research and the areas that need to be improved are reviewed.
【學(xué)位授予單位】:中國地質(zhì)大學(xué)(北京)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP393.098
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 慈新新,盛裕平,王韜;架設(shè)企業(yè)多網(wǎng)絡(luò)域的郵件系統(tǒng)[J];軟件世界;2000年07期
2 ;網(wǎng)絡(luò)暢“郵”——常青藤郵件系統(tǒng)解決方案分析[J];每周電腦報;2000年25期
3 劉杰;商業(yè)化郵件系統(tǒng):企業(yè)信息化第一應(yīng)用[J];互聯(lián)網(wǎng)周刊;2001年30期
4 ;郵件系統(tǒng)應(yīng)用——聚焦企業(yè)級市場[J];微電腦世界;2002年15期
5 ;附加價值——企業(yè)郵件系統(tǒng)的真正目標(biāo)[J];微電腦世界;2002年15期
6 ;擎空霹靂劍——在服務(wù)器端圍剿垃圾郵件[J];微電腦世界;2003年07期
7 馮琳蔚;分布式抗垃圾郵件技術(shù)[J];計(jì)算機(jī)安全;2004年09期
8 曉齊;啟明星辰推出 天澄防垃圾郵件系統(tǒng)[J];信息網(wǎng)絡(luò)安全;2004年08期
9 郁冰;;大容量郵件系統(tǒng)的動力[J];電子商務(wù)世界;2006年04期
10 王冰睿;;從1小時到幾秒鐘 宜春改造公務(wù)員郵件系統(tǒng)見奇效[J];IT時代周刊;2009年24期
相關(guān)會議論文 前10條
1 孟廣平;;分布式郵件系統(tǒng)特點(diǎn)及在寶鋼的應(yīng)用[A];第十一屆全國自動化應(yīng)用技術(shù)學(xué)術(shù)交流會論文集[C];2006年
2 劉華檳;;企業(yè)郵件系統(tǒng)的選型[A];創(chuàng)新·融合·發(fā)展——創(chuàng)新型煤炭企業(yè)發(fā)展與信息化高峰論壇論文集[C];2010年
3 劉陽;楊延新;鄭鐵成;;淺談企業(yè)涉密郵件系統(tǒng)建設(shè)與改造[A];2013年中國航空學(xué)會管理科學(xué)分會學(xué)術(shù)會議論文集[C];2013年
4 吳哲;田捷;李亮;楊鑫;;基于指紋身份認(rèn)證的安全郵件系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會論文集(下冊)[C];2007年
5 李軍輝;朱巧明;錢培德;;郵件語料庫的語料添加算法研究與實(shí)現(xiàn)[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年
6 黃斌;;第二代郵件系統(tǒng)[A];經(jīng)濟(jì)全球化和中國技術(shù)經(jīng)濟(jì)發(fā)展[C];2000年
7 尋曉勁;;郵件系統(tǒng)信息安全[A];2007中國科協(xié)年會——通信與信息發(fā)展高層論壇論文集[C];2007年
8 吳昊;;基于Lucene技術(shù)的郵件取證技術(shù)研究[A];第28次全國計(jì)算機(jī)安全學(xué)術(shù)交流會論文集[C];2013年
9 代剛;趙小宇;馬嚴(yán);;MailS(?)c智能安全郵件系統(tǒng)設(shè)計(jì)[A];全國計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)用年會論文集(2001)[C];2001年
10 陳良臣;劉淑珍;閆曉飛;孫功星;;基于BERW和IMAP4的移動終端郵件系統(tǒng)的設(shè)計(jì)與開發(fā)[A];第13屆全國計(jì)算機(jī)、網(wǎng)絡(luò)在現(xiàn)代科學(xué)技術(shù)領(lǐng)域的應(yīng)用學(xué)術(shù)會議論文集[C];2007年
相關(guān)重要報紙文章 前10條
1 本報記者 潘永花;郵件系統(tǒng)因需求而動[N];網(wǎng)絡(luò)世界;2002年
2 姜姝;企業(yè)郵件系統(tǒng)如何確保安全[N];中國信息化周報;2013年
3 本報記者 陳凡;對付垃圾郵件有新招[N];北京科技報;2004年
4 梁劍坤;垃圾郵件可以消除[N];中國計(jì)算機(jī)報;2002年
5 本報記者 張超;垃圾郵件:互聯(lián)網(wǎng)的煩惱[N];科技日報;2003年
6 小青;263積極打造郵件運(yùn)營價值鏈[N];中國經(jīng)營報;2004年
7 特約撰稿 張琦;垃圾郵件成“圣誕禮物”[N];中國電腦教育報;2006年
8 Mirapoint中國區(qū)技術(shù)經(jīng)理 顧春;系統(tǒng)硬件化 構(gòu)建安全郵件系統(tǒng)新趨勢[N];中國計(jì)算機(jī)報;2006年
9 ;碩琦: 垃圾郵件行為模式分析[N];計(jì)算機(jī)世界;2006年
10 李玉華;企業(yè)郵件系統(tǒng)大升級[N];計(jì)算機(jī)世界;2007年
相關(guān)博士學(xué)位論文 前1條
1 李弋;云環(huán)境中典型應(yīng)用的I/O優(yōu)化策略研究[D];復(fù)旦大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 孫延濤;軍隊(duì)安全郵箱系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];山東大學(xué);2015年
2 顧大偉;基于代理的敏感郵件監(jiān)控技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2015年
3 曹家軍;一種可接收短信的機(jī)頂盒系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
4 江奇峰;辦公郵件系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華僑大學(xué);2015年
5 吳o,
本文編號:2097457
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2097457.html