天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 經濟論文 > 電子商務論文 >

基于分類模型監(jiān)測電子商務違禁信息的研究與實現(xiàn)

發(fā)布時間:2017-04-15 07:09

  本文關鍵詞:基于分類模型監(jiān)測電子商務違禁信息的研究與實現(xiàn),由筆耕文化傳播整理發(fā)布。


【摘要】:當今,隨著互聯(lián)網的飛速發(fā)展和普及,電子商務已經成為人們生產和生活中的重要媒介。諸如阿里巴巴、淘寶等大型電子商務平臺每天都有數十萬的交易發(fā)生,其中難免會產生許多不良和違禁信息。如果不能及時有效的處理,將嚴重危害電子商務的發(fā)展。因此,對于各種良莠不齊的信息,必須采取有效的審核過濾機制。但是,面對急劇膨脹的信息量,僅靠人工審核將變的越來越困難,迫切需要利用計算機自動信息過濾手段來提高違禁信息監(jiān)測的效率。 本文針對電子商務違禁信息監(jiān)測機制進行深入分析和研究,旨在利用文本分詞、關鍵詞提取和文本分類等相關信息檢索技術來幫助實現(xiàn)違禁信息的自動識別,從而降低人工進行違禁信息審核的負擔,提高電子商務信息發(fā)布的效率。本文認為,違禁信息的監(jiān)測主要由違禁關鍵詞監(jiān)測和違禁內容監(jiān)測兩部分組成。其中,如何提取違禁關鍵詞和識別違禁內容,將成為解決違禁信息監(jiān)測的關鍵所在。因此,本文引入違禁類別關鍵詞選擇技術和文本分類模型作為違禁信息監(jiān)測的基礎。對于違禁關鍵詞,本文根據特征選取和類別區(qū)分度,實現(xiàn)違禁詞選。粚τ谶`禁內容,本文采用基于文檔結構特征的改進向量空間模型表示文檔信息,以求達到更加理想的分類效果,并在支持向量機分類摸型的基礎上實現(xiàn)了電子商務違禁內容的監(jiān)測,然后以最大熵算法作為效果對比。 本文采集了大量真實的電子商務信息進行了違禁信息監(jiān)測實驗。結果表明,本文提出的以違禁關鍵詞和違禁內容為基礎的電子商務信息監(jiān)測,對違禁信息的識別具有良好的效果,從而表明通過機器學習進行違禁信息自動監(jiān)測具有可行性。
【關鍵詞】:電子商務 違禁關鍵詞 違禁內容監(jiān)測 信息檢索 改進向量空間模型 文本分類
【學位授予單位】:浙江大學
【學位級別】:碩士
【學位授予年份】:2012
【分類號】:TP393.09
【目錄】:
  • 摘要4-5
  • Abstract5-10
  • 第1章 緒論10-16
  • 1.1 引言10
  • 1.2 互聯(lián)網與電子商務10-13
  • 1.2.1 互聯(lián)網及其發(fā)展11-12
  • 1.2.2 電子商務及其發(fā)展12-13
  • 1.3 研究目的和意義13-14
  • 1.4 本文工作和結構14-15
  • 1.4.1 本文工作14
  • 1.4.2 本文結構14-15
  • 1.5 本章小結15-16
  • 第2章 相關理論和工作16-29
  • 2.1 信息檢索與Web數據挖掘16-23
  • 2.1.1 信息檢索技術16-18
  • 2.1.2 信息檢索模型18-21
  • 2.1.3 Web數據挖掘技術21-23
  • 2.2 文本處理技術23-28
  • 2.2.1 中文分詞技術23-24
  • 2.2.2 文本分類技術24-28
  • 2.3 本章小結28-29
  • 第3章 違禁關鍵字選擇與匹配29-37
  • 3.1 違禁關鍵詞監(jiān)測總體設計30-31
  • 3.2 違禁關鍵詞選取31-35
  • 3.2.1 關鍵特征選擇32-33
  • 3.2.2 強類別區(qū)別詞選擇33-35
  • 3.3 違禁關鍵詞匹配35-36
  • 3.4 本章小結36-37
  • 第4章 基于分類的違禁內容監(jiān)測37-48
  • 4.1 違禁內容監(jiān)測總體設計37-38
  • 4.2 改進向量空間模型38-41
  • 4.2.1 傳統(tǒng)向量空間模型38-40
  • 4.2.2 結合網頁特征的向量空間模型40-41
  • 4.3 違禁內容分類建模41-47
  • 4.3.1 求解最優(yōu)分類超平面41-46
  • 4.3.2 違禁類別判斷46-47
  • 4.4 本章小結47-48
  • 第5章 系統(tǒng)設計與效果評估48-63
  • 5.1 系統(tǒng)總體設計框架48-49
  • 5.2 實驗數據49-54
  • 5.2.1 數據源獲取49-50
  • 5.2.2 數據預處理50-52
  • 5.2.3 分詞停用詞處理52-53
  • 5.2.4 輸入數據格式53-54
  • 5.3 系統(tǒng)實現(xiàn)54-56
  • 5.4 實驗結果56-62
  • 5.4.1 評價指標56
  • 5.4.2 違禁關鍵詞監(jiān)測結果及討論56-59
  • 5.4.3 違禁內容監(jiān)測結果及討論59-62
  • 5.5 本章小結62-63
  • 第6章 總結與展望63-65
  • 6.1 工作總結63-64
  • 6.2 未來展望64-65
  • 參考文獻65-69
  • 攻讀碩士學位期間主要的研究成果69-70
  • 致謝70

【共引文獻】

中國期刊全文數據庫 前10條

1 楊緒兵,韓自存;ε不敏感的核Adaline算法及其在圖像去噪中的應用[J];安徽工程科技學院學報(自然科學版);2003年04期

2 陶秀鳳,唐詩忠,周鳴爭;基于支持向量機的軟測量模型及應用[J];安徽工程科技學院學報(自然科學版);2004年02期

3 許高程;張文君;王衛(wèi)紅;;支持向量機技術在遙感影像滑坡體提取中的應用[J];安徽農業(yè)科學;2009年06期

4 郭立萍;唐家奎;米素娟;張成雯;趙理君;;基于支持向量機遙感圖像融合分類方法研究進展[J];安徽農業(yè)科學;2010年17期

5 馮學軍;;最小二乘支持向量機的研究與應用[J];安慶師范學院學報(自然科學版);2009年01期

6 鄒心遙;姚若河;;基于LSSVM的威布爾分布形狀參數估計(英文)[J];半導體技術;2008年06期

7 鄒心遙;姚若河;;基于LSSVM的小子樣元器件壽命預測[J];半導體技術;2011年09期

8 李卓遠,吳為民,王e,

本文編號:307882


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/307882.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶acd04***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com