天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于WEB文本挖掘的電子商務網(wǎng)站個性化推薦研究

發(fā)布時間:2017-04-21 12:04

  本文關鍵詞:基于WEB文本挖掘的電子商務網(wǎng)站個性化推薦研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:Web文本挖掘的目的在于從Web頁面中提取有用的信息和知識,而個性化推薦可以看成一種“信息找人”的方式。有效的信息是產(chǎn)生精確個性化推薦的基礎,因此Web文本挖掘已成為了個性化推薦研究的一個熱點。同時,大數(shù)據(jù)時代的到來,數(shù)據(jù)信息呈現(xiàn)爆炸式的增長,正是由于這種爆炸式的增長,人們發(fā)現(xiàn)自己感興趣信息的難度也在增大。因此,個性化推薦技術在互聯(lián)網(wǎng)很多領域變得更加重要。 電子商務個性化推薦的研究對用戶和網(wǎng)站來說是一種雙贏的模式。對用戶而言,可以快捷方便的得到自己的需求物品,滿足自己的真實需求;對于網(wǎng)站經(jīng)營者而言,可以充分的展示自己的商品,充分的挖掘長尾理論帶來了銷售額。從研究的價值角度上是很有前景的。 本文對電子商務網(wǎng)站個性化推薦的研究是基于Web文本挖掘模型的,推薦的數(shù)據(jù)來源為網(wǎng)站的Web服務器日志,并給出了基于Web文本挖掘的電子商務個性化推薦模型。首先,模型分析了電子商務網(wǎng)站的拓撲結構和頁面結構,通過對日志進行數(shù)據(jù)過濾、會話識別、用戶識別和路徑補充來提取交易事務;其次,進行Web文本挖掘,主要涉及到中文分詞,特征詞條權重計算以及特征詞條集合的提取等;進而對交易事務集進行特征化的轉換表示和聚類分析;最后,當用戶訪問網(wǎng)站時,通過分析當前用戶會話的特征信息,計算與聚類集中交易事務的相似性,進而產(chǎn)生個性化推薦集。本文最后建立了基于Web文本挖掘的電子商務網(wǎng)站個性化推薦系統(tǒng),用于驗證文中的模型,驗證的衡量指標為個性化推薦研究領域認可的精準率、召回率、推薦結果覆蓋率以及新穎度。同時,實驗中對比了傳統(tǒng)Web文本挖掘中使用的TF*IDF算法與本文選擇使用BM25F算法的優(yōu)劣。本文構建的基于Web文本挖掘的個性化推薦能夠很好的跟蹤用戶在訪問頁面中產(chǎn)生的興趣意向變化問題,當用戶從一類商品跳轉到另一類物品時,對特征詞條的提取也會變化,故能夠及時的調(diào)整推薦集。圖13表4參51
【關鍵詞】:個性化推薦 文本挖掘 BM25F 層次聚類
【學位授予單位】:安徽理工大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP391.1;TP393.092
【目錄】:
  • 摘要5-6
  • Abstract6-12
  • 1 緒論12-20
  • 1.1 研究背景12-13
  • 1.2 研究目的和意義13-15
  • 1.2.1 研究目的13-14
  • 1.2.2 研究意義14-15
  • 1.3 國內(nèi)外研究現(xiàn)狀15-17
  • 1.4 研究方法17-18
  • 1.5 創(chuàng)新點與推薦模型框架18-20
  • 2 電子商務網(wǎng)站W(wǎng)eb服務器日志挖掘20-27
  • 2.1 電子商務網(wǎng)站頁面結構分析20-21
  • 2.2 Web站點拓撲結構21-22
  • 2.3 提取交易事務22-24
  • 2.3.1 數(shù)據(jù)過濾22-23
  • 2.3.2 用戶識別23-24
  • 2.3.3 會話識別24
  • 2.4 Web頁面凈化24-27
  • 3 Web文本特征表示27-35
  • 3.1 Web文本特征化介紹27
  • 3.2 中文分詞27-30
  • 3.3 Web文本特征提取30-33
  • 3.4 Web文本特征選擇33-35
  • 4 基于Web特征詞條聚類的文本挖掘35-43
  • 4.1 交易事務特征詞條表示35-36
  • 4.2 頁面停留時間表示36-37
  • 4.3 交易事務特征化表示37-38
  • 4.4 交易事務聚類38-40
  • 4.4.1 層次聚類及算法流程38-39
  • 4.4.2 聚類文檔導出39-40
  • 4.5 推薦結果生產(chǎn)規(guī)則40-43
  • 5 實驗與分析43-51
  • 5.1 實驗數(shù)據(jù)43-45
  • 5.1.1 數(shù)據(jù)集介紹43-44
  • 5.1.2 數(shù)據(jù)集選取44-45
  • 5.2 實驗設計45-47
  • 5.3 實驗結果與分析47-51
  • 6 總結51-53
  • 參考文獻53-56
  • 驗證系統(tǒng)設計說明及核心代碼56-69
  • 致謝69-70
  • 作者簡介及讀研期間主要科研成果70

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 吳岳芬;劉洪輝;;WEB文本挖掘的研究[J];電腦知識與技術;2006年11期

2 魯強;金偉祖;;基于FMM和CRFs雙層分詞模型的研究[J];電腦知識與技術;2008年28期

3 汪婧;榮升格;;基于杰卡德相似性的推薦系統(tǒng)研究[J];安徽工程大學學報;2013年03期

4 王健鵬;劉守艾;于倩倩;;淺析中小型公司電子商務及其網(wǎng)絡拓撲結構[J];電子技術與軟件工程;2013年11期

5 黃德根;焦世斗;周惠巍;;基于子詞的雙層CRFs中文分詞[J];計算機研究與發(fā)展;2010年05期

6 張衛(wèi)豐,徐寶文,許 蕾;Web頁面安全性技術初探[J];計算機工程與應用;2000年11期

7 陳新中,李巖,謝永紅,楊炳儒;Web挖掘研究[J];計算機工程與應用;2002年13期

8 周業(yè)茂;丁二玉;趙志宏;駱斌;;一個基于關聯(lián)規(guī)則的個性化方法DPARM[J];計算機工程與應用;2008年30期

9 陸麗娜,楊怡玲,管旭東,魏恒義;Web日志挖掘中的數(shù)據(jù)預處理的研究[J];計算機工程;2000年04期

10 吳兵;葉春明;陳信;;基于多代理的個性化推薦學習系統(tǒng)[J];計算機工程;2010年15期


  本文關鍵詞:基于WEB文本挖掘的電子商務網(wǎng)站個性化推薦研究,由筆耕文化傳播整理發(fā)布。



本文編號:320287

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/320287.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶06801***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com