天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

用戶畫像技術(shù)在電子商務(wù)系統(tǒng)中的研究與應用

發(fā)布時間:2020-10-26 01:31
   本文研究了電子商務(wù)中的用戶畫像技術(shù),并對用戶畫像中的短文本信息分類及標簽權(quán)重計算兩個問題進行了著重研究,設(shè)計了基于TF-IDF-DL的樸素貝葉斯文本分類算法及TF-IDF與相關(guān)系數(shù)矩陣相結(jié)合的混合算法。兩個算法分別對用戶畫像技術(shù)中非量化信息分類以及標簽權(quán)重計算中權(quán)重不一致的情況進行了補充。在用戶畫像的技術(shù)研究中,對于非量化信息的研究是相對較少的,但在多數(shù)情況下,非量化信息能夠更有力的代表用戶的喜好,如用戶評論信息。用戶評論信息多為短文本信息,同時電子商務(wù)平臺中數(shù)據(jù)量較大,更新快,因此在對電子商務(wù)中的用戶評論信息進行分類時多采用分類速度較快的樸素貝葉斯文本分類算法,但該算法在特征計算以及特征分類的過程中默認所有特征詞的權(quán)重一致,這將會造成分類不準確的問題。針對這一問題,本文從特征詞詞頻以及特征詞位置與類別之間的關(guān)系出發(fā),設(shè)計了基于TF-IDF-DL的樸素貝葉斯改進算法,該算法對詞頻進行去中心化處理并在計算中引入特征詞位置影響因子,以提高文本分類的準確率。以往研究大多將標簽權(quán)重視為是一致的,這可能會造成在對用戶提供個性化推薦服務(wù)時準確率不高,數(shù)據(jù)加載量大等問題。因此針對這一問題,本文設(shè)計了TF-IDF與相關(guān)系數(shù)矩陣相結(jié)合的混合算法。該算法能夠從標簽數(shù)量層面反映出標簽對于用戶的影響力大小。同時,能夠在一定程度上反映出標簽與標簽之間的相關(guān)性。在畫像技術(shù)中使用該算法能夠達到相對降維的效果,并能夠真實、準確的得到標簽對用戶的影響力大小。最后,本文利用某B2C電子商務(wù)平臺的數(shù)據(jù)場景和上述算法,設(shè)計了用戶畫像方案,同時設(shè)計開發(fā)了相關(guān)實驗系統(tǒng)。該實驗系統(tǒng)不僅實現(xiàn)了通過對文本評論信息分類給用戶打標簽的功能,根據(jù)用戶標簽計算標簽合理權(quán)重的功能以及對生成的用戶畫像進行可視化展示的功能,而且實現(xiàn)了根據(jù)畫像為用戶提供商品個性化推薦的功能并通過推薦結(jié)果驗證了該畫像功能的合理性。
【學位單位】:北方工業(yè)大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:F274;TP391.1;F713.36
【部分圖文】:

網(wǎng)絡(luò)購物,增長率,互聯(lián)網(wǎng)


依據(jù)最新頒布的第42次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》顯示,截止到??2018年6月,中國國民上網(wǎng)人數(shù)己達到8.02億人,互聯(lián)網(wǎng)在我國的使用率已達??到57.7%,如圖1-1所示。從數(shù)據(jù)可以看出,互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)已經(jīng)深入到百??姓的日常生活中。??57?70%??immo?55.s%??S3.2^??90000?50.3%??0價?45胳47熱?湖8?貓??42?以?58826??31iS?^?'??70000?38-3%?6487S??6_?34?3、m。P?;?i?"??50000?g°?i?-??:靈?.丨.丨-??=r:?:;:??20說年?2011?年?2DU?年?2(M3?萃?2014?年:MIS?年?2016?年?年?201SH1??圖i-i中國國民規(guī)模和互聯(lián)網(wǎng)普及率??目前的互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)能夠產(chǎn)生關(guān)于用戶衣食住行的各種數(shù)據(jù),其特點??為數(shù)據(jù)量大、數(shù)據(jù)增長速度快。用戶在互聯(lián)網(wǎng)上進行信息注冊、登錄等操作會產(chǎn)??生用戶的基礎(chǔ)數(shù)據(jù),比如用戶的性別、年齡、星座、住址、收入等;用戶在互聯(lián)??網(wǎng)上進行網(wǎng)頁瀏覽則會產(chǎn)生瀏覽的行為數(shù)據(jù);用戶在互聯(lián)網(wǎng)上發(fā)表言論會產(chǎn)生相??關(guān)的文本數(shù)據(jù);用戶在互聯(lián)網(wǎng)上進行外賣訂購操作,會產(chǎn)生關(guān)于用戶餐飲相關(guān)的??數(shù)據(jù);用戶出行進行訂票、打車等操作,能夠產(chǎn)生用戶的出行數(shù)據(jù)等。簡而言之,??只要用戶在互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)中有行為產(chǎn)生,便會有相關(guān)的數(shù)據(jù)生成。??在所有的網(wǎng)民中,網(wǎng)絡(luò)購物用戶約占全體網(wǎng)民數(shù)的71.0%,如圖1-2所示。??顯然,網(wǎng)絡(luò)購物(即電子商務(wù))己經(jīng)成為網(wǎng)民普遍使用的購物方式,電子商務(wù)技??術(shù)也成為了當前

電子商務(wù)應用,前臺系統(tǒng),業(yè)務(wù)處理流程,業(yè)務(wù)流程


mjm??圖2-1電子商務(wù)應用的業(yè)務(wù)處理流程??由圖2-1可知,完整的電子商務(wù)應用業(yè)務(wù)流程起始點由商家觸發(fā),當商家對??自己商品進行上架管理操作后,用戶便可通過前臺系統(tǒng)進行商品的查詢、選擇及??其購買操作,當用戶購買商品后生成相應訂單,同時該訂單進入到訂單庫中。此??時商家可以通過后臺進行訂單的管理,比如對訂單進行查詢,對訂單狀態(tài)進行更??新操作等,當商家對訂單處理完畢后,商品交由物流來執(zhí)行商品的出入庫操作,??同時對該商品的庫存進行更新操作。??通過該業(yè)務(wù)流程看出,在整個電商流程中最花時間的操作是在用戶對商品的??查找、搜索過程中。因此,當商家能夠針對不同用戶推薦不同的上架商品時,會??減少用戶的查找量、瀏覽量,節(jié)省用戶查找時間,提高系統(tǒng)的使用效率。??2.1.2架構(gòu)分析??通過上述電子商務(wù)的業(yè)務(wù)流程以及圖2-2電子商務(wù)的架構(gòu)圖可以看出

功能分析,電子商務(wù),架構(gòu),功能模塊


2.1.3功能分析??要對用戶進行有針對性的商品推薦,則需要對電子商務(wù)應用的功能有深入??的了解。通過對架構(gòu)的分析可以總結(jié)出電子商務(wù)應用的功能模塊,如圖2-3所??7Jn?〇??|功能模塊_??|后臺常見功能模塊丨?丨前臺功能模塊I??^?u?1?個商?^??!商?訂?商?支?配?用?評?品?^?:用?人?品?用??丨品?單?品?付?送戶論?信?¥?戶?信?購?戶??:管?管推?方方管?管?息?評?息?買?瀏??丨理?理?薦?式?式?理?理?展?i?:論?管?退?覽??示?:?理?換??、???J??::后臺二據(jù)?|基礎(chǔ)愈-i??圖2-3電子商務(wù)功能模塊??10??
【相似文獻】

相關(guān)期刊論文 前10條

1 孫春華;劉業(yè)政;;基于產(chǎn)品特征詞關(guān)系識別的評論傾向性合成方法[J];情報學報;2013年08期

2 李薇薇;;北京官話區(qū)方言特征詞說略[J];渤海大學學報(哲學社會科學版);2017年04期

3 曾莉莉;;豐城方言個體特征詞研究[J];宜春學院學報;2016年05期

4 劉云;;漢語特征詞跨域使用的類型和特點[J];華中學術(shù);2016年04期

5 趙楓;;方言特征詞理論與研究方法綜述[J];現(xiàn)代語文(語言研究版);2014年11期

6 李政澤;韓毅;周斌;賈焰;;微博用戶分類的特征詞權(quán)重優(yōu)化及推薦策略[J];信息網(wǎng)絡(luò)安全;2012年08期

7 李康澄;;關(guān)于“方言特征詞”理論的回顧及思考[J];武陵學刊;2011年05期

8 董漢良;;應時新著《禽蛋療法》[J];江西中醫(yī)藥;1989年06期

9 胡珊;李柏令;;漢語方言“孩子”類稱謂的特征詞研究[J];現(xiàn)代語文(語言研究版);2016年01期

10 姜偉;鐘志農(nóng);吳燁;陳犖;李杰;;基于綜合支持度的廣義空間實體關(guān)系特征詞提取方法[J];計算機與現(xiàn)代化;2014年08期


相關(guān)博士學位論文 前8條

1 郝立麗;漢語文本數(shù)據(jù)挖掘[D];吉林大學;2009年

2 胡德鵬;基于農(nóng)業(yè)本體問句分析的問答系統(tǒng)研究與架構(gòu)設(shè)計[D];中國農(nóng)業(yè)科學院;2013年

3 溫昌衍;客家方言特征詞研究[D];暨南大學;2001年

4 陳浩彬;智慧德才兼?zhèn)淅碚摰膶嵶C研究[D];南京師范大學;2013年

5 曹廷玉;贛方言特征詞研究[D];暨南大學;2001年

6 孫春華;情感表達對在線評論有用性感知的影響研究[D];合肥工業(yè)大學;2012年

7 楊創(chuàng)新;基于機器學習的高性能中文文本分類研究[D];華南理工大學;2009年

8 羅芳;意見挖掘中若干關(guān)鍵問題研究[D];武漢理工大學;2011年


相關(guān)碩士學位論文 前10條

1 許甜華;用戶畫像技術(shù)在電子商務(wù)系統(tǒng)中的研究與應用[D];北方工業(yè)大學;2019年

2 閔澤雨;九江方言特征詞的研究[D];廣西民族大學;2018年

3 李堅;核輿情情感分析及預警方法研究[D];南華大學;2018年

4 邱明濤;基于LDA-WO混合模型的微博話題有序特征抽取算法研究[D];南京航空航天大學;2018年

5 丑曉慧;面向中文知識圖譜構(gòu)建中的知識推理方法研究[D];國防科學技術(shù)大學;2017年

6 郭躍;基于觀點挖掘的商品推薦研究[D];山東財經(jīng)大學;2017年

7 靳亞;基于領(lǐng)域空間對齊的跨領(lǐng)域情感分類方法研究[D];北京工業(yè)大學;2018年

8 劉辰雨;煙威地區(qū)方言特征詞研究[D];山東大學;2017年

9 張猛;基于LDA的短文本分類中特征擴展方法的研究[D];中國地質(zhì)大學(北京);2017年

10 張凌云;蘭州方言特征詞研究[D];西北師范大學;2015年



本文編號:2856280

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/2856280.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶774ef***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com