相似產(chǎn)品集在電子商務(wù)中的應(yīng)用
發(fā)布時(shí)間:2017-10-26 20:12
本文關(guān)鍵詞:相似產(chǎn)品集在電子商務(wù)中的應(yīng)用
更多相關(guān)文章: 數(shù)據(jù)稀疏性 相似產(chǎn)品 文本挖掘
【摘要】:伴隨著互聯(lián)網(wǎng)的飛速發(fā)展,我們進(jìn)入了一個(gè)信息海洋的時(shí)代。互聯(lián)網(wǎng)上的信息以指數(shù)階的速度增長,那么如何讓在如此多的數(shù)據(jù)中提煉出用戶感興趣的數(shù)據(jù)成為了一個(gè)很有研究意義的問題。在目前的電子商務(wù)系統(tǒng)中,由于商品數(shù)量和用戶數(shù)量都非常巨大,如何把商品推薦給合適的用戶,如何挖掘用戶的潛在購買需求,增加網(wǎng)站的流量和營業(yè)額,這些問題通過個(gè)性化推薦系統(tǒng)都能得到良好的解決,個(gè)性化推薦系統(tǒng)是用戶和信息之間的紐帶。 然而,在分析了當(dāng)前電子商務(wù)系統(tǒng)中推薦模型所遇到的主要問題之后,發(fā)現(xiàn)電子商務(wù)在擁有海量的對象(商品和用戶)的同時(shí),用戶行為數(shù)據(jù)卻過于稀疏。由此主要造成了兩個(gè)問題:一、推薦算法和推薦模型的可用性無法得到保障;二、出現(xiàn)了馬太效應(yīng),導(dǎo)致了受益群體過于集中。 本文正是針對上述在電子商務(wù)中出現(xiàn)的問題基于文本挖掘和產(chǎn)品知識庫,提出了一種商品聚類算法,即相似產(chǎn)品集算法。該算法運(yùn)用文本挖掘和行為定向技術(shù)聚合相似產(chǎn)品。通過對全部產(chǎn)品的分析,構(gòu)建介于產(chǎn)品和葉子類目之間的相似集合層。該相似集合層的粒度能根據(jù)業(yè)務(wù)需求做靈活的調(diào)整。在解決用戶行為數(shù)據(jù)稀疏的同時(shí),該算法還能為比價(jià)分析、價(jià)格指導(dǎo)以及重復(fù)產(chǎn)品的診斷提供一些實(shí)現(xiàn)方案。本文的主要內(nèi)容有: 1)分析了當(dāng)前電子商務(wù)環(huán)境下推薦系統(tǒng)所面臨的用戶行為數(shù)據(jù)稀疏的問題以及現(xiàn)階段的一些解決方案。 2)針對以上問題提出了基于文本挖掘的相似產(chǎn)品集算法,該算法基于文本挖掘,通過對描述商品的詞進(jìn)行了若干處理之后(如單復(fù)數(shù)轉(zhuǎn)換,去掉臟詞等),利用頻繁挖掘算法如Apriori,F(xiàn)P-Growth等算法進(jìn)行相似產(chǎn)品的劃分,聚合相似的產(chǎn)品,該算法能在一定程度上緩解用戶行為數(shù)據(jù)的稀疏性。 3)對提出的相似產(chǎn)品集算法進(jìn)行分析和實(shí)驗(yàn),,得出實(shí)驗(yàn)數(shù)據(jù)。 4)針對比價(jià)分析,發(fā)布商品價(jià)格指導(dǎo),和診斷重復(fù)商品的發(fā)布和分析商品的熱門程度等問題,利用相似產(chǎn)品集算法給出了若干可行的方案,并通過實(shí)驗(yàn)得出結(jié)論。
【關(guān)鍵詞】:數(shù)據(jù)稀疏性 相似產(chǎn)品 文本挖掘
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.1;F713.36
【目錄】:
- 摘要5-6
- ABSTRACT6-8
- 目錄8-10
- 第一章 緒論10-14
- 1.1 研究意義10-11
- 1.2 國內(nèi)外研究現(xiàn)狀11-13
- 1.3 本文的主要工作13
- 1.4 論文組織結(jié)構(gòu)13-14
- 第二章 個(gè)性化推薦系統(tǒng)14-35
- 2.1 推薦系統(tǒng)簡介14-15
- 2.2 推薦系統(tǒng)的工作組成15-16
- 2.3 推薦系統(tǒng)相關(guān)技術(shù)16-32
- 2.3.1 基于內(nèi)容的推薦16-23
- 2.3.2 協(xié)同過濾推薦23-29
- 2.3.3 基于社交的推薦29-30
- 2.3.4 在推薦中利用上下文信息30-32
- 2.3.5 推薦系統(tǒng)的實(shí)時(shí)性32
- 2.4 推薦方法總結(jié)32-33
- 2.5 本章小結(jié)33-35
- 第三章 協(xié)同過濾推薦系統(tǒng)中的常見問題35-40
- 3.1 推薦系統(tǒng)的冷啟動問題35-36
- 3.2 推薦系統(tǒng)的延伸性36-37
- 3.3 數(shù)據(jù)的稀疏性問題37-39
- 3.4 本章小結(jié)39-40
- 第四章 相似產(chǎn)品集40-49
- 4.1 相似產(chǎn)品集所依賴的技術(shù)42-47
- 4.1.1 產(chǎn)品信息分詞43
- 4.1.2 頻繁模式挖掘算法43-45
- 4.1.3 Apriori 算法45-47
- 4.1.4 Hadoop 分布式計(jì)算平臺47
- 4.2 通過相似產(chǎn)品集來實(shí)現(xiàn)商品聚類的意義47-48
- 4.3 本章小結(jié)48-49
- 第五章 相似產(chǎn)品集的構(gòu)造過程49-54
- 5.1 相似產(chǎn)品集的構(gòu)造過程49-52
- 5.2 相似產(chǎn)品集的構(gòu)造示例52-53
- 5.3 本章小結(jié)53-54
- 第六章 相似產(chǎn)品集的作用及相關(guān)實(shí)驗(yàn)54-68
- 6.1 商品信息數(shù)據(jù)來源54
- 6.2 原始數(shù)據(jù)處理過程54-57
- 6.3 基于相似產(chǎn)品集的搜索57-59
- 6.3.1 基于相似產(chǎn)品集搜索的實(shí)驗(yàn)58-59
- 6.4 價(jià)格分析59-61
- 6.5 商品熱度分析61-62
- 6.6 重復(fù)商品診斷62-65
- 6.6.1 基于相似產(chǎn)品集的解決方案62
- 6.6.2 基于最長公共子序列的解決方案62-64
- 6.6.3 基于最小編輯距離的解決方案64-65
- 6.7 相似產(chǎn)品集解決數(shù)據(jù)稀疏性問題65-67
- 6.7.1 相似產(chǎn)品集解決數(shù)據(jù)稀疏問題的實(shí)驗(yàn)65-67
- 6.8 本章小結(jié)67-68
- 第七章 結(jié)論68-70
- 致謝70-71
- 參考文獻(xiàn)71-75
- 附錄75-85
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 曾春,邢春曉,周立柱;基于內(nèi)容過濾的個(gè)性化搜索算法[J];軟件學(xué)報(bào);2003年05期
本文編號:1100261
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/1100261.html
最近更新
教材專著