協(xié)同過(guò)濾算法的設(shè)計(jì)及并行化實(shí)現(xiàn)與應(yīng)用
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.2協(xié)同過(guò)濾推薦系統(tǒng)的推薦流程
面”模塊承擔(dān)著用戶與推薦系統(tǒng)之間的交互。UI系統(tǒng)根據(jù)用戶的操系統(tǒng),推薦系統(tǒng)根據(jù)用戶的要求將結(jié)果處理完畢后通過(guò)UI界面向用的對(duì)用戶的友好程度也直接決定著用戶體驗(yàn),是推薦系統(tǒng)中不可或過(guò)濾推薦原理分析統(tǒng)的目的是為用戶進(jìn)行精準(zhǔn)高效的信息推送,它可以依據(jù)用戶的興戶對(duì)個(gè)性化推薦的需求。....
圖2.3K-Center算法步驟
與作為數(shù)據(jù)挖掘十大算法之一與K-Means算法一致,只是在迭代過(guò)距離樣本點(diǎn)均值最近的一個(gè)樣本點(diǎn),本文對(duì)K-Center算法的選擇主要是考目,因此可以使得這種基于原始項(xiàng)目首先隨機(jī)選擇出K個(gè)質(zhì)心(ClusterC始的簇集;接著遍歷樣本中所有其他相似度最大的節(jié)點(diǎn),將樣本點(diǎn)....
圖2.4Spark組織架構(gòu)
電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第二章相關(guān)技術(shù)概述與分析義之分,廣義上的Spark架構(gòu)指的是由資源管理、數(shù)據(jù)管理、數(shù)據(jù)處理、應(yīng)用四層組成生態(tài)系統(tǒng);狹義上的Spark則僅僅指的是Spark的數(shù)據(jù)處理框架,該部分屬于廣義Spa中最為核心的一部分。Spark的組織....
圖2.5Spark數(shù)據(jù)處理模型
較于傳統(tǒng)的大數(shù)據(jù)開(kāi)發(fā)框架,Spark之所以能有如此巨大的提升,作為Spark的核心分布式數(shù)據(jù)集RDD起到了至關(guān)重要的作用。RDD是Spark中最為基本的數(shù)據(jù)抽象個(gè)由可分區(qū)、不可變、內(nèi)部元素可并行化計(jì)算的集合。首先,RDD由分區(qū)組成,分?jǐn)?shù)據(jù)、進(jìn)行計(jì)算的最基本單位,....
本文編號(hào):3908409
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3908409.html