基于Hadoop平臺(tái)的醫(yī)療康復(fù)推薦系統(tǒng)的研究與實(shí)現(xiàn)
【圖文】:
江 蘇 大 學(xué) 碩 士 學(xué) 位 論 文第二章 系統(tǒng)相關(guān)技術(shù)及問題分析2.1 Hadoop 平臺(tái)簡(jiǎn)介Hadoop 是一個(gè)分布式系統(tǒng)開源框架,它的想法來自于 Google 的兩篇學(xué)術(shù)論文,分別為 MapReduce 和 Google File System。Hadoop 支持在計(jì)算機(jī)集群上面分布式處理簡(jiǎn)單的編程模型。集群中的每一臺(tái)機(jī)器都可以在本地進(jìn)行計(jì)算和數(shù)據(jù)的存儲(chǔ)。Hadoop 由很多元素組成,最底層是 Hadoop 分布式文件系統(tǒng)HDFS(Hadoop Distributed File System),它主要負(fù)責(zé)儲(chǔ)存集群上面所有節(jié)點(diǎn)的文 件[11]。 在 HDFS 的 上 一 層 是 MapRduce 引 擎 , 是 由 JobTrackers 和TaskTrackers 這兩個(gè)模塊組成。再往上面一層是數(shù)據(jù)倉(cāng)庫(kù)工具 Hive 和分布式數(shù)據(jù)庫(kù) HBase。Hadoop 集群的生態(tài)圈如圖 2.1所示。
一些概念進(jìn)行介紹:1) 行:每一行代表著一個(gè)數(shù)據(jù)對(duì)象,由行鍵來唯一標(biāo)識(shí),行鍵以字符串的形式存在,而且所有的行都是按照行鍵的字典序進(jìn)行排序存儲(chǔ)的,按照行鍵排序可以獲得像關(guān)系型數(shù)據(jù)庫(kù)主鍵索引一樣的特性[13]。2) 列:由列族和列限定符共同組成。列族需要在表創(chuàng)建時(shí)就定義好,列族里面包含了表中所有的列數(shù)據(jù),列族確定以后不能修改,會(huì)影響 Hbase 的物理存儲(chǔ)結(jié)構(gòu)。表中的每行可以有相同的列族,但是每一行的列族不一定都有相同的列標(biāo)識(shí),也就是說每行只存儲(chǔ)內(nèi)容不為空的數(shù)據(jù),這是一種稀疏的表結(jié)構(gòu),可以一定程度上避免數(shù)據(jù)的冗余。3) 單元格:每一個(gè)單元由列族和列標(biāo)識(shí)組成,單元格中存儲(chǔ)的是單元數(shù)據(jù)。從物理上,列式存儲(chǔ)數(shù)據(jù)庫(kù)聚合數(shù)據(jù)的時(shí)候是以列為單位,然后將列值依次存入磁盤,而行式存儲(chǔ)數(shù)據(jù)庫(kù)則是以連續(xù)地的方式存儲(chǔ)整行?梢詮 Hbase的集群架構(gòu)圖如 2.2所示。
【學(xué)位授予單位】:江蘇大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP391.3;R496
【參考文獻(xiàn)】
相關(guān)期刊論文 前7條
1 趙偉;李俊鋒;韓英;張紅濤;;Hadoop云平臺(tái)下的基于用戶協(xié)同過濾算法研究[J];計(jì)算機(jī)測(cè)量與控制;2015年06期
2 廖湘慶;楊松;羅麗群;張黔;;基于云平臺(tái)的公立醫(yī)院延伸醫(yī)療服務(wù)新模式的探索[J];中國(guó)醫(yī)院管理;2013年12期
3 王道平;李秀雅;楊岑;;基于內(nèi)容相似度的知識(shí)協(xié)同過濾推送算法研究[J];情報(bào)理論與實(shí)踐;2013年10期
4 路永和;李焰鋒;;改進(jìn)TF-IDF算法的文本特征項(xiàng)權(quán)值計(jì)算方法[J];圖書情報(bào)工作;2013年03期
5 黃承慧;印鑒;侯f ;;一種結(jié)合詞項(xiàng)語(yǔ)義信息和TF-IDF方法的文本相似度量方法[J];計(jì)算機(jī)學(xué)報(bào);2011年05期
6 李曼;王琰;趙益宇;杜小勇;王珊;;基于關(guān)系數(shù)據(jù)庫(kù)的大規(guī)模本體的存儲(chǔ)模式研究[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年S1期
7 原福永,楊桂芝,程玉良;基于Agent的個(gè)性化信息服務(wù)系統(tǒng)的開發(fā)與設(shè)計(jì)[J];計(jì)算機(jī)工程與應(yīng)用;2004年33期
相關(guān)博士學(xué)位論文 前4條
1 張琳;電子商務(wù)網(wǎng)站個(gè)性化推薦的多樣性對(duì)推薦效果的影響研究[D];北京郵電大學(xué);2017年
2 肖延輝;基于矩陣分解的圖像表示理論及其應(yīng)用研究[D];北京交通大學(xué);2014年
3 孔維梁;協(xié)同過濾推薦系統(tǒng)關(guān)鍵問題研究[D];華中師范大學(xué);2013年
4 付暢儉;基于內(nèi)容的視頻結(jié)構(gòu)挖掘方法研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 孟天宏;基于詞嵌入的個(gè)性化推薦系統(tǒng)的研究[D];河北科技大學(xué);2018年
2 陳中華;基于數(shù)據(jù)挖掘的圖書推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];湖南大學(xué);2018年
3 樂己揚(yáng);完善寧波工傷康復(fù)服務(wù)體系研究[D];寧波大學(xué);2017年
4 張炫鋌;基于HBase的矢量空間數(shù)據(jù)存取關(guān)鍵技術(shù)研究[D];江西理工大學(xué);2017年
5 張瑞;基于慢性病軌跡的我國(guó)慢性病干預(yù)研究[D];南京大學(xué);2017年
6 王冬暉;基于內(nèi)容的計(jì)算機(jī)科學(xué)論文推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2017年
7 唐麗娜;Y康復(fù)醫(yī)療機(jī)構(gòu)發(fā)展戰(zhàn)略研究[D];昆明理工大學(xué);2017年
8 侯瑞敏;基于SSM的電力設(shè)備管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華北電力大學(xué);2017年
9 李帥力;基于SpringMVC及MyBatis框架的智慧園區(qū)訪客管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];浙江工業(yè)大學(xué);2016年
10 梅紅泉;基于HBase的工業(yè)物聯(lián)網(wǎng)數(shù)據(jù)存儲(chǔ)策略研究[D];華中科技大學(xué);2016年
,本文編號(hào):2602728
本文鏈接:http://sikaile.net/linchuangyixuelunwen/2602728.html