基于Hadoop平臺的醫(yī)療康復推薦系統(tǒng)的研究與實現(xiàn)
【圖文】:
江 蘇 大 學 碩 士 學 位 論 文第二章 系統(tǒng)相關技術及問題分析2.1 Hadoop 平臺簡介Hadoop 是一個分布式系統(tǒng)開源框架,它的想法來自于 Google 的兩篇學術論文,分別為 MapReduce 和 Google File System。Hadoop 支持在計算機集群上面分布式處理簡單的編程模型。集群中的每一臺機器都可以在本地進行計算和數(shù)據(jù)的存儲。Hadoop 由很多元素組成,最底層是 Hadoop 分布式文件系統(tǒng)HDFS(Hadoop Distributed File System),它主要負責儲存集群上面所有節(jié)點的文 件[11]。 在 HDFS 的 上 一 層 是 MapRduce 引 擎 , 是 由 JobTrackers 和TaskTrackers 這兩個模塊組成。再往上面一層是數(shù)據(jù)倉庫工具 Hive 和分布式數(shù)據(jù)庫 HBase。Hadoop 集群的生態(tài)圈如圖 2.1所示。
一些概念進行介紹:1) 行:每一行代表著一個數(shù)據(jù)對象,由行鍵來唯一標識,行鍵以字符串的形式存在,而且所有的行都是按照行鍵的字典序進行排序存儲的,按照行鍵排序可以獲得像關系型數(shù)據(jù)庫主鍵索引一樣的特性[13]。2) 列:由列族和列限定符共同組成。列族需要在表創(chuàng)建時就定義好,列族里面包含了表中所有的列數(shù)據(jù),列族確定以后不能修改,會影響 Hbase 的物理存儲結(jié)構。表中的每行可以有相同的列族,但是每一行的列族不一定都有相同的列標識,也就是說每行只存儲內(nèi)容不為空的數(shù)據(jù),這是一種稀疏的表結(jié)構,可以一定程度上避免數(shù)據(jù)的冗余。3) 單元格:每一個單元由列族和列標識組成,單元格中存儲的是單元數(shù)據(jù)。從物理上,列式存儲數(shù)據(jù)庫聚合數(shù)據(jù)的時候是以列為單位,然后將列值依次存入磁盤,而行式存儲數(shù)據(jù)庫則是以連續(xù)地的方式存儲整行。可以從 Hbase的集群架構圖如 2.2所示。
【學位授予單位】:江蘇大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP391.3;R496
【參考文獻】
相關期刊論文 前7條
1 趙偉;李俊鋒;韓英;張紅濤;;Hadoop云平臺下的基于用戶協(xié)同過濾算法研究[J];計算機測量與控制;2015年06期
2 廖湘慶;楊松;羅麗群;張黔;;基于云平臺的公立醫(yī)院延伸醫(yī)療服務新模式的探索[J];中國醫(yī)院管理;2013年12期
3 王道平;李秀雅;楊岑;;基于內(nèi)容相似度的知識協(xié)同過濾推送算法研究[J];情報理論與實踐;2013年10期
4 路永和;李焰鋒;;改進TF-IDF算法的文本特征項權值計算方法[J];圖書情報工作;2013年03期
5 黃承慧;印鑒;侯f ;;一種結(jié)合詞項語義信息和TF-IDF方法的文本相似度量方法[J];計算機學報;2011年05期
6 李曼;王琰;趙益宇;杜小勇;王珊;;基于關系數(shù)據(jù)庫的大規(guī)模本體的存儲模式研究[J];華中科技大學學報(自然科學版);2005年S1期
7 原福永,楊桂芝,程玉良;基于Agent的個性化信息服務系統(tǒng)的開發(fā)與設計[J];計算機工程與應用;2004年33期
相關博士學位論文 前4條
1 張琳;電子商務網(wǎng)站個性化推薦的多樣性對推薦效果的影響研究[D];北京郵電大學;2017年
2 肖延輝;基于矩陣分解的圖像表示理論及其應用研究[D];北京交通大學;2014年
3 孔維梁;協(xié)同過濾推薦系統(tǒng)關鍵問題研究[D];華中師范大學;2013年
4 付暢儉;基于內(nèi)容的視頻結(jié)構挖掘方法研究[D];國防科學技術大學;2008年
相關碩士學位論文 前10條
1 孟天宏;基于詞嵌入的個性化推薦系統(tǒng)的研究[D];河北科技大學;2018年
2 陳中華;基于數(shù)據(jù)挖掘的圖書推薦系統(tǒng)設計與實現(xiàn)[D];湖南大學;2018年
3 樂己揚;完善寧波工傷康復服務體系研究[D];寧波大學;2017年
4 張炫鋌;基于HBase的矢量空間數(shù)據(jù)存取關鍵技術研究[D];江西理工大學;2017年
5 張瑞;基于慢性病軌跡的我國慢性病干預研究[D];南京大學;2017年
6 王冬暉;基于內(nèi)容的計算機科學論文推薦系統(tǒng)設計與實現(xiàn)[D];吉林大學;2017年
7 唐麗娜;Y康復醫(yī)療機構發(fā)展戰(zhàn)略研究[D];昆明理工大學;2017年
8 侯瑞敏;基于SSM的電力設備管理系統(tǒng)的設計與實現(xiàn)[D];華北電力大學;2017年
9 李帥力;基于SpringMVC及MyBatis框架的智慧園區(qū)訪客管理系統(tǒng)的設計與實現(xiàn)[D];浙江工業(yè)大學;2016年
10 梅紅泉;基于HBase的工業(yè)物聯(lián)網(wǎng)數(shù)據(jù)存儲策略研究[D];華中科技大學;2016年
,本文編號:2602728
本文鏈接:http://sikaile.net/linchuangyixuelunwen/2602728.html