毕业论文
计算机论文
经济论文
生物论文
数学论文
物理论文
机械论文
新闻传播论文
音乐舞蹈论文
法学论文
文学论文
材料科学
英语论文
日语论文
化学论文
自动化
管理论文
艺术论文
会计论文
土木工程
电子通信
食品科学
教学论文
医学论文
体育论文
论文下载
研究现状
任务书
开题报告
外文文献翻译
文献综述
范文
大数据分析挖掘算法实现-平台的监控(3)
1.4 名词解释
HDFS
这是大数据存储的
物理
基础。
它是一个分布式文件系统,擅长存储单个大文件。
Hive
对MR进行了SQL封装的一个实现。
如果数据是结构化并且很规整,那么可以直接使用Hive,以允许SQL的方式来生成报表。
HBase
基于HDFS的一个Big Table的实现。
它是基于列的数据库,可以存储海量的数据。
可以用key的方式快速检索出数据,也可以用Scan的方式获取一批数据。
当数据是海量的,且格式容易变化的时候可以采取这个方案。
MapReduce
是一种编程范式,适合分布式计算,提倡并行思想 。
Map是对数据映射到另一组数据,而reduce则是以一定的方式将一组数据进行计算求值。
Gmod
数据采集器,位于每个Node上。
Gmetad
数据混合收集器,每个cluster都有一个,便于构建多级
网络
。
1.5 论文结构
论文由 七个部分组成,第一章主要讲述了大数据时代来临,发展大数据相关技术已是大势所趋的背景,在这种背景下国内大数据相关技术却令人担忧,在大量的分析下,得出了本文的主要工作和选题背景。 第二章主要研究了课题需要用到的平台,第三章则是重点了解当前监控的
现状
,对几个涉及到的监控
软件
进行了研究和对比,最终选择比较适合的工具。第四章则是为了验证前面的结论,证明它们的适用性,搭建平台,配置环境,在本地主机上运行它们、使用它们,发现问题。第五章总结收获,提出建议。
共3页:
上一页
1
2
3
下一页
上一篇:
基于专家场先验的图像非盲复原算法研究
下一篇:
Jsoup微博关系图的研究与实现
asp.net+sqlserver大学生招聘管...
asp.net+sqlserver大学生校园二...
HTML5的飞机大战游戏的设计与实现
大学生消费习惯分析的二...
数据挖掘在电子商务中的应用
数据挖掘的主题标绘数据获取技术与实现
基于PageRank算法的网络数据分析
室外办公系统创新设计研究
中班幼儿“求助”型告状行为的访谈提纲
人性化的用户界面设计研究
无刷电机调速系统设计任务书
硅酸钇镥闪烁晶体的光学性能研究
天秤男婚后出轨能改好吗...
常用游戏对于小学生英语教学的影响
建议全面开放生育政策,...
地方政府跨区域联合环境污染治理研究
哈萨克民歌中生态美學思想的表现【4092字】