沉沙
2019-01-16
来源 :
阅读 670
评论 0
摘要:本篇教程探讨了大数据技术之大数据基础问答,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入。
本篇教程探讨了大数据技术之大数据基础问答,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入。

什么是大数据?
用于①数据的存储:分布式文件系统(分布式存储)②数据的计算:分布式计算。简单一点就是存储和计算的问题,解决日常海量数据的分析。
学习大数据需要什么基础呢?
Java基础(Javase):类、类、继承、I/O、反射、泛型等;
Linux基础(Linux的操作):创建文件、目录、vi编辑器的使用;
Java和大数据都有哪些关系呢?
基于Java语言开发→→→ Hadoop体系结构、原理、编程
第一阶段:HDFS、MapReduce、HBase(NoSQL数据库)
第二阶段:数据分析引擎 ---> Hive、Pig
数据采集引擎 ---> Sqoop、Flume
第三阶段:HUE:Web管理工具
ZooKeeper:实现Hadoop的HA
Oozie: 工作流引擎*
基于Java语言开发→→→Scala语言→→→Spark
Spark的学习
第一个阶段:Scala编程语言
第二个阶段:Spark Core-----> 基于内存,数据的计算
第三个阶段:Spark SQL -----> 类似Oracle中的SQL语句
第四个阶段:Spark Streaming ---> 进行实时计算(流式计算):比如:自来水厂
Apache Storm:类似Spark Streaming ---> 进行实时计算(流式计算):比如:自来水厂
NoSQL:Redis基于内存的数据库
本文由职坐标整理发布,学习更多的相关知识,请关注职坐标IT知识库!
喜欢 | 0
不喜欢 | 0
您输入的评论内容中包含违禁敏感词
我知道了

请输入正确的手机号码
请输入正确的验证码
您今天的短信下发次数太多了,明天再试试吧!
我们会在第一时间安排职业规划师联系您!
您也可以联系我们的职业规划师咨询:
版权所有 职坐标-一站式AI+学习就业服务平台 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
沪公网安备 31011502005948号