大数据技术 Hadoop学习(23):Impala介绍及安装
沉沙 2018-10-08 来源 : 阅读 1739 评论 0

摘要:本篇教程探讨了大数据技术 Hadoop学习(23):Impala介绍及安装,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入。

本篇教程探讨了大数据技术 Hadoop学习(23):Impala介绍及安装,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入。

<


 


     上一篇,我们讲述了HBase的协处理器。
   下面我们开始介绍Impala的介绍及安装。

介绍

一:定义
  Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。和Hive相比,速度快了个数量级,具有非常好的交互式SQL执行。
三:架构


 
Impala Daemon
  是Impala的核心进程,进程名叫做:impalad,运行在所有的数据节点上,可以读写数据,并接收客户端的查询请求,并行执行来自集群中其他节点的查询请求,将中间结果返回给调度节点。调用节点将结果返回给客户端。
Impala Statestore
  状态管理进程,定时检查The Impala Daemon的健康状况,协调各个运行impalad的实例之间的信息关系,Impala正是通过这些信息去定位查询请求所要的数据,进程名叫做 statestored,在集群中只需要启动一个这样的进程,如果Impala节点由于物理原因、网络原因、软件原因或者其他原因而下线,Statestore会通知其他节点,避免查询任务分发到不可用的节点上。
Impala Catalog Service
  元数据管理服务,进程名叫做 catalogd,将数据表变化的信息分发给各个进程。


安装

一:新增服务
  
二:勾选Impala
  
三:分配服务
  
  
四:存储配置
  
五:添加服务进行中
  
 
六:添加完成
  
 
  
 
  
--------------------------------------------------------------------
  到此,本章节的内容讲述完毕。

   

本文由职坐标整理发布,学习更多的大数据技术相关知识,请关注职坐标大技术云计算大技术技术频道!

本文由 @沉沙 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 1
看完这篇文章有何感觉?已经有1人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式AI+学习就业服务平台 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved