沉沙
2019-01-07
来源 :
阅读 4100
评论 0
摘要:本篇教程探讨了大数据技术之Hive中的Timestamp类型日期与Impala中显示不一致分析,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入。
本篇教程探讨了大数据技术之Hive中的Timestamp类型日期与Impala中显示不一致分析,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入。

Hive表中存储的Timestamp类型的字段显示日期与Impala中查询出来的日期不一致。
2.问题复现
1.创建一个简单的测试表
2.向表中插入一条测试数据
insert into date_test4 values(1,'1503751615','2017-08-26 08:46:55');获取当前系统时间存入表中:
3.通过Hive查询时间显示如下
select id,create_date_str,from_unixtime(create_date) from date_test4;4.通过Impala查询时间显示如下
select id,create_date_str,cast(create_date as timestamp) from date_test4;可以看到通过Hive查询看到的时间与通过Impala查询看到的时间不一致;
3.问题分析
3.1Hive的from_unixtime
Hive官网from_unixtime函数说明:
Return Type
Name(Signature)
Description
string from_unixtime(bigint unixtime, string format) Converts the number of seconds from unix epoch (1970-01-01 00:00:00 UTC) to a string representing the timestamp of that moment in the current system time zone in the format of "1970-01-01 00:00:00".
在Hive中通过from_unixtime函数将TIMESTAMP时间戳转换成当前时区的日期格式的字符串,默认格式为“yyyy-MM-dd HH:mm:ss”,所以Hive在查询的时候能正确的将存入的时间戳转成当前时区的时间;
3.2Impala的TIMESTAMP
默认情况下,Impala不会使用本地时区存储时间戳,以避免意外的时区问题造成不必要的问题,时间戳均是使用UTC进行存储和解释。具体说明请参考官方文档:
//impala.apache.org/docs/build/html/topics/impala\_timestamp.html#timestamp
4.解决方法
使用Impala的from_utc_timestamp函数指定时区进行时间转换,事例如下:
select id,create_date_str, cast(create_date as timestamp),from_utc_timestamp(cast(create_date as timestamp), 'EDT') from date_test4;指定时区后时间与原始Hive中显示时间一致,时区查看参考如下地址:
//zh.thetimenow.com/time-zones-abbreviations.php
本文由职坐标整理发布,学习更多的相关知识,请关注职坐标IT知识库!
喜欢 | 1
不喜欢 | 0
您输入的评论内容中包含违禁敏感词
我知道了

请输入正确的手机号码
请输入正确的验证码
您今天的短信下发次数太多了,明天再试试吧!
我们会在第一时间安排职业规划师联系您!
您也可以联系我们的职业规划师咨询:
版权所有 职坐标-一站式AI+学习就业服务平台 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
沪公网安备 31011502005948号