前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用presto数据库在字符数字比较中遇到的坑

使用presto数据库在字符数字比较中遇到的坑

作者头像
Meet相识
发布2018-09-12 16:48:26
6.8K0
发布2018-09-12 16:48:26
举报
文章被收录于专栏:技术专栏

1.事情的始末

公司的sql查询平台提供了HIVE和Presto两种查询引擎来查询hive中的数据,由于presto的速度较快,一般能用presto跑就不用hive跑(有的时候如果使用了hive的UDF就必须用hive了),然而昨天发生了一件血案。

有一个需求需要统计某个时间小于100000s的所有记录,这个时间存在一个map<string,string>中,然后自然想到的就是where map["stat_time"] <100000 ,结果出来的数据特别少,开始还天真的以为是数据的确就特别少。后来产品说不正常。仔细排查以后发现,这些数据都是小于10的。

相信看到这里就已经比较清晰了,这presto种字符串和数字比较,是把数字转化成字符串进行比较,也就是"10000" 和 23比,"10000" 小,由于hive和很多语言以及框架上,这种情况都是把字符串转化成数字,就没做特殊处理。结果遇到了这个坑。后来把查询引擎缓存hive就好了。

2.扩展

不过为了安全,健壮性和可读性考虑,还是应该加上一些转换函数,hive和presto中都提供了cast转换

代码语言:javascript
复制
cast(value AS type) → type
显式转换一个值的类型。 可以将varchar类型的值转为数字类型,反过来转换也可以。

try_cast(value AS type) → type
与cast类似,不过,如果转换失败会返回null,这个只有presto有

另外需要注意的是 hive中的int类型是就是int,而presto中是包装类型Integer,如果cast的type写错也会报错

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018.05.15 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.事情的始末
    • 2.扩展
    相关产品与服务
    数据库
    云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档