前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Hive的排序和Reduce的一个很隐蔽的问题

Hive的排序和Reduce的一个很隐蔽的问题

作者头像
Linker
发布2018-04-13 15:59:25
6730
发布2018-04-13 15:59:25
举报

Reduce是通过Python进行的,完成Reduce后sort。

结果,乱序了。

分析发现:Hive按照字符串排序,而不是按照字段的double类型。

进一步分析:Hive从stdin读入一行的时候,无从知晓列类型。只能按照字符串排序。

结论:绝对不要在Reduce后排序。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档