背景
Apache Hive是一个建立在Apache Hadoop之上的数据仓库软件项目,用于提供数据查询和分析,现支持引擎有MapReduce、Tez、Spark等等。
Hive像传统的关系型数据库一样含有大量内置函数,但也可支持UDF、UDAF等用户自定义函数编写。Hive自身支持函数的隐式转换,方便用户使用。但是这些隐式转换出现问题可能不会报错,但是也会给用户带来非期望的结果。建议大家函数按照规范来使用。
内置函数
现在分门别类地整理了日期、数值、集合、条件、字符串、聚合等内置函数的详解与举例说明等
假设有t表,数据如下:
id | col1 | col2 |
---|---|---|
A | 1 | 4 |
A | 2 | 5 |
B | 3 | 6 |
总结
这里Hive整理的是日常常用的函数,同时这也是Presto有的函数,只是函数名称、字段类型、参数的顺序不同而已。但是Presto这些函数都要求规范的数据类型,不然会报错的。
由于笔者知识及水平有限,因此文中错漏之处在所难免,恳请各位老师、专家不吝赐教。