(配置)
JSON Datasets (JSON 数据集)
Hive 表
指定 Hive 表的存储格式
与不同版本的 Hive Metastore 进行交互
JDBC 连接其它数据库...该页面所有例子使用的示例数据都包含在 Spark 的发布中, 并且可以使用 spark-shell, pyspark shell, 或者 sparkR shell来运行....Spark 2.0 中的SparkSession 为 Hive 特性提供了内嵌的支持, 包括使用 HiveQL 编写查询的能力, 访问 Hive UDF,以及从 Hive 表中读取数据的能力.为了使用这些特性...例如, 我们可以使用以下 directory structure (目录结构)将所有以前使用的 population data (人口数据)存储到 partitioned table (分区表)中,...Hive 不区分大小写, 而 Parquet 不是
Hive 认为所有 columns (列)都可以为空, 而 Parquet 中的可空性是 significant (重要)的.