我正在创建一个函数,它遍历我的变量并确定它们是否是数值。如果变量是数值,我希望它打印平均值、中位数、方差、模式和范围。如果它不是数字,我希望它只打印模式。然而,它不能工作,不确定我是否使用了正确的函数(typeof & class) 我收到以下错误 Error: Must group by variables found in `.data`.
print(typeof(df
我想比较一下拼花文件的不同之处。一个集合是用Apache创建的,另一个是使用Apache创建的。使用create创建的集合具有已知的类型,因为转换使用create和显式转换类型。星火所创建的集合使用RDD的简单保存来分割,并且要大得多。我想从Spark创建的parquet文件中获取类型,但不能用Drill查询模式。所有的拼花文件都被移动到或创建在/tmp中use dfs.tmp;
SELECT COL