我正在开发Scala/Spark应用程序,该应用程序从一个单元表中选择几个列,然后将其转换为一个可变的映射,其中第一列为键,第二列为值。将转换为Scala.mutable.Map(Newyork -> 1, LA -> 0, Chicago -> 1) val testDF = hiveContext.sql但是,当我在Dataframe中打印行数和Map大小时,我发现它们不匹配:
print
我正在尝试将复杂SQL查询的结果导入熊猫数据。我的查询要求我创建几个临时表,因为我想要的最终结果表包含一些聚合。df = pd.DataFrame(cursor.fetchall(),columns = [desc[0] for desc in cursor.description]) ValueError: Shape of passed values is (1,900000),indices imply (5,900000)
实际上,所有