文章/答案/技术大牛

发布

社区首页 >问答首页 >类型错误:无效的论证，而不是字符串或列

问类型错误:无效的论证，而不是字符串或列
EN

Stack Overflow用户

提问于 2022-05-02 14:18:44

回答 1查看 183关注 0票数 0

我试图做一些源，以目标测试在火星雨。我要做的第一部分是使用精益六西格玛方法对列进行计数，以确保列中的差异小于3/1000000。但是，当我运行这个程序时，if语句会抛出一个：

TypeError:无效论证，而不是字符串或列：-276244类型类型.对于列文字，请使用“lit”、“数组”、“struct”或“create_map”函数。

有人能帮忙吗？

import pyspark.sql.functions as f
from pyspark.sql.types import *

good_fields = []
bad_fields = {}
count_issues = {}


columns = list(spark.sql('show columns from tu_historical').toPandas()['col_name'])

for col in columns: 
   print(col)
   df = spark.sql(f'select pid,fnum,{col} from historical_clean')
   df1 = spark.sql(f'select pid,fnum,{col} from historical1')
   
   #count issue testing
   if abs(df1.count()-df.count()) > df1.count()*.000003:
      count_issues[col] = df1.count()-df.count()

   test_df = df.join(df1,(df.num == df1.file) & (df1.pid == df.pid),'left').filter(df1[col]!=df[col])

apache-spark

pyspark

python

pandas

dataframe

回答 1

Stack Overflow用户

发布于 2022-05-02 14:33:12

似乎你的columns有一个奇怪的价值。

您可能需要使用它来获取列名：

columns = spark.sql('select * from tu_historical limit 0').columns

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/72088067

复制

相似问题

问类型错误:无效的论证，而不是字符串或列
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问类型错误:无效的论证，而不是字符串或列EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问类型错误:无效的论证，而不是字符串或列
EN