可以使用cast
函数来实现。cast
函数用于将一个列的数据类型转换为另一个数据类型。对于将BigInt转换为Int,可以使用以下代码:
from pyspark.sql.functions import col
df = df.withColumn("new_column", col("old_column").cast("int"))
上述代码中,df
是一个Spark DataFrame,"old_column"是包含BigInt类型的列名,"new_column"是转换后的Int类型列名。cast
函数将"old_column"的数据类型转换为"int",并将结果存储在"new_column"中。
注意:由于BigInt类型的数据范围比Int类型大,因此在将BigInt转换为Int时可能会发生数据截断。如果BigInt的值超出了Int类型的范围,转换后的值将会是Int类型的最大值或最小值。
关于Spark的更多信息和使用方法,可以参考腾讯云的产品文档:Spark。
领取专属 10元无门槛券
手把手带您无忧上云