首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

在pySpark中将字符串类型列转换为datetime

在pySpark中,我们可以使用to_timestamp函数将字符串类型的列转换为datetime类型。

首先,我们需要导入pyspark.sql.functions模块,它包含了to_timestamp函数。

代码语言:txt
复制
from pyspark.sql.functions import to_timestamp

然后,我们可以使用to_timestamp函数来转换字符串类型的列。以下是一个示例代码:

代码语言:txt
复制
df = spark.createDataFrame([(1, '2022-01-01 12:00:00'), (2, '2022-02-01 12:00:00')], ['id', 'datetime_str'])
df = df.withColumn('datetime', to_timestamp('datetime_str', 'yyyy-MM-dd HH:mm:ss'))
df.show()

在上述代码中,我们创建了一个DataFrame,并指定了两列:'id'和'datetime_str'。其中,'datetime_str'列包含了字符串类型的日期时间。

然后,我们使用withColumn函数和to_timestamp函数来创建新的列'datetime',并将'datetime_str'列转换为datetime类型。to_timestamp函数的第一个参数是要转换的列名,第二个参数是日期时间格式的模式。

最后,我们使用show函数打印转换后的DataFrame。输出结果应该类似于:

代码语言:txt
复制
+---+-------------------+-------------------+
| id|       datetime_str|           datetime|
+---+-------------------+-------------------+
|  1|2022-01-01 12:00:00|2022-01-01 12:00:00|
|  2|2022-02-01 12:00:00|2022-02-01 12:00:00|
+---+-------------------+-------------------+

在这个例子中,我们成功将字符串类型的列'datetime_str'转换为了datetime类型的列'datetime'。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

没有搜到相关的沙龙

领券