spark无法推断java上的时间戳

Spark无法推断Java上的时间戳是因为Java的时间戳类型是long型，而Spark默认将long型的时间戳解释为Unix时间戳，即从1970年1月1日开始的毫秒数。然而，有时候我们可能会使用Java的时间戳表示其他类型的时间，例如日期时间字符串或者自定义的时间格式。

为了解决这个问题，我们可以使用Spark的函数库来显式地指定时间戳的格式。具体而言，可以使用from_unixtime函数将long型的时间戳转换为指定格式的日期时间字符串，然后再使用to_timestamp函数将日期时间字符串转换为Spark的时间戳类型。

以下是一个示例代码：

import org.apache.spark.sql.functions._

val df = spark.createDataFrame(Seq(
  (1, 1612345678000L),
  (2, 1612345679000L)
)).toDF("id", "timestamp")

val formattedDF = df.withColumn("formatted_timestamp", from_unixtime(col("timestamp") / 1000, "yyyy-MM-dd HH:mm:ss"))
val finalDF = formattedDF.withColumn("parsed_timestamp", to_timestamp(col("formatted_timestamp"), "yyyy-MM-dd HH:mm:ss"))

finalDF.show()

在上述代码中，我们首先创建了一个包含id和timestamp两列的DataFrame。然后，使用from_unixtime函数将timestamp列转换为格式为"yyyy-MM-dd HH:mm:ss"的日期时间字符串，并将结果存储在新的列formatted_timestamp中。接下来，使用to_timestamp函数将formatted_timestamp列转换为Spark的时间戳类型，并将结果存储在新的列parsed_timestamp中。最后，使用show方法展示最终的DataFrame。

这样，我们就可以在Spark中正确地处理Java上的时间戳了。

推荐的腾讯云相关产品：腾讯云云服务器（CVM）和腾讯云弹性MapReduce（EMR）。

腾讯云云服务器（CVM）：提供高性能、可扩展的云服务器实例，适用于各种计算场景。详情请参考腾讯云云服务器（CVM）产品介绍。
腾讯云弹性MapReduce（EMR）：是一种大数据处理和分析的云服务，提供了Hadoop和Spark等开源框架的托管服务。详情请参考腾讯云弹性MapReduce（EMR）产品介绍。

spark无法推断java上的时间戳

、、

我正在尝试从json-file (Spark 2.4.5)推断模式 {} .option("multiline", true)

浏览 16提问于2020-06-18得票数 0

回答已采纳

1回答

从Mapr表中推断InvalidType的Spark时间戳列

、、

我用Spark从MapR DB读取一张表。但是时间戳列被推断为InvalidType。在从Mapr读取数据时，也没有设置模式的选项。= true) | |-- InvalidType: string (nullable = true) 我试图将该列转换为时间戳进行推断.sql.utils.MapRSqlUtils$$anonfun$documentsToRow$1.apply(

浏览 1提问于2018-11-28得票数 0

回答已采纳

1回答

在Spark +2.4中读取CSV时如何设置时间戳格式

、、、、

我正在尝试解析具有自定义时间戳格式的CSV文件，但我不知道Spark使用哪种日期时间模式格式。，第一列总是被推断为字符串。csvDataFrame:org.apache.spark.sql.DataFrame Name:string Value:double 我不是Java/Scala开发人员，我是Spark/Databricks的新手。我在任何地方都

浏览 39提问于2019-05-10得票数 1

回答已采纳

1回答

Spark load parquet无法从已分区列推断时间戳

、、、

我可以保存由一个看起来像时间戳但实际上是一个字符串的列划分的拼图文件。当我尝试使用spark.read.load()将拼图加载回spark时，它会自动推断分区的列有一个日期，导致我丢失所有的时间信息。有没有一种方法可以将parquet文件作为字符串读回到分区列中，或者更好的是让它自动解析成指定格式的时间戳？下面是一个例子： test_df = <

浏览 16提问于2020-02-12得票数 1

回答已采纳

1回答

星星之火:在写入文件类型时不理解行为。

、、

我有这样的csv记录：name | age | entranceDate | TomDataTypes.StringType, false) return schema; .format("com.databricks.spark.csv上编写这个数据文件：new Str

浏览 1提问于2019-09-23得票数 3

回答已采纳

2回答

使用MongoDB Spark Connector实现基于时间戳的过滤

、、、、

我正在使用从mongodb..However获取数据，我无法获得如何使用Spark使用聚合管道(rdd.withPipeline)在Mongo上查询。.Following是我的代码，我想在其中获取基于时间戳并存储在数据帧中的记录：valappData.withPipeline(Seq(Document.parse("{ $

浏览 4提问于2017-07-04得票数 0

1回答

如何创建带有时间戳的星火数据？

、、、、

如何使用python一步创建带有时间戳数据类型的Spark数据？这是我分两步做的。StructField("ts", TimestampType(), True), ]) sdf = spark.createDataFrame

浏览 0提问于2022-06-29得票数 0

回答已采纳

1回答

HBase火花-与Spark2.0的连接

、、

一直试图使用Spark&Scala将数据写入HBase。需求是-我必须根据来自业务的列的时间戳为HBase记录设置TTL。将列的时间戳值转换为Epoch时间戳，并尝试在此基础上

浏览 1提问于2018-11-21得票数 3

2回答

如何使用DateTimeFormatter将字符串转换为获取java.sql.Timestamp

、、、、

我在字符串中有一个时间戳，我正在使用DateTimeFormatter解析该字符串，如下所示，并将其赋给时间戳类型的变量import java.time.format.DateTimeFormatterimport java.time.temporal.TemporalAccessor String myTime = "

浏览 93提问于2021-09-20得票数 0

2回答

使用scala将时间戳更改为UTC格式

、、、

这个问题与问题类似：基本上，它使用ISO8601 scala将带有偏移量的时间戳字符串格式转换为UTC时间戳字符串(2017-08-01T14:30:00+05:30 -> 2017-08-01T09我对scala/java有点陌生，我检查了星火库，他们在不知道时区的情况下无法进行转换，除非我不知道时区(我用丑陋的方式解析它，还是使用java/scala？)有人能帮忙吗？

浏览 4提问于2018-06-11得票数 1

回答已采纳

1回答

spark 3.1中的日期和inferSchema选项

、、、

我有一个带有日期列的CSV文件，如下所示，----------2021-02-152021-04-22 |-- datecol: string (nullable = true)有人能确认一下是否是错误吗?还是我需要使用其他的配置？

浏览 1提问于2021-12-22得票数 1

回答已采纳

1回答

如何迫使avro编写器在星火scala dataframe中用UTC编写时间戳

、、、

我需要将时间戳字段写入avro，并确保数据保存在UTC中。目前，avro在服务器的Local中将其转换为long (时间戳millis )，这会导致问题，就好像读取bk的服务器是不同的时区一样。我看了一下DataFrameWriter，它似乎提到了一个名为timezone的选项，但是help.Is似乎没有办法强迫Avro考虑在特定时区接收到的所有时间戳字段？**CODE SNIPPET** --w

浏览 5提问于2020-05-23得票数 0

回答已采纳

1回答

结构化流2.1.0卡夫卡驱动程序工作在纱线与-包，但有麻烦的独立集群模式

、

所有10个jars都存在于所有节点上的/home/.ivy2/. in 2中。_2.11-2.1.0.jar at spark://10.102.22.23:50513/jars/org.apache.spark_spark-tags_2.11-2.1.0.jar带时间戳1485467844923-1.0.0.jar at spark://10.102.22.23

浏览 2提问于2017-01-26得票数 1

4回答

对于Spark，什么是JSON中正确的日期/日期时间格式来自动推断它的模式？

、

Spark支持从JSON输入源自动推断模式(每行都是一个独立的JSON文件)--它通过扫描整个数据集来创建模式，但仍然很有用。(我说的是1.2.1，而不是新的1.3，所以可能会有一些变化) 我看到了一些关于支持/不支持它的相互矛盾的帖子，但我认为它是最近添加的(在1.2中)。我的问题是-在JSON中为Spark格式化一个日期/日期时间/时间戳<

浏览 1提问于2015-03-27得票数 7

回答已采纳

2回答

使用分区JSON的Spark分区投影/下推和模式推理

、、、

我想以JSON格式读取分区数据的子集，使用spark (3.0.1)从JSON推断模式。x && $"dt" >= y && $"dt" <= z)读取时，spark尝试读取整个数据集以推断模式。当我试图提前找出我的分区路径并将它们传递给read(paths :_*)时，spark抛出一个错误，它无法推断模式，我需要手动指定模式。我想，我正在寻找<em

浏览 20提问于2021-01-27得票数 4

2回答

一周中的Unix时间戳日模式

如果我所拥有的只是unix时间戳，并且无法使用任何函数来格式化它(例如星期的日期或日期)，那么通过查看时间戳来推断它是哪一天，是否有任何已知的模式？例如，可能所有可被150整除的时间戳都是星期一。

浏览 6提问于2016-06-15得票数 1

1回答

如何在OpenAI的Whisper ASR中获得字级时间戳？

、、、、

我使用OpenAI的 python来进行语音识别。我怎样才能得到文字级的时间戳？使用OpenAI的进行转录(在Ubuntu20.04 x64 LTS上使用Nvidia GeForce RTX 3090进行测试)： conda create -y --name whisperpy39

浏览 74提问于2022-09-23得票数 4

1回答

火花- spark.sql.legacy.timeParserPolicy文档在哪里？

、、、

指的是spark.sql.legacy.timeParserPolicy 时间戳/日期字符串的解析/格式化。在Spark3.0中，我们在Datetime模式中定义自己的模式字符串以进行格式化和解析，这是通过幕后的DateTimeFormatter实现的。新实现对其输入执行严格检查。例如，如果模式为yyyy，则2015-07-22 10:00:00 :00时间戳无法解析，因为解析

浏览 10提问于2022-02-20得票数 1

1回答

是否有可能在SparkSQL(1.3.0)中操纵时间戳/日期？

、、、

因为我是Spark (1.3.0)的新手，所以我想弄清楚它能做些什么，尤其是Spark SQL。 val sqlContext = new org.apache.spark.sql.SQLContext(sc)

浏览 3提问于2015-03-24得票数 0

1回答

如何将唯一的整数键分配给Apache Spark* Java应用程序中的每个Apache Spark Executor？*

、、

我需要为spark应用程序中的每个spark executor分配一个唯一的整数id。我需要从在executor上运行的任务中检索executor id。执行器id将与其它数据元素(时间戳、mac地址等)一起用于生成唯一的64位密钥。如何将唯一的整数键分配给Apache Spark Java应用程序中的每个Apache Spark Executo

浏览 27提问于2018-01-18得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

spark无法推断java上的时间戳

相关·内容

spark无法推断java上的时间戳

从Mapr表中推断InvalidType的Spark时间戳列

在Spark +2.4中读取CSV时如何设置时间戳格式

Spark load parquet无法从已分区列推断时间戳

星星之火:在写入文件类型时不理解行为。

使用MongoDB Spark Connector实现基于时间戳的过滤

如何创建带有时间戳的星火数据？

HBase火花-与Spark2.0的连接

如何使用DateTimeFormatter将字符串转换为获取java.sql.Timestamp

使用scala将时间戳更改为UTC格式

spark 3.1中的日期和inferSchema选项

如何迫使avro编写器在星火scala dataframe中用UTC编写时间戳

结构化流2.1.0卡夫卡驱动程序工作在纱线与-包，但有麻烦的独立集群模式

对于Spark，什么是JSON中正确的日期/日期时间格式来自动推断它的模式？

使用分区JSON的Spark分区投影/下推和模式推理

一周中的Unix时间戳日模式

如何在OpenAI的Whisper ASR中获得字级时间戳？

火花- spark.sql.legacy.timeParserPolicy文档在哪里？

是否有可能在SparkSQL(1.3.0)中操纵时间戳/日期？

如何将唯一的整数键分配给Apache Spark* Java应用程序中的每个Apache Spark Executor？*

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐