如何创建带时间戳的spark数据帧_带纪元时间戳的spark读取csv_从数据帧值创建日期/时间戳 - 腾讯云开发者社区

scala、apache-spark

如何在一步中创建具有timestamp数据类型的spark数据帧？下面是我如何在两个步骤中做到这一点。使用spark 2.4 首先创建带有时间戳字符串的dataframe import org.apache.spark.sql.types._ import org.apache.spark.sql.functions.to_ti

浏览 10提问于2019-02-27得票数 5

回答已采纳

2回答

使用dataframe scala创建文件名为时间戳的csv文件

scala、dataframe、csv、apache-spark

我有一个数据帧，数据如下。|1.0 ||football |2.0 |我想将上面的数据帧写入一个csv文件，其中的文件名将使用当前时间戳创建。给出了以下错误有没有更好的方式来使用scal

浏览 29提问于2021-03-02得票数 2

回答已采纳

1回答

使用基于时间的存储将数据帧快速保存到mongodb？

python、pandas、mongodb

如何使用推荐的将熊猫数据帧保存到mongodb？本例中的数据具有带日期时间的索引和带整数的列。我知道如何为每个时间戳创建单个文档，但不知道如何安排数据帧或循环通过数据帧来为一个文档保存几分钟的数据。

浏览 9提问于2021-02-19得票数 1

1回答

如何从现有的时间戳列向spark dataFrame添加新的datetime列

pyspark、apache-spark-sql

我在Spark中有一个数据帧，它有一个列时间戳。我想在此数据框中添加一个新列，该数据框具有从此现有时间戳列创建的以下格式的DateTime。 “YYYY-MM-DD HH:MM:SS”

浏览 35提问于2021-06-24得票数 0

2回答

使用MongoDB Spark Connector实现基于时间戳的过滤

mongodb、mongodb-query、apache-spark-sql、spark-dataframe、mongodb-hadoop

我正在使用从mongodb..However获取数据，我无法获得如何使用Spark使用聚合管道(rdd.withPipeline)在Mongo上查询。.Following是我的代码，我想在其中获取基于时间戳并存储在数据帧中的记录：valSeq(Document.parse("{ $mat

浏览 4提问于2017-07-04得票数 0

2回答

Spark将TimestampType转换为yyyyMMddHHmm格式的字符串

scala、apache-spark、timestamp、datetime-format、datetime-conversion

在我的数据帧中，我有一个TimestampType格式的列'2019-03-16T16:54:42.968Z‘，我想将其转换为格式为'201903161654’的StringType列，而不是通用的时间戳列这是因为我需要根据字符串格式的时间戳对几个目录进行分区，如果我对时间戳列进行分区，则会在创建目录时创建特

浏览 79提问于2019-03-18得票数 1

回答已采纳

0回答

正在写入cassandra 0001-01-01 00:00:00.0。改成0001-01-01 10:30:00？

mysql、scala、apache-spark、export-to-csv

我正在从spark读取csv格式的文件作为数据帧。对于列x，有时间戳值:0001-01-01 00:00:00.0。向Cassandra表写入数据帧后，发现时间戳值发生变化，0001-01-01 10:30:00谁来帮帮我..

浏览 3提问于2017-06-14得票数 0

2回答

如何将Spark Dataframe的时间戳列转换为字符串列

scala、apache-spark

我想把Spark dataframe所有的时间戳列转换成字符串列。有人能告诉我如何为每个数据帧自动做到这一点吗？因此，我需要在任何给定表中使用有关列类型的</e

浏览 66提问于2019-11-08得票数 1

1回答

我需要根据我的列本身的值更新Hbase中的时间戳，而不是默认的时间戳

scala、apache-spark、hbase、spark-dataframe

默认情况下，Hbase的每一行都有时间戳值。我们如何通过spark scala代码在HBase中更新我自己的时间戳值，同时保存(插入)来自spark Dataframe的记录？b, timestamp=1288380738440, value=value2 我们如何根据我们的</

浏览 3提问于2017-05-05得票数 0

1回答

连接pandas中的数据帧

python、pandas、dataframe、merge、concatenation

有没有一种方法可以连接下面的两个数据帧，以便：调整后的时间戳close reportedEPS estimatedEPS1月31日，3月1日，4月30日，7月1日，9月30日，10月1日，12月31日的时间戳？2个

浏览 4提问于2021-04-17得票数 0

1回答

获取spark数据帧写入的文件名

python、dataframe、amazon-s3、pyspark、filenames

我使用下面的代码将spark数据帧写入s3存储桶中。spark_df. \write. \mode("overwrite"). \在这里，我想要获取正在写入s3 bukcet的文件的名称，并

浏览 0提问于2018-06-18得票数 1

1回答

无法使用Spark获取Delta Lake表的元数据信息

scala、apache-spark、delta-lake

我正在尝试获取使用DataFrame创建的Delta Lake表的元数据信息。有关版本、时间戳的信息。已尝试：spark.sql("describe deltaSample").show(10,false) -这不提供与版本和时间戳相关的信息：+-----/deltaLakeSample.csv") /

浏览 21提问于2019-07-23得票数 0

1回答

Spark- Dataframe上的SQL窗口函数-查找组中的第一个时间戳

sql、apache-spark、dataframe、apache-spark-sql、window-functions

(uid)在不同时间(时间戳)跨不同区域(region)传输的数据。目前，为简单起见，时间戳显示为'int‘。请注意，上述数据帧不一定按时间戳的升序排列。此外，可能会有来自不同用户的一些行。为了简单起见，我仅以单调递增的时间戳顺序显示了单个用户的数据帧</e

浏览 1提问于2016-02-10得票数 1

2回答

如何从字符串在spark中创建TimestampType列

scala、apache-spark

我有一些数据包含在字符串数组中，如下所示(仅作为示例)：我想将我的列表映射到一个时间戳数组，以便创建一个RDD (myRdd)，然后创建一个数据帧，如下所示 val df = createdataframe(myRdd, StructType(Stru

浏览 3提问于2017-07-17得票数 4

回答已采纳

1回答

将timestamp整数列转换为spark* Dataframe中在小时后停止的Datetime*

python、datetime、pyspark、timestamp

我有一个这样的spark数据帧我有一个整型的时间戳，我想创建另一个包含整个日期+小时的列，我不明白为什么这个代码不能工作： df = df.withColumn("Date_per_hour

浏览 3提问于2021-07-19得票数 0

1回答

将带有UTC偏移量的字符串转换为spark时间戳

apache-spark、pyspark、apache-spark-sql、datetime-format

如何将字符串2018-03-21 08:15:00 +03:00存储为timestamptype，同时保留spark中的UTC偏移量？已在下面尝试 df = spark.createDataFrame([("2018-03-21 08:15:00 +03:00"df.withColumn("newtimestamp", to_timestamp(col('timestamp'), "

浏览 2提问于2021-02-17得票数 4

1回答

在Spark* SQL中传递参数*

apache-spark-sql、bigdata

我需要在Spark SQL中传递参数。例如，我有以下查询作为Val时间戳=spark.sql("select timestamp from tablea ")，现在，我有另一个查询要在where类Spark.sql中传递这个时间戳(s“select但是上面的查询返回不匹配的表达式错误。有没有人能提个解决方案

浏览 1提问于2020-02-04得票数 0

3回答

Spark SQL将字符串转换为时间戳

sql、apache-spark、apache-spark-sql、pyspark-sql

我是Spark SQL的新手，正在尝试将spark数据帧中的字符串转换为时间戳。我在一个名为time_string的列中有一个类似于'2017-08-01T02:26:59.000Z'的字符串CAST (time_string AS Timestamp) 但是这给了我一个2017-07-31 19:26:5

浏览 3提问于2017-08-08得票数 18

2回答

Python中的SQL查询-在SQL查询中插入来自Python的值

python、sql、timestamp

我在python中有一个根据时间戳过滤的SQL查询，但是时间戳会根据数据帧中的值进行更改。(SELECT [ID],[Timestamp],[Value] FROM [table] Where [Timestamp] >= '2021-10-13') alias""" big_df = spark.read.format("jdbc").option(&qu

浏览 13提问于2021-10-19得票数 0

1回答

Spark Scala，抓取1列的最大值，但保留所有列

scala、apache-spark

我有一个包含3列(客户、关联、时间戳)的数据帧。我想通过查看时间戳来获取最新的customer。.groupBy("value.customer") .show() 我相信上面的代码是工作的，但试图弄清楚如何包括所有列(即。如果我理解正确的话，将它添加到groupby中将意味着我将获取客户和关联

浏览 18提问于2021-10-05得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云