如何将带有小数的spark DataFrame转换为具有相同精度的BigDecimal的数据集？

要将带有小数的Spark DataFrame转换为具有相同精度的BigDecimal的数据集，可以按照以下步骤进行操作：

导入必要的库和类：

import org.apache.spark.sql.functions._
import java.math.BigDecimal

定义一个UDF（用户自定义函数）来将Double类型的小数转换为BigDecimal类型：

val toBigDecimal = udf((value: Double) => BigDecimal.valueOf(value))

使用UDF将DataFrame中的小数列转换为BigDecimal类型的列：

val transformedDF = originalDF.withColumn("decimalColumn", toBigDecimal(col("doubleColumn")))

其中，originalDF是原始的DataFrame，doubleColumn是包含小数的列，decimalColumn是转换后的BigDecimal类型的列。

如果需要保留小数的精度，可以使用setScale方法设置BigDecimal的精度：

val transformedDF = originalDF.withColumn("decimalColumn", toBigDecimal(col("doubleColumn")).setScale(scale, BigDecimal.ROUND_HALF_UP))

其中，scale是要保留的小数位数，BigDecimal.ROUND_HALF_UP表示四舍五入。

最后，如果需要将DataFrame转换为数据集（Dataset），可以使用.as方法：

val transformedDS = transformedDF.as[CaseClass]

其中，CaseClass是自定义的数据集类，用于定义转换后的数据集的结构。

这样，就可以将带有小数的Spark DataFrame转换为具有相同精度的BigDecimal的数据集。

注意：以上代码示例是使用Scala语言编写的，如果使用其他编程语言，可以根据语言特性进行相应的调整。

如何将带有小数的spark DataFrame转换为具有相同精度的BigDecimal的数据集？

、、、

如何创建具有给定精度的BigDecimal的spark数据集？请参见spark shell中的以下示例。您将看到，我可以创建具有所需BigDecimal精度的DataFrame，但无法将其转换为Dataset。"))).map(a => Row.fromSeq(a)).asJava, schem

浏览 73提问于2019-11-14得票数 2

回答已采纳

6回答

星火箱类-十进制型编码器错误“不能从十进制转换”。

、、

我从MySQL/MariaDB中提取数据，在创建Dataset期间，数据类型发生错误线程"main“org.apache.spark.sql.AnalysisException中的异常:不能从十进制(30，6)到十进制(38，18)，因为它可能截断目标对象的类型路径是：- AMOUNT (类："org.apache.spark.sql.types.Decimal"，名称：”org.apache.spark.sql.types.

浏览 16提问于2016-12-03得票数 13

回答已采纳

1回答

大量大小数类型在查询时为null

我有一个简单的火花代码如下所示，我想查询大量的大小数类型 test("SparkTest 0458") { import spark.implicits._ (new java.math.BigDecima

浏览 16提问于2019-02-28得票数 1

回答已采纳

1回答

星星之火:数据集中的圆到十进制

、、、

我有一个类似于下面的数据集，在DataFrame的情况下，我可以轻松地舍入小数点的2位，但我只是想知道在使用类型化数据集时是否有更简单的方法来完成同样的操作。下面是我的代码片段：|ALBIBC|1950363|EUR|747098198111.23| +------+

浏览 3提问于2018-05-07得票数 1

回答已采纳

2回答

如何在将BigDecimal集合加载为Spark数据集时在架构中指定Spark小数位数和精度

、、、、

我想要获取的数据集是一个集合，其中包含一个名为Output的对应case类，定义如下： case class Output(time: Long, pubKeyId: Long, value: BigDecimal这将为value属性生成一个随机的比例，并且其value溢出随机获得的比例的任何文档在结果数据集中都会缺少value属性。这显然不是我们想要的。[Output](sc, rc).toDS[Output] 但

浏览 105提问于2020-08-03得票数 0

回答已采纳

2回答

控制ActiveRecord创建参数类型和特征

、、

我有一个带有列amount的模型，它在数据库中是一个小数。我希望确保在实例化此模型时，只给出具有一定精度的BigDecimal。我已经编写了一些规范来测试在提供Float时的场景，然后我有一个before_create回调，如果它不是BigDecimal，就会抛出一个错误。但是，当值到达before_create回调时，Rails已经将其转换为BigDecimal。我想这很好，而且

浏览 0提问于2013-01-09得票数 1

回答已采纳

4回答

在Java中如何在不损失精度的情况下将字符串转换为双精度？

String("12.00");System.out.println(dble);但是我想要12.00的精度请告诉我在string类中不使用format()方法的正确方法

浏览 0提问于2013-03-09得票数 5

回答已采纳

1回答

如何对作为字符串传入的值执行assertEquals操作，该值可以是双精度或浮点型

、

问题是，我必须对我们的测试框架从应用程序接口中提取的内容进行assert equals操作，并且没有有效的方法来比较junit.Assert的浮点数/双精度数和字符串。我似乎能够将传入的字符串转换为浮点型/双精度型，但然后期望值和实际值必须具有相同的小数位数，否则断言将失败。当我将期望值转换为两个小数时，似乎总是由Decima

浏览 31提问于2020-07-25得票数 1

回答已采纳

2回答

Ruby BigDecimal和MySQL小数精度不匹配

、、、、

下面是我用来创建表的迁移的一部分(请注意具有给定精度的小数值)： t.decimal :something, :precision => 13我使用BigDecimal进行一些计算，得到的my_value是一个精度很高的数字(大于迁移中指定的数字)。我将对象存储在数据库中，并再次检索它。将原始值与数据</e

浏览 2提问于2011-01-21得票数 0

回答已采纳

3回答

在不丢失nanos的情况下将java.sql.Timestamp转换为javax.xml.datatype.XMLGregorianCalendar

将java.sql.Timestamp转换为javax.xml.datatype.XMLGregorianCalendar最简洁的方法是什么由于XMLGregorianCalendar具有小数秒的BigDecimal精度，因此精度没有损失，但是我不确定应该在XMLGregorianCalendar对象上设置哪个时区，因为java.sql.Timestamp是独立于时区的。在上有一个答案，所以我可以将我的Timest

浏览 2提问于2013-11-04得票数 1

1回答

火花中的bigint的兼容数据类型是什么，我们如何将bigint转换为火花兼容的数据类型？

、、、

我正在尝试使用Spark将数据从greenplum移动到HDFS。我可以从源表中成功地读取数据，而数据数据的火花推断模式(格林梅利表)是： je_header_id: long (nullable = true)java.lang.RuntimeException: java.math.BigDecimal is not a v

浏览 1提问于2019-02-11得票数 3

1回答

SparkSQL函数需要类型Decimal

、、、

我设计了以下函数来处理任何数值类型的数组：// Registersused in SQL statements.但是想要传递一个类型为float的数组

浏览 3提问于2016-03-15得票数 3

回答已采纳

3回答

正确的顺序是什么？是圆的->铸还是铸->圆？

、

当我试着周旋时，正确的顺序应该是什么？

浏览 2提问于2018-06-13得票数 2

回答已采纳

3回答

ClassCastException和不兼容

、

在我记得的一个方法中，在具有以下代码的行上抛出了一个错误。java.lang.ClassCastException: java.math.BigDecimal cannot be cast to java.lang.IntegerInteger count= (Integer) result[1];Integer count = ((BigDecimal) result[1]).intValue(); 错误已消失。但我是如何在新项目中获得相同代

浏览 1提问于2014-02-13得票数 1

2回答

Spark从多个列表/数组创建数据帧

、、

因此，我在Spark(scala)中有两个列表。它们都包含相同数量的值。第一个列表a包含所有字符串，第二个列表b包含所有长字符串。String] = List("a", "b", "c", "d") b: List[Long] = List(17625182, 17625182, 1059731078, 100) 我还有一个定义如下的模式StructField("check_name", StringType, true),

浏览 11提问于2021-03-15得票数 0

回答已采纳

2回答

使用Python将Dask Dataframe转换为Spark dataframe

、、、、

我想将Dask Dataframe转换为Spark Dataframe。让我们考虑这个例子：dask_df = dd.read_csv("file_name.csv") spark_df = spark_session.createDataFrame(dask_df) 但这是行不通的。

浏览 18提问于2021-02-25得票数 0

7回答

在Java中将双精度型转换为浮点型

、、

我面临着一个与将double转换为float相关的问题。实际上，我在数据库中存储了一个浮点类型23423424666767，但是当我们在下面的代码getInfoValueNumeric()中从数据库中获取数据时，它是double类型。我们得到的值是2.3423424666767E13形式的。那么，我们如何获得像23423424666767这样的float格式数据呢 2.3423424666767E13 to 2342342466676

浏览 510提问于2015-09-29得票数 94

回答已采纳

3回答

c#将字符串转换为双精度损失

结果是9.2233720368547758E+18，它不是完全相同的数字。如何在不损失精度的情况下将字符串转换为双精度？

浏览 2提问于2012-01-16得票数 4

回答已采纳

2回答

SQL Server小数部分不对结果进行舍入

、

我尝试了下面的乘法和除法，并期望四舍五入得到相同的结果。这两个操作的结果类型都是Decimal(38,6)，我想知道为什么在除法的情况下结果不会四舍五入？乘法和除法的结果应该按照下面的链接进行四舍五入 select cast(1.225114854 as decimal(38, 9)) * cast(1.000000000 as decimal(28,

浏览 1提问于2020-02-28得票数 1

5回答

JPA将Java双精度值映射到SQL数字列

、、

对于不能更改的表，我有以下SQL定义 id NUMBER NOT NULLmax NUMBER(10), ....JPA的类定义如下@Table(namereturn min; this.min =

浏览 0提问于2012-04-05得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何将带有小数的spark DataFrame转换为具有相同精度的BigDecimal的数据集？

相关·内容

如何将带有小数的spark DataFrame转换为具有相同精度的BigDecimal的数据集？

星火箱类-十进制型编码器错误“不能从十进制转换”。

大量大小数类型在查询时为null

星星之火:数据集中的圆到十进制

如何在将BigDecimal集合加载为Spark数据集时在架构中指定Spark小数位数和精度

控制ActiveRecord创建参数类型和特征

在Java中如何在不损失精度的情况下将字符串转换为双精度？

如何对作为字符串传入的值执行assertEquals操作，该值可以是双精度或浮点型

Ruby BigDecimal和MySQL小数精度不匹配

在不丢失nanos的情况下将java.sql.Timestamp转换为javax.xml.datatype.XMLGregorianCalendar

火花中的bigint的兼容数据类型是什么，我们如何将bigint转换为火花兼容的数据类型？

SparkSQL函数需要类型Decimal

正确的顺序是什么？是圆的->铸还是铸->圆？

ClassCastException和不兼容

Spark从多个列表/数组创建数据帧

使用Python将Dask Dataframe转换为Spark dataframe

在Java中将双精度型转换为浮点型

c#将字符串转换为双精度损失

SQL Server小数部分不对结果进行舍入

JPA将Java双精度值映射到SQL数字列

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐