Spark:减少双精度_如何修复此错误？必需的双精度，双精度；发现双精度；_python双精度 - 腾讯云开发者社区

、

我有一个RDD类型： dataset :org.apache.spark.rdd.RDD[(String, Double)] = MapPartitionRDD[26] 它等同于(Pedro, 0.0833), (Hello, 0.001828) ... 我想求和所有的值，0.0833+0.001828..，但是我找不到一个合适的解决方案。

浏览 4提问于2016-03-15得票数 4

回答已采纳

1回答

与RDD和DataFrame不同的浮点精度

、、、

我将RDD更改为DataFrame，并将结果与我使用read.csv导入的另一个DataFrame进行了比较，但浮点精度与这两种方法并不相同。谢谢你的帮助。我使用的数据来自。 from pyspark.sql import Row from pyspark.sql.types import * RDD方法 orders = sc.textFile("retail_db/orders") order_items = sc.textFile('retail_db/order_items') orders_comp = orders.filter(lambda li

浏览 0提问于2018-01-26得票数 5

回答已采纳

2回答

尝试使用Apache spark Java API透视表

、、、

浏览 1提问于2015-08-06得票数 0

1回答

有可能解决MATLAB和Python之间的滤波器舍入误差吗？

、

我正在尝试将一些Matlab代码复制到Python中，目前我正在开发一个单元测试来检查等价性。在下面的代码中，我得到了E-11顺序的错误，这表明它可能是一个舍入错误。 Matlab代码： width = 200; x = 1:100000; b = ones(width,1)/width; y = filter(b, 1, x); save('mat_data') Python代码： import numpy as np from scipy.io import loadmat from scipy import signal def plot_fig(x, y=None):

浏览 21提问于2018-12-13得票数 1

1回答

为什么即使使用-use_fast_math标志，使用计算功能1.3的简单RGB到Lab转换也要比1.0慢得多？

、、、

我使用的GT 740米(CC 3.5)，我有一个RGB到实验室转换内核。使用计算能力1.0 - 1.2，整个内核在924微秒内执行，但是使用1.3或更高的计算能力(最多3.5)，内核在大约3ms内执行。根据维基百科的表格，我发现它可能是由双精度浮点操作引起的，所以我使用了-use_fast_math标志，但是没有帮助。演出成功的原因是什么？整个源代码可以在中看到。

浏览 2提问于2015-03-31得票数 0

回答已采纳

1回答

使用spark / java的mod函数

、、、

我有一个数据帧 +--------------+-----------------+ |tracking_time | current_time | +--------------+-----------------+ | 1582037407 |1594110202934 | | 1582037587 |1594110202934 | +--------------+-----------------+ 我想要计算tracking_time和current_time之间的日期差，就像这个演算。 lon

浏览 19提问于2020-07-07得票数 0

回答已采纳

2回答

Spark将单列转换为数组

、、

如何将spark 2.0.1中的单个列转换为数组？ +---+-----+ | id| dist| +---+-----+ |1.0|2.0| |2.0|4.0| |3.0|6.0| |4.0|8.0| +---+-----+ 应返回Array(1.0, 2.0, 3.0, 4.0) 一个 import scala.collection.JavaConverters._ df.select("id").collectAsList.asScala.toArray 失败，错误为 java.lang.RuntimeException: Unsupported array type

浏览 0提问于2016-11-10得票数 3

回答已采纳

1回答

如何在Apache Spark中创建空RowMatrix

有没有办法在Apache Spark中创建一个空的RowMatrix。我尝试过以下几种方法 double[] empty = new double[0]; Vector vector = Vectors.dense(empty); 但是我不能从向量创建向量的JavaRDD，所以我可以从它创建RowMatrix。提前谢谢。

浏览 4提问于2015-09-25得票数 0

1回答

Spark和分类字符串变量

、、、

我正在尝试理解spark.ml是如何处理字符串类别独立变量的。我知道在Spark中，我必须使用将字符串转换为双精度。例如，"a"/"b"/"c“=> 0.0/1.0/2.0。但我真正想要避免的是不得不在这一列的doubles上使用。这似乎使管道变得不必要地混乱。尤其是因为Spark知道数据是绝对的。希望下面的示例代码能让我的问题更清晰。 import org.apache.spark.ml.feature.StringIndexer import org.apache.spark.ml.feature.VectorAssembler impor

浏览 1提问于2016-01-29得票数 2

1回答

在JavaPairDStream中添加tuple2值

、、

我有一个带有值的JavaPairDStream<String, Tuple2<Double, Double>>， (ADBE,(1.1,1.2)) (MSFT,(3.2,1.2)) 我想要将元组值相加在一起，并转换为JavaPairDStream<String,Double>作为 (ADBE,(2.3)) (MSFT,(4.4)) 如何在Java Spark streaming中实现这一点？

浏览 12提问于2019-02-16得票数 0

1回答

Scala使用ML查找Dataframe中的异常值

、

浏览 1提问于2018-01-05得票数 0

3回答

如何转换为双精度与2精度-字符串后面的点？

、、、

我想把这个字符串：0.55000000000000004转换成这个双精度的：0.55。如何做到这一点？

浏览 0提问于2011-02-15得票数 26

回答已采纳

2回答

OpenCL粒子系统中浮点精度不足的处理

、、

我正在编写一个基于OpenCL的粒子系统，以加速大规模网络的可视化。本质上，这是一个两阶段问题，其中第一阶段将负重力应用于每个粒子(典型的n-bodies问题)，因此它们都相互排斥，然后第二阶段基于粒子之间的边缘(或弹簧)吸引粒子。在重力算法的每次迭代中，每个粒子的位置(表示为一对浮点)受到彼此粒子之间距离的影响(经典物理模型，无阻力，保持简单)。在一种情况下，一个人有一个完全间隔的方形粒子阵列，重力的应用应该导致X和Y轴的对称性。这在重力应用开始时是正确的，但随着时间的推移，将大量浮点数相加所固有的精度不足会导致较小的非均匀偏差。这反过来在整个n体系统中传播，并发生对称性损失。避免这种

浏览 8提问于2012-01-25得票数 2

回答已采纳

1回答

在星火中精确的分位数代替还是近似的？

、、

为了计算分位数，我在任何approxQuantile或Dataframe of Spark中使用从stat()函数中访问的Dataset方法。它近似于的方式。 @Test @DisplayName("Quantiles de la population communale française") public void quantiles() throws TechniqueException { Dataset<Row> populationCommunes = individus().selectExpr("populationTotale"

浏览 1提问于2019-09-23得票数 2

回答已采纳

1回答

Spark double类型加/减错误

这必须是一个已知的问题，但我找不到任何关于它的东西： spark.sql(""" select 48.85 + 6.95 + -55.80 x, '48.85' + '6.95' + '-55.80' y, cast('48.85' as double) + cast('6.95' as double) + cast('-55.80' as double) z """).show() +----+---------

浏览 15提问于2020-08-09得票数 0

1回答

类型“int”不是“function result”的类型“double”的子类型

、

我是第一次接触flutter。卡在下面的问题中。 double weight = 0; weightIncrement() { setState(() { weight += 1; }); } weightDecrement() { setState(() { weight -= 1; }); } Text( cardType == CardType.age ? "$age".toString() : "$weight".toString()) 在一些按

浏览 22提问于2020-01-12得票数 0

回答已采纳

1回答

如何将双精度浮点数写入jdbc上的postgres中

、、

我正在尝试从Spark向Postgres写入数据；我有一个DataFrame，它由一些字符串、一些浮点值和一些宽度不同的整数组成，我发现如果我不传递一个模式，我就会得到一个如下所示的错误： User class threw exception: java.lang.IllegalArgumentException: Unsupported type in postgresql: ByteType at org.apache.spark.sql.jdbc.PostgresDialect$.getJDBCType(PostgresDialect.scala:83) 如果我确实通过了一个模式，我发

浏览 1提问于2019-08-14得票数 0

2回答

基本值比较评估在Lua中不起作用

、

我正在尝试比较两个值，它们看起来相等，但仍被评估为不同的。我做错了什么？有什么想法吗？我添加了tonumber()，以确保不会在某个地方将一个字符串转换为字符串。 --Check to see if the current health and the target health differ if tonumber( characterStatus.current[ statusColor .. "Health" ] ) ~= tonumber( characterStatus.target[ statusColor .. "Health" ] ) then

浏览 1提问于2014-01-04得票数 0

2回答

设置Spark大小:在10^9+循环中进行长到双倍的铸造，真的不好吗？

、、、、

(编辑:看看这个问题是从哪里开始的，结果真的更好了。)当通过SparkContext.parallelize()设置RDD大小与RDD的实际大小限制时，它最终成为一个很好的资源。还发现了一些在用户文档中找不到的并行化()参数。尤其是零323的评论和他被接受的答案。在阳光下没有什么新鲜事，但我发现这个问题已经问过了.问题在于，在Java的大型for循环中运行强制转换可能是多么错误/不明智/不恰当。我希望在将Arraylist传递给SparkContext.parallelize()方法之前运行一个for循环来初始化它。我发现将未初始化的数组传递给Spark可能会导致空集合错误。我见过很多关

浏览 7提问于2015-12-20得票数 2

回答已采纳

1回答

无法在Scala中为列表建立索引，因为“java.util.List[Ett... not take parameters error”

、

我有一个使用此语法收集的列表。 val cutoff = df.withColumn("rank", dense_rank() over bydf).filter("rank=5").select("amount").collectAsList() [[10.5]] 当我试图索引列表截止值以提取值10.5时，我得到了这个错误： Error:(38, 17) java.util.List[org.apache.spark.sql.Row] does not take parameters 我如何解决这个问题并从这个嵌套列表中提取10.5

浏览 0提问于2020-08-31得票数 0

2回答

Spark Dataframe为浮点数提供不同级别的精度

、、、、

当我们创建spark数据帧时，我们将数据帧中的数据发送到Kudu和Kafka(依次被提取并进入S3) 然而，一旦数据帧被插入，我们在Kudu中看到的精度是1e-15 现在，如果我使用相同的数据帧并将其转换为Kafka可以使用的格式 override def getKafkaDataFrame(df: DataFrame) : DataFrame = { df.withColumn("key", to_json(struct(df.col(PK1), df.col(PK2))) .withColumn("value", to_json(struct(

浏览 51提问于2020-02-07得票数 0

1回答

为什么UserDefinedAggregateFunction中的MutableAggregationBuffer需要bufferSchema？

、、、、

我正在研究在spark中实现UserDefinedAggregateFunction，并且发现需要一个bufferSchema。我知道如何创建它，但我的问题是为什么它需要bufferSchema？它不仅需要一个大小(聚合中使用的元素数量)、一个inputSchema和一个dataType？bufferSchema不是在sql的中间步骤中将其限制为UserDefinedTypes吗？

浏览 13提问于2019-08-14得票数 2

1回答

与fftw3相比，2D CuFFT逆变换是错误的

、、、

我正在尝试产生一些FFT数学，特别是做两个2D正向变换，相乘，然后进行逆变换。在进行逆变换之前，一切都很顺利。我已经用fftw3做过了，但在CuFFT中有些地方出错了。大多数值是相似的，但也有一些是错误的，这对未来的数学具有重要意义。这段代码有什么问题？ std::vector<complex> conv2dCUDA(complex *ui_anomaly, double *ds2, complex *u0, int anx, int any, double factor) { cufftComplex *b1, *b2; int size = 2 * anx *

浏览 2提问于2019-08-28得票数 0

4回答

将整数乘以浮点数--是否需要"F“？

这是： int i = 100 * 0.6; 比这更不正确？ int i = 100 * (0.6F); 我为这样一个简单的问题道歉，但我还没有记住所有的数据类型提升规则，我甚至不知道如何验证这一点。

浏览 3提问于2013-12-18得票数 9

回答已采纳

1回答

Apache火花MLLib -运行带IDF向量的KMeans . Java堆空间

、、、、

我正在尝试从(大型)文本文档集合()上运行一个KMeans在MLLib上。文档通过Lucene分析器发送，稀疏向量由HashingTF.transform()函数创建。无论我使用的并行化程度如何(通过合并函数)，KMeans.train总是在下面返回一个OutOfMemory异常。对如何解决这个问题有什么想法吗？ Exception in thread "main" java.lang.OutOfMemoryError: Java heap space at scala.reflect.ManifestFactory$$anon$12.newArray(Manifest.sca

浏览 0提问于2014-10-19得票数 4

2回答

如何统计经过DCT压缩后的图像位数？

、、

我需要知道如何枚举图像中的位数(在MATLAB中)在对图像应用DCT算法(压缩图像)之后，我需要查看应用DCT算法后图像的位数。因为我将它应用于512x512的图像，但在压缩前后我得到了相同的位数，所以我想知道是否有Matlab代码来计算图像的位数。

浏览 2提问于2015-01-05得票数 0

1回答

scala spark 1.5.1中的高斯混合模型权重总是均匀分布的

、、

我为我的算法实现了mllib中提供的默认gmm模型。我反复发现，无论我启动多少个集群，最终得到的权重总是相等地等待。权重不调整有什么特别的原因吗？我的实现是错误的吗？ import org.apache.spark.mllib.clustering.GaussianMixture import org.apache.spark.mllib.clustering.GaussianMixtureModel import org.apache.spark.mllib.linalg.Vectors import org.apache.spark.ml.feature.VectorAssembler i

浏览 1提问于2016-03-23得票数 1

1回答

对pyspark dataframe函数的Sql查询

、

我想使用pyspark DataFrame函数而不是SQL query来复制下面的代码。 spark.sql("select date from walmart_stock order by high desc limit 1").show() Link of dataset

浏览 53提问于2021-11-23得票数 0

回答已采纳

2回答

检查列数据类型并仅对Spark SQL中的Integer和Decimal执行SQL

、、、

我正在尝试检查来自输入Parquet文件的列的数据类型，如果数据类型是Integer或Decimal，则运行Spark SQL。 //get Array of structfields val datatypes = parquetRDD_subset.schema.fields //Check datatype of column for (val_datatype <- datatypes) if (val_datatype.dataType.typeName == "integer" || val_datatype.dataType.typeName.co

浏览 1提问于2017-07-26得票数 3

回答已采纳

2回答

火花R -火花R中的“因子()”是什么？

、、

从R中，我们得到了函数factors()。我想以并行的方式使用这个函数，用Spark。我的Spark版本是1.6.2，我在中找不到相应的版本。我以为我可以用一张地图来做这件事，但我不确定我是否理解，而且应该有一个更简单的方法。所以简单地说：factors() R中的是什么意思?

浏览 4提问于2016-07-19得票数 3

回答已采纳

1回答

串行通信打印问题

、、、

我正在研究两个MCU之间的串行通信，特别是生成假GPS数据的teensy(类似于Arduino)。我已经能够写入GPS数据，并从其他MCU读取很好，但如果你仔细观察，打印的数据有一些模糊。最后的值以某种方式改变了，我不明白为什么这是因为sprintf命令或将浮点数转换为字符串或其他原因？如果能帮上忙，我们将不胜感激。下面是串行终端的工作代码和代码片段。谢谢 float lat = 37.4980608; char str1[21]; void setup() { Serial3.begin(115200); Serial.begin(115200); // Config ser

浏览 0提问于2019-05-31得票数 0

1回答

如何通过网络高效地发送受约束的双精度值

、、、

我是网络编程的新手。我需要通过网络发送由doubles组成的纬度经度对。我对两端都进行了编码，所以我可以使用我喜欢的任何方法。目前。我将两者直接转换为字节，并发送完整的16个字节。我想知道的是，如果将每个值除以最大可能值(分别为90和180 )，然后乘以Int32.MaxValue，然后在发送之前转换为int，可能会更好。显然，这会将发送的数据减半，但我无法计算出我会失去多大的精度。有人知道怎么计算这个吗？

浏览 19提问于2021-10-30得票数 0

回答已采纳

2回答

将dataframe中的字符串数据转换为双精度

、、

我有一个包含双type.When的csv文件，我加载到一个数据帧中，我收到这个消息，告诉我类型字符串是java.lang.String，不能转换为java.lang.Double，尽管我的数据是numeric.How，我是否应该修改代码，从这个包含双type.how的csv文件中获得数据帧？ import org.apache.spark.sql._ import org.apache.spark.sql.functions._ import org.apache.spark.sql.SparkSession import org.apache.spark.sql.types.{ArrayTy

浏览 2提问于2017-01-02得票数 4

8回答

什么时候使用浮点数?什么时候使用双

、、、

通常，在我的编程经验中，我需要决定是使用float还是double作为实数。有时我选择float，有时我选择double，但实际上这感觉更主观。如果我要面对为我的决定辩护，我可能不会给出合理的理由。什么时候使用float，什么时候使用double？您是否总是使用double，只有在内存约束存在时才使用float？还是您总是使用float，除非精度要求要求您使用double？float和double在基本算法的计算复杂度上是否存在实质性的差异？使用float或double的利弊是什么？你用过long double吗？

浏览 0提问于2013-02-28得票数 228

回答已采纳

2回答

Crystal Reports:小数参数字段在页脚部分显示为整数

、、、、

我对在页脚部分显示十进制值有一个问题。实际上，我使用一个参数字段来显示子报表的页脚部分的某个统计数据。当我把它放在细节部分时，小数显示正确。有没有人遇到过同样的问题？ Example: 10 250,00 instead of 10 250,74: in the details section the correct value is shown.

浏览 2提问于2013-03-26得票数 0

1回答

有没有办法减少小数点后的位数？

、

我的android应用程序出了点小问题。我想用手机的GPS显示当前的纬度和经度。我能够获得手机的当前坐标，但它显示为双精度值与…我认为小数点后有6-8位数字。有没有办法减少小数点后的位数？下面是我的代码： public class Localisation extends Activity implements LocationListener{ protected LocationManager locationManager; protected LocationListener locationListener; protected Context context; private

浏览 3提问于2014-01-17得票数 0

4回答

使用英特尔11.1编译器在fortran 90中实现双精度

、、

我有一个很大的代码，用fortran写的，用来建立和迭代求解非线性偏微分方程组。我需要所有的变量都是双精度的。在我为代码编写的附加模块中，我将所有变量声明为双精度类型，但我的模块仍然使用旧源代码中声明为real类型的变量。所以我的问题是，在fortran中，单精度变量乘以双精度变量会发生什么？如果用于存储值的变量被声明为双精度，那么结果是双精度吗？如果一个双精度的值乘以一个在末尾没有"D0“的常量，该怎么办？我是否可以在英特尔11.1中设置一个编译器选项，使所有实数/双精度/常量成为双精度？

浏览 0提问于2011-03-11得票数 3

5回答

为什么Android API中有这么多浮点数？

、、

Java中默认的浮点类型是double。如果您将像2.5这样的常量硬编码到您的程序中，Java会自动将其设置为双精度。当你在浮点数或整型数上进行可能从更高精度中受益的操作时，该类型被‘提升’为双精度型。但在Android API中，从音量到矩形坐标，一切似乎都是浮动的。在大多数绘图中有一个叫做RectF的结构；F代表浮点数。对于经常将提升的替身转换回(float)的程序员来说，这真的是一种痛苦。难道我们不都同意Java代码已经足够凌乱和冗长了吗？通常，数学协处理器和加速器在Java中更喜欢double，因为它对应于内部类型之一。是不是Android的Dalvik VM出于某种原因更喜欢浮动

浏览 1提问于2010-03-19得票数 16

回答已采纳

1回答

在Fortran中10.D00是什么意思？

我必须从Fortran转换一些代码，所以我不知道这个语句是什么意思： var1 = 10.D00 有人能给我解释一下这是什么意思吗？

浏览 1提问于2011-12-09得票数 10

回答已采纳

1回答

matlab双精度混淆

、、

默认情况下，Matlab将输入设置为双精度，因此如果输入a=1/3，则变量将以双精度转换。 >> a=1/3 a =0.3333 >> whos('a') a 1x1 8 double 但是，当我随后输入vpa(a,100)时，我得到： ans=0.3333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333 我的问题是既然a是双精度的，只有8

浏览 4提问于2016-07-06得票数 2

回答已采纳

1回答

Scala函数仅过滤数字字段

、

我有以下功能： def isAllDigits(x: String) = x forall Character.isDigit def filterNum(x: (Int, String)) : Boolean = { accumNum.add(1) if(isAllDigits(x._2)) false else true } 我正在传递键/值，并且我想检查这些值是否为数值。出于某种原因，它正在被过滤掉： res10: Array[(Int, String)] = Array((1,18964), (2,39612), (3,1), (4,"&#

浏览 1提问于2015-06-05得票数 0

3回答

Java如何表示非常小的小数？

、

我开发了一个应用程序来检测垃圾邮件，使用朴素贝叶斯分类器。在估计某些概率时，结果是非常小的数，因此java返回零(0.0)。变量被声明为浮点数。Java如何处理6.9e-232这样的非常小的数字？

浏览 2提问于2014-02-07得票数 0

回答已采纳

1回答

Fortran实数表达式中的“d+0”后缀

、、、

有没有人知道后缀"d+0“在下面给M1、M2和M4的作业中意味着什么，或者在网上或书上有什么很可能找到这些信息的资源吗？ subroutine plot( t, x, p, q, nga, nt, wron, & ngq, gq, ngaq1, ngaq2, gaq, rwh, iwh ) implicit none integer*4 nga, nt, ngq, ngaq1, ngaq2, iwh(*) real*8 t, x(*), p(*), q(*), wron

浏览 2提问于2009-05-27得票数 3

回答已采纳

1回答

将字符串与atof一起转换为浮动会在末尾产生非常小的十进制数。

、、、

我有一个字符串，它存储一个十进制值，例如"0.10“。我想把它转换成浮子。但是当我用atof来做它的时候，我得到的数字并不是它应该的值。我正在编写一些复杂的算法，涉及到对十进制值的一些数字处理，所以这将使我的最终结果落空。下面是一些简单的代码，描述了我遇到的问题。在这里，我只需将一个十进制值放入字符串中，用atof将其转换为float，然后用cout打印出来。我得到的结果显示atof是在最后的值中添加一个微小的十进制数。 #include <iostream> #include <string> #include <cstdlib> using n

浏览 5提问于2014-05-29得票数 0

1回答

System.Array.SetValue -对象不能存储在此类型的数组中

、、

我有问题，请查看此链接以了解更多信息：我使用的组件名为Spring Framework .Net，它在使用double[]数组初始化double类型的System.Array时遇到问题，在调用参数之前需要使用该数组。价值的图像，我已经通过他们的GitHub问题部分张贴，我有源代码。我能做些什么来解决这个问题？ using System; using System.Collections.Generic; public class MyClass { public static void RunSnippet() { int argCount = 1;

浏览 1提问于2013-12-30得票数 1

4回答

以java分数表示的数学计算

我正在尝试实现一个基本的计算。这个程序接受2个数字，10除以5，然后给出答案2，如果有任何更小的值除以更大的值，它会得到0，我可以得到分数形式的答案吗？示例8除以100等于8/100而不是0。 public class numtheory { public static void main(String[] args) { int n1; int n2; Scanner scan = new Scanner(System. in ); System.out.println("input numbe

浏览 0提问于2013-04-26得票数 0

2回答

C++双精度不能等于两个整型除法

、、

我有点纠结于这个问题： int a = 5, b = 2; double c = a / b; cout << c; 这将输出以下内容： 2 为什么？我可以使用以下命令来跳过这一步： double aa = a, bb = b; c = aa / bb; 这将输出以下内容： 2.5 救命！:(

浏览 0提问于2016-12-25得票数 0

2回答

如何将scala向量转换为spark ML向量？

、、、

我有一个scala.collection.immutable.Vector类型的向量，我想把它转换成org.apache.spark.ml.linalg.Vector类型的向量。例如，我想要如下所示的内容； import org.apache.spark.ml.linalg.Vectors val scalaVec = Vector(1,2,3) val sparkVec = Vectors.dense(scalaVec) 注意，我可以简单地输入val sparkVec = Vectors.dense(1,2,3)，但我想转换现有的scala集合向量。我想这样做是为了将这些DenseVect

浏览 13提问于2017-02-24得票数 2

回答已采纳

1回答

3d卷积张量流float64

、、

我正在Tensorflow上做一些卷积计算，在双精度数字上得到了一些奇怪的错误。由于精度问题，我需要在float64中计算这些张量。 conv3d在float32上运行得很好，但在双精度下，它只能在中央处理器上运行，而对于图形处理器，错误告诉我 InvalidArgumentError (see above for traceback): Cannot assign a device for operation 'Conv3D': Could not satisfy explicit device specification '/device:GPU:0' b

浏览 8提问于2018-07-18得票数 1

1回答