使用QuantileDiscretizer的pyspark中的百分位数排名_计算MS SQL中的百分位数排名_多列的Pyspark百分位数 - 腾讯云开发者社区

pyspark、apache-spark-sql、quantile

我想知道是否可以在pyspark中使用QuantileDiscretizer转换器获得percentile_rank的结果。这样做的目的是为了避免计算整个列的percent_rank，因为它会生成以下错误： WARN WindowExec: No Partition Defined for Window operation!我遵循的方法是首先使用QuantileDiscretizer，然后规范化为0,1 from pyspar

浏览 67提问于2020-07-27得票数 1

2回答

Spark中QuantileDiscretizer与Bucketizer的区别

apache-spark、pyspark

这可能是一个新手问题，但是我不能理解在Spark2.1中使用QuantileDiscretizer比使用Bucketizer有什么特别的优势？我知道QuantileDiscretizer是一个估计器，可以处理NaN值，而Bucketizer是一个转换器，如果数据有NaN值，就会引发错误。从spark 中，下面的代码产生类似的输出from py

浏览 1提问于2017-04-13得票数 10

5回答

使用NTILE计算百分位等级？

sql-server、sql-server-2008、tsql

需要计算每个学生的百分位数排名(1-99个百分位数)，并在一次测试中取得分数。from @temp 在我看来它是

浏览 1提问于2012-03-23得票数 6

1回答

为数据列表中的每个条目计算百分位数

list、c#-4.0、percentile

lond StudentId; int Rank; } 但我需要计算的是每个学生的排名和特

浏览 10提问于2011-07-30得票数 0

回答已采纳

1回答

具有多种度量的百分位数排序

sql、sql-server-2008

我希望使用一些使用百分位数排序的指标对许多记录(ASX股票)进行排名。我使用下面的网站来计算百分位数，这对我来说很好。比方说，我想按照最高的收益，最低的债务与股本比率来对他们进行排名(我的排名可能超过5个指标)。假设我想要最高的收入有更高的重要性，比如说20% 我是否需要分别计算每个/公制的<

浏览 1提问于2018-04-12得票数 0

回答已采纳

2回答

您是否可以基于多个条件在SQL中创建百分位排名？

sql、sql-server

我试图根据客户的财务状况创建一个百分位数的排名。财务得分从0到1000。这创建了一个百分位数， PERCENT_RANK() OVER(2 Jane Doe 345 1000 但我想知道我是否可以让<e

浏览 0提问于2020-03-10得票数 0

1回答

从0到100的Dataframe百分比计算

python、pandas、dataframe、percentile

我需要计算数据帧中值的百分位数。按照其他人的建议计算百分位数的最接近方法是使用pandas.DataFrame.rank(pct=True) ()。但是，该方法不会从第0个百分位数开始：num.rank(pct=True)0 0.252 0.753 1.00 有没有更好的方法来获得这样的<

浏览 5提问于2018-04-06得票数 0

3回答

使用谷歌的PSI，Google.com和其他被大量贩运的网站能获得“快速”排名吗？

performance、performance-testing、lighthouse、pagespeed-insights、chrome-ux-report

Google将对快速排序FCP 的定义从90%更改为低于1000 of的75%。当说“基于

浏览 2提问于2019-02-12得票数 13

回答已采纳

1回答

如何在PySpark中对百分位数进行聚合？

apache-spark、pyspark、apache-spark-sql

我希望能够基于百分位数(或者更准确地说，在我的例子中是补充百分位数)进行聚合。考虑以下代码：from pyspark.sql import functions as F spark = SparkSession.builder.getOrCreate，我还想分别计算补码百分位数中val2的不同值。例如，对

浏览 22提问于2020-05-17得票数 0

回答已采纳

1回答

不在数组中的单元格的百分位排名- EXCEL

arrays、excel、rank

我有一个数字数组，我想看看如果另一个单元格包含在那个数组中，它会是多少个百分位数。我不能直接做排名函数，因为我正在测试的单元格不在数组中。还有许多单元格我也在寻找百分位数的排名。也许有一种方法可以选择要包含在Rank函数中的数组和单独的单元格？

浏览 2提问于2015-08-14得票数 1

2回答

如何计算不同时间段点数总和的百分位数排名？

php、mysql、math、codeigniter

每次授予声誉时，都会在MySQL表中创建一个新条目，其中包含user_id、奖励的操作和该组积分的值(例如，10个声誉)。同时，users表中的字段reputation_total也会更新。由于所有这些都没有参考框架，所以我想向用户显示他们在所有用户中的百分位数排名。对于总体声誉而言，这似乎很容易。假设我的user_id是1138。只需计算users表中reputation_tot

浏览 3提问于2009-06-17得票数 3

回答已采纳

1回答

COCOMO中的分析能力计算

performance

在这个评分中应该考虑的主要属性是分析和设计能力、效率和彻底性，以及沟通和合作的能力。评级不应考虑分析师的经验水平；这是用AEXP进行评级的。排名第15百分位数的分析师被评为非常低，而第95%的分析师被评为非常高。第15百分位数-非常低 75百分</em

浏览 2提问于2012-06-14得票数 1

2回答

用groupBy计算PySpark数据的百分位数

apache-spark、pyspark、apache-spark-sql、median、percentile

我正在尝试groupBy，然后计算PySpark数据的百分位数。我已经根据测试了下面的代码import pyspark.sql.functions as func 这是因为numpy版本(1.4.1)，百分位数函数是从

浏览 0提问于2018-12-14得票数 2

回答已采纳

8回答

在MS SQL中计算百分位排名

sql、sql-server、math

在MSSQL 2005中计算百分位数排名(例如，第90个百分位数或中位数分数)的最佳方法是什么？我希望能够为单列分数选择第25、中间和第75个百分位数(最好在单个记录中，这样我就可以将average、max和min组合起来)。因此，例如，结果的表输出可能是：----

浏览 6提问于2008-09-17得票数 26

1回答

在MySQL中利用累积数据计算百分位数

mysql

这些记录的百分位数排名应该是多少，是否可以运行MySQL查询来计算分数的百分位数？

浏览 8提问于2010-04-02得票数 1

2回答

创建Django下拉和“选择”作为默认选择？

django、django-models、django-forms

choices50th percentile <= other choices 我创建了Django学生模型和相关的百分位数查找模型StudentForm中创建一个自定义验证器，它将检查用户是否选择索引大于1的百分位数排序值，因为百分位表的排名列中的第一行包含"--选择

浏览 2提问于2013-08-21得票数 0

回答已采纳

1回答

在MySQL中找到条目的百分位数分数的时间复杂度是多少？

mysql、b-tree

我们有一个动态集合(每隔几分钟就会发生排名变化)。我们希望显示用户的百分位数分数。MySQL是否在索引中存储额外的信息以更快地计算？我使用的查询： SELECT COUNT(*) FROM score_table WHERE sc

浏览 2提问于2015-07-18得票数 0

回答已采纳

1回答

火花柱的十进制或其他分位数等级

pyspark

我有一个具有多个数字列的pyspark，对于每一列，我想根据每个变量计算该行的十进制或其他分位数等级。这对于熊猫来说很简单，因为我们可以为每个变量创建一个新的列，使用qcut函数为'q‘赋值0到n-1，如pd.qcut(x，q=n)中所示。怎样才能在火星雨中做到这一点？我试过以下几点，但很明显，这三分之一之间的断点并不是独一无二的。我想得到分配数据的1/3的1/3，下一个1/

浏览 0提问于2017-09-26得票数 6

回答已采纳

1回答

为列表中的每个值计算百分位分数

java、statistics、percentile、apache-commons-math

我一直在寻找一种方法来计算给定列表中每个值的百分位数排名，但到目前为止还没有成功。 org.apache.commons.math3提供了一种从值列表中获取pth百分位数的方法，但我想要的是相反的。我希望对列表中的每个值都有一个排名。有没有人知道Apache commons数学中有一个库或一种方法来实现这一点？例如:给定值列表{1,2,3,4,5

浏览 0提问于2013-12-10得票数 6

1回答

用PostgreSQL计算第50百分位数

sql、database、postgresql、oop、percentile

我有一个包含以下格式的10万行的表：1236年1287年1284年-- 01 -- 155.21386我需要计算按等级分组的第50百分位数，这意味着我需要获得这样的结果：00，…02 -… 每个秩的第50个百分</em

浏览 3提问于2018-05-24得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云