在R中是否有等效(或更快)版本的numpy.binCount，用于基于多个bin求和？

在R中，没有直接与numpy.binCount完全等效的函数，但你可以使用table函数结合其他函数来实现类似的功能。如果你需要基于多个bin求和，可以考虑使用cut函数将数据分到不同的bin中，然后使用aggregate或tapply函数进行求和。

以下是一个示例，展示如何在R中实现类似numpy.binCount的功能，并基于多个bin求和：

# 生成示例数据
data <- rnorm(100, mean = 50, sd = 10)

# 定义bin的边界
bins <- c(0, 30, 50, 70, 100)

# 将数据分到不同的bin中
data_binned <- cut(data, breaks = bins, right = FALSE)

# 计算每个bin中的数据点数量
bin_counts <- table(data_binned)
print(bin_counts)

# 如果你需要基于多个bin求和，可以使用aggregate或tapply
# 假设我们有一个与data相同长度的向量values，我们想基于data_binned对values求和
values <- runif(100, min = 1, max = 100)
sum_by_bin <- aggregate(values ~ data_binned, FUN = sum)
print(sum_by_bin)

在这个示例中，我们首先生成了一些正态分布的随机数据，然后定义了bin的边界。使用cut函数将数据分到不同的bin中，接着使用table函数计算每个bin中的数据点数量。最后，我们使用aggregate函数基于分箱结果对另一个向量values进行求和。

这种方法的优点是可以灵活地定义bin的边界，并且可以很容易地扩展到基于多个bin的其他聚合操作。

如果你需要更高的性能，特别是在处理大型数据集时，可以考虑使用R的data.table包，它提供了高效的数据操作功能。以下是使用data.table的示例：

library(data.table)

# 将数据转换为data.table
dt <- data.table(data = data, values = values)

# 定义bin的边界
bins <- c(0, 30, 50, 70, 100)

# 将数据分到不同的bin中，并计算每个bin中的数据点数量和values的和
dt[, bin := cut(data, breaks = bins, right = FALSE)]
result <- dt[, .(count = .N, sum_values = sum(values)), by = bin]
print(result)

在这个示例中，我们使用data.table包来高效地处理数据。通过cut函数将数据分到不同的bin中，然后使用by参数对分箱结果进行分组，并计算每个bin中的数据点数量和values的和。

这种方法在处理大型数据集时通常比纯R的方法更快。

参考链接：

cut函数：https://stat.ethz.ch/R-manual/R-devel/library/base/html/cut.html
table函数：https://stat.ethz.ch/R-manual/R-devel/library/base/html/table.html
aggregate函数：https://stat.ethz.ch/R-manual/R-devel/library/stats/html/aggregate.data.frame.html
tapply函数：https://stat.ethz.ch/R-manual/R-devel/library/base/html/tapply.html
data.table包：https://cran.r-project.org/web/packages/data.table/vignettes/datatable-intro.html

页面内容是否对你有帮助？

有帮助

没帮助

在R中是否有等效(或更快)版本的numpy.binCount，用于基于多个bin求和？

、、、、

我有一个算法，它需要一个由N个数字组成的变化矢量'wgts‘，根据整数’bin‘的M-x-N矩阵中的类别进行求和。我发现python包numpy对此有一个有用且快速的bincount函数。我想使用R，因为我的其余进程都在R中，但到目前为止，我无法在R中像在Python中那样快速地纠正

浏览 6提问于2019-06-07得票数 0

回答已采纳

1回答

Google电子表格中的地图或折叠

我想在Google电子表格中执行等效于地图或折叠操作(从函数式编程的意义上)。我有一个相对简单的表达式，我想将其应用于多个列(该表达式基于单个列中的值)，然后对这些结果求和。如果我可以执行map操作，那么求和部分就很容易了(折叠会更快，但map工作得很好)。真正的问题是:如何进行这种映射？

浏览 3提问于2014-12-25得票数 1

2回答

决不在excel计算中包含单元格值

是否可以将单元格标记为“忽略”(或等效)，以便如果它们包含在求和函数的范围内，则它们不会包含在计算中，从而不会输出值？我创建了一个复杂的表，用于描述未来几年的收入。如果我选择每个Jan列并单击insert，我会在每年年底得到一个空栏，可用于我的合计列(在每个Jan的左侧)。但是，我在每一行中广泛使用SUM，并且我不希望将Total列中<

浏览 1提问于2018-01-31得票数 0

2回答

C矢量化:在像python矢量化这样的数组中可以进行元素操作吗？

、、、

我正从python迁移到C，希望更快地实现，并尝试学习C中的矢量化，相当于python矢量化。例如，假设我们有二进制数组Input_Binary_Array，如果我想要将索引的每个元素(例如，i )乘以2**i，然后在python向量化中，将所有非零的求和进行如下操作： case 1 : Value，所以简单的for/while循环要快得多，但我不确定没有像python这样的等效<

浏览 3提问于2022-07-13得票数 1

3回答

为什么C#编译正则表达式的速度快于等效的字符串方法？

、、、、

每次我必须对字符串执行简单的包含或替换操作(其中搜索的术语是一个固定的值)时，我发现如果我接受我的示例输入并对其进行一些分析，使用编译的正则表达式几乎是*总是比使用来自String类的等效方法更快。( ndl )对regex.IsMatch( hs )

浏览 3提问于2012-09-14得票数 18

回答已采纳

5回答

如何在erlang中拆分二进制文件

、

我想要的是相对简单的：> split(Bin, ".").>>] 有什么建议吗？

浏览 1提问于2009-01-09得票数 10

回答已采纳

3回答

矩阵的行积和列和

、

我有一个大小为TxR的矩阵，我正在寻找一个命令来做这些行的乘积(返回乘积的1 x R向量)。之后，我想对列求和，即对R项求和。在Matlab中，这可能是这样的sum(prod(A,1),2)，但我不知道R中的代码。谢谢

浏览 3提问于2013-11-26得票数 8

回答已采纳

2回答

编译器错误CS0246侦听器服务IIS2008 R2

、、

在我的同事离开后，我继承了一个项目。我有一个侦听器服务的C#项目，它将被基于云的应用程序调用，向我们发送请求和数据。当我在IIS2008 R2上部署应用程序时，所有的测试都工作得很好。从我的研究中，我发现这个框架版本应该适用于为v4.5部署的所有应用程序。虚拟目录包含侦听器服务的asmx文件、Web.Config文件和包含所有

浏览 4提问于2017-07-07得票数 0

1回答

terraform env：：没有此类文件或目录

无法初始化Terraform模块，甚至无法检查版本。terraform init /usr/local/bin/terraform terraform shell脚本的内容 $ cat /usr/local/bin/terraform #!-e 's/"10My

浏览 13提问于2020-04-03得票数 0

1回答

Numpy和Biopython必须集成吗？

、、、

我有两个脚本来查看一个(多序列对齐) MSA是否有50多个列，缺口小于50%。第一个使用BioPython的是4.2秒，包含16281个序列，列为609列(PF00085格式为fasta格式)。实际上，删除和选择列(例如，删除具有50%间隙的列)非常耗时，在Biopython中没有很好地实现。我认为这对于PDB坐标的nx3 numpy数组也是有用的。我有五个想法，也许其中一个或两个是有用的

浏览 8提问于2012-11-25得票数 5

回答已采纳

1回答

我刚刚开始在Power BI中使用R视觉效果，但是我不能让它工作无论我尝试什么代码，我都会得到这个错误：错误:找不到函数"dir.exists“ ? 示例代码： ? 因为我不使用dir.exists，似乎R甚至不能启动，但是它似乎设置正确： ? 我的电脑上安装了RStudio，并且运行正常我刚从微软下载了示例.pbix (https://docs.microsoft.com/en-us/power-bi/visuals/service-<

浏览 31提问于2020-12-02得票数 1

回答已采纳

2回答

使用xargs比不使用xargs快吗？

这样更快吗？find /tmp -name core -type f | xargs /bin/rm -ffind /tmp -name core -type f -exec /bin/rm -(我从xargs的手册页得到了这个例子。)

浏览 0提问于2011-11-13得票数 5

回答已采纳

3回答

Server的真空等效分析？

、

在Postgres中，ANALYZE收集有关数据库中表内容的统计信息，并将其存储。这些统计数据用于确定PG中最有效的查询计划。运行analyze命令可以提高db的性能。我想知道Server中是否有类似的东西。如果Server没有完全等效的<

浏览 0提问于2016-10-03得票数 8

回答已采纳

3回答

具有预调整大小的数组的toArray

、、、、

使用ar.toArray(new String[ar.size()]) Android studio 3.2.1时，警告数组大小已预置，建议使用空数组有两种方式可以将集合转换为数组:使用预置大小的数组在较早的Java版本中，建议使用预置大小的数组，因为创建适当大小的数组所必需的反射调用相当慢。然而，由于OpenJDK 6的后期更新，此调用被内化，使得空数组版本的性能与预置大小<e

浏览 191提问于2018-11-13得票数 15

1回答

使用PHP获取和解析大量远程XML的替代方案？

、

请求和响应都是XML格式的。XML本身并不大，但是请求的数量很大(大约是)。( 5000)。有什么解决办法或建议吗？不确定这会不会更快。如果我用Python或Java等语言编写代码，这个过程会更快吗？

浏览 0提问于2013-08-16得票数 0

回答已采纳

1回答

可扩展Java数据库

、、

我在找一个开源的、基于Java的数据库. 我已经看过Apache和BerkleyDB了(在其他线程中)；目前我支持BerkleyDB，因为它似乎比Derby更快。您是否<e

浏览 1提问于2013-01-07得票数 0

1回答

如何在linux中加载特定版本的R？

、、

R3.0是我的默认版本。我已经安装了R 2.14，由于包依赖关系，我想使用它。请注意，这些包不能为3.0构建。如何强制ubuntu加载早期版本？

浏览 0提问于2014-11-13得票数 11

回答已采纳

2回答

使用R在data.frame中按样本对唯一计数求和

我有一个制表符分隔的表，它看起来像这样(它很大，"source“列中的条目一直到1000万行)： A0 G 0 5 0 0 0 我想使用R(或<

浏览 3提问于2017-03-09得票数 1

1回答

GDB:如何列出用于编译的所有源文件

、、

项目的新手，有多个用于编译的源文件，一些“可能”是在运行时加载的动态库。当使用"GDB“调试可执行文件时，是否有一个命令可以列出用于构建可执行文件的所有源文件(静态)。一旦我有了所有的源文件，设置断点，列出函数等对我来说就很容易了。我在GDB中找不到一个命令来做这件事(我相信应该有一个)。在DDD (基于图形用户界面的gdb)中

浏览 4提问于2014-04-03得票数 49

1回答

如何使用pipfile在来自自定义git分支的pipfile包中指定？

、、、

可以从自定义Git存储库在Pipfile包中指定。但是，我找不到关于如何指定用于安装的具体分支或提交的全面文档。对于如何在Pipfile中为支持的用于指定自定义分支、版本或提交的python包使用Git是否有完整的参考？如果它具有等效的pipenv命令行参数，那就太好了。

浏览 0提问于2017-12-03得票数 29

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在R中是否有等效(或更快)版本的numpy.binCount，用于基于多个bin求和？

相关·内容

在R中是否有等效(或更快)版本的numpy.binCount，用于基于多个bin求和？

Google电子表格中的地图或折叠

决不在excel计算中包含单元格值

C矢量化:在像python矢量化这样的数组中可以进行元素操作吗？

为什么C#编译正则表达式的速度快于等效的字符串方法？

如何在erlang中拆分二进制文件

矩阵的行积和列和

编译器错误CS0246侦听器服务IIS2008 R2

terraform env：：没有此类文件或目录

Numpy和Biopython必须集成吗？

R visual在Power BI中的第一步

使用xargs比不使用xargs快吗？

Server的真空等效分析？

具有预调整大小的数组的toArray

使用PHP获取和解析大量远程XML的替代方案？

可扩展Java数据库

如何在linux中加载特定版本的R？

使用R在data.frame中按样本对唯一计数求和

GDB:如何列出用于编译的所有源文件

如何使用pipfile在来自自定义git分支的pipfile包中指定？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐