在Python中按数据框子集重复计算

文章/答案/技术大牛

发布

1回答

、、、、

希望获得每个用户的计算结果，而不是来自df1的整个数据帧。minima), np.sum(h2))最终目标是对df上的df1中的每个用户进行重叠计算:实际计算将与下面的计算不同。Bob .54Alice .28 计算工作，只需要它由用户计算。尝试使用，但没有成功，因为计算不是针对

浏览 12提问于2019-11-01得票数 0

回答已采纳

1回答

循环，子集，并将它们放在一起-R

、、

我有个数据框。"n“次的平均值和sd，按日期(因数)改变线的位置。只有在我做数据的子集之前，我才能这样做，就像这样：df<-matrix(NA,nrow=Bsample(jun13$pe, replace=F)*sample(jun13$v.d, replace=F)))df 但我有几次约会(n = 30) .

浏览 0提问于2016-09-11得票数 0

1回答

首先我要说的是，我是一个完全的R新手，并且被要求做一些我无法理解的计算，所以如果这不是问这个问题的正确方式，请提前原谅我！！我有一个R数据框，它有两列:一列是年龄(18-80)，另一列是因变量，有三种可能的结果(0,1,2)。我想画一张图，x=年龄，y=年龄的因变量的平均值。我知道如何绘制一个简单的图表，也知道如何按年龄逐个计算我的(0,1,2)列的平均值，但从18岁到80岁的每个年龄段手动计算，然后在新的数据框中绘

浏览 15提问于2021-03-06得票数 0

1回答

如何使用python记录链接工具包对大数据集执行重复数据删除？

、、、

我目前正在使用Python Record Linkage Toolkit对工作中的数据集执行重复数据消除。has ideas for doing record linkage with two large data sets using numpy split，它对我的使用来说很简单，但不提供任何在单个数据帧内进行重复数据删除的功能我实际上将这个子集建议合并到了一个方法中，用于将多索引拆分成多个子集

浏览 26提问于2021-10-11得票数 0

1回答

PyQt自动重复表单

、、、、

我目前正在尝试将一个遗留的VBA/Microsoft Access应用程序迁移到Python和PyQt。我在迁移任何逻辑时都没有遇到任何问题，而且大多数表单都很简单。但是，我在应用程序最重要的部分--主数据输入表单上遇到了一个问题。表单基本上是与数据库中的字段相对应的一行文本框。用户只需在字段中输入数据，按tabs键切换到下一个字段，然后重复操作。当他到达记录/

浏览 2提问于2009-07-11得票数 2

回答已采纳

2回答

2D盒堆叠没有高度限制的重复

、

我一直试图解决这个问题的2D变体：也有一个高度限制，所以塔必须小于或等于这一限制。一个盒子在另一个盒子下面的底部必须大于或等于它(严格地说不是更大)。我一直在尝试应用LIS算法，其他限制似乎得到了处理，但我想不出如何解释不重复规则。因此，我的主要问题是，如果您试图最大化堆栈的高度并将其保持在极限以下，您如何解释不重复规则？由于最优塔必须使用这个排序列表的子集来建造，所以按照的顺序排列，所

浏览 3提问于2013-02-14得票数 2

回答已采纳

1回答

如何在Python Pandas中进行嵌套循环类型的操作？

、、、、

我需要找到一个子集的子集，并且需要迭代地进行，然后在这个子集的每个实例上计算一个值，然后将其保存到一个新的输出表中。为了更好地解释，我有一个类似于下图所示的数据框；我需要迭代数据集，并对团队A(组2)的所有人员1(组1)的成本求和。然后移动到团队B中的person 1，并执行相同的操作，依此类推，直到Person 1完成。然后移动到人员2，并对所有团队再次执行相同的操作。示例如下： ? Person in Group1:

浏览 18提问于2020-08-24得票数 0

2回答

尝试捕获MsgBox文本并按下xlwing中的按钮

、、

所以我有一些代码，它使用xlwing在Excel文件xlsm中写入数据。在我写完之后，我按下某个按钮来计算。有时，Excel中会弹出错误/消息，这很好，但我希望将此消息捕获到python中，并在稍后将其写入日志/打印它。此外，我还需要与此消息进行交互，在本例中，我需要在消息框中按"Ok“ 消息框的附加图像 ?

浏览 39提问于2019-06-11得票数 1

回答已采纳

2回答

按粒度级别细分数据，并对R中的每个数据帧应用一个函数

、、、

用一个例子来描述这个问题是最容易的：我目前在这个过程中有两个步骤：每个level.Calcul

浏览 3提问于2019-10-05得票数 0

回答已采纳

1回答

找出最靠近路线的地方

、、

我有很多地方数据(旅游景点)存储在数据库中。每个地方都有协调信息，如纬度和经度。当我随机选择一条路线时(例如:从纽约的某个地方到波士顿的某个地方)，我怎样才能找到这条路线上10个最近的地方？我试图找到一种方法，以尽量减少总计算时间，并节省手机电池。谢谢您的建议！

浏览 4提问于2016-08-25得票数 0

回答已采纳

2回答

按带行子集的数据平均计算- Python

、、

我有如下数据：1001 1 5 1001 3 9 但是，它不仅不能工作，而且由于我有大量的数据

浏览 6提问于2017-10-31得票数 1

回答已采纳

1回答

熊猫多层次数据的细分

、、、

我正在成功地使用groupby()函数来计算分组数据的统计信息，但是，现在我想对每个组的子集进行同样的计算。我似乎无法理解如何为每个组(作为groupby对象)生成子集，然后将其应用于group be函数(如mean() )。以下一行按预期工作：我如何将各个组的值子集，然后提供给均值函数？编辑以添加可重复的示例： ra

浏览 0提问于2018-10-25得票数 4

回答已采纳

2回答

使用父文档的子集合引用的固定恢复查询

、、、

我的Firestore数据库结构如下(如图所示) 我有一个用户集合，其中有一个帖子子集合。有没有没有重复字段的解决方案。

浏览 8提问于2022-04-11得票数 1

回答已采纳

2回答

按最大日期计算的重复值的子集数据

、、

下面有一个样本数据集：2019-02-25 A A B2019-02-23 J M L 19 18我如何子集我的数据集，以便如果有来自df[,2:4]的重复，我只保留最大日期在这些副本之外？我仍然希望存在上一个表中

浏览 1提问于2019-02-25得票数 1

回答已采纳

1回答

从R中的dataframe中提取具有条件的特定行和所有列

、、

我有一个包含三列(A、月、年)的数据框，我想从其中提取特定的行(例如，包含从第10月和第92年到第4个月和第93年的期间)和所有列。mydata$Month==10 & mydata$Year== 92 : mydata$Month==4 & mydata$Year== 93 ,] 我不想做这个mydata[3:14, ]，因为我的数据帧非常大这将使我自己找出从哪行到哪行数据帧长度超过50000。这是不切实际的。有没有办法做到这一点。预期结果为 ?

浏览 644提问于2019-09-07得票数 0

回答已采纳

1回答

在For循环中的for循环？在R中

、

我是R的新手，正在尝试创建不同大小的组的引导重采样的新数据帧。我的数据框有6个变量和一个组名称，有128个不同Ns的组。replace = T),:我理解这一点，因为128组中的每一组都有不同的我放入resample.Mi，尝试将128个组的所有1000x重采样累积到一个数据库中，我非常确定问题就在这里。我试着做了一个矩阵来放入信息(<e

浏览 0提问于2014-07-01得票数 0

1回答

计数唯一值单列pandas

、、

嗨，我有下面的数据框，我想计算一下每年重复的次数 df = pd.DataFrame({'year':[1958,1963,1958,1963],'title':['a','g','z','e']})我如何按年分组并计算每年有多少次？

浏览 37提问于2020-12-05得票数 0

2回答

有什么有效的方法来消除一组>100万字符串？

、、

在我的项目中，我需要非常高效地处理非常大的字符串集。也就是说，给定一个可能包含重复字符串的列表，我希望生成一个列表，列出列表中的所有字符串，但没有任何重复的字符串。下面是一些让它更快的想法：因为一组字符串在运行过程中变化很小，所以可能会缓存哈希函数是否生成任何冲突。如果它不生成任何字符串(同时考虑更改)，那么字符串可以

浏览 2提问于2020-02-18得票数 2

回答已采纳

1回答