python使用from to条件拆分数据框子集_按条件子集python数据帧_R中数据框中的条件子集 - 腾讯云开发者社区

python、dataframe

我有数据帧，并且我必须在以下条件下拆分成子集：开始拆分:C=1结束拆分:C= -1 示例： a b cFalse False -1

浏览 26提问于2020-04-29得票数 0

回答已采纳

2回答

如何使用R中的条件语句将一个数据帧拆分为多个数据帧

r、split、dataframe、conditional-statements

我有如下所示的数据：temp <- c(2,3,4,5,6,2,3,4,5,6,2,3,4,5,6,2,3,4,5,6)这是我的数据的一个非常基本的表示。如果绘制这个图，您可以很容易地看到有4个向上倾斜的数据组。我想把原始数据帧分成4个“子集”，这样我就可以对它们进行计算，比如"mean"，"max"，"min“和"std”。我想<e

浏览 2提问于2014-01-08得票数 5

1回答

如何在Python Pandas中进行嵌套循环类型的操作？

python、pandas、dataframe、loops、subset

我需要找到一个子集的子集，并且需要迭代地进行，然后在这个子集的每个实例上计算一个值，然后将其保存到一个新的输出表中。为了更好地解释，我有一个类似于下图所示的数据框；我需要迭代数据集，并对团队A(组2)的所有人员1(组1)的成本求和。我的理解是使用嵌套循环，如下所示： for Person in Group1: output.append(Person, Team, Newcost

浏览 18提问于2020-08-24得票数 0

3回答

如何导出列拆分的子集？

r、dataframe、dplyr

我需要导出数据框的两个子集，如下所示： df <- data.frame(factor = c("A", "A", "B", "B"), var = "value") factor var1 A value3 B value 4 B value 我使用group_split()按因子拆分数据帧，但似乎无法将

浏览 12提问于2019-12-13得票数 2

回答已采纳

2回答

使用for循环将数据帧拆分为多个，然后应用一个函数

r、for-loop

我正在尝试按照plot列的共享值对数据进行筛选/子集的标准，将一个数据帧拆分为多个数据帧。以前，我使用dplyr根据一些条件对数据进行子集，并选择我想要保留的数据(见下文)。我希望使用for循环来减少代码行，而不是复制和粘贴相同的代码X次。posX, posY, germ_bin) filter(plot==2) %>%

浏览 21提问于2020-01-29得票数 0

回答已采纳

1回答

逐字符串的子集数据

r、dataframe、subset

假设我有一个有7个变量的数据框。我想根据一列的内容自动设置数据框的子集。该列是Department，有17个不同的值。我想让R查看列" Dept“，并为每个Dept创建一个包含所有其他行的新数据框。这相当于Minitab中的“拆分工作表”。现在，我必须运行17次subset命令来为每个子集创建一个数据帧。R可以根据列内容自动执行此操作吗？最好的，谢谢！

浏览 0提问于2012-08-16得票数 1

1回答

rowSums为0的子集行数

基于条件寻找数据框(所有列都是数字)的子集。我希望将rowSum =0的行设置为子集。只能找到一个解决方案来子集不等于0的行！提前谢谢。

浏览 1提问于2021-02-10得票数 0

1回答

条件拆分默认输出

sql、ssis

我很难用条件分裂。我有两个条件：1 | Status column completed |(

浏览 0提问于2016-03-15得票数 0

回答已采纳

1回答

在训练\测试拆分之前，我应该进行标准化和去趋势吗？

python、machine-learning、train-test-split、standardized

我是python新手，正在尝试执行一个随机森林回归任务。我导入了总共有5列(包括date列)的数据集。我的数据是时间相关的，所以我不能使用训练/测试拆分。sklearn中的时间序列拆分将我的数据拆分成训练和测试tss = TimeSeriesSplit也就是说，我是先去掉均值再缩放数据，还是先缩放再去掉

浏览 22提问于2020-05-12得票数 1

回答已采纳

2回答

如何使用for循环或条件在熊猫数据框的子集中创建多个回归模型(statsmodel)？

python、pandas、for-loop、classification、regression

如何使用for循环或条件在熊猫数据框的子集中创建多个回归模型(statsmodel)？状态为1:51，并将用作分割数据帧条件如何使用for循环自动执行此任务？

浏览 0提问于2018-09-24得票数 1

1回答

基于某些条件，我尝试从Pandas dataframe创建一个子集。我可以创建两个子集，但在尝试创建另一个子集时出现语法错误。数据框是具有列标题的.csv文件:编号、环境、阶段、类型、计划结束日期、关闭代码、结束子类别、由更改引起的事件、待定更改。我应该尝试使用“计划结束日期”创建一个子集，其中计划结束日期离今天日期超过4天的记录应该在不同的子集中？我想创建一个包含所有“成功”和“完全成功”记录的不同子集，并且创建一

浏览 1提问于2019-11-21得票数 0

1回答

在r中循环保存Excel文件

r、excel、loops、openxlsx

我有数据框并创建了它的一个子集。我用一个变量因子来拆分数据帧和它的子集。我想把它保存在excel文件中。我想写一个循环来创建多个excel文件，数据框和子集文件是由一个可变因子在工作表中。

浏览 6提问于2019-02-16得票数 0

1回答

如何使用python记录链接工具包对大数据集执行重复数据删除？

python、python-3.x、dask、record-linkage

我目前正在使用Python Record Linkage Toolkit对工作中的数据集执行重复数据消除。在理想的情况下，我只需要使用阻塞或排序邻域来减少记录对索引的大小，但有时我需要对包含超过75k条记录的数据集进行完整索引，这会导致数十亿条记录对。我实际上将这个子集建议合并到了一个方法中，用于将多索引拆分成多个子集并运行这些子集，但它没有绕过.index()调用似乎将整个多索引加载到内存中并导致内存不足错误的问题

浏览 26提问于2021-10-11得票数 0

1回答

Python数组的快速细分

python、arrays

从R到Python，我明白了为什么这么多人喜欢Python的数据科学。R的一个有用的特性是快速子设置。11,34,67,134,45,8,99,3543,1)print(my_data[my_subset])可以以编程方式生成满足各种条件的子集，并使用单个指令将数据过滤到该子集。在python中如何做到这一点呢？

浏览 7提问于2021-02-27得票数 0

1回答

Python - scikit-learn:如何在决策树和回归树中指定验证子集？

python、scikit-learn、decision-tree

我正在尝试用Python构建决策树和回归树。我正在使用sci-kit，但我对其他选择持开放态度。关于这个库，我不理解的是是否可以提供训练和验证子集，以便库在训练子集上构建模型，在验证上测试模型，并根据某些规则停止拆分(通常当额外的拆分不能在验证子集上产生更好的性能时-这可以防止过度拟合)。我在官方网站()和互联网上都没有发现关于如何使用验证子集的内容。任何帮助都将是最受欢迎的！谢谢!

浏览 0提问于2014-12-02得票数 1

1回答

如何使用df.loc而不做选择？

python、pandas、dataframe

我知道要根据条件选择数据框的子集，我们可以使用df.loc[df['column1'] == 'ABC'] 然而，有没有一种方法，我可以把一些东西放在ABC的地方，它会给我整个表，而不是一个子集……我知道你会说为什么要使用.loc，但我正在尝试使用它作为用户输入……非常感谢您的帮助。

浏览 21提问于2021-03-21得票数 0

3回答

使用相同的条件设置R中的多个数据帧子集，但代码行数较少

r、subset、data-cleaning

我有几个数据框，它们具有相同的列，但按年份拆分。我希望使用相同的条件删除数据帧中的行，但希望减少执行此操作所需的代码行数。243 39 4 例如，我只想保留lat大于或等于44且小于或等于45的观察值，以及大于或等于10且小于或等于30的长度(实际上不是我正在处理的数据我希望避免大量的代码行(对于这些示例帧2，几行代码似乎不是很多，但我有10个不同的数据帧，每个数据帧都有数百万个观察值，我

浏览 38提问于2020-11-20得票数 0

2回答

随机森林的手动k-折叠交叉验证

python、random-forest、cross-validation、k-fold

我正在使用随机森林分类器，并且我想执行k折交叉验证。我的数据集已经被分成10个不同的子集，所以我想用它们来做k折交叉验证，而不是使用随机拆分数据集的自动函数。这在Python中是可能的吗？

浏览 8提问于2021-03-08得票数 0

3回答

python的排序()使用什么算法？

python、sorting

我试图向一些人解释为什么他们应该使用Python的内置排序()函数而不是滚动他们自己的函数，我意识到我不知道它使用的是什么算法。如果有关系，我们说的是python2.7

浏览 5提问于2012-06-08得票数 140

回答已采纳

1回答

子集a和分组依据数据帧具有多个条件和多个条件

r、dplyr、subset

我有一个具有多个变量和唯一I的数据集df1 20 5 5.4 120.52 50 40 7.5 117.83 10 50 3.4 1192 5 20 9.5 325.4new.df <- df[df$A< 56 & is.na(df$A) == FALSE,] 我想要条件列，并按I对数据框</e

浏览 15提问于2019-11-20得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云