删除带条件的数据帧中的行_删除pandas数据帧中的条件行_删除基于pandas数据帧行的条件 - 腾讯云开发者社区

r、dataframe、subset、na

我在R中查看了一些数据。其中一个标题为"Height“的特定列包含几行NA。我正在寻找我的数据帧的子集，以便从我的分析中排除高于某个值的所有高度。 df2 <- subset ( df1 , Height < 40 ) 但是，每当我这样做时，R都会自动删除包含高度NA值的所有行。我不想这样。我曾尝试包含na.rm的参数 f1 <- function ( x , na.rm = FALSE ) { df2 <- subset ( x , Height < 40 ) } f1 ( df1 , na.rm = FALSE ) 但这似乎没有任何作用；带NA的行仍

浏览 0提问于2016-11-06得票数 5

回答已采纳

2回答

Python，有没有办法把df.drop赋给一个新的变量？

python、pandas

我练习python已经有一段时间了，刚刚开始接触pandas，开始学习数据帧。我知道df.drop()会根据某些要求删除列/行，并生成一个新的df。我想知道，有没有一种方法可以将这些被删除的列/行分配给一个新的变量以用于日志记录？ import pandas as pd L = ["a","b","c","d","a","a"] df1 = pd.DataFrame(L) df1.columns = ['letter'] #print(df1) df2 = df1.drop(df1

浏览 17提问于2018-01-13得票数 2

回答已采纳

3回答

熊猫从df中删除了一系列行。

python、dataframe、pandas

我想从数据帧的底部删除m行。它是整数索引的(带孔)。如何做到这一点？ pandas == 0.10.1 python == 2.7.3

浏览 1提问于2013-03-29得票数 24

回答已采纳

1回答

如何根据字符串模式条件删除/删除/过滤pandas数据帧中的行？

python、pandas、database、dataframe

浏览 13提问于2020-10-28得票数 0

回答已采纳

1回答

仅参考值(无背景填充等)Excel中另一个工作表中的单元格的

excel、excel-formula、formatting、row

我在Excel 2010中有一个包含2个工作表的工作簿。表1具有按日期排序的数据行，每个日期具有不同的行数。 ? 工作表2根据日期计算日平均值，并将它们放在单独的行中(每个日期1行)，使用公式=Sheet1!A5可以很好地工作，但行带颜色也被复制，因此工作表2的行带带看起来格式不佳，似乎是通过引用继承的。 ? 如何在工作表2中保留均匀条带，并防止填充颜色与单元格的数据一起被复制？

浏览 16提问于2021-05-07得票数 0

2回答

R数据帧-使用na的逻辑测试

r、dataframe、logical-operators

我有一个带字段(DELETE_CUSTOMER)的数据帧(SCV)。我想删除数据框中DELETE_CUSTOMER != "Y“的行。目前，这个字段都是NA -但这是一个随时间增长的数据帧，因此它在未来可能会有Y。目前，我正在尝试以下内容： DELETIONS <- which(is.na(SCV_DELTA_R$DELETE_CUSTOMER) !=T & SCV_DELTA_R$DELETE_CUSTOMER == "Y") SCV_DELTA_R <- SCV_DELTA_R[-DELETIO

浏览 1提问于2014-07-31得票数 0

3回答

根据来自另一列的值从一列中选择值- python

python、pandas

我有一个很大的数据帧df1，看起来像这样： DeviceID Location 1 Internal 1 External 2 Internal 2 Internal 3 Internal 3 External 3 Internal 4 Internal 4 Internal 5 External 5 In

浏览 0提问于2019-09-25得票数 2

3回答

如果值小于10，如何删除dataframe中的行

pandas

如果某一列中的值小于10，我希望删除数据帧中的行。使用dataframe2.groupby('category_id').Description.count()，我可以列出数据帧中的项，这很好用。现在我想删除值小于10的行。我试图创建一个条件，以便删除行，但这不起作用。 if dataframe2.groupby('category_id').Description.count()>= 10: dataframe2.drop() 预期的输出应该是只有具有正确条件的行才会出现在数据帧中。输出是ValueError:系列的真值不明确。使用a.empt

浏览 3提问于2019-08-07得票数 0

1回答

pd.drop在函数外部工作，但不在函数内工作

pandas、jupyter-notebook、keyerror

通过关联两个独立的数据框来创建数据框。一切都很顺利，就在我独立检查的Jupyter中。我只是添加了另一个条件来从我的数据帧中删除一行-如果它是“current_edge‘’street_name‘的副本。当我测试时，这行在Jupyter notebook中有效，但当我将它放入函数中时就不起作用了。 # current_edge is a dictionary of values, edge_az is a float # edge is my dataframe for row in edge.index: if abs(current_edge['edgeAzimut

浏览 10提问于2019-04-11得票数 1

回答已采纳

1回答

为什么子集包括NA行，而过滤器不包括？

r、subset

当我根据某些条件对数据帧进行子集时，得到的结果是子集条件和NA行。当我使用filter时，它只给我过滤的行。所以子集我可能得到20行(10个实数行和10个NA行)，但过滤后，我得到10行(全部是实数行)。为什么会这样呢？

浏览 3提问于2021-02-23得票数 1

1回答

删除数据帧中具有某些NA值的特定行

r、dataframe

只有在找到NA值的其他行与数据帧中的其他值匹配时，我才希望从数据框架中删除列具有NA的行。例如, df <- data.frame(ID = c(1,1,2,2),DAY=c(1,1,2,3), VAL=c(1,NA,NA,5)) 我想移除第二行，因为VAL中缺少一个值，并且已经有一个ID =1和DAY =1的VAL值。 ID DAY VAL 1 1 1 2 2 NA 2 3 5 知道怎么做吗？我可以尝试写一个循环，但这似乎没有效率。

浏览 2提问于2015-07-28得票数 2

回答已采纳

2回答

R-从dataframe中排除不包含特定值的行

我有一个巨大的数据帧，我需要从其中删除不包含向量中存在的任何值的行(向量名为“code”)。示例数据帧： df <- data.frame(ID = as.integer(c(10001, 10002, 10004, 10005, 10006)), X1 = as.integer(c(150, 120, 175, 160, 1)), X2 = as.integer(c(1, 1412415, 16420, 19920, 150))) > df ID X1 X2 1 10001 150

浏览 48提问于2020-04-24得票数 2

回答已采纳

3回答

删除R中低于指定值的数据行

r、delete-row、threshold

我想知道是否有人能帮忙..。我有一个数据框架，其中包括一个连续的时间列，并且我试图删除指定时间以下的所有行。数据从大约开始。11:29:00但我想在12:30.00之前和14:20.00之后删除所有行。由于数据是每秒钟记录的，删除不必要的行将是一个很大的帮助，并使管理这些数据对我来说非常容易，因此任何帮助都将是非常感谢的。这是数据帧的头，因为您可以看到时间是连续的(以秒为单位)。我想在GPS.Time列中删除所有这些行，直到12:30:00。希望这是合理的。 Raw.Vel. Smooth.Vel. GPS.Time 1.48

浏览 0提问于2015-06-30得票数 0

回答已采纳

1回答

如何从dataframe中删除行？

scala、apache-spark、apache-spark-sql

我有数据帧df df.show() id|data|somedata 1 |k |v 2 |s |d 3 |f |k . . . 我尝试从df中删除id存在于lisst=List(4,9,200)中的行，所以我像这样使用drop val df1=df.drop(col("id").isin(lisst:_*)) 但我也试过了也不管用 val df1=df.filter(col("id").isin(lisst:_*).drop("id")) 但是df1在df中有相同的行。

浏览 0提问于2018-04-01得票数 3

回答已采纳

2回答

基于某些行值的子集Pandas数据帧

python、pandas、subset

我有一个带有“动态”列的Pandas数据框架(这意味着，在从各种数据库检索数据之前，我不知道列名是什么)。数据帧是一个单行，如下所示： Make Date Red Blue Green Black Yellow Pink Silver 89 BMW 2016-10-28 300.0 240.0 2.0 500.0 1.0 1.0 750.0 请注意，'89‘是数据帧中的特定行。我有以下代码： cars_bar_plot = df_cars.loc

浏览 0提问于2016-10-30得票数 0

回答已采纳

2回答

从Jasper报表中删除空白条目

jasper-reports

我已经在jrxml中创建了一个报告。我已经指定，如果我的其中一个字段使用如下所示的值的标记<printWhenExpression>填充，则仅打印每个值的详细信息： <textField> <reportElement x="670" y="4" width="105" height="20" isRemoveLineWhenBlank="true"> <printWhenExpression><![CDA

浏览 8提问于2013-05-17得票数 4

3回答

Python :基于条件创建数据

python、pandas

我想根据当前数据的情况为熊猫创建一个新的数据框架。如果当前的dataframe > 1000行，则使数据帧为空(删除行)。否则，只需使用当前的数据帧。下面是发生错误的代码： DF_NEW = np.where(len(DF)>1000, pd.DataFrame(DF[0:0]), pd.DataFrame(DF))

浏览 3提问于2022-07-28得票数 0

回答已采纳

1回答

排序数据框中每个ID的列中不同值/ distinct的数量

python、pandas

我有一个带ID的排序数据帧和一个值列，如下所示： ID value A 10 A 10 A 10 B 15 B 15 C 10 C 10 ... 我如何创建一个新的数据帧，它根据不同it的数量计算“新的”不同的值，以便它基本上遍历我的数据帧并看起来像这样： Number of ID Number of distinct values 1 1 2 2 3 2 在上面的情况下，我们有3个不同的ID，但ID A和C具有相同的值。因此，新数据帧中的第一行: values= of

浏览 24提问于2020-12-08得票数 1

回答已采纳

2回答

将一行中的值复制到R中的另一行

r、loops、row、copying

我试图将值从一行复制到相应列中值NA的指定行。在这种情况下--如果第1行中的值是NA，它们应该从第5行复制值。如果第2行中的值是NA，则应该在第6行中复制值。以下是示例数据： Name1 Name2 1 NA NA 2 4 NA 3 5 8 4 2 5 5 3 6 6 4 7 7 5 8 这是预期的产出： Name1 Name2 1

浏览 1提问于2018-02-07得票数 2

回答已采纳

1回答

基于条件的数据帧合并

python、pandas

我有两个数据帧，带shape 769, 5的a = {'SEX':[...], 'ENT':[...], 'XY':[...], 'RZD':[...], 'TOT':[...]} 和带有shape 34398, 9的b = {'K':[...], 'NOM':[...], 'M':[...], SEX':[...], 'ENT':[...], 'POB':[...], 'RZD':[...], '

浏览 19提问于2020-04-10得票数 0

1回答

如何通过观察函数在shiny中存储数据帧中选定行的行数

r、shiny、shinydashboard

我正在使用shiny创建一个带有值框和一些数据表的交互式仪表板。我想通过shiny输出中数据帧的选定行来更新值框中的值。但是，我能够读取数据帧的选定行的行号，但无法将它们存储到列表或向量中。 UI.R shinyUI(fluidPage( dashboardPage( dashboardHeader(title = "NUS Testing"), dashboardSidebar(), dashboardBody( fluidRow( valueBoxOutput("norm") ),#ending

浏览 4提问于2016-08-07得票数 0

1回答

根据每组值的分位数过滤数据帧

pandas、group-by、quantile

假设我有一个这样的数据帧： import pandas as pd df = pd.DataFrame({'col1':['A','A', 'A', 'B','B'], 'col2':[2, 4, 6, 3, 4]}) 我希望只保留那些在col2处的值小于col1的每组值的第x个分位数的行。例如，对于第60个百分位数，数据帧应如下所示： col1 col2 0 A 2 1 A 4 2 B 3 如何在pandas中高效地执行此操作？

浏览 30提问于2020-01-31得票数 1

回答已采纳

2回答

熊猫排成一行

pandas

我在Pandas中一次迭代一个数据帧。我正在检查那一行是否符合一定的条件。那么，我想放弃这一排。我怎样才能做到这一点？

浏览 3提问于2013-07-23得票数 0

回答已采纳

3回答

如何将条件应用于pandas数据帧中的大量列

python、pandas、dataframe

我希望消除具有大量列的数据帧中等于特定值(或在特定范围内)的所有行。例如，如果我有以下数据帧： a b 0 1 0 1 2 1 2 3 2 3 0 3 并且想要删除所有包含0的行，我可以使用： a_df[(a_df['a'] != 0) & (a_df['b'] !=0)] 但当您处理大量列时，这就变得很麻烦了。可以这样做： for i in a_df.columns.values: a_df = a_df[a_df[i] != 0] 但这似乎效率不高。有没有更好的方法来做这件事？

浏览 0提问于2015-08-25得票数 0

1回答

每个关键帧中带有标头的MP4段

mp4、h.264、mpeg-dash、mpeg-4、mp4box

我试图在分段文件(Styp)的mp4容器中定位mp4帧。对于分段，我目前使用的是MP4Box破折号。我使用了MP4Box解析器，并注意到在每个关键帧(IDR)中，示例的大小与原始文件中相同帧的大小不同。我计算了差异，对于其他段中的同一个文件，总是有37个字节。这些字节代表什么？它们只出现在每个关键帧之前的分段mp4文件类型中。我用其他文件进行了测试，这些字节的数量略有变化(其他文件为39个字节)，而且不是相同的数据(尽管它们共享一些字节模式)。这是来自mp4标准、H264甚至MP4Box的东西吗？我一点线索都没有。

浏览 5提问于2018-03-06得票数 4

回答已采纳

1回答

Julia dataframe :从子数据帧中删除行

julia、dataframes.jl

问题语句:从子数据帧中删除行代码： x=[rand(3) for i in 1:3] dfx=DataFrame(x,:auto) dfy=@view dfx[2:3,:] 问:我想从dfy中删除第一行，这样它也会从dfx中删除。我做了原始dfx的子集，以进一步检查子集的行是否满足条件。最后，我想决定是将行保留在dfx中还是将其删除。我对dfx的子集dfy进行操作。

浏览 7提问于2021-09-01得票数 2

1回答

如何根据一定的条件从数据框中创建过滤条件？

python、python-3.x、pandas、dataframe

我需要根据数据帧中的一些条件创建过滤条件。我被困在这里了。你能帮我解决我的问题吗？提前感谢！示例： Df： 0 1 0 kol_id 101152 1 jnj_id 7124166 2 thrc_cd VIR 3 operator <= 4 start_dt 05/10/2018 使用上面的数据帧，我需要创建下面的过滤器查询： kol_id = '101152' and jnj_id = '7124166' and thrc_cd = 'VIR' and start_dt <= '

浏览 9提问于2020-09-22得票数 1

回答已采纳

1回答

如何从Scala中的数据帧序列中删除空数据帧

scala、apache-spark、dataframe、apache-spark-sql

如何从数据帧序列中删除空数据帧？在下面的代码片段中，twoColDF中有许多空的数据帧。下面的for循环的另一个问题是，有没有一种方法可以让它更有效？我试着将它重写到下面的代码行，但是不起作用 //finalDF2 = (1 until colCount).flatMap(j => groupCount(j).map( y=> finalDF.map(a=>a.filter(df(cols(j)) === y)))).toSeq.flatten var twoColDF: Seq[Seq[DataFrame]] = null if (colCount == 2 )

浏览 0提问于2016-11-29得票数 0

2回答

使用顺序向量中的值获取R数据帧的子集

r、subset、correlation、dataframe

我有一个相关性分数向量myCorVector，它包含从1到-1的值范围。对于数据帧myDataFrame的每一行，向量myCorVector具有分数。我可以通过指定myDataFrame[order(myCorVector),]来对数据帧行进行排序。我想要做的是对数据帧进行排序，但是从myDataFrame中检索myCorVector值小于0的行的子集。如果我在myCorVector上应用subset()，那么order()返回的索引将不再与myDataFrame中的有效行索引相关联。有没有一种快速和/或优雅的方法可以做到这一点，而不需要myCorVector上的for循环

浏览 10提问于2011-02-23得票数 0

回答已采纳

2回答

删除与特定字符串对应的行，但保留NA值。

r、subset、na

当特定列中的行对应于一个字符串时，我希望删除数据帧中的所有行，但保留NAs：当数据的第一列具有名为" string“的字符串值时，将删除数据帧中的所有行。但是我的第一列也有缺失的值-- NA s，所以当我使用df <- df[df$Col1!="string",]时，与字符串和NA值对应的所有行都从数据帧中删除。我希望保留NA值。也是可取的:用""替换所有NAs，以便当我执行is.na(df$Col1)时，它显示为假。<code>H 212</code><code>f 213</code>

浏览 1提问于2020-09-13得票数 1

回答已采纳

1回答

当不是所有元素都匹配时，匹配R中的数据

r、merge、plyr

我有一个数据框，其中有一列表示邮政编码。我还有一个数据框，里面有邮政编码的列表，以及它们属于哪个大都会统计区。我正在尝试附加基于邮政编码的MSA。任何一个数据帧中的邮政编码都不能保证在另一个数据帧中，并且主数据中的每个邮政编码可能会多次出现。数据框以779行开始，应以779行结束。 sheet <- merge(sheet, msa, by = "Zip", all.x = TRUE, all.y=FALSE) 然而，所得到的数据帧1881行。我也尝试过使用plyr test <- join(sheet, msa, by = "Zip") 这也产生

浏览 2提问于2015-09-04得票数 0

2回答

比较两个数据帧并将结果存储在另一个数据帧中

python、pandas、dataframe、for-loop、if-statement

我有两个这样的数据帧:第一个有一列720行(dataframe A)，第二个有10列720行(Dataframe B)。数据帧仅包含数值。我尝试这样比较它们:我想遍历数据帧B的每一列，并将该列的每个单元(行)与数据帧A中的相应行进行比较。(例如:对于数据帧B的第一列，我将第一行与数据帧A的第一行进行比较，然后将B的第二行与A的第二行进行比较，依此类推。) 基本上，我想逐行比较数据帧B的每一列与数据帧A中的单个列。如果dataframe B中的值小于或等于dataframe A中的值，我想将+1添加到另一个dataframe (或列表，取决于它如何更容易)。最后，我希望删除dataframe

浏览 0提问于2020-10-09得票数 0

1回答

与熊猫一起读取csv时“skiprows”的问题

pandas

我有一个很大的数据帧(大约500万行)，其中包含一些错误的数据。我已经识别了具有错误数据的行的索引，现在我正在尝试从数据帧中删除“错误”的行。由于数据帧的大小，我在读取csv时使用了chunksize功能。为了跳过“错误”的行，我使用了skiprows和error_bad_lines features。我还使用low_memory特性来防止警告(出于示例的目的，我只读取了前20000行)。然后，我将新数据帧保存在新的csv中。问题是，只有前9个“错误”行被跳过，然后“错误行”仍然被读取(并保存到输出csv)。下面是我的代码： for df in pd.read_csv('dat

浏览 14提问于2020-09-25得票数 0

回答已采纳

3回答

Pandas/Python:如何在不重复的情况下连接两个数据帧？

python、pandas、duplicates

我想将两个数据帧A，B连接到一个没有重复行的新数据帧中(如果B中的行已经存在于A中，则不添加)：数据帧A:数据帧B： I II I II 0 1 2 5 6 1 3 1 3 1 新数据帧： I II 0 1 2 1 3 1 2 5 6 我该怎么做呢？

浏览 1提问于2014-01-24得票数 81

回答已采纳

1回答

按数据帧中的最大值和最小值逐列过滤

r、dataframe、filter

我用站点ID和相应的计数创建了这个数据框架。现在，我想找到这个数据帧中的10个最大值和10个最小值，并将它们保存在一个新的数据框架中。 station_activity <- tripdata %>% count(start.station.id) station_activity <- station_activity %>% filter(n > 6100 & n < 100) 第1行用于创建图片中看到的数据帧，第2行用于通过值进行筛选，但这显然会导致空的数据帧。是否有更好的版本可以这样做，而不需要编写长的条件代码？

浏览 1提问于2022-02-26得票数 1

回答已采纳

2回答

有没有一种方法可以使用循环和条件在R中创建数据框？

我想使用一个循环函数来创建一个现有数据帧的子数据帧。我有一个数据框，它由10列和多行组成。其中一列被标记为“答案”，有三种可能的答案--“是”、“否”或“我不知道”。现在，我想使用一个循环，后跟一个if函数来创建一个数据框，该数据框由答案为‘我不知道’的所有行组成。在我提到的10列中，有3列是“姓名”、“主题”和“联系号码”。我的新数据框由包含“我不知道”的行组成，也需要包含前面提到的3列。我如何使用循环和if函数来创建这个新的数据框？

浏览 36提问于2021-01-28得票数 0

3回答

如何在python中使用.add()函数合并两个数据帧

python、pandas

请使用所附图片作为参考。我有两个数据帧 df_class_a 使用数据： Subject maximum minimum Physics 98 50 Maths 100 45 Chem 99 65 带数据的df_class_b Subject maximum minimum Maths 100 45 Physics 98 44 Chem 85 50 language 88 54 我想把它们合并起来形成一个新的数据框，比如说df_add Subject maximum minim

浏览 21提问于2020-10-25得票数 2

回答已采纳

1回答

GeoPandas .sjoin大型结果表

python、pandas、geopandas

我有两个数据帧，每个数据帧都包含几何列。第一个数据帧包含POLYGONS，第二个数据帧包含POINT。我的目标是加入数据帧，以便将每个POINT分配给相应的POLYGON。DF_polygons有113704行，DF_points有23223行。我使用以下代码连接数据帧(还尝试了'within'和'contains')： points_in_polygons = gpd.sjoin(DF_points, DF_polygons, op='intersects') 问题是，它返回的结果在所有情况下都近似为3.000.000 rows。会有什么问

浏览 1提问于2020-06-01得票数 0

1回答

R中两个数据的盒形图

r、dataframe、boxplot

我想从中创建一个盒子图，在R中有两个不同的数据格式，在每个dataframe中，行表示示例。而列代表疾病。框图分布应根据每行中的值进行。数据应该显示每个数据帧(控制组、实验组)中行分布的比较。因此，如果每个数据帧中有6行，那么应该有12个框。应该是这样的。两种数据帧的行数相同，但列数不同，因为实验条件不同。我还希望按照数据帧的1的行中值重新排序这些图，并且对于整个框图，应该保留此顺序。有什么主意吗？我是R的新手，希望有任何线索。

浏览 7提问于2017-07-17得票数 1

回答已采纳

1回答

从python函数的dataframe中删除空行

python、pandas、dataframe

我希望在一个巨大的数据帧中找到特定的行，并在满足条件的情况下分配一个注释。我使用的代码部分如下： def check_car(x): if x['CAR'] == 'FERRARI' and x['COUNTRY'] != 'ITALY': return 'This is wrong' else: x.drop() 之后，我使用此函数来创建新的数据框，其中包含ID和注释。新数据帧包含带有“This is wrong”和None值的ID

浏览 1提问于2019-06-12得票数 0

1回答

迭代PANDAS DATAFRAME时添加、删除、编辑行和列

python、pandas、dataframe

我有一个包含超过50,000条tweet的csv文件，我在Pandas中以DataFrame的形式打开 df = pd.read_csv('dataset_tweets.csv') 我的目标是分析推文的情绪，在继续之前，我需要对推文进行规范化。我已经为此定义了一个函数，并且我想将输出添加为数据帧的新列(例如Text_Normalized)。然而，如果满足某些条件(例如，如果tweet不是用英语编写的)，我可能还需要删除该行。如何遍历数据帧，将"normalizer“函数应用于文本列，如果行不满足特定条件则将其删除，并最终添加一个文本规范化的新列？

浏览 6提问于2017-08-15得票数 1

回答已采纳

3回答

Pandas数据帧使用列逻辑对行进行重复数据消除

python-3.x、pandas、dataframe

我有一个大约有1亿行的熊猫数据帧。我对消除重复数据很感兴趣，但有一些标准我还找不到相关文档。我想要对数据帧进行重复数据消除，忽略其中一列会有所不同。如果该行是重复的，除了那一列之外，我只想保留具有特定字符串的行，比如X。示例数据帧： import pandas as pd df = pd.DataFrame(columns = ["A","B","C"], data = [[1,2,"00X"], [1,3,"010"]

浏览 27提问于2020-09-04得票数 2

回答已采纳

1回答

使用基于时间的存储将数据帧快速保存到mongodb？

python、pandas、mongodb

如何使用推荐的将熊猫数据帧保存到mongodb？本例中的数据具有带日期时间的索引和带整数的列。我知道如何为每个时间戳创建单个文档，但不知道如何安排数据帧或循环通过数据帧来为一个文档保存几分钟的数据。 client = MongoClient('localhost', 27017) db = client.testing data_df = pd.read_pickle('fake_data.pkl') for i, row in tqdm(enumerate(data_df.itertuples(), 1)): query = {'Time

浏览 9提问于2021-02-19得票数 1

2回答

列子集和过滤器Pandas

python、pandas

如何在一个命令中过滤Pandas数据帧中的行并仅获取pandas数据帧中的列的子集。我正在试着应用像这样的东西... frame[(frame.DESIGN_VALUE > 20) & (frame['mycol3','mycol6']))] 谢谢。

浏览 0提问于2015-10-02得票数 17

回答已采纳

1回答

保留具有矩阵R的相同列名的数据帧的行

r、dataframe、matrix、devtools

我想保留只有13列的数据帧(20行)矩阵的行，这意味着删除与矩阵的列名同名的数据帧的行。因此，最终得到了13行的最终数据帧，这是因为我想在将来绘制热图时将此数据帧注释到我的矩阵中。我不确定这是否真的可能:S 矩阵： ? DataFrame： ?

浏览 10提问于2020-04-22得票数 0

回答已采纳

1回答

从新添加的第二个Dataframe中提取行，与第一个Dataframe进行比较

我有两个数据帧，我需要在第二个数据帧中找到新添加的行，这意味着我的第一个数据帧有一些行，而我的第二个数据帧可以从我的第一个数据帧和其他一些行中有几个行。我需要找到那些不在第一个数据帧中的行。这意味着只在我的第二个数据帧中的行。下面是输出的示例 comp1<- data.frame(sector =c('Sector_123','Sector_456','Sector_789','Sector_101','Sector_111','Sector_113','Sector_115'

浏览 0提问于2020-06-22得票数 0

3回答

如何正确过滤Pandas中的多列？

python、pandas、filtering

我使用这个数据集：https://www.kaggle.com/uciml/pima-indians-diabetes-database。我想根据行是否包含任何零来过滤数据帧(Outcome除外)。当我尝试根据一列过滤数据帧时，一切都很好： ? 但是，当我尝试过滤两列或更多列时，根据我是否这样做，我得到了不同的行数： ? 或者这样： ? 我分别得到429行和652行。因此，我尝试使用iloc进行过滤 ? 但这只会用NaN填充列，而不会删除行。它还改变了Outcome列，我希望它保持不变。这个iloc方法似乎只在一次过滤一列时有效。有没有什么方法可以一次

浏览 121提问于2021-11-21得票数 2

回答已采纳

4回答

是否有使用列中的定性需求对数据进行子集的功能？

r、subset

我在为大型数据帧创建子集时遇到了问题。我需要提取与其中一列中两个正确城市之一匹配的所有行，但是我创建的任何子集最终都是空的。给定主要数据帧，我尝试： New = data[data$Home.port %in% c("ARDGLASS","NEWLYN")] 但是，R返回“选定的未定义列”

浏览 0提问于2020-03-11得票数 0

1回答

如何通过过滤另一个数据框的列来创建新的数据框

python、pandas、dataframe

我有几个数据集共享相同的列，所以我将它们连接在一起形成一个大的dateframe。我的想法是通过> .5过滤goals_per_90列，这样它就会创建一个新的数据帧，在新的数据帧中显示所有玩家的整行，其中的值大于.5。我现在正在考虑这样的事情，但是当我被卡住的时候 def gettopplayers(Dataframe): if Dataframe.loc[Dataframe['goals_per_90_overall'] > .5]: apply. 我迷路了，不知道要把这一行追加到哪里。任何帮助都将不胜感激。谢谢!

浏览 28提问于2020-08-22得票数 0

1回答

如何使用pandas dataframe函数维护样本中具有条件的某些行

python、pandas、point-clouds

我有一个这样的数据帧： SeqNumber X Y Z 0 12 4 5 5 1 12 7 5 -8 2 13 10 2 1 3 16 4 8 7 ... 我想在X_min，X_max和Y_min，Y_max之间的样本中识别对应于正Z值的SeqNumbers，然后将这些SeqNumbers保留在整个数据帧上。我如何使用.loc来做到这一点呢？如果我定义x_min = 3、x_max = 8、y_min =4和y_max = 6，则只会选择前两行。然后，在这些行中，只有第一行有一个正的Z。所以为

浏览 2提问于2021-09-12得票数 2

回答已采纳