如何通过将列的不同值放入不同的列来转换数据帧？_如何将多行数据放入新数据帧的不同列中_如何检查来自不同数据帧的列值？ - 腾讯云开发者社区

r、dataframe、type-conversion

我一般都喜欢R，但是类型转换的问题让我发疯了。下列问题：我从数据库连接中读取数据帧。结果是一个带有字符列的数据帧。我知道第一列是日期格式，其他的都是数字格式。然而，无论我如何尝试将数据帧的字符列转换为正确的类型，它都没有成功。当将数据帧转换为矩阵，然后返回到数据框架时，所有列都变成了类型因子--而将因素转换为数字生成了错误的结果，这导致了因子级别的指标被转换而不是实际值。此外，如果表的大小很大-我不想手动转换每一列。难道没有办法自动完成这件事吗？

浏览 1提问于2016-08-12得票数 1

回答已采纳

1回答

多胞胎加入大熊猫

pandas、merge

我正在寻找连接一个列的两个数据帧，如果有多个匹配，然后将结果附加到另一个列。

浏览 4提问于2022-09-16得票数 0

1回答

python:一个内核密度图，在单个数据帧中包含多个列

python、kernel-density

我需要制作一个包含多个列的数据帧的单个高斯核密度图，其中包括数据帧的所有列。有人知道怎么做吗？到目前为止，我只知道如何使用seaborn绘制单列的高斯核图。ax = sns.kdeplot(df['shop1'])但是，ax = sns.kdeplot(df)和ax = sns.kdeplot(df['shop1','shop2])都不能工作。否则，有没有变通的办法，我可以通过将每一列都添加到另一列来转换具有形状df.shape(544，33)到(17952，2)的数据帧？数据框包括一种产品的标准化价格，而每列表示不同的卖家，行表示价格的日期和时间

浏览 0提问于2017-04-25得票数 0

1回答

为不同的列定义不同的时间序列

r、datetime、time-series、forecasting

我有一个数据帧，其中一些列的开始时间晚于另一列。请找一个可重复使用的例子。 set.seed(354) df <- data.frame(Product_Id = rep(1:100, each = 50), Date = seq(from = as.Date("2014/1/1"), to = as.Date("2018/2/1"), by = "month"),

浏览 0提问于2019-05-10得票数 0

1回答

合并同一类型列上的两个数据帧会得到错误的结果

pandas、merge

我有两个数据帧，假设是A和B，它们是在读取Excel文件的工作表并执行一些基本功能后创建的。我需要在名为ID的列上对这两个数据帧执行merge right操作，这两个数据帧首先都被转换为astype(str)。左侧数据帧(A)的ID列为： 0 5815518813016 1 5835503994014 2 5835504934023 3 5845535359006 4 5865520960012 5 5865532845006 6 5875531550008 7 58854982

浏览 4提问于2019-10-08得票数 0

回答已采纳

1回答

数据清理:从熊猫栏中删除特定数量的零-

python、pandas、dataframe、data-cleaning

我需要帮助从数据帧中移除不需要的零。列值是整数，我不太确定如何从“年份”列中移除零。如下图所示，(蓝色高亮显示)，我试图在“2014”之后删除零。(本专栏中还有其他一些类似于此的值)

浏览 2提问于2022-10-10得票数 1

2回答

Pandas sort_value排序不正确

python、pandas

我在尝试对0-100之间的一列数字进行排序时遇到问题。 df_score = df.sort_values('score', ascending = False) 原始数据帧为df：和排序后的df：排序后的数据帧已正确排序，但最后两行除外，这两行都是100。它们应该在前两个条目中。我该如何解决这个问题？谢谢编辑:列不是数字形式，这是导致错误的原因。谢谢!

浏览 0提问于2020-08-06得票数 0

2回答

如何将数据帧中所有字段的值由十进制转换为整数

python、pandas、dataframe、floating-point、integer

我们有一个110万行×4300列的数据帧。数据框在不同的列中包含不同的浮点值，其中一个字段值的示例是0.567。为了读取包含所有浮点值的完整数据帧，我们需要大量的内存。因此，我们正在考虑通过将所有值转换为整数，通过将值乘以1000来读取完整的数据帧。那么有没有人能指导我们呢？

浏览 15提问于2021-06-21得票数 0

2回答

从Excel中将float作为字符串导入时出现问题。添加精度不正确

r、excel、openxlsx

使用openxlsx read.xlsx从多类列导入数据帧。所需的结果是将所有值作为字符串导入，与它们在Excel中的表示完全相同。但是，一些小数表示为非常长的浮点数。示例数据只是一个Excel文件，其中的一列包含以下行： abc123, 556.1, 556.12, 556.123, 556.1234, 556.12345 require(openxlsx) df <- read.xlsx('testnumbers.xlsx', ) 使用上面的R代码读取文件会导致df包含以下字符串 values: abc123, 556.1, 556.12,

浏览 0提问于2018-06-25得票数 1

1回答

将数据帧与数据帧列表进行匹配，并将新变量添加到R中的列表中

我有两个独立的数据帧 df1 ID Name loq 1 a 1.2 1 b 1.4 1 c 1.0 2 a 0.5 2 b 0.7 2 c 0.3 3 a 0.5 3 b 0.2 3 c 0.1 df2这是数据帧列表 [1] ID Name 1 a 3 b

浏览 0提问于2012-03-28得票数 1

回答已采纳

1回答

R中包含人名的两列的聚类分析

我是R的初学者，我必须在包含两列人员姓名的数据中进行聚类分析。我将其转换为数据帧，但它是字符类型。要使用dist()函数，数据帧必须是数字。我的数据示例： Interviewed.Type interviewed.Relation.Type 1. An1 Xuan 2. An2 The 3. An3 Ngoc 4.

浏览 0提问于2012-07-09得票数 0

1回答

我如何将其绘制为折线图？

python、pandas、dataframe、matplotlib

我有下面的数据。我在想我该怎么画出来。这是一个数据帧，第一列是索引，第二列保存时间戳(左边的数字)，然后是价格。这只显示了前5行，但数据帧实际上是(366，1)。我不确定如何拆分数据，这样我就可以制作一个折线图。 prices 0 [1577836800000, 1.011314677267319] 1 [1577923200000, 1.048537268947032] 2 [1578009600000, 0.9541815075748614] 3 [1578096000000, 0.9551243387141036] 4 [157818240

浏览 10提问于2021-04-09得票数 0

回答已采纳

1回答

Python Pandas:将dataframe转换为Str后，NAN不再是NAN

python、pandas

我有一个从Excel导入的数据帧。导入后，我检查了有很多 NAN 数据帧中的值。当我将dataframe列转换为Str对象时。没有剩余的NaN值。我的意思是，dataframe不能再计算NaN值了。那些 NAN 值显示为 nan 在数据帧中。我真的想要那些 NAN 数据框中的空单元格，如Excel。有什么建议吗？

浏览 151提问于2021-03-01得票数 0

回答已采纳

1回答

isnull()函数无法识别数据中的缺失值

python、pandas、numpy、data-cleaning

我在一个数据帧上使用df''.isnull()，我当前正在使用从CSV中拉出的数据帧。实践数据故意有很多缺失值和错误，然而，熊猫无法识别“道布”列中的缺失值，通过打开CSV并看到“道布”列下的空单元格来验证是否存在缺失值。 df['DOB'].isnull().sum() Output: 0

浏览 85提问于2020-10-25得票数 2

回答已采纳

1回答

创建二进制数组表

python、pandas

给定具有数值的pd.DataFrame。我创建了一个汇总每列的行，如果数字大于或小于列数量的0.1 %，我想将其转换为二进制值0 /1。 dataframe example最后一行是列的总和(数据帧很大，它只是其中的一部分) 我知道每行和每列都需要一个循环。我命令用R： percent <- vector(length=nrow(df)) for (i in 1:ncol(df)) { percent[i] <- sum(df[, i])*0.001 } df_bin <- df for (i in 1:33) { for (j in 1:nr

浏览 16提问于2020-05-03得票数 0

回答已采纳

2回答

如何更改python中所有列的数据类型

python、pandas

我使用的是pandas数据帧。数据包含3032列。所有列都是'object‘数据类型。如何将所有列转换为“float”数据类型？ ? ?

浏览 30提问于2020-12-01得票数 1

回答已采纳

3回答

比较pandas数据帧的行(行有一些重叠值)

python、pandas、dataframe

我有一个包含21列的pandas数据框架。我将重点放在具有完全相同的列数据值的行子集上，除了每行唯一的6个之外。我不知道这6个值对应的是先验的列标题。我尝试将每一行转换为Index对象，并对两行执行set操作。例如。 row1 = pd.Index(sample_data[0]) row2 = pd.Index(sample_data[1]) row1 - row2 它返回一个索引对象，其中包含row1独有的值。然后，我可以手动推断哪些列具有唯一值。如何以编程方式获取这些值在初始数据帧中对应的列标题？或者，有没有办法比较两个或多个数据帧行，并提取每行的6个不同的列值，以及相应的标题？理想

浏览 4提问于2013-05-14得票数 8

2回答

根据R中的字母顺序将数值分配给字符串

r、rank

我想在我的数据框中创建一个数字列，其中数字表示字符列中字符串的字母顺序。因此，假设我创建了以下数据帧： df <- data.frame (names = c("Frank"，"Jack"，"Peter")) 如何添加一个新列，其中Frank获得值1，Jack 2和Peter 3(基于名称的字母顺序)？

浏览 13提问于2021-03-19得票数 0

3回答

从csv文件向现有apache spark数据帧添加数据

python、apache-spark、pyspark、spark-dataframe

我有一个spark dataframe，它有两列: name，age，如下： [Row(name=u'Alice', age=2), Row(name=u'Bob', age=5)] 数据帧是使用以下命令创建的 sqlContext.createDataFrame() 接下来我需要做的是从外部的'csv‘文件中添加第三列'UserId’。外部文件有几列，但我只需要包括第一列，即'UserId'：两个数据源中的记录数相同。我在windows操作系统上使用的是独立的pyspark版本。最终结果应该是一个包含三列的新数据帧:

浏览 9提问于2016-09-16得票数 0

回答已采纳

2回答

向DataFrame Python添加新列。SettingWithCopyWarning

python、pandas

我试图在数据帧中添加一个新列。我有一列日期，我将其转换为秒-自纪元，并将其添加到数据帧的新列中。 def addEpochTime(df): df[7] = np.NaN # Adding empty column. for n in range(0, len(df)): # Writing to empty column. df[7][n] = df[0][n] - 5 # Conduct some mathematical mutations... addEpo

浏览 5提问于2015-08-17得票数 0

回答已采纳

1回答

将dataframe列的条目与列表进行匹配，并基于匹配创建新列

python、pandas、list、dataframe

我正在寻找一种pythonic方法来处理这个数据帧列和列表匹配问题：这是我的数据框架： ? 现在，我有一个roll_no的列表： roll_no_matching = [3,5] 我想在这个列表和B栏，也就是roll_no栏之间做一个匹配。并插入一个新列，该列的0表示不匹配，1表示匹配。例如，生成的数据帧将如下所示： ? 我知道如何基于任何索引列匹配两个数据帧，并可能合并两个数据帧中的一些列，但我不确定如何创建新列。这里的任何指导都是非常感谢的。

浏览 13提问于2021-01-07得票数 1

回答已采纳

3回答

p.adjust对整个数据帧的尊重

我有一个p.value数据帧，每个列都有变量名。我的代码是sapply(pval,p.adjust,method="fdr")。这段代码返回基于每一列调整的qvalue，这意味着基于每一列的p个排名然后进行调整。我如何对整个数据帧进行fdr，这意味着p在所有数据中排名？

浏览 3提问于2015-10-04得票数 2

2回答

将所有值字符串列数据帧与其他数据帧字符串列进行匹配

python、pandas

我有两个熊猫数据帧：数据帧1： ITEM ID TEXT 1 some random words 2 another word 3 blah 4 random words 数据帧2： INDEX INFO 1 random 3 blah 我想要将( dataframe 2的) INFO列的值与dataframe 1的TEXT列进行匹配。如果匹配，我希望看到一个新的列带有"1“。如下所示： ITEM ID TEXT MATCH 1 some random words

浏览 8提问于2020-03-11得票数 1

回答已采纳

1回答

按R和add作为列计算月中的日和月平均数

r、dataframe、dplyr、tidyverse

我有一个数据框架存储在一年内的每日数据，我想要计算月平均数和星期平均日，并将这些值作为额外的列。这是我的数据帧的MWE df <- tibble(Date = seq(as.Date('2020-01-01'), by = '1 day', length.out = 365), Daily_sales = rnorm(365, 2, 1)) df <- df %>% mutate(month = lubridate::month(Date), #Month dow = lubridate::wday

浏览 6提问于2022-07-01得票数 1

回答已采纳

2回答

Pandas仅删除NaN和float为0.0的行

python、python-3.x、pandas

我有一个dataframe，其中每一列代表一个用户。我正在尝试删除一个只有NaN和0.000000的any列，这样Username1或第一列就不会包含在数据帧中，而其他列会包含在数据帧中。这是数据帧： username 1 2 3 4 5 date 2019-01-16 NaN 9.16667 NaN NaN 1.000000 2019-01-17 NaN NaN NaN 1.000000 1.000000 2019-0

浏览 12提问于2019-02-04得票数 3

回答已采纳

1回答

如何统计scala Dataframe中列的特定值的记录更改

scala、apache-spark

在数据帧中，列具有如下所示的输入： | id| priority| status| datetime|data_as_of_Date|Amount|open_close| | 1|Unassigned| Fixed| 10/8/2019 0:00| 2/12/2020 0:00| 40| Closed| | 1|Unassigned| New|2/12/2019 11:00| 2/12/2020 0:00| 20| Open| | 1|Unassigned|F

浏览 9提问于2020-05-09得票数 1

3回答

故障理解列表和数据帧交互

我有一个数据帧的列表，并且可以帮助理解调用某些数据的约定，因为我正在交叉连接。我试图将许多数据帧中的多列合并到一个数据框架中，最后我将主要使用线条图来说明随时间推移的趋势。然而，我一直在试图创建一个数据框架。下面是一些示例数据，它们将在一个代表我的数据结构的列表中创建两个数据框架： ValueID <- c(1610, 1638, 1651, 1652, 1741, 1748, 1759, 1761, 1766) Area <- c(136300, 73900, 230000, 178700, 54700, 4500, 120000, 3400, 45000) Dep2001 &

浏览 0提问于2015-06-17得票数 1

回答已采纳

1回答

在对枚举/类别类型列求和时，h2o dataframe GroupBy sum函数的作用是什么？

h2o

想知道当列类型是分类的(特别是h2o enum类型)时，在h2o dataframe GroupBy对象中求和列时会发生什么。将pandas数据帧转换为H2o数据帧。然后，我按某一列对行进行分组，并对其他列求和。 location_id price store ------------------ 1 10 JCP 1 15 SBUX 3 20 HOL then after grouping and summing; df.group_by('location_id').sum(['

浏览 26提问于2019-04-02得票数 0

回答已采纳

1回答

不带for循环的R操作

r、loops、for-loop

我有一个索引数据帧，它有索引$ row和index$col列，它们表示X数据帧的行和列。索引数据帧 row col 375 1 376 1 379 1 380 1 381 1 460 4 461 4 462 4 463 4 我想取X数据帧中每个观测值的最小值，该值由索引数据帧表示。如果不使用for循环，我该怎么做呢？我需要这个，因为我有多个索引数据帧，而这在for循环中需要很长时间。

浏览 2提问于2017-01-22得票数 0

1回答

利用熊猫来寻找每天的平均值

python、csv、pandas

我目前正在编写一个代码，该代码接受如下所示的.csv文件： 724070 93730 19800101 0 330 1.5 22000 -1.7 -5 1013.6 78 724070 93730 19800101 100 230 1.5 22000 -2.7 -5.5 1013.7 81 724070 93730 19800101 200 0 0 22000 -3.8 -4.9 1013.9 92 724070 93730 19800101 300 340 1.5 22000 -5.6 -6.1

浏览 1提问于2014-05-05得票数 1

回答已采纳

1回答

在数据框中查找唯一值，而无需循环

python、pandas

如何在不循环的情况下跨数据帧找到唯一值？ df1 = pd.DataFrame(np.random.randint(0,105673,size=100).reshape(10,10)) df2 = pd.DataFrame(np.random.randint(0,206782,size=100).reshape(10,10)) df3 = pd.DataFrame(np.random.randint(0,435612,size=100).reshape(10,10)) 为了只找到一个数据帧的唯一值，我使用了pd.unique(df1.values.ravel())。在遍历数据帧时，使用列表追加

浏览 0提问于2014-01-16得票数 1

1回答

按相同列、不同顺序的结果数据帧对三组进行联合

python、pandas、pandas-groupby、concat

我已经创建了三个不同的pandas数据帧，方法是将Group by应用于三个不同的数据，列分别为A、B、C。 Resultdf=SessionDev.query(AppDetails).filter(text(" A in ('20170727L00319')")).all() df1= Resultdf.groupby(["A", "B","C"]).size().reset_index(name='Count') df1 A | B

浏览 13提问于2018-12-31得票数 0

19回答

有没有一种简单的方法可以将Pandas数据帧中的yes/no列更改为1/0？

python、pandas、dataframe、series

我将csv文件读入pandas数据帧，并希望将具有二进制答案的列从yes/no字符串转换为1/0整数。下面，我展示了其中一列("sampleDF“是pandas数据帧)。 In [13]: sampleDF.housing[0:10] Out[13]: 0 no 1 no 2 yes 3 no 4 no 5 no 6 no 7 no 8 yes 9 yes Name: housing, dtype: object 非常感谢您的帮助！

浏览 18提问于2016-12-01得票数 53

2回答

如何在R中转换数据帧

r、tidyr

我有一个数据框 newDF<-data.frame(type=c(rep("A",4), rep("B",2),rep("C",3), rep("D",4),rep("E",4)), cluster=sample(1:4,17,replace=T), count=sample(1:20, 17, rep=T), sum=sam

浏览 0提问于2015-06-16得票数 0

1回答

如何计算字符或数字在整个DataFrame中的实例？

python

假设我有一个数据帧列表month[1..12]，每个数据帧有10行和30列，填充了数字0、1，有时还填充了"N“。我必须计算每个数据帧中每个0、1和"N“的实例数。期望的结果如下所示： month[1].stack().value_counts() 1: 200 0: 80 "N": 20 不幸的是，上面的代码给出了错误的答案。你会如何用其他方法来解决这个问题？

浏览 5提问于2019-12-22得票数 0

回答已采纳

2回答

从引号中解开.csv行

python、pandas、csv

.csv文件如下所示 col1, col2, col3 "a, b, c" "d, e, f" 我想解开引号中的行以正确读取pandas/Python中的文件。如R中的重复问题所述，可以读取.csv数据两次: 1)展开辅助数据帧的第一列中的数据，以及2)调用辅助数据帧的第一列上的读取函数。对熊猫来说，最优雅的方式是什么？

浏览 0提问于2018-12-15得票数 1

1回答

删除联接中用作“by”参数的列

r、dplyr

我有以下查询： library(dplyr) FinalQueryDplyr <- PostsWithFavorite %>% inner_join(Users, by = c("OwnerUserId" = "Id"), keep = FALSE) %>% select(DisplayName, Age, Location, FavoriteTotal, MostFavoriteQuestion, MostFavoriteQuestionLikes) %>% select(-c(OwnerUserId)) %>%

浏览 1提问于2020-04-18得票数 1

回答已采纳

1回答

处理R中的数据帧列表

r、dataframe

我正在尝试并行运行模拟。 iterations = 50000 sim = foreach(i=1:iterations) %dopar% sim(dataframe, ... ) 列表sim中的每个项目是具有40列和100行的数据帧。每个数据帧都有一个ID列。我想通过ID确定超过50,000个模拟的平均分数。我尝试了以下方法，但速度非常慢，我认为这是因为它必须不断地重新生成数据帧： results = do.call(rbind.data.frame, sim) avg.scores = ddply(sim,~Player,summarise,mean=mean(score)) 我还尝试设

浏览 1提问于2015-03-14得票数 1

2回答

使用pandas dataframe返回满足两个条件的列

python、numpy、pandas、dataframe

我是python的新手，在这里我有一个问题，我不知道如何解决，请帮助。事情是这样的:我有一个dataframe，我想提取一个满足两个不同条件的列。列如下所示： state gender year name births 13299 AK F 2013 Emma 57 13300 AK F 2013 Sophia 50 13301 AK F 2013 Abigail 39 13302 AK F 2013 Isabella

浏览 1提问于2016-06-29得票数 0

1回答

字符串(对象)数据的to_sql内存不足错误

python、sql、pandas、dataframe

我正在使用to_sql将pandas数据帧写入SQL server数据库。数据帧很小(1列，100行)。然而，我得到了一个错误： cursor.executemany(statement, parameters) MemoryError 该列的dataType为object (即string)。如果我将dataType转换为INT，则代码执行时不会出现错误。为什么对象数据会导致内存不足错误?我如何修复它？

浏览 3提问于2020-09-19得票数 0

2回答

在使用to_flat_index之后如何处理列？

python、pandas

在使用to_flat_index()函数时，我观察到列名的一些奇怪行为。从MultiIndex数据帧开始 a=[0,.25, .5, .75] b=[1, 2, 3, 4] c=[5, 6, 7, 8] d=[1, 2, 3, 5] df=pd.DataFrame(data={('a','a'):a, ('b', 'b'):b, ('c', 'c'):c, ('d', 'd'):d}) 生成此数据帧 a b c d a b c d

浏览 29提问于2020-03-04得票数 0

回答已采纳

3回答

如何在Pandas数据帧中找到最大值的行和列的索引？

python、pandas、dataframe

我有一个很大的Pandas数据帧，我想找出最大值所在的列和行(在整个数据帧中)。不幸的是，df.idxmax()只返回每行/列的最高值的索引，而不是整个数据帧的索引。有没有办法做到这一点？

浏览 136提问于2021-07-28得票数 2

回答已采纳

1回答

TypeError: float()参数必须是字符串或数字，而不是“函数”

machine-learning、python、predictive-modeling、pandas、data-cleaning

我在努力清理数据。但我不知道如何从数据帧中的列中删除函数。 📷 在第473行，它显示列N有一个函数。它应该如何过滤掉？

浏览 0提问于2018-05-21得票数 6

回答已采纳

1回答

如何在pandas中获取整个数据帧的最大值

python-2.7、pandas、max

我已经对数据进行了排序，现在的数据帧是这样的： Tr Srate(V/ns)mean Tf Srate(V/ns)mean CPULabel 100HiBW_Fast 3.16 3.09 100LoBW_Fast 3.16 3.09 BP100_Fast 3.16 3.06 我的数据帧是slew_

浏览 11提问于2017-06-23得票数 4

回答已采纳

3回答

如何在不更改数值的情况下将因子格式转换为R中的数字格式？

r、numeric、r-factor

下面是我想要在不改变当前值(0；0；8,5；3)的情况下将其列"V2“从因子格式转换为数值的数据帧df1。 df1= V1 V2 V3 X2 X3 4470 2010-03-28 0 A 21.53675 0 4471 2010-03-29 0 A 19.21611 0 4472 2010-03-30 8,5 A 21.54541 0 4473 2010-03-31 3 A NA NA 由于"V2“列是因子格式，我首先将其转换为字符格式：df1[,2]=as.character(df1[,2]) 然后

浏览 0提问于2013-05-02得票数 4

回答已采纳

3回答

从依赖的pyspark dataframe中选择列时，显示的行的顺序会发生变化

apache-spark、pyspark、apache-spark-sql

当我通过show显示dataframe列的子集时，为什么显示的行的顺序不同？以下是原始数据帧：这里的日期是给定的顺序，如您所见，通过show。现在，当我为新数据帧选择predict_df by列选择方法的子集时，通过show显示的行的顺序发生了变化。

浏览 4提问于2021-05-16得票数 3

1回答

将索引设置为驻留在级别3多索引数据帧中的日期列

python、pandas

对于如下所示的数据帧： ? 我想简单地将索引设置为日期列，即您看到的第一列。数据帧来自一个api，我在其中将数据保存到csv中： data.to_csv('stocks.csv', header=True ,sep=',',mode='a') data = pd.read_csv('stocks.csv',header=[0,1,2]) data 最好我也想去掉"Unnamed:..“你在图中看到的标签。谢谢。

浏览 0提问于2020-01-08得票数 0

1回答

sort()运行良好，但使用它显示完整的排序数据框会产生不同的输出，而不是排序后的输出

我想按列的内容对数据框进行排序。使用sort()函数但不能获得排序后的数据帧我有一个像姓名，年龄，性别这样的列的数据框架。我想要根据年龄对数据帧进行排序我尝试了sort(data_info$Age)，它给出了正确的输出： > my_sort <- sort(data_info$Age) [1] 19 19 19 20 20 20 20 20 20 20 20 20 20 21 23 Levels: 19 20 21 23 现在想要根据年龄对完整的数据帧进行排序，所以使用： > group_info_df[my_sort,] 我希望得到排序后的数据帧，但输出结果是

浏览 7提问于2019-07-08得票数 0

回答已采纳

1回答

Pythonic式的通过迭代创建字典的方法

python、pandas

我正在尝试写一些东西来回答“每一列中可能的值是什么？” 我创建了一个名为all_col_vals的字典，并从1迭代到我的数据帧有多少列。然而，当在网上读到这一点时，有人说这看起来太像Java了，更多的pythonic方式是使用zip。我不明白我怎么能在这里使用zip。 all_col_vals = {} for index in range(RCSRdf.shape[1]): all_col_vals[RCSRdf.iloc[:,index].name] = set(RCSRdf.iloc[:,index]) 输出看起来像'CFN Network': {nan, &#

浏览 14提问于2019-07-03得票数 3

回答已采纳

2回答

在R中设置数据帧中的空白行

r、dataframe、subset

如果给定列中的行为空白或NA，我如何从数据帧中子集行。例如： x <- c(1,2,3,4,"","","") y <- c("A","B","C","D","E","F","G") z <- c(100,200,300,400,500,600,700) xyz <- data.frame(x,y,z) View(xyz) g1 <- subset(xyz,

浏览 1提问于2013-08-14得票数 2

回答已采纳