将列动态添加到R中的dataframe_R将CDF列添加到DataFrame_使用dplyr将新列添加到R中的dataframe - 腾讯云开发者社区

r、rbind

我有dataframe (dataframexml)，它有3个cols-名称、路径和URL以及URL上的多个rows.Based，我在R中解析XML并使用getdataframe() function.So创建一个基于URL数量的数据Name，将生成许多数据文件。(所有数据格式都有相同的列) 现在，我需要向每个dataframe添加一个新列，它将在所有行中都有dataframe名称，并将一个dataframe动态地附加到另一个dataframe上，创建主dataframe。这部分是我被困的地方。寻求一些指导。代码： for (i in 1:nrow(dataframexml)){ data

浏览 3提问于2017-04-21得票数 0

回答已采纳

1回答

如何将多个数据帧中的单个列重命名为它们在R中所在的数据帧的名称？

r、dataframe、naming

我目前正在尝试重命名多个dataframe中的单个列，以匹配R中的dataframe名称。我在网站上看到了一些问题/解决方案，这些问题/解决方案与我正在尝试做的事情相似，但似乎没有一个是动态完成的。我有超过45个数据帧需要重命名其中的一个列，因此手动输入每个单独的名称是可行的，但很耗时。 Dataframe1 <- column Dataframe2 <- column Dataframe3 <- column I want it to look like this: Dataframe1 <- Dataframe1 Dataframe2 <- Datafr

浏览 0提问于2019-11-07得票数 0

1回答

如何使用XLSX包动态合并来自R闪亮应用程序的xlsx下载列？

r、shiny、xlsx

我正在尝试使用XLSX包动态合并来自R闪亮应用程序的xlsx下载列。目前，我可以合并从静态dataframe创建的XLSX文档的列，如下面的最小示例所示： library(xlsx) # Creating dataframe. df <- data.frame(c("Title", 1, "one"), c("", 2, "two"), c("", 3, "three")) # Creating a workbook us

浏览 2提问于2018-04-25得票数 0

回答已采纳

1回答

如何从列表创建新的DataFrame？

scala、apache-spark、dataframe、dataset

大家好，我有一个函数，它从一个DataFrame中获取行值，将它们转换成一个列表，然后从中生成一个数据帧。 //Gets the row content from the "content column" val dfList = df.select("content").rdd.map(r => r(0).toString).collect.toList val dataSet = sparkSession.createDataset(dfList) //Makes a new DataFrame sparkSession.

浏览 13提问于2019-07-16得票数 0

2回答

一次聚合一个dataframe的所有列

r、apache-spark、pyspark、aggregate-functions

我希望在一个列上分组一个dataframe，然后在所有列上应用一个聚合函数。例如，我有一个带有10列的df。我希望对第一列"1“进行分组，然后对其余的所有列(都是数字列)应用一个聚合函数'sum‘。它的R等价值是summarise_all。在R. df = df%>%group_by(column_one)%>%summarise_all(funs(sum)) 我不想手动在pyspark中的聚合命令中输入列，因为dataframe中的列数将是动态的。

浏览 1提问于2019-05-22得票数 4

回答已采纳

1回答

在rpy2中，是否有一种简单的方法可以生成不同值长度的数据？

python、dataframe、rpy2

当我这么做时： import rpy2.robjects as R exampleDict = {'colum1':R.IntVector([1,2,3]), 'column2':R.FloatVector([1,2]), 'column3':R.FloatVector([1,2,3,4])} R.DataFrame(exampleDict) 我得到的错误是，这些行不是相同的长度：“参数意味着不同的行数: 2、4、3”。我之前是如何解决这个问题的:先遍历这些列表，然后再将它们作为向量，然后将NA添加到所有小于最长的列表中，直到它们都具有相同的长

浏览 5提问于2012-04-03得票数 0

回答已采纳

3回答

如何根据R中的另一个数据框重命名数据框的所有列？

我对R非常陌生，我正在尝试根据另一个数据帧来重命名一个数据框的列。基本上，我的数据看起来像这样 DataFrame1 A B C D 1 2 3 4 我还有另一张表，看起来像这样‘DataFrame2 Col1 Col2 A E B Q C R D Z 我想根据这个表重命名我的第一个数据框的列，这样它就会显示出来： E Q R Z 1 2 3 4 我正在尝试使用plyr库进行循环。这是我尝试过的命令： library(plyr) for (i in names(DataF

浏览 23提问于2016-07-28得票数 8

回答已采纳

2回答

PySpark -拆分所有列中的数组并合并为行

apache-spark、pyspark

在PySpark中有没有一种方法可以同时分解所有列中的数组/列表，并将分解后的数据分别合并/压缩到行中？根据其他因素，列数可以是动态的。从dataframe |col1 |col2 |col3 | |[a,b,c]|[d,e,f]|[g,h,i]| |[j,k,l]|[m,n,o]|[p,q,r]| 到dataframe |col1|col2|col3| |a |d |g | |b |e |h | |c |f |i | |j |m |p | |k |n |q | |l |o |r |

浏览 17提问于2018-02-27得票数 1

回答已采纳

3回答

在Python的for-循环中丢弃行数据

python、dataframe、for-loop

我有多个具有多列的数据文件，如下所示： DF = A B C metadata_Colunm r1 6 3 9 r1 r2 2 1 1 r2 r3 5 7 2 r3 如何使用for -循环对每一列进行迭代，以生成新的dataframe，然后为每个新的dataframe删除值低于5的行？结果应该如下所示： DF_A= A metadata_Colunm 6 r1 5 r1 DF_B= B metadata_Colunm 7 r3 D

浏览 5提问于2021-12-03得票数 1

回答已采纳

2回答

如何标记对角线矩阵中的行和列？

r、matrix

我在R中创建一个方差的对角矩阵，因此： D <- diag(data $ Variances, length(data $ Variances), length(data $ Variances)) 有人知道如何添加行标签和列标签吗？标签是来自dataframe "data“列" species”中的物种名称，"Variances“列也取自该列。

浏览 0提问于2013-05-14得票数 2

回答已采纳

1回答

从dataframe火花scala中选择列数组和expr

scala、apache-spark、apache-spark-sql

我们可以从数据文件中选择列列表和expr吗？我需要从dataframe中选择列和expr的列表。下面是列的列表 val dynamicColumnSelection = Array("a", "b", "c", "d", "e", "f") // These columns will change dynamically. 此外，我还有一个expr可以与上面的列一起从相同的数据格式中选择。 expr("stack(3, 'g', g, 'h', h, &#

浏览 2提问于2019-11-26得票数 0

回答已采纳

2回答

使用spark sql实现Parquet的数据类型转换-动态转换，无需显式指定列名

pyspark、apache-spark-sql、spark-dataframe、hiveql、parquet

我正在寻找一种动态处理数据类型转换的方法。SparkDataframes，我正在使用hive SQL将数据加载到Dataframe中，并将其存储到dataframe中，然后写入到parquet文件中。Hive无法读取某些数据类型，我希望将decimal数据类型转换为Double。是否有任何方法可以动态处理数据类型，而不是单独指定每个列的名称。假设在我的dataframe中，8列中有50列是小数，并且需要将所有8列转换为双精度数据类型，而不指定列名。我们可以直接这么做吗？

浏览 3提问于2017-05-16得票数 0

1回答

如何将rpy2矩阵对象转换为Pandas数据帧？

python-2.7、pandas、rpy2

在使用熊猫读取.csv文件，然后使用rpy2包将其转换为R数据后，我使用一些R函数(也通过rpy2)创建了一个模型，现在我想将模型的摘要转换为pandas (这样我就可以将其保存为.csv文件或用于其他目的)。我遵循了熊猫网站上的说明(来源：)，以便找出答案： import pandas as pd from rpy2.robjects import r import sys import rpy2.robjects.packages as rpackages from rpy2.robjects.vectors import StrVector from rpy2.robjects imp

浏览 3提问于2017-09-13得票数 0

回答已采纳

1回答

使用python将excel文件转换为文本文件时删除索引值

python、python-3.x、pandas

我使用的是Python3.7，我想把.xlsx文件转换成.txt文件，下面是我的代码： import pandas as pd dataframe1 = pd.read_excel(r'C:\path\exceldata1.xlsx', index=False) print(dataframe1) with open(r'C:\path\exceldata1.txt', 'w') as text_file: dataframe1.to_string(text_file) 我可以将.xlsx转换为.txt，但我也可以在文本文件中打印索

浏览 21提问于2020-02-05得票数 0

回答已采纳

2回答

星火中的动态列选择(基于另一列的值)

scala、apache-spark

对于给定的星火DataFrame： > df.show() +---+-----+---+---+---+---+ | id|delay| p1| p2| p3| p4| +---+-----+---+---+---+---+ | 1| 3| a| b| c| d| | 2| 1| m| n| o| p| | 3| 2| q| r| s| t| +---+-----+---+---+---+---+ 如何动态选择列，使新的col列是p{delay}现有列的结果？ > df.withColumn("col", /* ?

浏览 2提问于2017-09-22得票数 1

回答已采纳

1回答

在R中使用聚合创建数据帧

r、dataframe、aggregate

我正在尝试从现有的dataframe创建一个dataframe，只为指定的列值(我的数据中的一个物种)保留特定的列。本质上，我打算为我的数据集中的每个物种创建单独的数据帧，详细说明它们降落的站点，并保留运输的养殖剂(RF.haul)。我的建议是 QSC <- with(Dataframe[Dataframe$Species=="QSC", ], aggregate(number=RF.haul), by(Station=Station), FUN = sum, na.rm= TRUE) 我得到了各种各样的错误，主要是"object not found“和代码中的

浏览 0提问于2020-08-28得票数 0

1回答

在if语句中使用变量名的向量

r、variables、dataframe

我刚开始使用R，但在我尝试做的事情中，我经常遇到这个问题。我希望根据传递给包含函数的值将函数应用于data.frame中的特定列。它看起来像这样： myfunction <- function(var) { < do something to mydata$var > } 其中，var可以是mydata ( data.frame)中任何列的名称。问题出在代码的dataframe$var部分。我不知道如何动态地调用这样的变量名。dataframe[,var]似乎不起作用，dataframe[,get(var)]或dataframe[,eval(var)]也不起

浏览 0提问于2014-04-24得票数 0

1回答

基于dataframe的两列创建网络，并将其组件ids添加为新的聚合列。

python、r、pandas、data.table、networkx

在R中，我可以基于dataframe的两列创建一个网络，然后将其集群成员In作为新的聚合列分配给原始的dataframe，如下所示。 library(igraph) library(data.table) g = graph_from_data_frame(df[, .(col1, col2)]) clu = clusters(g) df[, cluId := clu$membership[as.character(df[, col1])]] 你将如何在Python中对熊猫和照片，或者网络进行同样的操作？我在这里发现了一个类似的问题，但所提供的答案非常缓慢。示例：

浏览 2提问于2018-03-28得票数 2

1回答

如何从一个PDF的多个页面中提取多个表，并将它们全部放在一个DataFrame中？

python、pandas、dataframe、python-camelot

我想把一个PDF的所有表放到一个DataFrame中，而这些表有相同的列。 ka1 = camelot.read_pdf(r"example.pdf",'all') for i,table in enumerate(ka1): v = table.df w = pd.concat(v) print(w)

浏览 10提问于2022-05-09得票数 0

1回答

第二个y轴在ggplot2命令下消失，有炸药滴答=true，ggplot2

r、ggplot2、ggplotly

我已经在R中创建了下面的数据和相关的ggplot图表，首先我们使用R导入库 library(plotly) library(ggplot2) 接下来，我们按照如下所示创建数据 dataframe_1<-data.frame("Month"=c(1:12)) dataframe_1$Sales<-25*dataframe_1$Month dataframe_1$Fac1=dataframe_1$Sales/100 dataframe_1$Month<-as.character(dataframe_1$Month) 接下来，我们

浏览 1提问于2020-04-28得票数 5

2回答

scala从Map转换为dataframe

scala

如何将input5数据格式转换为dataFrame，使用模式名中提到的模式细节..the转换应该是动态的，而不使用Row(r(0),r(1))输入和模式中的列数可以增加或减少，因此代码应该是动态的 case class Entry(schemaName: String, updType: String, ts: Long, row: Map[String, String]) val input5 = List(Entry("a","b",0,Map("col1 " -> "0000555", "ref" -

浏览 7提问于2017-09-22得票数 0

2回答

是否有方法在SQL雪花中将多列中的特定值替换为null？

python、sql、r、stored-procedures、snowflake-cloud-data-platform

我有一个雪花表，多个数据列的默认值作为1900-01-01输入，然后在我的机器上手动将其更改为R中的null。但是，由于我处理的是30M+行，所以我想尝试在雪花中实现这一点，而不是我的本地机器，因为它需要永远的时间。我知道有一个replace()函数，我可以手动引用每一列并用null替换1900-01-01，但是是否有一种方法可以引用数据类型等于数据的所有列，然后运行这个replace()参数呢？在R中，我们有tidyselect动词，所以在dataframe中，我们可以根据列名或列类型中的模式动态地引用许多列，以查看SQL中是否有类似的内容？

浏览 10提问于2022-08-18得票数 1

回答已采纳

1回答

Pandas DataFrame的条件级联

python、pandas

我正在连接的列，并希望提高代码的速度。我的数据有以下结构： Apple Pear Cherry 1 2 3 4 5 NaN 7 8 9 我只想连接Cherry列的内容，如果在相应的行中实际存在值。如果我的代码工作正常，那么上面示例的结果应该是： Result 1 :: 2 :: 3 4 :: 5 7 :: 8 :: 9 到目前为止我的代码是： a_dataframe[result] = a_dataframe.apply(lambda r:

浏览 0提问于2017-02-06得票数 4

回答已采纳

2回答

将Dataframe转换为scala可变映射不会产生相同数量的记录

scala、dictionary、apache-spark、dataframe、collections

我对Scala很陌生。我正在开发Scala/Spark应用程序，该应用程序从一个单元表中选择几个列，然后将其转换为一个可变的映射，其中第一列为键，第二列为值。例如： +--------+--+ | c1 |c2| +--------+--+ |Newyork |1 | | LA |0 | |Chicago |1 | +--------+--+ 将转换为Scala.mutable.Map(Newyork -> 1, LA -> 0, Chicago -> 1) 下面是我进行上述转换的代码： val testDF = hiveContext.sql("

浏览 3提问于2017-10-28得票数 0

回答已采纳

1回答

将Excel文件附加到Python

python、excel、pandas、dataframe、append

下面的代码通过Regis文件夹中的excel文件并将它们附加到一个新的DataFrame中。我需要对代码做以下修改：数据从第7列开始，所以我不需要追加每个文件的前6行，每个表在文件名的末尾都有一个日期。"Regis 30012022“最后8个数字是日期(欧洲格式)，我想添加一个列，以便我知道数据所指的日期。此日期应添加到A列中。 import pandas as pd import glob # path of the folder path = r'Regis' # reading excel files filenames = glob.glob(path

浏览 3提问于2022-02-08得票数 0

回答已采纳

1回答

使用Pandas数据帧改进Python for循环的性能

python、performance、pandas

请考虑以下DataFrame df： timestamp id condition 1234 A 2323 B 3843 B 1234 C 8574 A 9483 A 根据列条件中包含的条件，我必须在此数据框中定义一个新列，该列计算该条件中有多少个in。但是，请注意，由于DataFrame是按时间戳列排序的，因此可能有多个条目具有相同的id，因此简单的.

浏览 9提问于2018-07-01得票数 0

回答已采纳

2回答

python数据写入R数据格式

python、r、pandas、dataframe

我有一个问题要写一个数据格式给R。我有1000列X 77行数据。我想把这个数据写到R数据中。当我使用 r_dataframe = com.convert_to_r_dataframe(df) 它给了我一个错误，比如dataframe对象没有艺术品类型。当我看到com.convert_to_r_dataframe()的代码时。它只获取dataframe的列，并得到colunm.dtype.type。在这个时候，列是dataframe，我认为大列dataframe里面有数据吗？有人想办法解决这个问题吗？

浏览 9提问于2017-03-27得票数 8

回答已采纳

1回答

通过循环将表添加到R中的列表

r、list、dataframe

我正在阅读HTML表格，可以很好地做到这一点，但我正在收集多年的表格。不幸的是，每年的列和行都是不同的，所以我想把它们都递归地添加到一个列表中，这样以后我就可以应用lapply并进行一些分析。我可以下载该表，并在执行一次操作后将其操作到dataframe中，但是当我将其添加到列表中时，该列表只接受第一列。 library(XML) #reg r=readHTMLTable('http://www.nhl.com/stats/team?season=20132014&gameType=2&viewName=summary#',stringsAsFactors=F

浏览 3提问于2015-04-24得票数 0

1回答

Dataframe专用转换优化

python、python-3.x、pandas

我想将从一行转到列，其中行数是动态的。然后，transposed还必须具有动态列数。我成功地使用了iterrow()和concat()方法，但是我想优化我的代码。请查找我的当前代码： import pandas as pd expected_results_transposed = pd.DataFrame() for i, r in expected_results.iterrows(): t = pd.Series([r.get('B')], name=r.get('A')) expected_results_transposed = p

浏览 3提问于2019-10-21得票数 1

回答已采纳

1回答

如何根据dataframe中的列动态生成for循环？

python、python-3.x、pandas

我尝试根据数据帧中的列数动态生成一个for循环。例如，如果我在dataframe中的列是5，那么我生成For循环并相应地分配变量。如果 df_cols = ['USER_ID', 'BLID', 'PACKAGE_NAME', 'PACKAGE_PRICE', 'ENDED_DATE'] 那么金砖四国就是我的数据框架 for index, row in brics.iterrows(): analytics.track(row['USER_ID'], 'Cancelled Subsc

浏览 28提问于2019-09-27得票数 1

回答已采纳

1回答

将两行数据帧相加在一起

r、dataframe、tibble

我试图在R中的dataframe中处理一些麻烦的行，我的追索权是简单地将它们相加在一起，将两行合并为1。因此，例如，如果我有一个带有X列的100行，那么在操作之后，我将有99行X列。理想情况下，我只需传递两个行号，并将它们合并。我想为每一列添加每个值，就像矩阵运算一样。我该怎么做？

浏览 0提问于2018-10-14得票数 1

回答已采纳

2回答

给定一个DatetimeIndex和一个数据时间感知记录集合，如何创建一个DataFrame？

python、pandas、dataframe

我得到了一个预定义的DatetimeIndex和这类元组的列表：(日期时间、浮点数)。我需要创建一个Pandas DataFrame并使用列表中的数据填充它。不用说，每个记录(一个元组)的第一个元素定义了它在结果DataFrame中的假定位置，而不是一个列的值，结果DataFrame中只有3个浮动列。在DatetimeIndex中没有匹配元素的记录应该被丢弃(我不介意在这种情况下出现错误)。给定元组本身的列表，pd.DataFrame.from_records()将元组的每个元素视为列的值(如果在列列表中不包括datetime列，则会引发错误)。给定一个定义为{r[0]: (r[1], r

浏览 1提问于2018-10-09得票数 1

回答已采纳

1回答

如何将结果保存到dataframe？

python

我正在使用这段代码：，这段代码将提取的文本保存到.txt文件中。我希望将在DataFrame中提取的每个记录保存为一个单独的行。我希望将结果作为“文件”保存到DataFrame中，作为一列。如何实现同样的目标？ import glob import os.path from bs4 import BeautifulSoup dir_path = r"C:\My_folder\tmp" results_dir = r"C:\My_folder\tmp\working" for file_name in glob.glob(os.path.join(dir_pa

浏览 1提问于2019-04-09得票数 0

回答已采纳

2回答

用ends_with动态选择R中的列

r、dplyr

我有一个dataframe，我想通过选择来缩小它的大小，所有实例都出现在dataframe中。这是数据文件： df<-structure(c("1", "2", "3", "4", "5", "TRUE", "FALSE", "TRUE", "TRUE", "FALSE", "FALSE", "FALSE", "FALSE", "TRUE", "FALSE

浏览 2提问于2018-10-17得票数 1

回答已采纳

1回答

正确访问Glue中的数据表

amazon-web-services、amazon-iam、aws-glue、amazon-athena、aws-glue-data-catalog

我在雅典娜中创建了一个没有S3源代码爬虫的表。它会出现在我的数据记录中。但是，当我试图通过Glue ETL中的python作业访问它时，它会显示它没有列或任何数据。访问列时会弹出以下错误：AttributeError: 'DataFrame' object has no attribute '<COLUMN-NAME>'。我试图按照胶水的方式访问动态框架： datasource = glueContext.create_dynamic_frame.from_catalog( database="datacatalog_database&

浏览 19提问于2022-03-06得票数 0

回答已采纳

5回答

为R中的循环遍历列

r、for-loop、dataframe

我想在dataframe中遍历列，对于每一列，如果NAs的数量大于所有条目的50%，我想从dataframe中删除该列。到目前为止，我有这样的事情，但它不起作用： for (i in names(df_r)) { if (sum(is.na(df_r[,i]))/length(df_r) > 0.5) { df_r <- df_r[, -i] } } 我更像个蟒蛇，我正在学习R，所以我可能会在这里混合语法。

浏览 0提问于2018-02-27得票数 1

回答已采纳

1回答

使用超出范围的pd.Cut进行装箱(将Nan替换为"<min_val“或">Max_val”)

python-3.x、pandas、binning

df= pd.DataFrame({'days': [0,31,45,35,19,70,80 ]}) df['range'] = pd.cut(df.days, [0,30,60]) df 这里复制了as代码，其中pd.cut用于将数值列转换为分类列。pd.cut通常根据传递给[0,30,60]的列表来给出类别。在这一行的0、5和6中，被归类为Nan，它超出了[0,30,60]。我想要的是0 should categorized as <0 & 70 should categorized as >60和类似的80 should cat

浏览 20提问于2019-11-29得票数 0

回答已采纳

1回答

如何在R中导入matlab表

r、matlab、import、mat-file、matlab-table

我有一个带有表数据类型的matlab 文件，我想在R中导入它，为此我使用'readMat‘，而R是作为一个列表读取它。在此之后，是否有一种方法可以将列表转换为R中的数据或表格式？当我使用as.dataframe时，我会得到以下错误： Error in (function (..., row.names = NULL, check.rows = FALSE, check.names = TRUE, : arguments imply differing number of rows: 5, 6, 1 我想出的一个可能的解决办法是将表从matlab导出为.csv并将其读入R中，但

浏览 4提问于2018-07-09得票数 3

2回答

ifelse仅返回数值

我是一个新的R用户，刚刚开始使用数据帧。我正在尝试在dataframe中创建一个新列(使用下面的代码)。问题是创建的新列包含数值，而代码中使用的所有列都不是数值我试着在网上找答案，但找不到答案。 dataframe$newcol <- ifelse(dataframe$colA == "London", dataframe$colA, dataframe$colB)'

浏览 1提问于2019-04-27得票数 3

1回答

有一个pandas函数可以通过多值比较来过滤DataFrame吗？

python、pandas、function、dataframe

我有一个两个pd DataFrames，我想通过检查另一个dataFrame的同一行中是否存在多个列的值来过滤其中一个。示例DataFrame1： CHROM POS ALT Col4 r1 X 22 A 4 r2 1 43 T 6 r3 3 100 C 7 r4 15 22 A 13 DataFrame 2： ALT chrom Col3 Col4 start r1 A X 25 26 22 r2 A 1 18 19 2

浏览 0提问于2020-10-31得票数 1

1回答

在for循环中追加数据帧中的行

pandas

我有一个长度为4000的Dataframe1，还有一个长度为600的列表。我希望将该列表与Dataframe1中的列进行比较，如果它们具有相同的值，则将Dataframe1的行移至Dataframe2，如果不同，则将其移至Dataframe3 这是我的代码，但它需要永远运行，谁能推荐一个更快的解决方案。 for i in range(len(Dataframe1)): for j in range(len(list)): if Dataframe1['Column'][i] == list[j]: Datafram2 =

浏览 7提问于2020-05-15得票数 0

1回答

在星火数据中遍历列并计算最小最大值。

scala、apache-spark、apache-spark-sql、spark-streaming、spark-dataframe

我想在我的星火程序中遍历dataframe列，并计算min和max值。我对Spark和scala很陌生，一旦我在dataframe中获取它，我就无法遍历这些列。我尝试过运行以下代码，但它需要将列号传递给它，问题是如何从dataframe中获取它并动态传递它，并将结果存储在一个集合中。 val parquetRDD = spark.read.parquet("filename.parquet") parquetRDD.collect.foreach ({ i => parquetRDD_subset.agg(max(parquetRDD(parquetRDD.colum

浏览 3提问于2017-07-18得票数 0

回答已采纳

11回答

更改pandas中的列类型

python、pandas、dataframe、types、casting

我希望将一个表示为列表列表的表转换为Pandas DataFrame。举一个非常简单的例子： a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df = pd.DataFrame(a) 将列转换为适当类型的最佳方法是什么?在本例中，将列2和列3转换为浮点数？有没有一种方法可以在转换为DataFrame时指定类型？或者更好的做法是先创建DataFrame，然后遍历这些列以更改每

浏览 5提问于2013-04-09得票数 1155

回答已采纳

4回答

向DataFrame中添加多个列，并将它们设置为等于现有列

python、pandas

我希望将多个列添加到pandas DataFrame中，并将它们设置为等于现有列。有什么简单的方法吗？在R中，我会这样做： df <- data.frame(a=1:5) df[c('b','c')] <- df$a df a b c 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 5 在pandas中，这将导致KeyError: "['b' 'c'] not in index"： df = pd.DataFrame({'a': np.arange(1,6

浏览 1提问于2017-04-14得票数 7

回答已采纳

2回答

与大熊猫和大熊猫动态比较

python、pandas

我有一个字典，其中每一列都作为dataframe中的键，如下所示： dict = {"colA":1,"colB":1,"colC":1} 与colA，colB，colC的列，我的dataframe。我想做这样的事情： df.loc[(df["colA"] < = dict["colA"]) & (df["colB"] < = dict["colB"]) & (df["colC"] < = dict["colC"])

浏览 2提问于2016-11-15得票数 1

回答已采纳

1回答

从熊猫数据中创建新的动态词典

python

我有一个数据文件，我想从中获取某些值，以便输入一个新的字典。我想从dataframe中重命名一些列，并在字典中使它们成为键。如何从零开始构建动态字典，将数据中的列值作为值输入字典？ df输入列包括"AwardNumber“，它将是字典中的"noticeNumber”和“学院”等。 AwardAmount AwardNumber College Department Name Email None 3R01GM110382-03S1 College of Arts and Sciences Ch

浏览 0提问于2018-04-13得票数 3

回答已采纳

1回答

在Dataframe列中创建列表，该列是来自其他两个数据帧列的一系列值。

python、pandas、dataframe

我需要在dataframe列中创建一个列表，这是一个数字范围。范围限制应该是其他两个数据帧列中的值。 df = pd.DataFrame({'A': [3, 7, 2, 8], 'B': [1, 3, 9, 3]},index=[1,2,3,4]) 现在需要一个dataframe列，它将是一系列的列表，如下所示 [1,2,3] [3,4,5,6,7] [2,3,4,5,6,7,8,9] [3,4,5,6,7,8] 我可以以这种方式在dataframe列中创建一个列表。 df['C'] = (df[['A','B']

浏览 0提问于2022-06-18得票数 0

1回答

汇总熊猫行，并将其存储为数据块或其他合适的数据类型

python、python-3.x、pandas、dictionary、pandas-groupby

我有熊猫DataFrame，我正在尝试将选择的列聚合并存储为dicts。 import pandas as pd df = pd.DataFrame({ 'id': [1, 1, 2], 'lat': [37.7825, 37.7825, 37.7836], 'lon': [-122.4148, -122.4148, -122.4127], 'b': [1, 2, 1],

浏览 2提问于2022-05-05得票数 1

2回答

为什么使用pandas.assign而不是简单地初始化新列？

python、pandas

我刚刚发现了熊猫数据帧的assign方法，它看起来很不错，非常类似于R中的dplyr的mutate。然而，我总是通过‘动态’初始化一个新列来获得它。有没有assign更好的原因？例如(基于pandas文档中的示例)，要在dataframe中创建一个新列，我可以这样做： df = DataFrame({'A': range(1, 11), 'B': np.random.randn(10)}) df['ln_A'] = np.log(df['A']) 但是pandas.DataFrame.assign文档建议这样做： df.assi

浏览 1提问于2018-01-10得票数 32

回答已采纳

1回答

动态列.withColumn Python DataFrame

python-3.x、pyspark、apache-spark-sql、databricks、azure-databricks

我想在我的星火DataFrame上动态地应用. list中的列名。 from pyspark.sql.functions import col from pyspark.sql.types import BooleanType def get_dtype(dataframe,colname): return [dtype for name, dtype in dataframe.dtypes if name == colname][0] def get_matches(dataframe): return [x for x in dataframe.columns if ge

浏览 3提问于2020-04-21得票数 1

回答已采纳