如何合并数据帧中具有相同名称的多个列，同时避免重复_如何合并r中具有多个相同ID的两个数据帧_合并两列，同时消除pandas数据帧中的重复字符串 - 腾讯云开发者社区

首先，我有两个数据帧，我使用公共列删除列的后缀来组合具有相同列但不同后缀的数据帧。现在，我必须计算R中数据帧中具有相同列名的每两列之间的差异我尝试获取唯一的列列名，并将其减去列名，但公共Id列转换为NA。 ffsub[[k]][[i-1]] <- sapply(unique(names(temp)), function(x) apply(temp[grep(x, names(temp))], 1, function(y) { y[1] - y[2] })) 也尝试过； ffsub[[k]][[i-1]] <- sappl

浏览 2提问于2019-05-02得票数 0

1回答

简单地合并四倍的观察值

r、merge

事实证明我不应该相信我的数据来源。他们留下了重复的观察结果，并且没有像我想象的那样清理数据。所以这个问题是没有意义的。我正在尝试合并两个数据帧。我在过去已经做过很多次了，并且取得了很大的成功(在剔除打字错误之后)。我一直在用这个把头撞到墙上。我找不到问题所在。一个文件只有6列，其中4列在较大的文件中重复。我需要合并这4列的独特组合。例如，2014年场地X的横断面A处的植物1应该只有1行。每个横断面和场地都有指定给每个植物的唯一前缀，但我需要在以后通过这4列进行子集，所以我想维护它们。我尝试过cbind()和merge()。在merge中，我还使用了all=true或false，因为我知道

浏览 8提问于2019-06-11得票数 0

1回答

连接多个数据帧和重复的列

python、pandas

我确信我做错了什么，但这对我来说并不明显。我有很多想加入的数据帧。我使用pd.merge左连接加入，我是这样做的 Database=pd.merge(df1, df2, left_on='key', Right_on='key',how='left') Database=pd.merge(df3, df4, left_on='key', Right_on='key',how='left') 重复但总是写回数据库数据帧，一切正常，但最后我有多个副本，即df1_code已被重复为df1_code_x

浏览 1提问于2016-04-28得票数 0

3回答

两只熊猫联盟DataFrames

python、pandas、dataframe、merge、concatenation

假设我有两个数据帧： df1： A 0 a 1 b df2： A 0 a 1 c 我希望结果是两个框架的联合，其中有一个显示该行所属的源数据框架的额外列。在重复的情况下，应删除重复项，并在相应的额外栏中显示这两个来源： A B 0 a df1, df2 1 b df1 2 c df2 我可以获得级联的数据帧(df3)，而不需要重复，如下所示： import pandas as pd df3=pd.concat([df1,df2],ignore_index=True).drop_duplicates().reset_index(drop=True) 我想/找不到一种方法来控制

浏览 0提问于2019-01-22得票数 13

回答已采纳

2回答

R和Stata之间的合并命令比较

r、merge、stata

作为一名R用户，我现在正在使用资源学习merge，并且对Stata命令感到困惑。在R中，我不必担心错误地合并数据，因为它无论如何都会合并所有内容。我不需要担心公共列是否包含任何重复的列，因为Y数据帧将合并到X数据帧中的每个重复行。(在merge中使用all=FALSE ) 但是对于Stata，在继续合并之前，我需要从X中删除重复的行。在Stata中，是否假设为了让merge继续，主表中的公共列必须是唯一的？

浏览 0提问于2011-09-07得票数 8

2回答

Pandas:连接数据帧并保留重复索引

python、pandas、concat

我有两个数据帧，我想将它们按列(axis=1)与一个内部联接连接起来。其中一个数据帧有一些重复的索引，但行不是重复的，我不想丢失其中的数据： df1 = pd.DataFrame([{'a':1,'b':2},{'a':1,'b':3},{'a':2,'b':4}], columns = ['a','b']).set_index('a') df2 = pd.DataFrame([{'a':1,&#

浏览 0提问于2014-07-11得票数 13

回答已采纳

1回答

合并目录中的多个数据帧

我想在一个目录中合并多个数据帧。其中一些数据帧具有重复的行。所有数据帧都有相同的列信息。我在下面的上找到了下面的代码，但是，我不知道如何修改它，以便重复的行不会导致错误。我得到了以下响应：Error in read.table(file = file, header = header, sep = sep, quote = quote, duplicate 'row.names' are not allowed 下面是从单个目录读取多个数据帧的代码。我如何修改它来避免重复行的问题？ multmerge = function(mypath){ filenames=list

浏览 5提问于2018-07-22得票数 0

1回答

Pyspark dataframe连接的列名重复的很少，没有重复列的也很少

python、dataframe、pyspark

我需要在我的项目中实现pyspark数据帧连接。我需要加入3个不同的案例。 1)如果两个数据帧具有相同的名称连接列。我加入如下所示。它消除了重复的列col1, col2。 cond = ['col1', 'col2'] df1.join(df2, cond, "inner") 2)如果两个数据帧具有不同的名称连接列。我加入如下所示。它按预期维护所有4连接列。 cond = [df1.col_x == df2.col_y, df1.col_a == df2.col_b] df1.join(df2, cond, "in

浏览 35提问于2019-12-03得票数 1

回答已采纳

3回答

比较数据帧列的

r、dataframe

我有一个具有重复I的数据帧，它可以如下所示 +-----+------+------------------+ | ID + Name + other columns....| +-----+------+------------------+ | 1 + AAA + | | 1 + BBB + | | 2 + ABA + | | 2 + ACA + | | 2 + CCC + | |

浏览 0提问于2018-02-20得票数 0

回答已采纳

1回答

如果另一个数据帧之间的另一个列条目匹配，则从另一个数据帧的行条目填充pandas列

python-3.x、pandas

我正在尝试向数据帧中添加一个新列。首先，我想检查每一行的id是否存在于另一个数据帧中。如果是，那么我想用来自另一个数据帧的值填充我的行条目。例如，我想要查找的数据帧如下所示： id replays 0 2 1 1 5 1 2 6 2 3 8 3 4 12 1 我想要为其创建新列的dataframe最初看起来像这样，只有id： id 0 2 1 5 2 6 最终，应该使用如下所示的新列填充此dataframe，其中重放条目是那些与第一个dataframe中的id匹配的条目： id replays 0 2 1

浏览 11提问于2020-12-18得票数 0

回答已采纳

1回答

循环输出中重复的字段名称以计算R数据帧中的新字段

r、loops、dataframe

我使用for循环在R dataframe中创建一组新列，但是在输出中复制了原始列，并添加了dataframe名称作为后缀，并且新列也有这个后缀，这是我不想要的。我只希望新输出与原始数据帧相同，但包含一组包含新计算的新列。我该如何实现这一点？详细信息如下：以下是原始数据框的列: Area；SR_2005;SR_2006;SR_2007;SR_2008;xnull_SR_2005;xnull_SR_2006;xnull_SR_2007;xnull_SR_2008 然后我想向这个数据帧中添加一系列新字段，其中每个‘SR’列被其对应的‘xnull_SR’列分割(例如SR_2005/ xnull_S

浏览 9提问于2020-07-22得票数 0

3回答

从Pandas的索引获取类

python、python-3.x、pandas

我有两个数据帧 df1=pd.DataFrame({'index':[1,2,3,4],'Name':['Andi','Boby','Charlie','Daniel'],'Occupation':['x','xxx','xxx','x']}) 和 df2=pd.DataFrame({'index':[1,2,3,4],'Occupation':['x','xxx

浏览 15提问于2020-09-21得票数 0

3回答

合并两个pandas数据帧产生“重复”列

python、pandas

我正在尝试合并包含相同键列的两个数据帧。其他一些列也具有相同的标题，尽管行数不同，合并后，这些列将与原始标题“复制”，并给出postscript _x、_y等。有人知道如何让pandas删除下面示例中的重复列吗？这是我的python代码： import pandas as pd holding_df = pd.read_csv('holding.csv') invest_df = pd.read_csv('invest.csv') merge_df = pd.merge(holding_df, invest_df, on='key', h

浏览 0提问于2014-12-05得票数 12

回答已采纳

2回答

在R中子设置时保留重复的列名

r、duplicates、subset

我有一个在R中有重复列名的dataframe，当我使用subset从这个dataframe中选择特定的列时，它会重命名重复的列，使它们不同。当我使用函数data.frame()创建数据帧时，我可以通过使用参数check.names = FALSE来阻止这种情况的发生，有没有一种方法可以使用subset (或任何其他选择名称列的方法)来做到这一点。例如，假设我有一个数据帧 data <- data.frame('sample' = 50, 'x_mean' = 1.5, 'Lower CI' = 1.0, 'Upper CI'

浏览 0提问于2012-11-16得票数 1

回答已采纳

1回答

在数据帧的每个索引处输入值

python、pandas

我有一个熊猫数据帧，我正在视频中存储关于不同对象的信息。对于视频的每一帧，我将对象的位置保存在一个数据帧中，其中列'x'，'y‘’粒子‘，帧编号在索引中： x y particle frame 0 588 840 0 0 260 598 1 0 297 1245 2 0 303 409 3 0 307 517 4 这工作得很好，但我想保存有关视频的每一

浏览 15提问于2019-05-17得票数 0

1回答

如何比较两个表中的多列并找出重复的列？

python-3.x、pandas、dataframe

我有两个数据帧数据帧1 ? 数据帧2 ? ID列在两个表中不唯一。我想要比较两个表中除ID之外的所有列，并打印唯一行预期输出 ? 我尝试了“isin”函数，但不起作用。每个数据帧大小为150000，我删除了两个表中的重复项。请建议如何做到这一点？

浏览 20提问于2020-11-03得票数 0

1回答

基于值连接数据帧，pandas

python、python-3.x、pandas、dataframe

我有两个数据帧，假设是A和B。A具有列['Name', 'Age', 'Mobile_number']，B具有列['Cell_number', 'Blood_Group', 'Location']，'Mobile_number'和'Cell_number'具有公共值。我只想根据'Mobile_number'和'Cell_number'中的公共值将'Location'列连接到A上，这样最终的DataFrame就会有A={&

浏览 12提问于2021-03-02得票数 0

1回答

使用“OR”合并两个数据框，即条件应该是如果有任何列匹配，则合并

r、merge、conditional-statements

我有两个数据帧。df1和df2。df1有三列a、b和c。df2有三列x、y和z。我想合并df1和df2，条件是if a==x OR b==y。如果其中任何一个条件为真，就应该合并。

浏览 13提问于2021-03-05得票数 0

1回答

使用Pandas查找其他两个数据帧中的重复项和唯一元素？

python、pandas、dataframe

我有两个从XML数据创建的数据帧；它们有每个文件的文件名和路径的列表，包括一些额外的元数据。像这样的东西 filename - filepath - meta1 - meta2 - meta3 基本上，每个数据帧中的文件可能在另一个数据帧中具有相同的文件名，但它们将位于不同的路径中。我正在尝试比较这两个数据帧，以找出哪些文件在这两个数据帧中是唯一的，以及哪些文件名在这两个数据帧中是通用的。我将只查看文件名；因此，如果一个文件存在于两个数据帧上，即使路径不同，我也会将它们视为重复。在指定我只想使用filename列之后，我开始研究各种Pandas方法，并找到了适用于我的示例的drop_dup

浏览 28提问于2020-11-09得票数 0

2回答

如何在满足条件的情况下更改dataframe中的单值？

python、pandas、dataframe

据我所知，我目前更改pandas数据框中的值的方法还远远不是最优的，并且确实损害了我的工作流程。示例:我想检查是否在另一个数据帧中找到了一个名称，如果是，使用第一个数据帧中搜索到的名称的iloc放入该数据帧中的值： for idx in id_list_of_names: name = df["name"].iloc[idx] if name in df_two["name"].values: df["value"].iloc[idx] = df_two["value"][d

浏览 13提问于2019-05-09得票数 1

1回答

获取列表中数据帧的名称

如何获取列表中数据帧的名称？不是数据帧中的列，而是数据帧本身。所以这就是我所拥有的： mydata <- lapply(myfiles, read.csv, stringsAsFactors=FALSE) fileNames <- list.files(pathx,pattern = "*.csv") names(mydata) <- gsub("\\.csv", "", fileNames) results <- lapply(mydata,myFUN) 假设这些名称是[df1,df2,df3...]。现在，根据数据

浏览 0提问于2014-12-07得票数 1

5回答

如何使用python pandas从数据帧中删除重复的列

python、pandas

通过对两列进行分组，我做了一些更改。我使用python生成了一个文件，它产生了两个重复的列。如何从数据帧中删除重复的列？

浏览 0提问于2013-06-05得票数 10

2回答

按列号对数据帧列表求和

python、pandas

我有一个包含5个数据帧的列表，每个数据帧有9列和15000行。我希望将每个数据帧中的列相加，以获得最终的9*15000数据帧。我试过这样的东西 Total = reduce(lambda x, y: x.add(y, fill_value=0), List) 所有这些操作都是将所有列附加到df Total。

浏览 22提问于2020-10-18得票数 1

回答已采纳

1回答

将数据帧与数据帧列表进行匹配，并将新变量添加到R中的列表中

我有两个独立的数据帧 df1 ID Name loq 1 a 1.2 1 b 1.4 1 c 1.0 2 a 0.5 2 b 0.7 2 c 0.3 3 a 0.5 3 b 0.2 3 c 0.1 df2这是数据帧列表 [1] ID Name 1 a 3 b

浏览 0提问于2012-03-28得票数 1

回答已采纳

2回答

R不复制列的合并

r、merge、dataframe

我有两个数据帧。例如 require('xlsx') csvData <- read.csv("myData.csv") xlsData <- read.xlsx("myData.xlsx") csvData看起来像这样： Period CPI VIX 1 0.029 31.740 2 0.039 32.840 3 0.028 34.720 4 0.011 43.740 5 -0.003 35.310 6 0.013 26.090

浏览 1提问于2014-06-28得票数 11

回答已采纳

2回答

什么是key_0，为什么我会在合并的数据帧中看到它，有什么方法可以防止它吗？

python、python-3.x、pandas

根据我的juptyer笔记本查询，Python 3.6.5和Pandas 0.23.0。我正在合并两个数据帧： df_merged1=pd.merge(df_RL, df_BR, how='left',left_on=df_RL['Business Service Manual'], right_on=df_BR['Names']) 左边的数据帧df_RL.dtypes Server object Server Farm object Business Service Man

浏览 4提问于2018-08-30得票数 2

1回答

求出Excel公式中最小的三个值和键

excel-formula

假设我在Excel (2016)中有一个由A列中的名称和B列中的一个计数组成的表，如下所示：我现在想知道最低的三项数字的名字。在这种情况下，我希望输出如下所示：如果数据中没有重复项，则可以使用 =INDEX(A2:A11, MATCH(SMALL(B2:B11, 1), B2:B11, 0)) =INDEX(A2:A11, MATCH(SMALL(B2:B11, 2), B2:B11, 0)) =INDEX(A2:A11, MATCH(SMALL(B2:B11, 3), B2:B11, 0)) 但是，如果使用计数列中的重复项，就会产生"Wiley，Ruby，Ru

浏览 1提问于2019-08-19得票数 0

回答已采纳

1回答

在Pandas中连接，但保留重复的列名

python、pandas、numpy

在连接pandas中的数据帧列表时，有没有办法保留重复的列。例如，我创建了一个数据帧列表： import pandas as pd Label1 = ['A', 'B', 'C', 'A'] Label2 = ['A', 'C', 'D', 'E'] Label3 = ['A', 'B', 'C', 'D', 'E'] row1 = [1, 2, 3, 5] row2 = [2,4,5

浏览 97提问于2021-07-12得票数 0

1回答

优化两个大型pyspark数据帧的连接

apache-spark、join、pyspark、apache-spark-sql

浏览 9提问于2020-06-10得票数 2

回答已采纳

1回答

在R中将多个数据框合并为一个数据框后更改列名

r、merge、plyr

在将多个数据帧合并为一个数据帧之后，我想知道如何更改主数据帧中的列标题，以表示它们所来自的原始文件。我使用以下代码将大量数据帧合并为一个： library(plyr) dflist = list.files(path=dir, pattern="csv$", full.names=TRUE, recursive=FALSE) import.list = llply(dflist, read.csv) Master = Reduce(function(x, y) merge(x, y, by="Hours"), import.list) 我希望属于每个原始

浏览 1提问于2014-05-17得票数 1

3回答

如何将列表列表转换为R中的dataframe

r、list、dataframe

我正在使用quantmod下载以嵌套列表形式出现的选项链。但是，出于我的目的，我更喜欢数据帧形式的信息，其中每个列表的名称都包含在数据帧的一列中(因此需要两列，一列包含期权的执行日期，另一列包含期权的类型--看涨或看跌期权)。在R中如何做到这一点？下面是一个可重复的例子： library(quantmod) AAPL.2015 <- getOptionChain("AAPL", "2019/2021") ? 如果可能的话，我应该怎么做才能得到英语版的期权日期呢？

浏览 42提问于2019-09-22得票数 1

回答已采纳

2回答

Neo4j -图的空值

neo4j、cypher

我通过csv在Neo4j中创建节点和关系。我有三列，其中两列的值为空值。每当我输入“WHERE NOT line.column_name IS null”时，它都不会给出已填充的其他节点的图。看起来是不是根本不包括有null的那一行。我是一个全新的cypher和图形数据库的概念。 csv数据示例： manager_name,contractor_name,company_name "John Smith","Matt Potter",Google "John Smith","Ann Potter",Google "Andy

浏览 0提问于2019-05-16得票数 1

1回答

如何在postgres中根据来自同一表的唯一值创建数组，该表连接了两次？

sql、postgresql、distinct、jsonb、array-agg

我有一个查询，在这个查询中，我加入了同一个表的两倍，即： left join tag tag1 [...] left join tag tag2 [...] 我希望使用一个名为tag的列进行查询，在这个列中，我将具有两个表(tag1、tag2)的唯一值。示例：现在，我可以使用jsonb_agg(distinct tag_name)从每一列中选择唯一的值，而在我的查询中，我有两列： tag1 | tag2 [Sport, Music] | [Sport, Games] 我希望有一个列具有来自tag1和tag2的唯一值，例如： tag [Sport, Music, Ga

浏览 8提问于2021-11-09得票数 0

3回答

Pandas:在一个数据帧中使用来自另一个数据帧的匹配键创建新列

python、pandas

我有两个pandas数据帧，第一个数据帧有两列，假设它们是键和值，第二个数据帧只包含键，我想在第二个数据帧中添加一个新列。此列的值应该是第一个数据帧中匹配的键的值 df = pd.DataFrame({'vi' : ['a','b','c','d','e'],'s':[2,5,7,0,1]}) tf = pd.DataFrame({'vi' : ['b','d','c','a','e'

浏览 0提问于2015-12-22得票数 0

1回答

在R中合并会产生比其中一个数据框更多的行

r、merge、dataframe、rstudio

我有两个数据帧，第一个包含9994行，第二个包含60431行。我想合并两个数据帧，以便合并后的数据帧包含两个数据帧的组合列，但只包含9994行。然而，我在合并时得到了超过9994行。我如何确保这种情况不会发生？ df1 = readRDS('data1.RDS') nrow(df1) # [1] 9994 df2 = readRDS('data2.RDS') nrow(df2) # [1] 60431 df = merge(df1,df2,by=c("col1","col2")) nrow(df) # [1] 10057

浏览 2提问于2015-05-23得票数 7

1回答

DATETIME2列上使用SYSDATETIME()默认值的重复密钥

sql-server、asp-classic、primary-key

我有一个使用ADODB和sqloledb提供程序连接到Server 2012的经典ASP站点。当用户单击链接时，我会将一条记录插入到表中以跟踪单击情况。该表有一个主键，由三个列组成: int、clickTime datetime2(7)和remoteAddress varchar(15)。我的insert语句提供id和remoteAddress值，clickTime列被设置为SYSDATETIME()的默认值。一个例子是：插入MyClick (id，remoteAddress)值(766319，'108.178.236.50') 我每天能捕捉到几千次点击，但是我每天都

浏览 2提问于2016-01-22得票数 3

回答已采纳

2回答

用相同的名称重命名数据帧的列

我将数据帧(数据)的列重命名为R，名称存储在字符数组中。如果字符数组(名称)中的两个名称相同，例如("JK“、"JK”、"test“、"hi") 使用， colnames(Data) <- Names colnames(Data) 输出： "JK" "JK.1" "test" "hi" 期望产出： "JK" "JK" "test" "hi" 我无法理解为什么.1被追加到第二个名称中。对于如何避免这种情况，有什么建议吗？

浏览 0提问于2018-09-03得票数 1

1回答

将数据从Excel映射到sheet2会在sheet1中创建重复的列

python、pandas

我尝试使用pandas数据帧将值从Sheet1映射到sheet2，在sheet2中列出了列名，但是当我将数据写入工作表2时，它将第一列保留为空，并将数据附加到重复的列中。当我尝试打印dataframe2时也会发生这种情况 df1 = pd.read_excel(open(r'C:\Users\Desktop\notepad.xlsx', 'rb'), sheet_name='sheet1') df2 = pd.read_excel(open(r'C:\Users\Desktop\notepad.xlsx', 'rb&#

浏览 5提问于2021-03-27得票数 0

2回答

如何使用CSV中定义的关系将大型数据集导入Neo4j

neo4j、cypher

问题:如何有效地将大约8 GB的以下格式的数据加载到Neo4j中。我使用的是DocGraph数据集，它显示了医疗保险提供者之间的关系。数据集是一个包含以下列的csv： From_ID、To_ID、Count_Patients、Count_Transacts、Avg_Wait、Stdv_Wait From_ID指的是转诊医生的ID。To_ID是接受推荐的医生。最后四列是关系属性。第一列或第二列中的任何ID都可以在这两列中重新出现，因为提供者在这两个方向上都可以有许多关系。下面是我想出的基本查询(对Cypher来说非常新，但对SQL很在行)： LOAD CSV FROM "url"

浏览 3提问于2020-01-31得票数 1

1回答

基于多个列值的映射值和合并数据帧

python、pandas

我有以下数据帧： df1:包含患者危重病历的数据帧 AREA DATE_TIME CRITICAL ISSUE NOTES 0013 11/6/2017 2:25:00 P.M Nurse attended to the patient 1121 10/23/2017 6:43:00 A.M Completed an ER 1121 10/2/2017 9:30:00 P.M

浏览 0提问于2018-01-20得票数 2

1回答

R选择数据框中的所有行，其中值在一列中重复，但在另一列中具有特定值

r、dataframe、dplyr、duplicates、subset

我正在尝试从R数据帧中提取在一列中具有重复值，但在另一列中具有0或1的行。例如，如果这是数据帧： Data <- data.frame( + X = c(1,3,5,7,7,8,9,10,10,11,11), + Y = sample(36476545:36476555), + timepoint = c(0,1,0,0,1,1,0,1,0,1,1) + ) 看起来像是 > Data X Y timepoint 1 1 36476549 0 2 3 36476545 1 3 5 36476552

浏览 24提问于2019-02-08得票数 1

回答已采纳

1回答

如何合并或连接spark中列号不相等的数据帧

python、apache-spark、pyspark、apache-spark-sql、spark-dataframe

我正在做一个使用spark的项目。在某些阶段，我需要在单个数据帧中合并或连接3个数据帧。这些数据帧来自spark sql表，我使用了联合函数，它已经合并了两个表中具有相同编号的列，但我也需要合并不相等的列值。我现在很困惑，有没有办法在pyspark中合并或连接不相等的基于列的数据帧，请指导我

浏览 13提问于2016-09-22得票数 0

4回答

比较R中的两个数据帧对象是否相等？

r、dataframe、compare、equality

如何检查两个对象(例如数据帧)在R中的值是否相等？所谓值相等，是指一个数据帧的每一列的每一行的值等于第二个数据帧中相应行和列的值。

浏览 3提问于2012-05-15得票数 57

回答已采纳

2回答

是否允许HTTP客户端发送同名的多个标头？

http

我知道HTTP服务器可以发送带有重复密钥的头(至少想到了Set-Cookie )，但是客户端这样做有什么合理的理由吗？

浏览 4提问于2016-09-27得票数 2

回答已采纳

1回答

如何显示集合中按日期命名的文档数据列表？

firebase、flutter、google-cloud-firestore

//如何显示来自所有集合的所有文档数据？我按日期设置每个集合的名称。这只能按日期获取最新数据。 var now = new DateTime.now(); var formatter = new DateFormat('yyyy-MM-dd'); String formatted = formatter.format(now); final FirebaseAuth firebaseAuth = FirebaseAuth.instance; final FirebaseUser user = await firebaseAuth.curr

浏览 2提问于2019-12-20得票数 0

回答已采纳

1回答

将文本预处理函数应用于scala spark中的dataframe列

scala、dataframe、apache-spark

我想创建一个函数来处理我在处理文本数据时遇到的问题。我熟悉Python和pandas数据帧，我通常认为解决问题的过程是使用一个函数，然后使用pandas apply方法将该函数应用于列中的所有元素。然而，我不知道从哪里开始实现这一点。因此，我创建了两个函数来处理替换。问题是我不知道如何在这个方法中放入多个替换。我需要对三个独立的数据帧进行大约20次替换，所以用这种方法解决这个问题需要60行代码。有没有一种方法可以在一个函数中进行所有替换，然后将其应用于scala中数据帧列中的所有元素？ def removeSpecials: String => String = _.replaceA

浏览 9提问于2019-12-26得票数 0

回答已采纳

2回答

熊猫-Merging的日期栏不起作用

python、pandas、date、merge

你好，堆栈溢出社区。在尝试在共享相同日期列的两个数据文件之间进行简单合并时，我遇到了一个问题。对不起，我对python并不熟悉，也许我表达自己的方式还不太清楚。我正在从事与股票价格计算有关的项目。第一个数据框架有日期和收盘价列，而第二个数据帧只有类似的日期列。我的目标是获得一个单一的日期列，它将有匹配的收盘价列在它旁边。这就是我为合并两个数据文件inner_join = pd.merge(df.iloc[7:79],df1[['Ex-Date','FDX UN Equity']],on ='Ex-date',how ='inner

浏览 2提问于2020-05-03得票数 0

2回答

向DataFrame动态添加行

python、pandas、dataframe

假设我有一个空的dataframe，它已经设置了列，但没有行。我从web上抓取了一些数据，因此假设我需要向空的数据帧添加一个索引'2176'。当我尝试分配该行时，如何自动将该行添加到数据库中？这是熊猫的目的吗?还是我应该使用其他东西？

浏览 12提问于2017-12-30得票数 3

回答已采纳

2回答

如何将唯一的重复列折叠为R中的唯一列？

r、dplyr

溶液我带着下面的“毛里塔尼亚”和“akrun”提供的解决方案。问题对于数据帧，我只想保留每组重复列中的1列。此外，保留的列采用的名称是重复列集中所有列名的连接。数据帧中有多组重复列。数据框架包含数以万计的列，因此使用for循环可能会花费太多时间。我已经尝试了使用重复()、汇总()、聚合()、lapply()、combination ()和the for循环的组合。输入数据帧(df_in)： 0 1 2 3 4 5 6 7 0 1 0 0 1 0 1 1 0 1 0 1 1 0 0 0 1 0 1 0 0 1 1 0 输出数据帧(df_out)： 0-2-5 1-4 3 6 7 0

浏览 1提问于2019-04-13得票数 0

回答已采纳

3回答

如何合并数据帧，其中column1是column2的子字符串

r、dataframe、merge

我有一个数据框架，并希望根据df$name列的值对每一行进行分类。对于分类，我有一个具有列tl$name和tl$type的两列数据框架tl。我想在类似的条件下合并两个数据帧，grepl( tl$name，df$name )，而不是df$name = tl$name。我已经尝试过遍历df中的所有行，并查看与tl匹配的位置，但这似乎非常耗时。例如： df name # African elephant # Indian elephant # Silverback gorilla # Nile crocodile # White shark

浏览 0提问于2017-05-07得票数 3

回答已采纳