如何合并一列中具有多个元素的两个数据帧_如何在具有多个值的pandas中合并两个数据帧_如何合并r中具有多个相同ID的两个数据帧 - 腾讯云开发者社区

python、pandas、dataframe、inner-join

我有两个数据帧，我想把它们合并成一个。第一个文件具有ID作为其列，而第二个文件具有相同的值，但在名为id_number的列中。我尝试了下面的代码，但最终final_df同时具有ID和id_number列及其值。如何在合并后只保留一列I？ final_df = df.merge( df2, left_on='ID', right_on='id_number', how='inner') 另外，让我们假设df列A的数据帧格式如下： A 0 1 2 第二个dataframe中的同一列A有一些空字段，如下所示： A -

浏览 15提问于2021-06-22得票数 0

3回答

为什么我不能在用cbind创建的dataframe中添加数字？

r、dataframe、cbind

我正在寻找关于如何从两个数据帧中互相减除值的建议。在下面两个数据帧A和B的示例中，我希望在第一列向量匹配的条件下，从彼此之间减去第二列的值。例如，当向量X1为R1时，5.1-5和4.8-5。 A<-data.framework(c( 'R1'，‘R1’，'R2'，'R4'，'R4'，'R4')，c(5.1，4.8，4.9，5.0，5.3)) B<-data.framework(c(c(‘R1’，'R2'，'R3'，'R4')，c(5，4.9，5.2，5.

浏览 0提问于2011-09-01得票数 4

回答已采纳

2回答

用不同的列和行数合并R DataFrames

r、merge

我正试图通过一个名为用户名的列来组合两个数据帧。一个数据框架包含12个变量，有1619行观察。另一列包含37个列，有1603个观察结果。我想匹配每个数据集的用户名，但保留所有数据。我尝试过合并，但是对于Y数据集，我总是得到NA (除非冒号在这两组数据中)。是否有一种方法通过列名(如“用户名”)将一组数据附加到另一组数据？例子如下： DataFrame 1 Username HighschoolGPA Age Applydate Smith, John 3.1 18 03-12-2012 DataFrame 2 Userna

浏览 3提问于2016-03-24得票数 0

回答已采纳

3回答

R:将单独的经度数据框和纬度数据框合并为空间点

r、spatial

我有两个数据帧，每个1000x1000，一个带有经度的数据帧(长)和一个带有纬度的数据帧(纬度)，指定像素(或光栅)数组的坐标，我陷入了如何将这两个数据帧组合成一个1000x1000空间点数据帧(或等效数据帧)的问题。spatialpointsdataframe的第一个单元格将具有由lon1,1和lat1,1等指定的坐标。有没有简单的方法可以做到这一点？我想我可以一列一列地做，然后按顺序将空间点对象绑定在一起，但这似乎有点冗长。有什么想法吗？已按建议尝试： lat.t <- data.frame(seq(10, 15, 1), seq(20, 25, 1), seq(30,

浏览 2提问于2017-12-16得票数 0

1回答

df[i]是做什么的？

我一直在教的是向量是一维的，数据帧是二维的。因此，向量索引需要一个数字--例如，v[1] --而数据帧索引需要两个数字，例如，df[1, 1]。我从中学到，例如，df[1]实际上显示了df的第一列。例如, > x <- data.frame(x = 1, y = 2, z = 3) > x[1] x 1 1 > x[,1] [1] 1 我注意到它们略有不同，因为x[,1]可能只引用第一列中的条目向量，而x[1]则包含行和列名。无论如何，这与我所说的信息相矛盾--数据帧需要两个数字来索引。这个说法不正确吗？如果是正确的，如何向R的新手解释为什么x[1]给出了x的第

浏览 3提问于2016-12-20得票数 2

回答已采纳

1回答

Python :合并列表列上的两个Pandas Dataframe

python、pandas、dataframe、merge、jupyter

我需要根据一列名为"authors“的列表找到两个pandas数据帧之间的交集。但我得到的却是这个错误：

浏览 3提问于2017-06-23得票数 0

3回答

熊猫-用相同的列名合并两个DataFrames，并在一个单元格中合并两个DataFrames的信息。

python、pandas、dataframe、merge

我在第一列中有两个具有相同列名和相同in的数据帧。在第一个数据帧中，我有int信息，在第二个str中。下面是它们的样子的一个例子： ID Cat1 Cat2 Cat3 1 1 1 0 2 0 2 1 3 0 0 5 ID Cat1 Cat2 Cat3 1 text text text 2 text text text 3 text text text 我希望将它们合并到一个Data

浏览 2提问于2020-03-01得票数 0

回答已采纳

2回答

尝试将一个数据框中的值与另一个数据框中的值进行匹配(python)

python、pandas、dataframe、country-codes

我目前有一个由国家代码列(code1)组成的数据帧A，例如CA、RU、US等。我还有另一个数据帧B，它有3列，其中第一列包含所有可能的国家代码，第二列包含经度值，第三列包含纬度值。我尝试遍历A，获取第一列中的第一个国家代码，将其与B的第一列中的国家代码进行匹配，然后获得该国家的相关经度和纬度，依此类推。我计划创建一个新的数据帧，其中包含来自A的代码(第一列)以及新提取的经度值和纬度值。到目前为止，我的函数如下所示 def get_coords(): for i in range(len(A["code1"])): for j in range(len

浏览 63提问于2020-07-17得票数 1

回答已采纳

3回答

在两个数组中查找重复的值，Python

python、pandas、numpy

我有两个数组(A和B)，每个数组大约有50000个值。每个值代表一个ID。我想创建一个有三列的pandas数据帧，col1:来自数组A的值，col2:来自数组B的值，col3:标签为“唯一”或“重复”的字符串。在每个数组中，ID:s是唯一的。数组的长度不同。所以我不能做这样的事情来开始。 a = np.array([1, 2, 3, 4, 5]) a = np.array([5, 6, 7, 8, 9, 10]) pd.DataFrame({'a':a, 'a':b}) 我当时正在考虑创建一个不同的pandas数据帧，也有三列。一个是ID，另一个是ID来自的

浏览 80提问于2021-01-28得票数 2

回答已采纳

1回答

在Python中计算相关性时出现问题

python、correlation

我有以下数据框我需要计算所有列的相关矩阵。问题是:当我分别计算两列时，得到的值与使用df.corr()计算每一对的所有值时不同。我构建数据帧的方式是将第一列与其他列合并，这种合并过程导致两个数据帧的行长不同。例如:第一列( btc_logreturns )和第二列(gold_logreturns)最初有2000行，而btc_logreturns和ewz_logreturns有2100行。但是所有列加起来有2459行。在计算相关性时，函数.corr()是否考虑了NaNs？对于我得到的不同相关值，数据帧的长度是否是一个潜在的问题？

浏览 1提问于2021-05-07得票数 0

3回答

在R结果数据帧中合并数据帧太大

r、dataframe、merge、inner-join

我正在尝试合并R中的两个数据帧，通过它们共享的一列来连接它们。下面是两个数据帧的屏幕截图，我在"INC_KEY“列上合并。这是我用来合并两个数据帧的代码: dp <- inner_join(d，p，by="INC_KEY") D有177156个观测值，p有1641137个观测值，但最终合并的数据帧有8416113个观测值，这对我来说没有意义。我还尝试将上面的inner_join函数更改为merge函数，但仍然得到相同的结果。我想知道如何修复这段代码，以便合并后的数据帧具有真实的观察值--非常感谢您的帮助！

浏览 0提问于2021-01-11得票数 0

3回答

根据另一个数据框中的值从DataFrame中选择行，并根据第二个dataframe用值更新其中一列

python、pandas、dataframe、rows、updating

我有两个数据帧df和df1。主DataFrame如下： DF： start end price 0 A Z 1 1 B Y 2 2 C X 3 3 A Z 4 4 D W 5 第二个DataFrame： DF1： start end price 0 A Z 100 1 B Y 200 我希望主数据帧df根据df1中的开始和结束来更新'price‘列中的值。它应该更新与df1中具有相同开始和结束的所有行的列值。DF： start end price 0 A Z

浏览 0提问于2018-09-21得票数 4

1回答

Pandas多索引数据帧合并问题

python、pandas、dataframe、merge、multi-index

我想合并两个数据帧，df1和df2，它们有多个索引列： mi1 = pd.MultiIndex.from_tuples([('id', '0'), ('car', '2018')], names=['variable', 'year']) mi2 = pd.MultiIndex.from_tuples([('id', '0'), ('car', '2019')], names=['variable', 'yea

浏览 61提问于2020-12-15得票数 0

回答已采纳

4回答

比较R中的两个数据帧对象是否相等？

r、dataframe、compare、equality

如何检查两个对象(例如数据帧)在R中的值是否相等？所谓值相等，是指一个数据帧的每一列的每一行的值等于第二个数据帧中相应行和列的值。

浏览 3提问于2012-05-15得票数 57

回答已采纳

1回答

如何重新整理excel中的数据？

sql-server-2005

我有一个电子表格中的数据，我必须上传在sql中。问题是，这些数据相当粗糙。我需要重新排列excel文件中的工作表，使它们之间的关系更好。第一个工作表具有主数据，此工作表的一列将链接到另一个工作表中的数据。我只有一张嵌入了数据的工作表。使用扩展器按钮显示数据之间的关系。请告诉我如何快速重新排列这些数据？我认为这可以通过运行sql查询或ssis包来完成，但我不确定。

浏览 2提问于2012-11-30得票数 0

1回答

基于R中的转换数据框更改数据框列中的字符值

r、dataframe

我在R中有一个数据框，其中有一列字符串/字符。我在下面把它叫做"myDat“。我在R中有另一个数据框，它有两列字符串/字符。我在下面把它叫做"conversionDat“。有一列("Name")包含与"myDat“中的列相似的名称。另一列("Name2")包含"myDat“列应该转换为的名称。以下是这两个数据帧的MWE： myDat <- data.frame(Name = c("A","D","P","R")) conversionDat <- da

浏览 0提问于2016-11-12得票数 2

2回答

我是否应该连接功能和目标数据帧，以便与scikit-learn一起使用？

pandas、scikit-learn

我正在尝试创建一个回归模型来使用设计参数(dataframe 1)来预测可交付成果(dataframe 2)。这两个数据帧都有一个id号，我将其用作索引。是否可以使用两个数据帧为sklearn创建一个数据集？或者我需要加入他们？如果我需要加入他们，那么最好的方式是什么？ # import data df1= pd.read_excel('data.xlsx', sheet_name='Data1',index_col='Unnamed: 0') df2= pd.read_excel('data.xlsx', sheet_nam

浏览 0提问于2021-04-12得票数 0

1回答

Python DataFrame将两个时间序列数据帧相乘

python、pandas

我有两个数据帧。第一数据帧具有一年能量，时间间隔为30分钟。第二个数据帧是30分钟的一天价格数据。如何将两个数据帧相乘，得到第二个数据帧在第一个数据帧的每天重复相乘的结果？非常感谢!

浏览 29提问于2017-08-19得票数 1

回答已采纳

1回答

如何合并或连接spark中列号不相等的数据帧

python、apache-spark、pyspark、apache-spark-sql、spark-dataframe

我正在做一个使用spark的项目。在某些阶段，我需要在单个数据帧中合并或连接3个数据帧。这些数据帧来自spark sql表，我使用了联合函数，它已经合并了两个表中具有相同编号的列，但我也需要合并不相等的列值。我现在很困惑，有没有办法在pyspark中合并或连接不相等的基于列的数据帧，请指导我

浏览 13提问于2016-09-22得票数 0

2回答

如果两个数据帧必须相同，我如何合并两个数据帧？

r、dataframe、merge

我有两个数据帧。例如，df1如下所示： Name Month Number 1.H 1 8 2.H 2 7 3.H 3 6 4.A 1 9 5.A 2 10 6.A 3 11 df2看起来像这样： Name Month index 1.H 1 3 2.H 2 2 3.H 3 1 4.A 1 3 5.A 2 5 6.A 3 9 我想把它合并到下面的df中 Name Month Number

浏览 35提问于2016-05-28得票数 -1

2回答

在Pandas中共享索引时，将列从一个数据帧复制到另一个数据帧

python、pandas、dataframe

我正在尝试使用索引作为引用，将一列数据从一个数据帧复制到另一个数据帧。在复制列时，我想用NaN填充在两个数据帧中都没有出现的任何条目。例如，我有这两个虚拟dfs： df1 = col_1 col_2 col_3 col_4 index A 1 4 7 10 B 2 5 8 11 C 3 6 9 12 df2 = col_5 col_6 index A 13 15 C 14

浏览 0提问于2019-07-18得票数 0

1回答

如何根据大熊猫另一个数据帧中的条件更新数据帧

python、pandas、dataframe

我有两个数据框架，我想根据两个数据帧中的条件更新df_source的一列： df_source = pd.Dataframe({'Sentiment':['neg', 'neg','pos'], 'text': ['hello ', '12where', 'here [null]'], 'pred': ['neu', 'neg', 'pos')}) df2 = pd.Dataframe({'Se

浏览 5提问于2021-10-13得票数 2

回答已采纳

2回答

什么是key_0，为什么我会在合并的数据帧中看到它，有什么方法可以防止它吗？

python、python-3.x、pandas

根据我的juptyer笔记本查询，Python 3.6.5和Pandas 0.23.0。我正在合并两个数据帧： df_merged1=pd.merge(df_RL, df_BR, how='left',left_on=df_RL['Business Service Manual'], right_on=df_BR['Names']) 左边的数据帧df_RL.dtypes Server object Server Farm object Business Service Man

浏览 4提问于2018-08-30得票数 2

1回答

在pyspark中对多个键执行连接，只需重复不相同的列名

python、pyspark

我想用Spark外部连接两个数据帧： df1 columns: first_name, last, address df2 columns: first_name, last_name, phone_number 我的密钥是first_name and df1.last==df2.last_name 我希望最终的数据集架构包含以下列： first_name, last, last_name, address, phone_number 这意味着如果列名相同，我希望‘合并’输出数据帧中的列，如果不相同，我希望保持两列的分离。我不能在一个连接中做到这一点，而只能在两个连接中做到这一点：df1.

浏览 2提问于2019-02-02得票数 0

1回答

将数据帧与数据帧列表进行匹配，并将新变量添加到R中的列表中

我有两个独立的数据帧 df1 ID Name loq 1 a 1.2 1 b 1.4 1 c 1.0 2 a 0.5 2 b 0.7 2 c 0.3 3 a 0.5 3 b 0.2 3 c 0.1 df2这是数据帧列表 [1] ID Name 1 a 3 b

浏览 0提问于2012-03-28得票数 1

回答已采纳

3回答

从Pandas的索引获取类

python、python-3.x、pandas

我有两个数据帧 df1=pd.DataFrame({'index':[1,2,3,4],'Name':['Andi','Boby','Charlie','Daniel'],'Occupation':['x','xxx','xxx','x']}) 和 df2=pd.DataFrame({'index':[1,2,3,4],'Occupation':['x','xxx

浏览 15提问于2020-09-21得票数 0

1回答

基于三个匹配列的数据融合

python、dataframe、merge

谢谢您的帮助，我真的很难合并dataframes (我想将两个框架合并到下面的条件中)，但是它失败了，“意外地导致了合并的dataframes黄色-在图3中高亮显示)。我想根据前两列合并。第一排。如果两个帧中的第一列和第二列匹配在一起。->然后合并成一排。2)。如果两个框架中的第一列或第二列不匹配，但另一列匹配->创建一个新行。3)。如果第一列和第二列在两个框架中不匹配->创建一个新行。 Dataframe (1) Dataframe (2)

浏览 6提问于2022-05-01得票数 0

9回答

组合两个不同长度的数据帧

r、dataframe

我有两个数据帧。第一列只有一列和十行。第二种是3列50行。当我试图通过使用cbind组合它时，它会给出以下错误： data.frame中的错误(.，check.names = FALSE)：有人能建议另一个功能来做到这一点吗？我也尝试过使用列表，但是它也会产生同样的错误。当我使用write.table函数编写时，由3列组成的数据框架应该是CSV文件中的前3列，而带有一列的数据帧应该是该文件中的第四列。前3列有50行，第四列应该占前10行。

浏览 11提问于2011-08-08得票数 35

1回答

一个接一个地匹配dataframe行并返回相应的行值。

python、pandas、dataframe、string-matching

我有两个数据帧dfA，dfB。dfA有value和action两列，dfB有一列action。我希望将B与A在'Value‘列中匹配，并返回'Action’项，如果不匹配，则返回字符串"NOT“。 dfA value action "user" "enter" "password" "enter" "login" "click" "customerid" "enter"

浏览 5提问于2022-02-17得票数 0

2回答

在追加两个pandas数据帧时，布尔值将转换为浮点数

python、pandas、dataframe、append

当其中一个数据帧的列全部为空值(NaN)，而另一个数据帧在同一列中具有布尔值时，追加两个pandas数据帧具有意外的行为。结果(通过追加)数据帧中的相应列被类型化为float64，并且布尔值根据它们的原始布尔值被转换为1和0。示例： df1 = pd.DataFrame(data = [[1, 2 ,True], [10, 20, True]], columns=['a', 'b', 'c']) df1 a b c 0 1 2 True 1 10 20 False df2 = pd.DataFrame

浏览 30提问于2019-11-13得票数 2

回答已采纳

1回答

条件乘法两个数据帧

r、conditional、product

我想知道如何根据匹配条件灵活地将两个数据帧相乘。例如： df1 <- data.frame(c1 = letters[seq(1,5)], c2 = seq(1,5), c3 = seq(31,35), c4 = seq(41,45)) df1 c1 c2 c3 c4 1 a 1 31 41 2 b 2 32 42 3 c 3 33 43 4 d 4 34 44 5 e 5 35 45 df2 <- data.frame(c1 = letters[seq(5,1)], c2 = seq(11,15), c3 = seq(21,25), c4 = seq

浏览 2提问于2018-10-20得票数 0

2回答

如何在python中连接两个数据帧？

python-3.x

我想使用python连接两个数据帧。我附上Book.xls文件以供参考。在该文件中，表1中有两列为System_requirement_linked，另一列为OH_Requirement linked。在另一个工作表中，我们有一个列作为System_Requiremnet_liknked，其中包含与工作表1的两个列相同的数据。我想将工作表1的数据与工作表2的数据合并，并使用工作表中所有可用的相应数据打印最终的结果工作表。一般而言，我将工作表放在不同的文件夹中，而不是放在Book表单中。 📷 📷

浏览 37提问于2020-08-23得票数 0

回答已采纳

1回答

如何根据列单元格值在一个数据帧上查找行，并将其附加到另一个数据帧上的行？

python、pandas

我已经寻找这个答案一天了。我找不到解决办法。我有两个NBA统计数据帧。一个只有团队名称，另一个有团队名称和相关统计数据。我想在第一个数据帧中查找每个团队名称，并将第二个数据帧中的统计数据附加到与该团队名称匹配的行中。 df1 = 'DATE' : [rows of dates], 'TEAM_NAME': [row of team names with duplicates] df2 = 'TEAM_NAME': [row of unique team names], 'STAT #1' ['row of stats],

浏览 22提问于2021-02-08得票数 0

回答已采纳

1回答

如何在dataframe中查找值并使用python/pandas返回匹配值？

python、pandas、merge、lookup

我有两个大的数据帧，df1和df2。我在df2中缺少一列(colB)，我想根据共享列(colA)中的值添加该列。如果我使用的是Excel，我会通过一个标准的vlookup公式来做这件事，但是我正在努力使用pandas合并函数来获得想要的结果。 colA和colB都包含具有相同值的多个条目，因此我使用这行代码来创建一个仅包含唯一对的新数据帧。 df_keyvalues = df1[["colA", "colB"]].drop_duplicates() 然后使用merge将colB添加到df2中 df2 = df2.merge(df_keyvalues, how =

浏览 5提问于2021-06-11得票数 0

回答已采纳

3回答

在R中连接两个数据帧

r、dataframe、merge

抱歉，如果这是一个非常基本的问题，但我在处理R项目时遇到了一个问题。基本上我有两个数据框对象，一个是基因及其在不同患者中表达水平的主列表，另一个只有一列大小。然后，一个只有一列的列表是属于特定基因子类别的基因列表，所有这些基因都在主列表中。我正在尝试创建一个数据框架，其中我有我的特定基因子集及其在主列表中包含的不同患者的表达。我尝试使用merge()函数，但只创建了一个空的dataframe。基本上代码是这样的:合并<- new_dataframe (master_list，specific_gene_list，by = "gene")。我认为这段代码应该在我的主列表

浏览 24提问于2020-07-13得票数 0

3回答

Python Pandas -合并条件

python、pandas、merge、conditional-statements、between

我在python pandas中有两个数据帧数据帧1 User_id zipcode 1 12345 2 23456 3 34567 数据帧2 ZipCodeLowerBound ZipCodeUpperBound Region 10000 19999 1 20000 29999 2 30000 39999 3 如何使用pandas merge将区域中的数据映射到条件为if(df1.zipcod

浏览 3提问于2016-10-29得票数 3

3回答

基于R中公共列连接两个数据帧

r、dataframe、join、tidyverse

我想基于公共的第一列连接两个数据帧(df1，df2)，但是，我希望将两个数据帧中的每一列依次放置，如下例所示： INPUT df1 df1 <- data.frame(name = c("JMA", "PSA", "TAN", "POS"), HAN = c("0.2119", "-0.1726", "0.0002", "-1.036"), ENA = c("0.0736", "-1.6644", "0.0743"

浏览 35提问于2021-10-07得票数 1

回答已采纳

2回答

通过列中的公共字符串合并多个pandas数据帧

python、pandas、dataframe、nlp

我有6个csv文件，其中一列是句子，第二列是整数。所有csv文件中的句子都是相同的，但它们在文件之间的关键顺序是不同的。我想逐句合并所有数据帧，这样我就有了一列句子，然后每个整数列都与来自每个csv文件的句子相关联。我尝试了常见的“句子”列的各种合并和缩减技术，但最终得到的行数比正常情况下多了几个数量级。例如： data_frames = [df1, df2, df3, df4, df5, df6] reduce(lambda x,y: pd.merge(x,y, on='sentence', how='inner'), data_frames) 产生一

浏览 0提问于2020-01-07得票数 1

2回答

熊猫数据:从单一索引到多列索引的转变

python、pandas、dataframe

在蟒蛇熊猫里，我有一个数据 df_aaa： date data otherdata symbol 2015/1/1 11 12 aaa 2015/2/1 21 22 aaa 2015/3/1 31 31 aaa df_all： 2015/1/1 31 31 bbb 目前，date是两个的索引。我想将df_aaa附加到df_all中，并让它们具有符号和日期的复合索引。我该怎么做？基本上，以下都是一个问题：，我如何设置一个多索引，并在追加时使用它。我能用不同的列顺序来做吗？我需要刷新

浏览 4提问于2017-11-08得票数 1

回答已采纳

3回答

如何从数据帧列表中提取特定列

我有一个数据帧的列表“l”。这些数据帧本身就是二维矩阵.在我的工作中，我需要创建另一个列表，其中包含来自原始列表的数据帧的子集。列表l1有两个数据帧D1和D2，分别有10列和12列不同的数据。现在，我想创建一个新的列表l2，它也有两个数据帧，但是这些数据帧是从早期的数据帧D1和D2中挑选出来的列。请考虑到同一列在D1和D2中的位置可能不同，因此我必须通过列名而不是索引来访问它。有人能建议我如何实施这个吗？

浏览 8提问于2017-11-22得票数 0

1回答

简单地合并四倍的观察值

r、merge

事实证明我不应该相信我的数据来源。他们留下了重复的观察结果，并且没有像我想象的那样清理数据。所以这个问题是没有意义的。我正在尝试合并两个数据帧。我在过去已经做过很多次了，并且取得了很大的成功(在剔除打字错误之后)。我一直在用这个把头撞到墙上。我找不到问题所在。一个文件只有6列，其中4列在较大的文件中重复。我需要合并这4列的独特组合。例如，2014年场地X的横断面A处的植物1应该只有1行。每个横断面和场地都有指定给每个植物的唯一前缀，但我需要在以后通过这4列进行子集，所以我想维护它们。我尝试过cbind()和merge()。在merge中，我还使用了all=true或false，因为我知道

浏览 8提问于2019-06-11得票数 0

1回答

pandas数据帧之间的内部联接不适用于比较DenseVector类型

python、pandas、dataframe、inner-join

我正在处理熊猫数据帧，我想得到2个数据帧，df1和df2之间的重合度。 df1： +------------+-------+ | features | col2 | +------------+-------+ | [1.0, 2.0] | 2 | +------------+-------+ | [1.0, 3.0] | 1 | +------------+-------+ df2： +------------+-------+ | features | col2 | +------------+-------+ | [1.0, 2.0] | 2 | +

浏览 0提问于2018-04-16得票数 0

2回答

在Pandas Python中梳理两个数据帧

python、pandas

我想合并两个数据帧我想将这两个数据帧合并在一起，这样帐户就是一样的。例如，acct 10应该在CME和NISSAN中取值，而其余的都是零。

浏览 0提问于2019-02-19得票数 1

1回答

将多个数据帧连接在一起，并确保正确的数字进入同一列

python、pandas、merge

我有几个数据帧，它们都有一个"Dirty Price“和"Factor”，我想在同一列中包含它们。当我尝试这样做时，当我将第二个数据帧连接在一起，然后pandas创建了一个新的"Dirty Price_x“和"Factor_x”，但是我不想让我的新列合并到与我指定的条件匹配的同一列中。这是我所做的： df = df.merge(gs[['CUSIP', 'temp_Counterparty','Dirty Price','Factor']], how = 'left', on =

浏览 11提问于2020-04-22得票数 1

回答已采纳

1回答

如何比较两个表中的多列并找出重复的列？

python-3.x、pandas、dataframe

我有两个数据帧数据帧1 ? 数据帧2 ? ID列在两个表中不唯一。我想要比较两个表中除ID之外的所有列，并打印唯一行预期输出 ? 我尝试了“isin”函数，但不起作用。每个数据帧大小为150000，我删除了两个表中的重复项。请建议如何做到这一点？

浏览 20提问于2020-11-03得票数 0

1回答

如何根据两列中的值查找和引入另一个数据帧中的值

python、pandas、dataframe、mapping、vlookup

我有两个数据帧。我需要从右侧(第二个)数据库中提取一个值，并基于两个数据帧中存在的另外两个列，将其作为列添加到左侧(第一个)数据帧中。这样做时，我需要在左边的dataframe中为这个列指定一个不同于在右边的dataframe中调用的名称。我排除了merge和join，因为dataframes有成百上千的列，我只需要带出一列，并且在这样做的时候还需要更改列名。相反，我正在尝试map它。例如： import pandas as pd emp_data = { 'Name':['Tom', 'Tom', 'Ste

浏览 6提问于2019-05-01得票数 1

1回答

如何使用R计算同一数据帧中具有相同列名的列之间的差异

首先，我有两个数据帧，我使用公共列删除列的后缀来组合具有相同列但不同后缀的数据帧。现在，我必须计算R中数据帧中具有相同列名的每两列之间的差异我尝试获取唯一的列列名，并将其减去列名，但公共Id列转换为NA。 ffsub[[k]][[i-1]] <- sapply(unique(names(temp)), function(x) apply(temp[grep(x, names(temp))], 1, function(y) { y[1] - y[2] })) 也尝试过； ffsub[[k]][[i-1]] <- sappl

浏览 2提问于2019-05-02得票数 0

1回答

熊猫合并与布尔索引

python、join、pandas、merge

我在Python3.4中使用熊猫来识别两个数据帧之间的匹配。除了最后一列之外，匹配是基于严格相等的，在最后一列中，关闭匹配(+/- 5)很好。一个数据帧包含许多行，而在本例中，第二个数据帧只是一行。所需的结果是包含第一数据帧的子集的数据帧，如所述，该第一数据帧与该行匹配。我首先讨论了布尔索引的具体解决方案，但这需要一段时间才能完成所有的数据，所以我尝试了熊猫合并功能。但是，在我的测试数据上，合并的实现甚至更慢。它的运行速度比布尔索引慢2到4倍。下面是一个测试运行： import pandas as pd import random import time def make_lsts(l

浏览 3提问于2016-01-26得票数 1

回答已采纳

1回答

pandas数据透视表重命名列

python、pandas、pivot、pivot-table、data-mining

如何在pandas pivot操作后重命名多级列？下面是一些生成测试数据的代码： import pandas as pd df = pd.DataFrame({ 'c0': ['A','A','B','C'], 'c01': ['A','A1','B','C'], 'c02': ['b','b','d','c'], '

浏览 4提问于2017-02-08得票数 16

回答已采纳

2回答