如何使用一列的子串合并两个数据帧_R:根据子串合并两个数据帧_如何使用条件合并两个数据帧 - 腾讯云开发者社区

、、、、

我需要根据一列名为"authors“的列表找到两个pandas数据帧之间的交集。但我得到的却是这个错误：

浏览 3提问于2017-06-23得票数 0

3回答

如何合并某些行值相等的两个数据帧？

、、、

我有两个数据帧，我想把它们合并成一个。第一个文件具有ID作为其列，而第二个文件具有相同的值，但在名为id_number的列中。我尝试了下面的代码，但最终final_df同时具有ID和id_number列及其值。如何在合并后只保留一列I？ final_df = df.merge( df2, left_on='ID', right_on='id_number', how='inner') 另外，让我们假设df列A的数据帧格式如下： A 0 1 2 第二个dataframe中的同一列A有一些空字段，如下所示： A -

浏览 15提问于2021-06-22得票数 0

1回答

Pandas带前缀锁定

、、、

我有两个数据帧，我想让一个数据帧中的每一行通过某一列(包含一些id)来定位另一个数据帧中的匹配线。我想检查一下df1中的行，并使用loc函数在df2中查找匹配的行。问题是df2中的一些id除了id本身之外还有一些额外的信息。例如: df1的id为1234，df2的id为1234-KF 例如，我如何使用loc来定位此id？loc能否以某种方式仅通过前缀匹配？

浏览 5提问于2021-07-19得票数 1

1回答

在Python中计算相关性时出现问题

、

我有以下数据框我需要计算所有列的相关矩阵。问题是:当我分别计算两列时，得到的值与使用df.corr()计算每一对的所有值时不同。我构建数据帧的方式是将第一列与其他列合并，这种合并过程导致两个数据帧的行长不同。例如:第一列( btc_logreturns )和第二列(gold_logreturns)最初有2000行，而btc_logreturns和ewz_logreturns有2100行。但是所有列加起来有2459行。在计算相关性时，函数.corr()是否考虑了NaNs？对于我得到的不同相关值，数据帧的长度是否是一个潜在的问题？

浏览 1提问于2021-05-07得票数 0

3回答

熊猫-用相同的列名合并两个DataFrames，并在一个单元格中合并两个DataFrames的信息。

、、、

我在第一列中有两个具有相同列名和相同in的数据帧。在第一个数据帧中，我有int信息，在第二个str中。下面是它们的样子的一个例子： ID Cat1 Cat2 Cat3 1 1 1 0 2 0 2 1 3 0 0 5 ID Cat1 Cat2 Cat3 1 text text text 2 text text text 3 text text text 我希望将它们合并到一个Data

浏览 2提问于2020-03-01得票数 0

回答已采纳

1回答

一个接一个地匹配dataframe行并返回相应的行值。

、、、

我有两个数据帧dfA，dfB。dfA有value和action两列，dfB有一列action。我希望将B与A在'Value‘列中匹配，并返回'Action’项，如果不匹配，则返回字符串"NOT“。 dfA value action "user" "enter" "password" "enter" "login" "click" "customerid" "enter"

浏览 5提问于2022-02-17得票数 0

2回答

pd.merge未对列值进行合并

、、、

我正在尝试将下面的两个数据帧合并到列retweeting_id上 retweeting_id retweeting_username retweeting_followers_count 207857 822215673812119553 WhiteHouse 26139914 id user_id retweet_count tweet predict

浏览 29提问于2021-01-07得票数 1

回答已采纳

1回答

Pandas Dataframe上的部分字符串合并

、、

我有两个包含不同信息的数据帧，但这两个数据帧都有一个account_number列，我希望与之进行合并。问题出在这里：其中一个数据帧具有完整的帐号，例如12345678，另一个数据帧具有掩码的帐号，但最后四位除外，因此它类似于****5678。我确信每个帐号的最后四位数都是不同的，那么如果最后四位数匹配，我该如何在内部连接中合并数据帧呢？谢谢你的帮助。

浏览 16提问于2019-10-24得票数 0

回答已采纳

3回答

为什么我不能在用cbind创建的dataframe中添加数字？

、、

我正在寻找关于如何从两个数据帧中互相减除值的建议。在下面两个数据帧A和B的示例中，我希望在第一列向量匹配的条件下，从彼此之间减去第二列的值。例如，当向量X1为R1时，5.1-5和4.8-5。 A<-data.framework(c( 'R1'，‘R1’，'R2'，'R4'，'R4'，'R4')，c(5.1，4.8，4.9，5.0，5.3)) B<-data.framework(c(c(‘R1’，'R2'，'R3'，'R4')，c(5，4.9，5.2，5.

浏览 0提问于2011-09-01得票数 4

回答已采纳

1回答

如何根据大熊猫另一个数据帧中的条件更新数据帧

、、

我有两个数据框架，我想根据两个数据帧中的条件更新df_source的一列： df_source = pd.Dataframe({'Sentiment':['neg', 'neg','pos'], 'text': ['hello ', '12where', 'here [null]'], 'pred': ['neu', 'neg', 'pos')}) df2 = pd.Dataframe({'Se

浏览 5提问于2021-10-13得票数 2

回答已采纳

1回答

如何在R中使用sqldf获取两个字符串之间的字符匹配百分比

、、

我想在我的数据帧中获取两个字符串/两列名称之间的字符匹配百分比。如果可以使用sqldf实现以下功能，将会很有帮助。下面是一个示例，我想在我的一列数据帧中实现它。 FAYE与FAYE2的比较产出将为90% 要使用的公式如下：字符总数(将第一个和第二个字符串的长度相加)=9个匹配字符乘以2除以总字符= (4 X 2) /9*当有2个字符串时，我们将匹配字符乘以2 8/9 =88.88%或90% 谢谢

浏览 34提问于2019-02-28得票数 0

3回答

合并来自两个Pandas数据帧的列，并显示每行的源

、、

我有两个Pandas数据帧： import pandas as pd a = pd.DataFrame( {'key' : [123, 234, 345, 456] } ) b = pd.DataFrame( {'key' : [ 234, 345, 456, 567 ] } ) 我想做的是将它们合并到一个包含两列的数据帧中:一列是两列的并集；另一列是source，列出了两个原始数据帧中哪一个包含该键。对于上面的输入，我需要这样： +---+-----+--------+ | | key | source | +---+-----+--------

浏览 1提问于2014-12-11得票数 0

1回答

基于R中的转换数据框更改数据框列中的字符值

、

我在R中有一个数据框，其中有一列字符串/字符。我在下面把它叫做"myDat“。我在R中有另一个数据框，它有两列字符串/字符。我在下面把它叫做"conversionDat“。有一列("Name")包含与"myDat“中的列相似的名称。另一列("Name2")包含"myDat“列应该转换为的名称。以下是这两个数据帧的MWE： myDat <- data.frame(Name = c("A","D","P","R")) conversionDat <- da

浏览 0提问于2016-11-12得票数 2

3回答

在R中连接两个数据帧

、、

抱歉，如果这是一个非常基本的问题，但我在处理R项目时遇到了一个问题。基本上我有两个数据框对象，一个是基因及其在不同患者中表达水平的主列表，另一个只有一列大小。然后，一个只有一列的列表是属于特定基因子类别的基因列表，所有这些基因都在主列表中。我正在尝试创建一个数据框架，其中我有我的特定基因子集及其在主列表中包含的不同患者的表达。我尝试使用merge()函数，但只创建了一个空的dataframe。基本上代码是这样的:合并<- new_dataframe (master_list，specific_gene_list，by = "gene")。我认为这段代码应该在我的主列表

浏览 24提问于2020-07-13得票数 0

2回答

如何将大熊猫的均值和标准差列合并成一个单栏

、、、

我有一个熊猫数据框架，一列数据帧是平均值，第二列数据帧是标准差。数据帧的每一行表示一个sample_Case，我们对其有一个均值和标准差。我想要创建一个新的列，在该列中，我可以以以下格式将平均值和标准差保存在一起：平均值(+- StD) 然后我想将它导出为csv文件。所以这个文件就像 Sample_1，平均值(+- StD) Sample_2，平均值(+- StD) 诸若此类。我不知道如何将熊猫的数据框架组合在一起来产生这样的东西。我想知道是否有人能为我指出正确的方向，我如何能做到这一点？

浏览 16提问于2022-04-20得票数 0

1回答

pandas数据帧之间的内部联接不适用于比较DenseVector类型

、、、

我正在处理熊猫数据帧，我想得到2个数据帧，df1和df2之间的重合度。 df1： +------------+-------+ | features | col2 | +------------+-------+ | [1.0, 2.0] | 2 | +------------+-------+ | [1.0, 3.0] | 1 | +------------+-------+ df2： +------------+-------+ | features | col2 | +------------+-------+ | [1.0, 2.0] | 2 | +

浏览 0提问于2018-04-16得票数 0

1回答

如何根据两列中的值查找和引入另一个数据帧中的值

、、、、

我有两个数据帧。我需要从右侧(第二个)数据库中提取一个值，并基于两个数据帧中存在的另外两个列，将其作为列添加到左侧(第一个)数据帧中。这样做时，我需要在左边的dataframe中为这个列指定一个不同于在右边的dataframe中调用的名称。我排除了merge和join，因为dataframes有成百上千的列，我只需要带出一列，并且在这样做的时候还需要更改列名。相反，我正在尝试map它。例如： import pandas as pd emp_data = { 'Name':['Tom', 'Tom', 'Ste

浏览 6提问于2019-05-01得票数 1

1回答

如何比较两个表中的多列并找出重复的列？

、、

我有两个数据帧数据帧1 ? 数据帧2 ? ID列在两个表中不唯一。我想要比较两个表中除ID之外的所有列，并打印唯一行预期输出 ? 我尝试了“isin”函数，但不起作用。每个数据帧大小为150000，我删除了两个表中的重复项。请建议如何做到这一点？

浏览 20提问于2020-11-03得票数 0

3回答

基于R中公共列连接两个数据帧

、、、

我想基于公共的第一列连接两个数据帧(df1，df2)，但是，我希望将两个数据帧中的每一列依次放置，如下例所示： INPUT df1 df1 <- data.frame(name = c("JMA", "PSA", "TAN", "POS"), HAN = c("0.2119", "-0.1726", "0.0002", "-1.036"), ENA = c("0.0736", "-1.6644", "0.0743"

浏览 35提问于2021-10-07得票数 1

回答已采纳

2回答

R中的条件索引

、、

作为工作示例:数据帧df由两个数值列组成: x，y我希望基于列x中的最大值来索引列y中的值 x<-rnorm(100,1, 2) y<-rnorm(100,0.5, 2) df<-data.frame(x,y) max(x) #[1] 5.842416 如何根据数据帧中(x)的行位置而不是(x)的值来识别(y)的值？这段代码是在for循环中实现的，这是我使用dplyr的解决方案，但是它会返回一列NAs，没有出现错误。 x[i] <- max(df$x) y[i]<-df %>% group_by(y) %>% slice(which.max(x[

浏览 38提问于2021-07-23得票数 0

回答已采纳

2回答

如何在python中连接两个数据帧？

我想使用python连接两个数据帧。我附上Book.xls文件以供参考。在该文件中，表1中有两列为System_requirement_linked，另一列为OH_Requirement linked。在另一个工作表中，我们有一个列作为System_Requiremnet_liknked，其中包含与工作表1的两个列相同的数据。我想将工作表1的数据与工作表2的数据合并，并使用工作表中所有可用的相应数据打印最终的结果工作表。一般而言，我将工作表放在不同的文件夹中，而不是放在Book表单中。 📷 📷

浏览 37提问于2020-08-23得票数 0

回答已采纳

1回答

pandas:比较来自两个不同大小的不同数据帧的字符串列

、、、、

我有两个不同大小的数据帧，每个数据帧都有一列句子，如下所示： import pandas as pd data1 = {'text': ['the old man is here','the young girl is there', 'the old woman is here','the young boy is there','the young girl is here','the old girl is here']} df1 = pd.DataFrame (dat

浏览 10提问于2020-12-21得票数 0

回答已采纳

1回答

如何在pandas中合并多索引(名称，日期)和列日期，同时保持多索引？

、、

我有两个熊猫数据帧。df1由多个索引(名称、日期)编制索引。df2是一个简单的0到n的索引，有一个'Date‘列。我的问题是如何按日期合并这两个数据帧，同时保持多索引。我使用下面的命令来合并。合并后的数据帧不再具有多索引。 df_merg = pd.merge(df1, df2, how='left', left_on='date', righ_on='Date')

浏览 15提问于2019-09-27得票数 0

1回答

熊猫合并与布尔索引

、、、

我在Python3.4中使用熊猫来识别两个数据帧之间的匹配。除了最后一列之外，匹配是基于严格相等的，在最后一列中，关闭匹配(+/- 5)很好。一个数据帧包含许多行，而在本例中，第二个数据帧只是一行。所需的结果是包含第一数据帧的子集的数据帧，如所述，该第一数据帧与该行匹配。我首先讨论了布尔索引的具体解决方案，但这需要一段时间才能完成所有的数据，所以我尝试了熊猫合并功能。但是，在我的测试数据上，合并的实现甚至更慢。它的运行速度比布尔索引慢2到4倍。下面是一个测试运行： import pandas as pd import random import time def make_lsts(l

浏览 3提问于2016-01-26得票数 1

回答已采纳

1回答

插入数据后的熊猫列数不匹配

、、

我正在尝试从一个数据到另一个数据插入一列值。两个单独数据的值的总计数是91744，但是当我使用 df1.insert(loc=0, column='x1', value=ts) 要将ts的值作为df1中的第一列插入，插入后的值计数为84175，而不是实际的91744。请告诉我这是怎么回事。 >>> df1.insert(loc=0, column='x1', value=ts) >>> df1.x1.count() 84175 >>> ts.count() 0 91744 dtype: int64 &

浏览 0提问于2018-05-09得票数 0

1回答

使用单词列表从dataframe中定位行

、、

如何使用单词列表作为引用从数据框中选择行？例如，我有一个数据帧df_business，最后一列中的每一项都是一个包含逗号分隔的类别的字符串，如下所示： categories: "Restaurants, Burgers, Coffee & Tea, Fast Food, Food" 我尝试过这个方法，但它只给出了类别中只包含咖啡一词的企业的行： bus_int = df_business.loc[(df_business['categories'].isin(['Coffee']))] 我如何才能获得包含我的单词的企业，即使它存在于其

浏览 12提问于2021-01-01得票数 1

回答已采纳

2回答

Python Pandas合并Dataframe以仅获取唯一值

、、

我是使用Pandas的新手，我想合并两个数据帧，以便只从第一个数据帧中获得唯一的值。下面我给出了一个例子： df1 = ['Apple', 'Banana', 'Carrot', 'Squash', 'Watermelon'] df1 = pd.DataFrame(df1) df2 = ['Apple', 'Cucumber', 'Raddish', 'Watermelon'] df2 = pd.DataFrame(df2) Result desi

浏览 1提问于2021-02-17得票数 0

1回答

条件乘法两个数据帧

、、

我想知道如何根据匹配条件灵活地将两个数据帧相乘。例如： df1 <- data.frame(c1 = letters[seq(1,5)], c2 = seq(1,5), c3 = seq(31,35), c4 = seq(41,45)) df1 c1 c2 c3 c4 1 a 1 31 41 2 b 2 32 42 3 c 3 33 43 4 d 4 34 44 5 e 5 35 45 df2 <- data.frame(c1 = letters[seq(5,1)], c2 = seq(11,15), c3 = seq(21,25), c4 = seq

浏览 2提问于2018-10-20得票数 0

3回答

在两个数组中查找重复的值，Python

、、

我有两个数组(A和B)，每个数组大约有50000个值。每个值代表一个ID。我想创建一个有三列的pandas数据帧，col1:来自数组A的值，col2:来自数组B的值，col3:标签为“唯一”或“重复”的字符串。在每个数组中，ID:s是唯一的。数组的长度不同。所以我不能做这样的事情来开始。 a = np.array([1, 2, 3, 4, 5]) a = np.array([5, 6, 7, 8, 9, 10]) pd.DataFrame({'a':a, 'a':b}) 我当时正在考虑创建一个不同的pandas数据帧，也有三列。一个是ID，另一个是ID来自的

浏览 80提问于2021-01-28得票数 2

回答已采纳

1回答

基于三个匹配列的数据融合

、、

谢谢您的帮助，我真的很难合并dataframes (我想将两个框架合并到下面的条件中)，但是它失败了，“意外地导致了合并的dataframes黄色-在图3中高亮显示)。我想根据前两列合并。第一排。如果两个帧中的第一列和第二列匹配在一起。->然后合并成一排。2)。如果两个框架中的第一列或第二列不匹配，但另一列匹配->创建一个新行。3)。如果第一列和第二列在两个框架中不匹配->创建一个新行。 Dataframe (1) Dataframe (2)

浏览 6提问于2022-05-01得票数 0

2回答

迭代数据帧并将列作为新的数据帧

、、

我正在尝试从一个大的数据帧创建一组数据帧。这些数据帧以这种方式由原始数据帧的列组成:第一个数据帧是原始数据帧的第一列，第二个数据帧是原始数据帧的第一列和第二列，依此类推。我使用下面的代码来迭代数据帧： for i, data in enumerate(x): data = x.iloc[:,:i] print(data) 这是可行的，但我在开始时也得到了一个空的数据帧和一个不需要的索引向量。对如何删除这两个有什么建议吗？谢谢

浏览 12提问于2021-09-13得票数 2

回答已采纳

1回答

合并同一类型列上的两个数据帧会得到错误的结果

、

我有两个数据帧，假设是A和B，它们是在读取Excel文件的工作表并执行一些基本功能后创建的。我需要在名为ID的列上对这两个数据帧执行merge right操作，这两个数据帧首先都被转换为astype(str)。左侧数据帧(A)的ID列为： 0 5815518813016 1 5835503994014 2 5835504934023 3 5845535359006 4 5865520960012 5 5865532845006 6 5875531550008 7 58854982

浏览 4提问于2019-10-08得票数 0

回答已采纳

2回答

尝试将一个数据框中的值与另一个数据框中的值进行匹配(python)

、、、

我目前有一个由国家代码列(code1)组成的数据帧A，例如CA、RU、US等。我还有另一个数据帧B，它有3列，其中第一列包含所有可能的国家代码，第二列包含经度值，第三列包含纬度值。我尝试遍历A，获取第一列中的第一个国家代码，将其与B的第一列中的国家代码进行匹配，然后获得该国家的相关经度和纬度，依此类推。我计划创建一个新的数据帧，其中包含来自A的代码(第一列)以及新提取的经度值和纬度值。到目前为止，我的函数如下所示 def get_coords(): for i in range(len(A["code1"])): for j in range(len

浏览 63提问于2020-07-17得票数 1

回答已采纳

2回答

合并具有不同信息的两列，python

、、、

我有一个包含一列姓氏和一列名字的数据帧。如何合并这些列，以便拥有一个包含名字和姓氏的列？这就是我所拥有的:名字(第一列) 约翰丽莎吉姆姓氏(第2列) 史密斯棕色 Dandy 这就是我想要的：全名约翰·史密斯丽莎·布朗吉姆·丹迪。谢谢!

浏览 0提问于2017-06-06得票数 0

1回答

如果在另一数据帧的列中找到ID匹配，则更新数据帧中一列的值

、、、、

我有两个数据帧。第二数据帧是从第一数据帧派生的。我更新了第二个dataframe中的一列，然后希望将更新后的值放回第一个dataframe中。我尝试过"merge"，但它给出了两个后缀为"_x“和"_y”的列。 import pandas lotQtyQueryForDF = pandas.read_sql_query(refreshQuery,conForInfo) dataFrameOfLots = pandas.DataFrame(lotQtyQueryForDF,columns=['Customer','Stage',&

浏览 19提问于2020-05-27得票数 1

回答已采纳

1回答

如何在excel中将两个透视表合并为一个图表

、、

我有两个数据透视表，每个都有两列。一列是从0到6.5的范围，按.5分组，另一列是数据落入示教分组的整个列的百分比。我需要将这两个透视表与显示两个区域重叠的面积图进行比较，但我不知道如何做。我可以为每个人单独制作一个面积图，但我不知道如何组织数据来制作前面提到的组合图。以下是数据：

浏览 155提问于2019-08-21得票数 0

1回答

在使用iterable进行设置时，必须具有相等的len键和值

、

我有两个数据帧作为流： leader: 0 11 1 8 2 5 3 9 4 8 5 6 [6065 rows x 2 columns] DatasetLabel: Unnamed: 0 0 1 .... 7 8 9 10 11 12 0 A J .... 1 2 5 NaN NaN NaN 1 B K .... 3 4 NaN NaN NaN

浏览 14提问于2017-12-28得票数 13

回答已采纳

1回答

将多个数据帧连接在一起，并确保正确的数字进入同一列

、、

我有几个数据帧，它们都有一个"Dirty Price“和"Factor”，我想在同一列中包含它们。当我尝试这样做时，当我将第二个数据帧连接在一起，然后pandas创建了一个新的"Dirty Price_x“和"Factor_x”，但是我不想让我的新列合并到与我指定的条件匹配的同一列中。这是我所做的： df = df.merge(gs[['CUSIP', 'temp_Counterparty','Dirty Price','Factor']], how = 'left', on =

浏览 11提问于2020-04-22得票数 1

回答已采纳

3回答

SQL -有条件地将同一表中的两列连接成一列

我正在使用一个包含两个版本的存储信息的表。为了简化，一列包含文件运行的旧描述，而另一列包含用于显示ran文件的更新标准。它变得更加复杂，因为较旧的列本身可以有多个标准。下表： Old Column New Column Desc: LGX/101/rpt null null Home Print: LGX/234/rpt null null Print null Page 我需要将这两列合并为一列，但还需

浏览 0提问于2012-09-29得票数 0

回答已采纳

1回答

如何进行左连接，其中"data B“中的行与id所在的行不同？

我有一个包含两列的数据框"A“，第一列是城市名称(唯一值)，第二列是NA，我想用失业数据填充它。数据框"B“有一列城市名称，但失业数据不在同一行，准确地说，它总是在下面1行。如何合并这两个数据，以便R查看数据帧"A“上的第一列，找到它在数据帧"B”上的匹配，并将数据帧"A“的第二列中的NA替换为匹配行下面的值1行。以下是数据帧A和B外观的一些汇总版本。 names= c("Bogotá", "Medellín") data_frame_A= as.data.frame(names, ncol=1) colnames(

浏览 1提问于2019-04-23得票数 0

4回答

对数据帧中多列的特定值序列的个数进行计数

、、

我想创建一个表或一个新的数据框，为原始数据框(其中有许多列)中的每一列显示一个特定值的序列出现的次数。例如，如果我有以下数据帧： x <- data.frame("Red" = c("a", "b", "a", "a", "c", "d"), "Blue" = c("b", "a", "a", "a", "a", "a"), "Green" = c(&

浏览 0提问于2019-05-31得票数 1

3回答

从csv文件向现有apache spark数据帧添加数据

、、、

我有一个spark dataframe，它有两列: name，age，如下： [Row(name=u'Alice', age=2), Row(name=u'Bob', age=5)] 数据帧是使用以下命令创建的 sqlContext.createDataFrame() 接下来我需要做的是从外部的'csv‘文件中添加第三列'UserId’。外部文件有几列，但我只需要包括第一列，即'UserId'：两个数据源中的记录数相同。我在windows操作系统上使用的是独立的pyspark版本。最终结果应该是一个包含三列的新数据帧:

浏览 9提问于2016-09-16得票数 0

回答已采纳

3回答

R:将单独的经度数据框和纬度数据框合并为空间点

、

我有两个数据帧，每个1000x1000，一个带有经度的数据帧(长)和一个带有纬度的数据帧(纬度)，指定像素(或光栅)数组的坐标，我陷入了如何将这两个数据帧组合成一个1000x1000空间点数据帧(或等效数据帧)的问题。spatialpointsdataframe的第一个单元格将具有由lon1,1和lat1,1等指定的坐标。有没有简单的方法可以做到这一点？我想我可以一列一列地做，然后按顺序将空间点对象绑定在一起，但这似乎有点冗长。有什么想法吗？已按建议尝试： lat.t <- data.frame(seq(10, 15, 1), seq(20, 25, 1), seq(30,

浏览 2提问于2017-12-16得票数 0

4回答

在Python中合并两个长度相等的数据集

我有两个长度相等的数据集。两者都只有一列。我正在尝试将它们组合在一起，并创建一个包含两列的数据集。我尝试使用的是一列，其中包含第一个数据帧中的所有值。但第二列是阿南的，请帮帮忙。我试过.join & .merge & pd.concat & .add & ... df_low_rename = df_low_sui.rename(index=str, columns={'suicides/100k pop': 'low_gdp'}) df_high_rename = df_high_sui.rename(index=str,

浏览 10提问于2019-03-28得票数 0

3回答

根据另一个数据框中的值从DataFrame中选择行，并根据第二个dataframe用值更新其中一列

、、、、

我有两个数据帧df和df1。主DataFrame如下： DF： start end price 0 A Z 1 1 B Y 2 2 C X 3 3 A Z 4 4 D W 5 第二个DataFrame： DF1： start end price 0 A Z 100 1 B Y 200 我希望主数据帧df根据df1中的开始和结束来更新'price‘列中的值。它应该更新与df1中具有相同开始和结束的所有行的列值。DF： start end price 0 A Z

浏览 0提问于2018-09-21得票数 4

3回答

多索引合并返回空df，但联接应有效

、、、

我正在尝试连接两个数据帧，其中分别包括按国家代码列出的奥运奖牌总数和按国家代码和年份列出的国家人口。每个都是具有相同多索引(国家/地区、人口)的一列的数据帧。数据帧可能不一定包括相同的国家和年份，例如，奥运会年份不像普通年份那么多，并且人口估计数据集中缺少一些国家代码。以下是几个摘录，用于说明ITA和部分重叠的年份的数据结构： med： Medals Cty Year ITA 1960 88 1964 50 1968 32 1972 25 1976 31 弹出：

浏览 7提问于2018-02-22得票数 1

1回答

将lambda函数应用于两个Pandas数据文件中的两列

、、、

我有两个数据帧，我正在尝试合并，基于公司名称的主键&外键。一个数据集有50,000个独特的公司名称，另一个数据集大约有5,000个公司名称。在每个列表中都可以有重复的公司名称。我试图生成一些字符串编辑距离度量，比较两个数据帧之间的两列。下面是一个带有示例数据帧的MWE： mwe1 = pd.DataFrame({'company_name': ['Deloitte', 'PriceWaterhouseCoopers',

浏览 5提问于2022-11-30得票数 0

2回答

R- text挖掘中的水平合并数据帧

、、

如何在R中水平合并/合并3个数据帧？我有三个数据帧，一列中有一个单词，下一列中从文本中提取的单词计数，有点像这样： word. count 1 hello. 6 2 test. 3 3 how. 8 4 are. 4 5 you. 1 我们来看一下dataframe 2： word. count 1 hello. 6 2 test. 3 3 i. 3 4 am. 6 5 good.

浏览 0提问于2020-09-18得票数 0

3回答

如何在Pandas Python中合并两个数据帧

、、、、

如何合并/连接两个数据帧我想合并两个数据文件:第一个是带有datetime64 dtype的一列的dataframe，第二个是float，一个列是dataframe。这就是我尝试过的： df1 = pd.DataFrame(df, columns = ['MemStartDate']) df4 = pd.DataFrame(df, columns = ['TotalPrice']) df_merge = pd.merge(df1,df2,left_on='MemStartDate',right_on='TotalPrice')

浏览 3提问于2022-04-28得票数 0

1回答

熊猫合并两个数据帧是否存在已知问题，每个数据帧都有一个日期时间类型的索引

我合并了两个数据帧，每个数据帧都有一个日期时间类型的索引，因此得到的数据帧的行数比原来的多。这两个数据帧具有相同数量的记录，每个和相同的索引值。看一下--我发现同一索引上有重复的记录--这是一个已知的问题吗？守则： df_merged = df1.merge(df2, left_index=True, right_index=True)

浏览 2提问于2022-01-18得票数 0