在两个公共列R的匹配值上连接两个数据帧_基于R中公共列连接两个数据帧_spark连接两个没有公共列的数据帧 - 腾讯云开发者社区

r、dataframe、merge、inner-join

我正在尝试合并R中的两个数据帧，通过它们共享的一列来连接它们。下面是两个数据帧的屏幕截图，我在"INC_KEY“列上合并。这是我用来合并两个数据帧的代码: dp <- inner_join(d，p，by="INC_KEY") D有177156个观测值，p有1641137个观测值，但最终合并的数据帧有8416113个观测值，这对我来说没有意义。我还尝试将上面的inner_join函数更改为merge函数，但仍然得到相同的结果。我想知道如何修复这段代码，以便合并后的数据帧具有真实的观察值--非常感谢您的帮助！

浏览 0提问于2021-01-11得票数 0

2回答

Python连接满足条件的列上的两个数据帧

python、join、pandas

假设我有两个数据帧A和B，每个数据帧包含两个名为x和y的列。我希望连接这两个数据帧，但不是连接在两个数据帧中x和y列相等的行上，而是连接在A的x列是B的x列的子字符串且y列相同的行上。 if A[x][1]='mpla' and B[x][1]='mplampla' 我希望它能被捕获。在sql上，它可能类似于： select * from A join B on A.x<=B.x and A.y<=B.y. 这样的事情能在python上完成吗？

浏览 2提问于2015-01-21得票数 0

2回答

Spark Dataframes:如何更改Java/Scala中列的顺序？

java、scala、dataframe、spark-dataframe

在连接两个数据帧之后，我发现列的顺序改变了我的预期。例如:在b上连接具有列[b,c,d,e]和[a,b]的两个数据帧将产生[b,a,c,d,e]的列顺序。如何更改列的顺序(例如，[a,b,c,d,e])？我已经找到了在Python/R中做到这一点的方法，但没有找到Scala或Java。是否有任何方法允许交换或重新排序数据帧列？

浏览 1提问于2016-06-29得票数 4

1回答

用于将信息从R中的一列复制到下一列的循环

r、loops、if-statement

我有一个数据帧，如下所示： test # Name1 Name2 Match #1 A C 1 #2 E NA 0 #3 D G 1 #4 R NA 0 如果两个name列都有非NA元素，则match列显示1，如果没有非NA元素，则显示0。我想创建一种读取数据帧的方法，以便如果测试$match == 0，则Name 1中的行元素将被复制到Name 2，如下所示： test # Name1 Name2 Match #1 A C 1 #2 E E

浏览 23提问于2021-06-26得票数 0

回答已采纳

2回答

为t测试统计量在两个数据帧中查找匹配列(R初学者)

我想对R中的数据执行两个样本t-测试，给定两个高维数据帧，我需要在所有行上以某种方式循环匹配列(String ())，并对每一对列执行测试--分别来自df1和df2。问题是数据帧中的列没有按正确的顺序排列，即col1 form df1与来自df2的col1不匹配，而且df2还有其他列，而df1中不存在这些列。我从来没有用R来完成这样的任务，我想知道是否有一个快速方便的解决方案，可以在t-test的数据帧中找到匹配的列对。我考虑过for -循环，但我认为对于大数据帧来说，这将是非常低效率的。提前感谢您的帮助。编辑的*？两个小示例数据格式，df1和df1。 *df1* "Row\Co

浏览 3提问于2013-04-07得票数 3

回答已采纳

1回答

连接两个数据帧。如果第一个索引值与第二个索引值匹配，则添加一个列值

python、pandas

我有两个数据帧，分别称为1和2。第一个有索引-‘客户’。第二个也有索引-‘客户’，有一些相似的值，也有一些不同的值。第一个有列'P‘和'Q’。第二个也有名为'P‘和'Q’的列。我想连接两个数据帧，例如，如果第一个的索引值与第二个的索引值匹配，则将B中的'P‘和'Q’的相关值添加到第一个的'P‘和'Q’中。返回数据帧优先示例1数据帧为： customer P Q A 0.5 4 B 0.4 6 C 0.3 5 D 0.7 7 第二个数据帧是：

浏览 7提问于2016-07-28得票数 0

回答已采纳

2回答

在pandas中连接两个数据帧的行

python、pandas、dataframe

我需要一个接一个地连接两个具有相等行数(nRow)的数据帧df_a和df_b，而不考虑任何键。此函数类似于R programming language中的cbind。每个数据帧中的列数可能不同。所得到的数据帧将具有相同的行数nRow和等于两个数据帧中的列数之和的列数。换句话说，这是两个数据帧的盲列连接。 import pandas as pd dict_data = {'Treatment': ['C', 'C', 'C'], 'Biorep': ['A', 'A', 'A

浏览 0提问于2015-01-25得票数 79

回答已采纳

1回答

如何基于2列合并R上的2个数据帧？

r、dataframe、merge、sas、merging-data

我希望基于R中的2列合并2个数据帧，这两个数据帧称为popr和data列，它们共享相同的2个变量: USUBJID和TRTAG2N，这两个变量是我想要组合这两个数据帧的变量。当我只尝试根据一列进行合并时，合并函数就能工作： merged <- merge(popr,droppedcol,by="USUBJID") 当我试图通过使用2列合并并查看数据框架“工期”时，表是空的，没有值，只有列标题。它说“表中没有可用的数据”。我的任务是在R中复制SAS代码： data duration; set pop combined1 ; by usubjid trtag2n;

浏览 1提问于2019-07-09得票数 2

回答已采纳

1回答

如何使用R计算同一数据帧中具有相同列名的列之间的差异

首先，我有两个数据帧，我使用公共列删除列的后缀来组合具有相同列但不同后缀的数据帧。现在，我必须计算R中数据帧中具有相同列名的每两列之间的差异我尝试获取唯一的列列名，并将其减去列名，但公共Id列转换为NA。 ffsub[[k]][[i-1]] <- sapply(unique(names(temp)), function(x) apply(temp[grep(x, names(temp))], 1, function(y) { y[1] - y[2] })) 也尝试过； ffsub[[k]][[i-1]] <- sappl

浏览 2提问于2019-05-02得票数 0

1回答

如何将第一个dataframe中的列与第二个dataframe中的列进行比较，匹配后从第二个dataframe中的另一个列中提取值

python、pandas、dataframe

假设我有一个数据帧： a = [['A','def'],['A','xyz'],['A','uiu'], ['B','jkl'], ['C','pqr'], ['C','rty']] df1 = pd.DataFrame(a, columns=['1', '2']) 1 2 0 A def 1 A xyz 2 A uiu 3 B

浏览 8提问于2021-03-10得票数 1

回答已采纳

1回答

如何在pandas中按组计算一组行的模式

python、python-3.x、pandas

我有一个数据帧，看起来像这样： import pandas as pd foo = pd.DataFrame({'var_name': ['r1','r2','r3','var', 'r1','r2','r3','var'], 'group': ['a','a','a','a','b','b',

浏览 6提问于2020-04-09得票数 1

回答已采纳

1回答

通过连接比较两个pyspark数据帧

python、dataframe、join、pyspark

我有两个pyspark数据帧，它们的行数不同。我试图通过在多个键上连接这两个数据帧来比较所有列中的值，这样我就可以找到这些列中具有不同值的记录和具有相同值的记录。 #df1: +-------+----------+----------+----------+ |id |age |sex |value +-------+----------+----------+ | 1 | 23 | M | 8.4 | 2 | 4 | M |2 | 3 |16 | F | 4.

浏览 14提问于2021-02-13得票数 0

1回答

基于值连接数据帧，pandas

python、python-3.x、pandas、dataframe

我有两个数据帧，假设是A和B。A具有列['Name', 'Age', 'Mobile_number']，B具有列['Cell_number', 'Blood_Group', 'Location']，'Mobile_number'和'Cell_number'具有公共值。我只想根据'Mobile_number'和'Cell_number'中的公共值将'Location'列连接到A上，这样最终的DataFrame就会有A={&

浏览 12提问于2021-03-02得票数 0

1回答

如何合并或连接spark中列号不相等的数据帧

python、apache-spark、pyspark、apache-spark-sql、spark-dataframe

我正在做一个使用spark的项目。在某些阶段，我需要在单个数据帧中合并或连接3个数据帧。这些数据帧来自spark sql表，我使用了联合函数，它已经合并了两个表中具有相同编号的列，但我也需要合并不相等的列值。我现在很困惑，有没有办法在pyspark中合并或连接不相等的基于列的数据帧，请指导我

浏览 13提问于2016-09-22得票数 0

1回答

使用pandas将新字段(列)插入到mongoDB

pandas、mongodb、dataframe、pymongo

我在MongoDB中有一个现有的数据，其中主键设置为'date‘，其中有几个字段。我想在MongoDB中的现有数据中插入一个带有新字段(列)的新pandas数据帧，连接两个数据帧上的'date‘字段。例如，假设这是我的日期中的数据帧A(当从MongoDB调用数据时，我用‘MongoDB’字段设置了索引) ? 这是我要插入到MongoDB的新数据帧B ? 这是带有新字段( 'std_50_3000window'，'std_50_300window'，'std_50_500window‘添加在'date’索引上的

浏览 85提问于2020-07-11得票数 0

回答已采纳

2回答

如何在不获取额外行的情况下合并两个数据帧？

python、pandas

基本上，我有两个数据帧，第一个看起来像这样： ? 第二个是这样的： ? 我想要获取第二个数据帧的"lat“和"lnt”列，并仅当两个数据帧中的城市名称匹配时才添加到第一个数据帧中。我尝试使用pd.merge()，但它创建了具有重复值的新行。如果可能，我希望在没有任何匹配的行中放置一个NaN，但我不想删除或添加行到原始数据帧。

浏览 19提问于2021-08-12得票数 0

回答已采纳

2回答

如何合并两个数据帧并将R中的同名列替换为其他列

我在R中有以下两个数据帧 df1 key volume name hours location ABC 456 SS32 34.34 London ERT 34 SS31 33.14 London TYU 21 SS33 3 London GHU 678 SS35 1.30 London THU 67 SS35 0.30

浏览 0提问于2017-10-27得票数 0

1回答

根据ID变量合并R中的两个数据帧

r、merge

我试图根据ID-变量在R中合并两个数据帧，因为在第一个数据帧中，ID-变量是一个因子，而在第二个数据帧中，ID-变量是一个数字向量。 datC <- data.frame("ID" = c("001","010","100","110"), "X" = rnorm(4)) datD <- data.frame("ID" = c(001,010,100,110,210), "Y" = rpois(5,3)) merge(datC,datD,by="I

浏览 2提问于2015-11-10得票数 1

回答已采纳

1回答

查找两个数据帧之间不匹配的行

python、pandas、dataframe

我有一个场景，我希望在两个数据帧之间找到不匹配的行。这两个数据帧都有大约30列和一个唯一标识每条记录/行的id列。因此，我想检查df1中的行是否与df2中的行不同。df1是更新后的数据帧，df2是以前的版本。我尝试了一种方法pd.concat([df1, df2]).drop_duplicates(keep=False)，但它只是将两个数据帧结合在一起。有办法做到这一点吗。如果能帮上忙我会很感激的。这两个dfs的示例数据如下所示。 id user_id type status 总共有39列，其中可能包含NULL值。谢谢。 P.S. df2将始终是df1的子集。

浏览 11提问于2020-09-28得票数 1

1回答

具有部分字符串匹配的两个Pandas数据帧之间的映射/压缩

python、string、dataframe、matching、fuzzy

我有两个数据帧，每个数据帧大小约为1,000,000行。两者共享一个公共的'Address‘列，我用它来连接数据帧。使用这个连接，我希望将信息从dataframe1移动到dataframe2，我称之为“details”。 df2.details = df2.Address.map(dict(zip(df1.Address,df1.details))) 然而，address列并不表现出完全的通用性。我尽了最大努力清理，但仍然只能移动大约40%的数据。有没有办法修改上面的代码以允许部分匹配？这一次我完全被难住了。数据非常简单，如所述。两个小数据帧。虚构的样本数据如下： df1 Addr

浏览 1提问于2019-04-02得票数 0

1回答

R中的合并排序联接

r、sorting、join

我想知道R是否支持在排序的键上连接？这个想法是为了加速合并两个具有排序关键字的数据帧(在实例中，是一个日期列)。我现在使用的是dplyr的inner_join函数。

浏览 16提问于2020-04-29得票数 2

回答已采纳

1回答

如何连接两个不同的数据帧并将列中的值替换为另一列中的值？

python、pandas、concatenation

浏览 16提问于2021-07-02得票数 0

4回答

比较R中的两个数据帧对象是否相等？

r、dataframe、compare、equality

如何检查两个对象(例如数据帧)在R中的值是否相等？所谓值相等，是指一个数据帧的每一列的每一行的值等于第二个数据帧中相应行和列的值。

浏览 3提问于2012-05-15得票数 57

回答已采纳

1回答

在date和date上加入两个pandas数据帧

python、pandas

我正在尝试连接两个数据帧，但是在合并两个数据帧之后，我从其中一个dataframes (主)获得了所有列的NaN，但是列标题在那里。下面是每个数据帧的结构 b.columns Index(['Date', 'Ticker', 'Price'], dtype='object') Master.columns Index(['Ticker', 'Date', 'Previous Quarter', 'No. Of Shares', 'Action'],

浏览 11提问于2016-09-12得票数 0

3回答

基于Pandas中的公共列值合并两个数据框

pandas、dataframe

如何从具有共同列值的两个数据帧中获得合并的数据帧，使得只有那些行使得合并的数据帧在特定的列中具有共同的值。我有5000行df1格式： director_name actor_1_name actor_2_name actor_3_name movie_title 0 James Cameron CCH Pounder Joel David Moore Wes Studi Avatar 1 Gore Verbinski Johnny Depp Orlando Bloom Jack Davenport Pirates o

浏览 6提问于2017-04-09得票数 76

回答已采纳

1回答

将两个结构相似的数据连接到两个索引列上？

r、dataframe

我有两个结构相同的数据格式:列id-part1 1、列id-part1 2和列data1。id-part1 1和id-part1 2一起用作索引- 现在，我要计算列data1的两个数据格式相对于两个id列的差异。事实上，在一个数据帧中，id-part2 1和id-part2 2的组合可能不存在. 所以它是一个SQL连接操作，不是吗？

浏览 1提问于2014-01-14得票数 0

回答已采纳

1回答

选择未出现在内连接熊猫中的行

python、python-3.x、pandas

我有两个数据帧，A和B，我想从它们创建另外两个数据帧。 A_out将包括出现在A中但没有出现在A和B之间的内连接中的所有行(基于前两列) 类似地，B_out将包括出现在B中但没有出现在A和B之间的内连接中的所有行。例如-对于数据帧：答： a 1 b 2 c 3 B： b 2 c 3 d 4 预期输出为： A_out： a 1 B_out： d 4 我试着用下面的代码来完成这个任务： common = pileup_df.merge(lists_df.drop_duplicates(), on=['identifier', 'position'

浏览 11提问于2021-03-08得票数 1

回答已采纳

2回答

pandas数据帧的减法

python、pandas、dataframe、subtraction

我尝试减去2个数据帧，但没有得到我想要的结果，然后，我想将差值除以第三个数据帧的值。对于第一部分，我尝试这样做： r.sub(rf, fill_value=0) 为了确保它们具有相同的行数，我决定暂时不删除na，并确保它们具有相同的索引名。这就是我有的..。例如，在2020-01-09，我应该有0.030079 (=0.136245 - 0.106166)。它看起来像是在连接两个数据帧的列... 有什么建议吗？

浏览 2提问于2020-04-07得票数 0

1回答

如何匹配ID号以合并两个数据帧

r、pattern-matching

我有两个数据帧，这两个数据帧的列的ID号应该匹配。然而，这两个数据帧的ID数量不同。一个有118个ID，另一个有103个ID。具有118个ID的数据帧有全部103个ID，但有一些额外的ID。我想从118行数据帧中提取两列，并根据ID号将它们与103行数据帧中匹配的ID合并。我不知道解决这个问题的最简单的方法。

浏览 2提问于2019-02-07得票数 3

回答已采纳

1回答

如何重新建立索引以合并两个数据帧？

python、pandas

我正在尝试合并两个都有'product_desc‘列的数据帧。我使用的是Pandas 0.13和Python 2.7。 small_df = pd.merge(small_df, linregress_df, on = 'product_desc', how = 'left') 但是，我得到以下错误： pandas.core.index.InvalidIndexError: Reindexing only valid with uniquely valued Index objects 我将两个数据帧导出到平面文件中，其中的索引或其他列都没有重复值。我需

浏览 8提问于2014-06-09得票数 2

1回答

从整数向量匹配R数据帧中的多个列条件

r、dataframe

我有一个用1和0填充的大型数据帧，我有两个整数向量，"a“和"b”，它们与数据帧中的特定列相关。A中不存在b中的列引用，反之亦然(即没有相交)。我尝试做的是生成一个包含标志的新列，条件是："a“中的任何列都是1(在给定行上)，而"b”中的所有列都是0(在同一行上)。我试着这样做： processed.tbl$flag <- ifelse(processed.tbl[, a] == 1 & processed.tbl[, b] ==0, 1, 0) 但是我得到了一个不一致数组的错误，大概是

浏览 0提问于2018-01-25得票数 0

回答已采纳

2回答

Panda对具有重复项的customerEmail列的合并

python、pandas、merge、data-science

目的是从这个数据集中检测欺诈。我有两个数据帧，列如下： DF1customerEmail、客户电话、客户设备、客户添加、NoOftransactions、欺诈等(168,11) DF2customerEmail、交易etc、支付方式、订单状态等(623,11) customerEmail列在两个数据帧中都是通用的，因此合并customerEmail上的表是有意义的。问题是我在DF2中重复了customerEmail，而在DF1中没有引用。因此，当我使用以下命令合并时：：DF3 = pd.merge(DF1，DF2，on='customerEmail') 行和列的总大小为(

浏览 0提问于2020-08-27得票数 0

3回答

“融合”两个数据帧的最佳方式是什么？

我有两个数据框(df_a和df_b)，它们都包含许多列和患者ID。这些列包含有关特定诊断(TRUE或FALSE)的信息。我的任务是组合这两个数据帧，以便如果其中任何一个数据帧中的值为TRUE，则该值为TRUE。实际上，df_a和df_b中的行数是不同的。匹配应该使用id来完成。两个数据帧具有相同的一组列。 df_a <- data.frame(id = 1:10, dg_a = c(T, T, T, F, F, F, T, T, F, T), dg_b = c(F, F, F, F, T, T, F, T, T, F

浏览 2提问于2018-02-12得票数 1

回答已采纳

1回答

R如果值与第二个数据帧中的值匹配，则替换该值

r、dataframe、merge

我对R比较陌生，希望你能帮助我:) 我有两个数据帧，一个是main DF，另一个是设置条件(第一列)和替换主DF中的值的值(第二列)。因此，例如，mtcar dataframe的列"hp“中的值"110”应替换为值"3“。 df1 <- mtcars first_column <- c(110, 93, 65) second_column <- c(3, 2, 1) df2 <- data.frame(first_column, second_column)

浏览 7提问于2021-05-02得票数 1

回答已采纳

2回答

在pandas中合并两个数据帧时如何“模糊”匹配字符串

python、pandas

我有两个数据帧df1和df2。 df1 = pd.DataFrame ({'Name': ['Adam Smith', 'Anne Kim', 'John Weber', 'Ian Ford'], 'Age': [43, 21, 55, 24]}) df2 = pd.DataFrame ({'Name': ['adam Smith', 'Annie Kim', 'John Weber', &#

浏览 63提问于2018-03-06得票数 5

回答已采纳

2回答

Scala使用两列(不区分大小写)在dataframes上左转联接

scala、apache-spark、dataframe、join、apache-spark-sql

我已经创建了下面的方法，它以两个Dataframes；lhs和rhs及其各自的第一和第二列作为输入。该方法应该使用为每个dataframe提供的两列返回这两个帧之间的左联接的结果(忽略它们的大小写敏感性)。我面临的问题是，它正在做更多的内部连接。它正在返回lhs数据帧中的行数的3倍(由于rhs中的重复值)，但由于它是左联接，所以rhs数据帧中的重复和行数应该无关紧要。 def leftJoinCaseInsensitive(lhs: DataFrame, rhs: DataFrame, leftTableColumn: String, rightTableColumn: String,

浏览 2提问于2017-11-01得票数 2

回答已采纳

1回答

连接具有不同行数和列数的两个数据帧

python、pandas、dataframe

我有两个数据帧： df1 shape = (101, 4825) df2 shape = (97, 5818) df2的前4825个列名与df1相同，然后递增+1。但是，在这两个数据帧的末尾，都有一个名为Group_number的列。我希望连接两个数据帧，以便最终数据帧的形状为(198,5818)，即最终数据帧包含df1部分的和NaN值的所有行(在初始的4825值之后)。我尝试使用pd.concat([df1,df2])，但是Group_number列搞混了。

浏览 1提问于2018-08-08得票数 0

1回答

如何使用Pandas中提取的字符串来获得一个新的列？

python-3.x、pandas、indexing

我有一个来自csv文件的15列的数据框架。我正在尝试删除列文本的一部分，并在每一行上创建包含该信息的新列。每一行‘磷化’应该只有一个匹配我的要求提取。现在，我试图将结果添加到我的数据框架中，但是我得到了错误： TypeError:插入列与帧索引不兼容的索引 dataset有两个带有名称的列和6个带有值的列(如65.98，表示ex)。例如：加入序列修饰膦CON_1 CON_2 CON_3 LIF1 LIF2 LIF3 P18767 R. R.GAAQNIIPASTGAAK.A 1xTMT6丛K15；1 xTMT6丛N-术语1x膦(98.3) 这是该死的代码： a =

浏览 0提问于2019-05-14得票数 1

1回答

比较两个数据帧R的列

r、dataframe

我有两个数据帧： c1 <- c("chr1:981994","chr1:1025751","chr2:6614300", "chr2:6784300") c2 <- c("G/A","C/T","A/T", "T/G") df1 <- data.frame(c1,c2) a <- c("chr1:981994","chr1:1000000","chr2:6614300", "chr2

浏览 2提问于2016-10-10得票数 3

回答已采纳

2回答

使用特定列连接两个pandas数据帧

python、join、pandas、dataframe

我是pandas的新手，我正在尝试基于一个特定列的相等性来连接两个数据帧。例如，假设我有以下内容： df1 A B C 1 2 3 2 2 2 df2 A B C 5 6 7 2 8 9 两个数据帧具有相同的列，并且只有一列(例如A)的值可能相等。我想要的输出是： df3 A B C B C 2 8 9 2 2 列'A‘的值在两个数据帧中都是唯一的。谢谢

浏览 0提问于2015-06-02得票数 20

回答已采纳

2回答

如何比较两个数据框是否具有相同的列名和类？

r、dataframe

我想要比较两个数据帧，并检查它们是否都有相同的一组列，R中是否有内置的函数或库？这些数据框的值可能不同，但这两个数据框将具有相同的类型和命名列。我尝试在mtcar和一个副本数据帧上运行identical和all_equal： duplicate <- mtcars identical(mtcars, duplicate) [1] TRUE all_equal(mtcars, duplicate) [1] TRUE 然后我更新了data.frame副本的mpg列，使其具有与mtcar不同的值： duplicate$mpg <- as.numeric(scale(dupl

浏览 2提问于2018-03-25得票数 3

3回答

如何从另一个数据帧扩展数据帧中的值

python、python-3.x、pandas、dataframe

例如，考虑两个数据帧A和B 数据帧A： Name1 | Col1 | Col2 ------+------+----- A | 1 | 2 B | 4 | 3 C | 6 | 8 和数据帧B： Name2 | Col3 | Col4 ------+------+----- P | 5 | 9 Q | 0 | 1 R | 2 | 7 我希望将它们转换为一个数据帧，如新数据帧： Name1 | Col1 | Col2 | Name2 | Col3 | Col4 ------+------+------+-

浏览 0提问于2020-06-21得票数 0

1回答

pandas合并2个数据帧并在合并数据中添加新列

python、pandas

你能帮我解决这个问题吗?我不能在python pandas中走动，基本上我有两个数据帧，如下: df1 df2 我从上面的两个数据帧创建了一个连接的数据帧，并得到了这个结果: df3=pd.concat(df1，df2，sort=False) 现在我在上面的df3中有两列，即"a“和"az”，我想合并它们，因为它们是相同的，但在第二个dataframe中没有数据的地方有零。那么，有没有一种方法可以让这两个列的合并列表示相同的数字，即在列"a“中有零的地方，它应该将其填充为列"az”中的值，反之亦然。如果你能帮上忙，我将不胜感激。谢谢。

浏览 7提问于2020-06-06得票数 0

1回答

是否可以合并2个没有唯一键的数据帧

r、dataframe

我现在正在做合成的工作。我有两个数据帧。第一个数据帧有150条职业类型和关联程度的记录 df1 Occupation Degree Biologist Masters Cleaner High_School Office Manager Bachelor Software Eng. Bachelor Data Scientist Phd .... Data Scientist Masters 另一个是包含大约100K条记录的主数据帧， main df: Name Degree

浏览 40提问于2019-09-08得票数 0

回答已采纳

1回答

根据列名替换数据帧列

我对R非常陌生，过去我使用了大量的堆栈溢出搜索来解决许多问题，但无法找到解决我当前问题的方法：我希望将空数据帧的列替换为包含基于匹配列名的度量数据的另一个数据帧的列。为了说明这个问题，这里有一些示例数据： #sample data set.seed (543) input <- data.frame(replicate(6,sample(0:100,20,rep=TRUE))) colnames(input) <- c("Time", "C2", "B1", "A1","A2", "A3

浏览 1提问于2017-07-10得票数 1

回答已采纳

1回答

合并数据文件

r、social-networking

我在R中有以下数据帧： Id Class @a 64 @b 7 @c 98 和第二个数据框架： SOURCE TARGET @d @b @c @a 这是描述社会网络中的节点和边缘。用户(前面都有@)属于一个特定的社区，并在列类中列出了这个数字。为了分析列之间的连接，我希望合并这个数据帧并创建一个新的数据框架，如下所示： SOURCE TARGET SOURCE.Class TARGET.Class @a @i 56 2 @f @k

浏览 3提问于2017-04-07得票数 0

回答已采纳

2回答

在多个值上合并两个数据帧

python、pandas

我有两个像这样的数据帧 df1 name ID abb 0 foo 251803 I 1 bar 376811 R 2 baz 174254 Q 3 foofoo 337144 IRQ 4 barbar 306521 IQ df2 abb comment 0 I fine 1 R repeat 2 Q o

浏览 2提问于2016-07-21得票数 1

回答已采纳

2回答

对来自不同数据帧的列的数学运算

python-2.7、pandas、jupyter-notebook、pandas-datareader

我有两个数据框，通过熊猫从法马法语和雅虎导入。我正在尝试比较两个数据框中的列值(更具体地说，从另一个数据框中减去一个)，但每当我尝试这样做时，都会出现值错误。数据帧有不同的索引，我不知道如何考虑这个因素(我对python和pandas很陌生)。下面是有问题的代码： start, end = dt.datetime.now()-dt.timedelta(days=60*30), dt.datetime.now() f = data.DataReader('F-F_Research_Data_Factors', 'famafrench', start, end)

浏览 6提问于2016-08-06得票数 2

回答已采纳

1回答

如何使用(部分)文本值合并两个数据帧？

r、reference、text-mining、matching

我有两个数据框架，都有包含文本的列。现在，我希望通过在文本列之间使用(不完美)匹配来合并这些数据帧。如果数据帧1的文本列的单元格1具有文本值，该文本值包含类似于数据帧2文本列的文本值cel 2中的(a的一部分)字的(a的一部分)字的文本值，那么我希望使用这些单元格合并数据帧。在R中做这件事的最好方法是什么？我不确定我的问题是否足够明确，但如果是，是否有人知道一个R包或函数，可以帮助我做这种合并？事先非常感谢！

浏览 1提问于2013-08-09得票数 0

回答已采纳

1回答

如何使用dplyr处理多行条件语句？

r、dataframe、dplyr

下面的简化代码连接所有myData数据帧列，除元素R之外，只有在数据帧中有多个R元素时才连接元素R，而在元素列中只有一个R的情况下，则显示单个R而不连接。 --当数据帧的元素列中没有R元素时，代码也应该可以工作--但是它不使用。下面是运行代码时的正确输出，其中有两个R元素，而只有一个R元素-- 有两个R元素： Element Group ElementCnt finalCode 1 C 4 1 C.4.1 2 R 0 1 R.0.1 3 C 1 2 C

浏览 3提问于2022-07-29得票数 1

回答已采纳