基于部分字符串匹配的两个数据帧的两列比较_比较pandas中基于两列组合的两个数据帧_如何基于部分字符串匹配来连接两个数据帧？ - 腾讯云开发者社区

r、dataframe、merge

浏览 4提问于2019-02-28得票数 1

1回答

具有部分字符串匹配的两个Pandas数据帧之间的映射/压缩

python、string、dataframe、matching、fuzzy

我有两个数据帧，每个数据帧大小约为1,000,000行。两者共享一个公共的'Address‘列，我用它来连接数据帧。使用这个连接，我希望将信息从dataframe1移动到dataframe2，我称之为“details”。 df2.details = df2.Address.map(dict(zip(df1.Address,df1.details))) 然而，address列并不表现出完全的通用性。我尽了最大努力清理，但仍然只能移动大约40%的数据。有没有办法修改上面的代码以允许部分匹配？这一次我完全被难住了。数据非常简单，如所述。两个小数据帧。虚构的样本数据如下： df1 Addr

浏览 1提问于2019-04-02得票数 0

1回答

查找两个数据帧之间不匹配的行

python、pandas、dataframe

我有一个场景，我希望在两个数据帧之间找到不匹配的行。这两个数据帧都有大约30列和一个唯一标识每条记录/行的id列。因此，我想检查df1中的行是否与df2中的行不同。df1是更新后的数据帧，df2是以前的版本。我尝试了一种方法pd.concat([df1, df2]).drop_duplicates(keep=False)，但它只是将两个数据帧结合在一起。有办法做到这一点吗。如果能帮上忙我会很感激的。这两个dfs的示例数据如下所示。 id user_id type status 总共有39列，其中可能包含NULL值。谢谢。 P.S. df2将始终是df1的子集。

浏览 11提问于2020-09-28得票数 1

1回答

使用模糊合并合并两个数据帧

r、merge

我有两个数据帧，我必须合并。在两个数据帧中都有一列，我希望在该列上合并两个数据帧。但这两列中的数据并不相似。这两个数据帧中的关键列的长度为12位，另一个数据帧的长度为5 -6位。我想合并的基础上类似的5-6位从第二个数据帧。我的数据框： df1 = data.frame(CustomerId = c(987689000000,786581000000,765909000000,565400000000,746541000000,516890000000), Product = c(rep("Toaster", 3), rep("Radio", 3)))

浏览 11提问于2017-07-13得票数 1

回答已采纳

2回答

Python连接满足条件的列上的两个数据帧

python、join、pandas

假设我有两个数据帧A和B，每个数据帧包含两个名为x和y的列。我希望连接这两个数据帧，但不是连接在两个数据帧中x和y列相等的行上，而是连接在A的x列是B的x列的子字符串且y列相同的行上。 if A[x][1]='mpla' and B[x][1]='mplampla' 我希望它能被捕获。在sql上，它可能类似于： select * from A join B on A.x<=B.x and A.y<=B.y. 这样的事情能在python上完成吗？

浏览 2提问于2015-01-21得票数 0

2回答

使用另一个数据帧作为映射替换数据帧中的列？

在我的具体情况下，我有两个数据框架： > a column 1 red apple 2 red car 3 yellow train 4 random 5 random string 6 blue water 7 thing > map x y 1 red color 2 blue color 3 yellow color 4 random other 5 thing other 我想要的结果是： > a column 1 colo

浏览 4提问于2016-10-17得票数 3

2回答

如何使用模糊逻辑从熊猫的数据帧中匹配和提取文本？

python、pandas

我有两个数据帧，如下: DF1： Name Value buying fish hook 240 arrange lunch 75 repair equipment 800 purchase air condition 1400 buying fish 66 DF 2： Name fish lunch equipemt air condition hair condition fish hook 我想用模糊逻辑匹配来自两个数据帧的名称列中的名称，并将第二个数据帧中的名称列

浏览 1提问于2018-07-05得票数 3

4回答

向量化或加速PANDAS列上的Fuzzywuzzy字符串匹配

python、pandas、performance、fuzzywuzzy

我正在尝试在充满组织名称的PANDAS列中寻找潜在的匹配项。我目前正在使用iterrows()，但它在大约有70,000行的数据帧上非常慢。在查看了StackOverflow之后，我尝试实现了一个lambda row (apply)方法，但这似乎几乎不能加快速度。数据帧的前四行如下所示： index org_name 0 cliftonlarsonallen llp minneapolis MN 1 loeb and troper llp newyork NY 2 dauby o'connor and zaleski llc carmel IN 3 wegner c

浏览 4提问于2018-10-04得票数 14

1回答

与Pandas中的布尔值进行无效的类型比较

python、python-3.x、pandas、numpy、type-conversion

正在尝试基于其他行级数据或具有类似数据的其他数据帧来清除pandas数据帧(源)中的Country (Ctry)列。有关示例数据框，请参阅链接。它最终将在数据帧中提供两个新列，给出格式正确的国家和数据质量“分数”。 Origin Dataframe Nafta, Countries, and States DataFrames 该函数作用于查找表中的值或空格，但当我传入“坏”数据时，它会给出一个无效的类型比较。单独测试它会返回一个布尔值，并正常工作： Nafta.loc[Nafta[col] == a].empty . 不知道为什么这个不起作用。我测试了这些值，并将其布尔值转换为布尔值。参

浏览 12提问于2019-02-05得票数 0

1回答

当我在数据帧中只使用列名的开头部分时，R为什么不抛出一个错误？

r、dataframe、columnname

我有一个包含各种列以及sender_bank_flag的数据框架。我在我的数据框架上运行了以下两个查询。 sum(s_50k_sample$sender_bank_flag, na.rm=TRUE) sum(s_50k_sample$sender_bank, na.rm=TRUE) 尽管我的数据帧中没有sender_bank这样的列，但我从这两个查询中得到了相同的输出。我预期第二段代码会出现错误。不知道R有这样的功能！有谁知道这个功能到底是什么&如何更好地利用它呢？

浏览 1提问于2018-08-28得票数 5

回答已采纳

2回答

如何比较两个数据框是否具有相同的列名和类？

r、dataframe

我想要比较两个数据帧，并检查它们是否都有相同的一组列，R中是否有内置的函数或库？这些数据框的值可能不同，但这两个数据框将具有相同的类型和命名列。我尝试在mtcar和一个副本数据帧上运行identical和all_equal： duplicate <- mtcars identical(mtcars, duplicate) [1] TRUE all_equal(mtcars, duplicate) [1] TRUE 然后我更新了data.frame副本的mpg列，使其具有与mtcar不同的值： duplicate$mpg <- as.numeric(scale(dupl

浏览 2提问于2018-03-25得票数 3

3回答

根据单元格包含的字符替换数据帧列中的整个字符串，在R中

r、string

我有两个数据帧，其中有一个公共列，其中包含世界各国的名称。但这两个数据帧并不遵循相同的国家名称格式。例如，一个数据框显示朝鲜，而另一个数据框显示韩国的Dem People's Rep。另一个例子是一个数据帧中的马其顿，而另一个数据帧中显示的是前南斯拉夫的马其顿共和国。我正在寻找一种方法来合并这个国家/地区列上的两个数据帧，因为它是唯一的公共列。我将不得不对许多不同的数据帧多次执行此操作。我试过了 t<-as.data.frame(sapply(data, function(x) gsub("Yugoslav", "Macedonia",x)))

浏览 1提问于2017-03-29得票数 2

1回答

如何匹配ID号以合并两个数据帧

r、pattern-matching

我有两个数据帧，这两个数据帧的列的ID号应该匹配。然而，这两个数据帧的ID数量不同。一个有118个ID，另一个有103个ID。具有118个ID的数据帧有全部103个ID，但有一些额外的ID。我想从118行数据帧中提取两列，并根据ID号将它们与103行数据帧中匹配的ID合并。我不知道解决这个问题的最简单的方法。

浏览 2提问于2019-02-07得票数 3

回答已采纳

2回答

rbind数据帧，重复行名问题

r、duplicates、dataframe、duplicate-removal、rbind

虽然在matrix中允许重复的行(和列)名称，但在data.frame中不允许。尝试rbind()一些具有共同行名的数据帧会突出这个问题。考虑下面的两个数据帧： foo = data.frame(a=1:3, b=5:7) rownames(foo)=c("w","x","y") bar = data.frame(a=c(2,4), b=c(6,8)) rownames(bar)=c("x","z") # foo bar # a b a b # w 1 5

浏览 0提问于2012-10-24得票数 4

回答已采纳

1回答

熊猫上的模糊Vlookup

python、fuzzywuzzy

我有两个数据帧，大约有300,000行，每个大约11列。第一个dataframe包含原始数据，其名称不是同构字符串。另一个是官方数据(和同构字符串)。首先，我尝试通过一个代码在“原始数据”和官方数据之间运行模糊匹配，这对于大约有200个条目的数据帧似乎工作得很好。当我尝试在我的300,000行上运行代码时，内核变慢了(它已经运行了一个多小时)……有什么想法可以让我加速这个过程吗？我在考虑将数据帧拆分成更小的数据帧，但我需要整个数据集来确保匹配正确。谢谢! 附注:当前代码： def fuzzy_merge(df_1, df_2, key1, key2, threshold=90, limit

浏览 1提问于2020-06-30得票数 0

3回答

R-有没有办法通过合并同名的列来连接两个数据帧？

r、join、merge

A -1和1在同一点通常是不可能的。因此，这不是一个应该麻烦的问题。此外，两个数据帧具有相同的列数和观察值。最终产品不应该有.x或.y文件，如Var1.x和Var.y。我试图用join函数来解决这个问题，但都失败了，因为它总是只合并这两个数据帧，而不是将列连接在一起。我可能不得不补充说，列和观察值的数量非常高。因此，在代码中考虑列名并不能解决我的问题。谢谢你们。

浏览 4提问于2021-07-14得票数 2

1回答

计算两个数据帧中每个元素之间的Jaccard距离

python、pandas、scipy、data-science

我想计算两个数据帧之间的Jaccard距离。具体地说，我希望使用CountVectorizer模型分别计算所有谷歌实体(34000行，7个cols)和所有亚马逊实体(34000行，7个cols)之间的成对Jaccard距离。我为每个数据帧创建了一个countVectorizer，如下所示： cv = CountVectorizer(analyzer='word', ngram_range=(1,1), stop_words='english', binary=True) cvGoogle = cv.fit_transform(goog_s) cvAmazon =

浏览 1提问于2019-10-09得票数 0

1回答

isin不用于为唯一值搜索列的子集

python、pandas、isin

我有一个数据框架，重复一些多列值组合。我试图提取有两个以上重复的列。我有以下代码 d = {'main_id': [1, 1, 1, 2, 2, 3, 3, 3], 'type': [1, 1, 1, 1, 1, 2, 2, 2], 'instant': [1, 2, 3, 1, 2, 1, 2, 3]} df = pd.DataFrame(data=d) uniqueCombinations = df.groupby(['main_id', 'type']).size().reset_index().renam

浏览 8提问于2022-09-24得票数 0

回答已采纳

2回答

循环if语句遍历各行

我是R的新手，所以我在问一个基本的问题。我有两个数据帧数据帧1包含匹配对： Factor1 Factor2 A D B E C F 数据帧2包含不同样本中不同因素的水平： Sample1 Sample2 A 10 0 B 10 0 C 0 0 D 0 10 E 0 10 F 0 0 我正在尝试遍历第一个数据帧。对于数据帧1中的每一行，如果样本1中factor1的电平大于5，并且样本2中因子2的电平大于5，则在数据帧1中添加第三列中的TRUE，否则添

浏览 0提问于2017-09-12得票数 0

2回答

比较两个数据帧中的列名

python、pyspark、spark-dataframe

浏览 8提问于2017-03-09得票数 2

回答已采纳

1回答

用python、pandas实现股票数据的存储和计算

python、pandas

我正在处理每天使用文件下载的股票数据。该文件每天包含相同数量的列，但行数每天都会发生变化，这取决于进出列表的股票。我希望比较两个日期的文件，并找到之间的总数量列的差异。我想看看这两个文件之间的区别，哪些股票进入了列表，哪些股票退出了列表。我尝试使用pandas数据帧并将其存储在hd5文件中。然后尝试数据帧的合并功能，找出两个文件之间的差异。我正在寻找一个非常优雅的解决方案，以便我可以比较数据帧并找到差异，就像我使用excel的索引和匹配(或vlookup)函数所做的那样。

浏览 3提问于2019-04-18得票数 0

1回答

检查一个值是否在两列之间，spark scala

scala、apache-spark、apache-spark-sql

浏览 27提问于2021-03-15得票数 0

回答已采纳

1回答

填充缺少的值Pandas

python、pandas

我想填充数据帧的列，如示例所示。 df=pd.DataFrame({'A':['a','','','a','','b','b','','b','']}) ? 我想替换具有相同值的两行之间的空值: output： ? 我们可以在没有iterrows的情况下做到吗？

浏览 28提问于2020-08-11得票数 0

回答已采纳

1回答

将两个数据帧与部分匹配值进行比较

我对r非常陌生，但我想知道是否有可能比较两种数据帧。例如，我有一个数据框架，其中一个列包含值"peanut_butter“、"applesauce”、“苹果汁”，另一个数据帧列包含值"apple“、”花生“。是否有一种方法可以对第一列中的每一行进行检查，如果有部分匹配(花生酱包含花生酱)，它会创建一个新的列，其名称是匹配的？

浏览 11提问于2022-02-19得票数 1

1回答

如何重新建立索引以合并两个数据帧？

python、pandas

我正在尝试合并两个都有'product_desc‘列的数据帧。我使用的是Pandas 0.13和Python 2.7。 small_df = pd.merge(small_df, linregress_df, on = 'product_desc', how = 'left') 但是，我得到以下错误： pandas.core.index.InvalidIndexError: Reindexing only valid with uniquely valued Index objects 我将两个数据帧导出到平面文件中，其中的索引或其他列都没有重复值。我需

浏览 8提问于2014-06-09得票数 2

1回答

使用cassandra-cli创建两个复合列

nosql、cassandra

我的列族需要两个复合列，键数据类型是BytesType。下面是使用CQL的表的定义： CREATE TABLE stats ( gid blob, period int, tid blob, sum int, uniques blob, PRIMARY KEY(gid, period, tid) ); 我想要做的是使用Cassandra CLI创建列族。这是我的机会。第一个组合的结构是： CompositeType(Int32Typ

浏览 0提问于2012-06-28得票数 3

回答已采纳

2回答

如何比较两个数据帧？

r、dataframe

我有两个数据帧，每个数据帧都有两列(例如x和y)。我需要比较两个数据帧，看看x或y中是否有任何值，或者x和y在两个数据帧中是否都相似。

浏览 3提问于2012-06-11得票数 8

回答已采纳

2回答

Pandas:为了准备合并，如何匹配两个大型(130万行)列的日期/年份格式？

python、pandas、dataframe、merge、cell

听我说，我是熊猫新手。要合并两个大型数据帧，我需要匹配几十万行乘以三列。一个df列中的年份格式为'MM/DD/YY HH:MM'，另一个df列中的格式为'YYYY‘。这是我的merge命令： df = pd.merge(df1, df2, how='left', left_on=['COL1','COL2','YEAR'], right_on = ['COL1','COL2','DATE']) 最后两个YY值跨列匹配--我如何标

浏览 31提问于2018-08-15得票数 0

2回答

减去日期时间UTC和日期时间非UTC

python、pandas、date、datetime

从我的数据帧中，我尝试从一个datetime64[ns]中减去一个datetime64[ns, UTC]列。我认为我应该标准化其中一列，然后减去(应该将UTC添加到datetime64[ns]列，或者将UTC减去datetime64[ns, UTC]，这样之后我就可以减去它们)。 df estimated_delivery_time_local time_check 2020-01-22 23:48:52 2020-01-22 23:48:52+00:00 2020-01-23 00:45:05 2020-01-

浏览 18提问于2020-02-15得票数 0

回答已采纳

1回答

比较两个pandas数据帧之间的geohashes

pandas、dataframe、geohashing

我有两个数据帧df1和df2，它们具有不同的经度和纬度，以及它们对应的地理散列。现在，对于df1中的每个geohash，我希望在dataframe df2中找到最接近的geohash。我不确定是否有一种方法可以比较geohashes。例如，对于df1中的id121，df2中最接近的geohash将是9mu3rr，而对于df2中的id122，最接近的geohash将是9wv97m1。数据帧df1 Id Latitude Longitude Geohash 121 32.815130 -117.151695 9mudwju 122 37.920948 -108.00504

浏览 0提问于2016-08-19得票数 1

1回答

具有大数据帧的R模糊连接

r、stringdist、fuzzyjoin

我想做一个基于模糊匹配的left_join(df1, df2)。我的df1是100k行，我的df2是25k行。基本上，我想用jaro winkler方法计算两个数据帧的join_colum之间的字符串相似度。所以这将是100k * 25k的比较。我希望只有一个匹配，而不是多个。因此，我的目标是获得具有最高字符串相似度的匹配。除此之外，我只想在jaro winkler字符串相似度至少为0.8的情况下加入(让我们假设在我虚构的示例中满足了这个条件)。我试图展示输入是什么样子的，以及我想要什么作为输出，但是由于我的数据帧的大小，我正在努力实现实际的实现。我已经尝试过使用fuzzyjoin库中的

浏览 12提问于2021-11-11得票数 0

1回答

逐列检查R中2个数据帧中元素的相等性

r、for-loop、dataframe、equality

我正在尝试使用all.equal函数逐列检查R中两个数据帧的元素是否相等，我想使用一个for循环来完成这项工作。我是R的新手，所以我不知道如何写一个包含两个数据帧的for循环。任何帮助都是非常感谢的。

浏览 5提问于2017-01-23得票数 0

2回答

将数据框中的一列拆分为多列而不重复

r、split

我想在基于分隔符的数据帧内将一列拆分为两列。例如, METHAMPHETAMINE | MORPHINE THC 变成了 METHAMPHETAMINE MORPHINE THC 在数据帧内。谢谢!

浏览 0提问于2017-08-09得票数 1

1回答

正则表达式与fuzzyjoin / dplyr匹配

r、dplyr

我有两个数据帧，我想通过第一列连接它们，并忽略大小写： df3<- data.frame("A" = c("XX28801","ZZ9"), "B" = c("one","two"),stringsAsFactors = FALSE) df4<- data.frame("Z" = c("X2880","Zz9"),"C" = c("three", "four"), stringsAsFact

浏览 13提问于2020-11-19得票数 0

回答已采纳

1回答

Python/Pandas:比较两个数据帧中的多个列，如果未找到匹配，则删除行

python、pandas、dataframe

我正在学习Python和Pandas，并试图找出最有效的方法来比较两个数据帧上的多个选定列，以找到匹配的列。例如，如果我有以下两个数据帧： Frame 1 A B C D E F 001 10 0 0 10 0 10 Frame 2 A B C D E F 200 10 0 10 0 10 0 201 0 10 10 0 0 10 202 0 10 0 0 0 0 2

浏览 11提问于2019-09-15得票数 2

回答已采纳

1回答

比较两个数据帧R的列

r、dataframe

我有两个数据帧： c1 <- c("chr1:981994","chr1:1025751","chr2:6614300", "chr2:6784300") c2 <- c("G/A","C/T","A/T", "T/G") df1 <- data.frame(c1,c2) a <- c("chr1:981994","chr1:1000000","chr2:6614300", "chr2

浏览 2提问于2016-10-10得票数 3

回答已采纳

4回答

比较字符串“数字优先”

php、string、sorting、compare

我想用“数值”来比较两个字符串。我的意思是，就像2C比11A还小。我试过了，但不起作用： if("2A" < "11A"){ echo "First corect"; } if(strcmp("2A", "11A") < 0){ echo "Last corect"; } echo "Tests completed";

浏览 1提问于2013-05-08得票数 2

回答已采纳

1回答

超越比较4-没有显示出适当的差异

beyondcompare4

大家好，我正在比较两个文本文件，使用beyond compare V4，它显示了如下快照所示的差异。右文件没有CollectionCash，左文件没有CollectionsCO值。对于在这两个文件中都不存在的值，它应该显示空白/缺少行。我想根据行中完全匹配的第一个单词进行比较。我尝试了不同的规则，但没有成功。请建议我如何实现这一点。谢谢

浏览 9提问于2018-08-01得票数 0

1回答

如何将两个不同数据帧的子集进行比较--通过随机抽样？

r、dataframe、random

我想比较两种不同的数据框架。这两个数据帧都由相同数量的行和列组成。第一数据帧( 1 )是从0到1的购买概率，而第二数据帧(2)是编码二进制的，代表用户的实际购买。我的斗争是，我如何从df (1)中取一个随机子集来比较这个子集，它在df (2)中也是一样的？例如，：如何使用与df (2)相同的100个用户(行)子集和两个df (1)产品(列)。这有可能吗？还是我必须先重新操作我的数据帧？通常，可以通过user_ID连接这两个数据帧--如果这可能很重要的话。 # FIRST DF CONSISTS OF PROBABILITIES df_probabilities <- data.

浏览 3提问于2017-09-20得票数 0

回答已采纳

2回答

将所有值字符串列数据帧与其他数据帧字符串列进行匹配

python、pandas

我有两个熊猫数据帧：数据帧1： ITEM ID TEXT 1 some random words 2 another word 3 blah 4 random words 数据帧2： INDEX INFO 1 random 3 blah 我想要将( dataframe 2的) INFO列的值与dataframe 1的TEXT列进行匹配。如果匹配，我希望看到一个新的列带有"1“。如下所示： ITEM ID TEXT MATCH 1 some random words

浏览 8提问于2020-03-11得票数 1

回答已采纳

2回答

在多列上合并会导致奇怪的排序

r、sorting、merge

当两个数据帧被一个数字列合并时(默认情况下)，它们将由该列作为一个数字排序。但是，如果使用两个数值列作为by，则会产生不同的排序(实际上，似乎数字列被转换为字符串并按字符串排序)。这是意料之中的，还是一个bug？例如，考虑以下两个数据框架： A <- data.frame(a = 1:12, b = 1, x = runif(12)) B <- data.frame(a = 1:12, b = 1, y = runif(12)) 然后merge(A, B, by = 'a')生成一个列a值为1、2、.、9、10、11、12的数据帧(即期望的数值排序)。但是，mer

浏览 4提问于2016-01-12得票数 3

回答已采纳

3回答

在R中匹配两个不同数据帧的列

我有两个具有经度值和纬度值的数据帧，我想从数据帧#2 (比方说数据帧#2的列df2$C，第三列)中提取与数据帧1的列匹配的值。例如，数据帧1有两列(lon、lat)，数据帧2有三列(lon、lat和一些值"C")...我想在数据帧1中添加第三列，其中df2$C的值与两个数据帧中的两列完全匹配的值相对应，例如df1$lon == df2$lon和df1$lat == df2$lat...在lat中，不匹配的lon对，我想添加一个NA，这样第三列(我想添加到数据中。帧1)的长度为= nrow(df1)。我尝试了合并函数，但在将df1的两列与df2的列进行匹配时遇到了问题。

浏览 2提问于2014-12-02得票数 0

1回答

在列"a“中查找两个不同数据集在列"b”中具有不同值的值

数据包含多列和3000行相同的OrderNo但不同的Ordertype。我想要得到两个数据帧中Ordertype不同的所有OrderNo。我已经从两个数据帧中分离出两列，并将它们设置为升序。然后，我尝试使用函数cbind来组合这两列，并查找其中一列中缺少的值。 xxx <- data.frame( orderNo = c(1:10), Ordertype = c("a", "b", "c", "d", "a", "b", "c", "d", "e

浏览 10提问于2019-09-30得票数 0

回答已采纳

3回答

当我有两个数据帧，其中第二个数据帧的列多于第一个数据帧时，如何获取列不匹配报告

我有两个数据帧： a1 <- data.frame(a = 1:5, b=letters[1:5], c=c('a','t','f','e','v')) a2 <- data.frame(a = 1:3, b=letters[1:3]) 我想要比较这两个数据帧，并希望获得两个数据帧中不匹配的列数。 comparison <- compare(a2,a1,allowAll=TRUE)

浏览 0提问于2019-01-02得票数 0

3回答

在R结果数据帧中合并数据帧太大

r、dataframe、merge、inner-join

我正在尝试合并R中的两个数据帧，通过它们共享的一列来连接它们。下面是两个数据帧的屏幕截图，我在"INC_KEY“列上合并。这是我用来合并两个数据帧的代码: dp <- inner_join(d，p，by="INC_KEY") D有177156个观测值，p有1641137个观测值，但最终合并的数据帧有8416113个观测值，这对我来说没有意义。我还尝试将上面的inner_join函数更改为merge函数，但仍然得到相同的结果。我想知道如何修复这段代码，以便合并后的数据帧具有真实的观察值--非常感谢您的帮助！

浏览 0提问于2021-01-11得票数 0

1回答

方法从PowerPivot模型中的所有列创建计算列。

powerpivot

我想要比较两个动力转轴表中的数据。在PowerPivot中有比较两个数据表的方法吗？或者另一种选择。我已经创建了一个“键”计算列(作为使用‘&’连接6个列的连接)，并且我正在从所有剩余的数据(大约100列)创建一个计算列。是否有允许我创建计算列的方法/函数？编辑:原因是在数据迁移前后对数据执行数据比较检查。此外，PowerPivot被认为是该解决方案的首选技术，使用RedGate比较可能要容易得多。

浏览 3提问于2014-03-25得票数 0

回答已采纳

2回答

检查具有不同值系统的两个数据框列的相似性

python、pandas、dataframe

我有两列两个不同的数据帧。以下块是前5行，但每列要长得多： A = pd.DataFrame(['30-34', '20-24', '20-24', '15-19', '00-04']) 和 B = pd.DataFrame(['6','4', '4', '3', '0']) 我想检查两列是否重合，考虑到 0 represents 00-04; 1 represents 05-09; 2 represents 10-14; 3 re

浏览 1提问于2021-11-12得票数 0

3回答

在ID和列名上，根据公共列自动合并具有多个条件的2个数据帧

python、pandas

我有两个大数据帧，每个df有数千列。我需要左转--加入两个表，即df1和df2。但是，我认为我无法手动列出两个数据帧之间的所有公共列/键。以下是数据框架的一个示例： df1 = pd.DataFrame({'id' : ['a', 'b', 'c'], # Define dictionary 'test' : [0,0,0], 'beautiful' : [0,0,0], 'crazy'

浏览 9提问于2022-07-29得票数 0

回答已采纳

2回答

返回dataframe值不同的列

python-3.x、pandas

我有两个类似下面的df1和df2示例的数据帧。我想要比较数据帧之间的值，并返回数据帧在列中具有不同值的列。因此，在下面的示例中，它将返回B列。 df1 A B C 1 2 3 1 1 1 df2 A B C 1 1 3 1 1 1

浏览 5提问于2018-10-03得票数 0

1回答

如何迭代两个不同大小的数据？

python、pandas

具体来说，我想迭代两个数据文件，一个是大的，另一个是小的。最后，我想比较一下某一列中的值。我试着创建一个嵌套的for循环；外部循环遍历大型dataframe，内部循环迭代小的dataframe，但是我遇到了困难。我正在寻找一种方法来识别我的大型数据文件中的"name“和"value”，它们与我的小dataframe匹配。背景信息:我正在使用熊猫库。大型数据帧：小数据集： Name Value SF 12.84 TH -49.45

浏览 1提问于2019-07-30得票数 1

回答已采纳