Pandas:如果不同的给定列重复，如何组合列int值？

文章/答案/技术大牛

发布

1回答

、

在Stack Overflow上也有类似的问题，但没有一个适合我的情况。我尝试过使用add(...)、merge(...)、concat(...)、drop_duplicates(...)等等的组合，但我似乎就是搞不明白。在此之前，我正在处理数据，如果ID匹配(类型为str)，则需要组合A1、A2、B1、B2、B3、B4、B5和B6列(所有类型均为int)。新的FavoriteFood或索引“继承”什么并不重要。给定数据： Index

浏览 6提问于2020-02-15得票数 1

回答已采纳

4回答

如何迭代数据帧的唯一行的列值，在熊猫中有排序的数值索引和重复的数据？

、、、

我有一个熊猫DataFrame，它有排序的数字索引和重复的数字索引，对于给定列中相同的索引值，列值是相同的。我想迭代给定列的值，以获得索引的唯一值。中的值，以查找索引- [3,5]中的唯一条目。当我使用默认的index迭代并打印列<

浏览 0提问于2018-03-06得票数 1

回答已采纳

1回答

Python/Pandas将行合并为一行，并决定在每一列中执行什么操作

、、、

我有一个Pandas DataFrame (数据)，列有“日期”(日期时间)、“工时”(时间增量)、“薪资”(浮动)、“每小时薪资”(浮点数)、“距离”(浮动)、“最低工资”(浮动)。如何根据对所有列相同的列值将行组合为1行，但如何分配如何计算其他列的值？，我希望基于相同日期的['Date'].dt.date组合行。并为每一<

浏览 9提问于2022-04-28得票数 1

1回答

两列在多行中不能相同

是否有办法确保两列是唯一的组合，但每一列都可以是重复的？如果我们有cols a和b，我希望系统允许这个查询。

浏览 2提问于2022-12-04得票数 -2

回答已采纳

2回答

TSQL不工作。

、、、

我有以下查询，并尝试使用DISTINCT关键字为每个GLOBAL_CONTENT_ID保留一个唯一的值。不幸的是，我无法让它发挥作用。

浏览 3提问于2016-01-07得票数 0

回答已采纳

1回答

将双循环python替换为apply

、、、

有没有人知道有没有可能用更快的函数来代替python中的双循环呢？例如，我有这样的数据帧：df["col_1"] = ["hello", "salut","hello", "bye", "bye","hi","hello",100,45,100,51,51,32,100,85]def f (l1, l2): if li

浏览 16提问于2017-08-10得票数 0

回答已采纳

1回答

在散列函数中将常量字符转换为小写

我需要为给定的单词生成一个哈希值。散列值需要是确定性的，或者对于相同的单词是相同的值，但是，如果给定的单词具有不同的大小写，则散列值会改变。因此，我的目标是将给定的单词(const char)转换为具有散列函数的小写，以便

浏览 9提问于2021-01-12得票数 0

回答已采纳

2回答

Pandas:如果一列重复而另一列不同，则删除行

、、、

我想删除pandas数据帧中的行，其中一列A中的值是重复的，而另一列B中的值不是给定A的重复。一个说明性的例子： df = pd.DataFrame({'A': ['cat', 'dog', 'cat', 'cat', 'bat'

浏览 30提问于2019-12-14得票数 0

回答已采纳

3回答

MySQL 5中的多列主键

、、

我正在努力学习如何使用键，并打破对我的所有表中的所有行都有SERIAL类型I的习惯。同时，我也在做许多到多个关系，所以在表的任何一列上要求唯一的值来协调这些关系会阻碍这一点。如何在表上定义主键，使任何给定的值都可以在任何列中重复，只要所有列的值组合从未被精确重复</e

浏览 3提问于2010-04-15得票数 35

回答已采纳

1回答

熊猫把Int64 (首都)投给int64

、、

我得到了一个结果DataFrame，它的列类型为Int64。下面的代码没有工作。print(region_ids.mycolumn.dtypes) print(region_ids.mycolumn.dtypes)Int64预期结果：int64

浏览 3提问于2021-08-24得票数 1

回答已采纳

1回答

在python中按索引绘制字符串数据

、、、

我想画出它的分布图。我的意思是画一条线，对于每个组合，电话，日期，演员和对象组告诉我实例出现了多少次，这样我就可以告诉我重复的行为。谢谢,

浏览 13提问于2018-12-13得票数 1

回答已采纳

1回答

查找某一列的重复项，但仅在另一列具有相同值时才返回结果

、

我想找出给定列中重复(复制)的值，但仅当该行中的另一列相同时才返回重复。也许举个例子会更清楚。列值都相同的情况下才返回repeat。因此，在上面的结果中，我们有重复的'Contact‘。它会重复5次。但是我只想在所有5条记录都有相同的名称列值的情况下返回这个结果。

浏览 16提问于2019-04-23得票数 0

回答已采纳

1回答

如何在pandas数据帧中添加标头

、

我有一个pandas dataframe，它的标题id，n和t包含重复的id，在调用groupby和size()之后，在给定计数的情况下生成了没有标题的额外列如何添加与第4列值的值相关联的额外列标题‘below.Now

浏览 1提问于2015-11-14得票数 0

1回答

用Pandas/Python在excel中填入一列，给出相应的数据

、

我正在尝试编写一个pandas/python脚本，在jupyter notebookssee excel data for example中执行以下操作我需要在列C中搜索每一行数据，并查看列E中该行对应的数字然后，我希望它在列G中查找相同的数字，并将从E获得的相应值放入列I中。如果一个值在列C中有多个实例，而在列E中有不同的对应<e

浏览 32提问于2019-12-24得票数 3

5回答

熊猫:复制索引

、、

给定一个dataframe，我希望得到重复的索引，这些索引在列中没有重复的值，并查看哪些值是不同的。具体来说，我有这样的数据：wget https://www.dropbox.com/s/vmimze2g4lt4ud3/alt_exon_repeatmasker_intersect.beda

浏览 2提问于2013-11-25得票数 47

回答已采纳

3回答

我的故事中的唯一标识符哲学

、、、

我有一个三列的表，其中没有一个列是唯一的。因此，我在我的表中添加了一个Id列，将其作为唯一标识符，并将其设为主要列。只有一个Quesion:如果在这些列中有相同值的两行将被添加到表中，那么第二行会发生什么呢？添加还是不添加？我如何在我的场景中避免这样的事情？

浏览 0提问于2011-04-12得票数 0

1回答

熊猫中任意列表的笛卡尔乘积

、

给定任意数量的列表，我想生成一个熊猫DataFrame作为笛卡尔乘积。例如，给定：b = ['val1', 'val2']我希望得到一个包含a、b和c列以及所有3x2x2=12组合的DataFrame。与不同，我希望能够提供两个以上的输入，并且不希望传递DataFrames，这将涉及将同一DataFrame内的值保持

浏览 2提问于2019-10-05得票数 2

1回答

Postgres SQL命令来找出哪些列可以是枚举，哪些不是？

、、

背景是，我正在构建一个通用工具，它可以接收不同的客户数据库，并将其与内部仪表板连接。因此，在我的用例中，我经常遇到几十个varchar/int列，老实说，它们只是枚举。我正在寻找一种方法，这样我就不必手动筛选每一列，看看它是否可以是枚举。有没有可以自动检测表中可枚举列的命令 SQL: Select <column_name> FROM <table> WHERE <column_name> has maxi

浏览 0提问于2020-04-29得票数 0

5回答

从Dataframe中的两个或多个列获取唯一值的有效方法

、、、、

| 1 | 4 | 5 || 5 | 8 | 6 |+---+---+---+我希望获得x和y列的唯一值, 6]>>> sf['x'].append(sf['y']).unique()

浏览 3提问于2016-08-03得票数 12

2回答

多列的Pandas因子分解的等价物？

、

我有三个数据帧的二进制类型的列，它们的值一起构成了一个有意义的数据分组。为了引用该组，我目前正在将一个新列设置为硬编码的二进制编码，如下所示：Pandas factorize将为序列的每个不同值</

浏览 2提问于2016-05-12得票数 2

点击加载更多