首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >正在尝试透视仅包含文本列的数据帧-“索引包含重复条目,无法重塑”

正在尝试透视仅包含文本列的数据帧-“索引包含重复条目,无法重塑”
EN

Stack Overflow用户
提问于 2019-12-09 11:40:52
回答 1查看 75关注 0票数 0

我在透视以下数据时遇到了问题

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
     index  column  data
0    1      A       cat
1    1      B       blue
2    1      C       seven
3    2      A       dog
4    2      B       green
5    2      B       red
6    2      C       eight
7    2      C       five
8    3      A       fish
9    3      B       pink
10   3      C       one

我正在尝试通过使用

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df.pivot(index='index', columns='column', values="data")

但我收到错误消息“索引包含重复条目,无法重塑”

我查阅了大量类似的帖子,但我尝试的解决方案都没有奏效

我想要的输出是

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
index  A    B     C
1      cat  blue  seven
2      dog  green eight
2      dog  green five
2      dog  red   eight
2      dog  red   five
3      fish pink  one

对此最好的解决方案是什么?

EN

回答 1

Stack Overflow用户

发布于 2019-12-09 13:58:27

在这个问题Pandas pivot warning about repeated entries on index中,他们指出重复的对(因此在“索引”和“列”列中的重复对)是不可能透视的。

在数据集中,索引2的列值是B和C的两倍。

你能改变“index”列吗?以我的新数据帧为例:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
    df = pd.DataFrame({'index': [1,1,1,2,2,3,2,4,3,4,3], 
               'column': ['A','B','C','A','B','B','C','C','A','B','C'], 
               'data':['cat','blue','seven', 'dog', 'green', 'red', 
                       'eight','five', 'fish', 'pink', 'one']})
    df
    out:
    index   column  data
    0   1   A       cat
    1   1   B       blue
    2   1   C       seven
    3   2   A       dog
    4   2   B       green
    5   3   B       red
    6   2   C       eight
    7   4   C       five
    8   3   A       fish
    9   4   B       pink
    10  3   C       one

    df.pivot('index', 'column', 'data')
    out:
    column  A    B      C
    index           
    1      cat  blue    seven
    2      dog  green   eight
    3      fish red     one
    4      NaN  pink    five

Option_2

如果你使用unstack with 'append':

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
   testing = df.set_index(['index', 'column'], 
                    append=True).unstack('column')
   testing

                data
      column    A    B      C
      index         
   0    1     cat   NaN     NaN
   1    1     NaN   blue    NaN
   2    1     NaN   NaN     seven
   3    2     dog   NaN     NaN
   4    2     NaN   green   NaN
   5    2     NaN   red     NaN
   6    2     NaN   NaN     eight
   7    3     NaN   NaN     five
   8    3     fish  NaN     NaN
   9    3     NaN   pink    NaN
   10   3     NaN   NaN     one
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59248133

复制
相关文章
crontab条目包含%号问题
crontab条目中包含%号,最常见的取时间,如:date +%d, 对%需要使用\进行转义,否则不能按预期执行,正确做法为: * * * * * echo "`date +\%d`" > /tmp/r1r.txt 而不能为 * * * * * echo "`date +%d`" > /tmp/r1r.txt %是crontab的特殊字符,所有%后的被当作了标准输入,这可以通过“ man 5 crontab”查看到说明: The entire command portion of the line, up to a newline or a "%" character, will be executed by /bin/sh or by the shell specified in the SHELL variable of the cronfile. A "%" character in the command, unless escaped with a backslash (\),  will be changed into newline char-acters, and all data after the first % will be sent to the command as standard input. 示例:
一见
2019/03/14
5370
包含列的索引:SQL Server索引进阶 Level 5
作者David Durant,2011/07/13 关于系列 本文属于Stairway系列:Stairway to SQL Server Indexes 索引是数据库设计的基础,并告诉开发人员使用数据库关于设计者的意图。 不幸的是,当性能问题出现时,索引往往被添加为事后考虑。 这里最后是一个简单的系列文章,应该使他们快速地使任何数据库专业人员“快速”。 ---- 前面的级别引入了聚簇和非聚簇索引,突出了以下各个方面: 表中每一行的索引总是有一个条目(我们注意到这个规则的一个例外将在后面的级别中进行讨论)。
Woodson
2018/07/19
2.4K0
SQL Server 索引和表体系结构(包含列索引)
包含列索引 概述 包含列索引也是非聚集索引,索引结构跟聚集索引结构是一样,有一点不同的地方就是包含列索引的非键列只存储在叶子节点;包含列索引的列分为键列和非键列,所谓的非键列就是INCLUDE中包含的列,至少需要有一个键列,且键列和非键列不允许重复,非键列最多允许1023列(也就是表的最多列-1),由于索引键列(不包括非键)必须遵守现有索引大小的限制(最大键列数为 16,总索引键大小为 900 字节)的要求所以引进了包含列索引。 正文 创建包含列索引 ----创建表 CREATE TABLE [dbo].
逸鹏
2018/04/11
1.4K0
PP-基础操作:传统数据透视表无法实现的包含筛选项功能
小勤:不是啊。我是透视之后隐藏了另外2列数据而已,但我总不能要看另一个区域的时候再去放出来,然后又隐藏吧!
大海Power
2021/08/30
9120
干货!直观地解释和可视化每个复杂的DataFrame操作
大多数数据科学家可能会赞扬Pandas进行数据准备的能力,但许多人可能无法利用所有这些能力。操作数据帧可能很快会成为一项复杂的任务,因此在Pandas中的八种技术中均提供了说明,可视化,代码和技巧来记住如何做。
计算机与AI
2020/11/19
13.3K0
干货!直观地解释和可视化每个复杂的DataFrame操作
matlab分析包含Emojis的文本数据并可视化
表情符号是内联出现在文本中的图形符号。在智能手机和平板电脑等移动设备上书写文字时,人们会使用表情符号来保持文字简短,传达情绪和感受。
用户9925864
2022/07/27
9500
matlab分析包含Emojis的文本数据并可视化
linux 上查找包含特定文本的所有文件
grep > grep -rnw '/path/to/somewhere/' -e 'pattern' -r或者-R是递归的, -n 是行号,并且 -w 代表匹配整个单词。 -l (小写 L) 可以添加只给出匹配文件的文件名。 -e 是搜索过程中使用的模式 除了这些, --exclude, --include,--exclude-dir标志可用于高效搜索: 只搜索那些具有 .c 或 .h 扩展名的文件 > grep --include=\*.{c,h} -rnw '/path/to/somewhere/'
入门笔记
2022/06/02
3.4K0
linux 上查找包含特定文本的所有文件
原文链接:https://rumenz.com/rumenbiji/linux-find-strings.html
入门笔记
2022/07/21
3.6K0
Power BI: 透视列和逆透视列
文章背景: 透视列(Pivot)和逆透视列(Unpivot)是在Excel当中经常使用的一对数据聚合和拆分方法,在Power BI中也提供了同样的功能。
Exploring
2023/08/17
3.7K0
Power BI:  透视列和逆透视列
linux 上查找包含特定文本的所有文件
原文链接:https://rumenz.com/rumenbiji/linux-find-strings.html
入门笔记
2021/11/24
3.9K0
AngularJS 包含
大多服务端脚本都支持包含文件功能 (SSI: Server Side Includes)。
陈不成i
2021/07/26
6710
解决包含 GitHub Actions Workflow 的分支无法推送的问题
refusing to allow an OAuth App to create or update workflow {0} without workflow scope.
walterlv
2023/10/22
3350
解决包含 GitHub Actions Workflow 的分支无法推送的问题
检查 Python 中给定字符串是否仅包含字母的方法
Python被世界各地的程序员用于不同的目的,如Web开发,数据科学,机器学习,并通过自动化执行各种不同的过程。在本文中,我们将了解检查python中给定字符串是否仅包含字符的不同方法。
很酷的站长
2023/08/11
2440
检查 Python 中给定字符串是否仅包含字母的方法
freemarker${}包含${}
  ${books[user_index]}  //这么取值是错误的 ${books[${user__index}]}   内嵌的话是不需要加{}的。
陈灬大灬海
2018/09/12
8740
亚马逊正在重塑MLOps
作者 | Vishnu Prathish 译者 | 王强 策划 | 冬梅 本文最初发布于 Medium 网站,经原作者授权由 InfoQ 中文站翻译并分享。 众所周知,在三大云提供商中 AWS 拥有最丰富的机器学习能力组合。随着 Sagemaker Studio 于 2020 年初公开发布,他们创建了一个全集成的 ML 开发环境——这是业界首创。 在所有 ML 产品的中心锚定一个 IDE 是一个明智的举动——只要你的相关服务正确地填补了关键运维层面的空白。如果一切顺利,亚马逊将有机会一劳永逸地重塑行业中机
深度学习与Python
2023/04/01
8980
亚马逊正在重塑MLOps
亚马逊正在重塑 MLOps
众所周知,在三大云提供商中 AWS 拥有最丰富的机器学习能力组合。随着 Sagemaker Studio 于 2020 年初公开发布,他们创建了一个全集成的 ML 开发环境——这是业界首创。
深度学习与Python
2021/12/01
1K0
亚马逊正在重塑 MLOps
文件包含漏洞与文件包含Bypass漏洞基础
服务器通过PHP的特性(函数)去包含任意文件时,由于要包含的这个文件来源过滤不严,从而可以去包含一个恶意文件,而我们可以构造这个恶意文件来达到攻击的目的。
天钧
2020/03/12
3.2K0
select count(*)、count(1)、count(主键列)和count(包含空值的列)有何区别?
最直接的方法,我想就是通过10053事件,来看下不同SQL对应的执行计划和资源消耗等情况,进而看看是否有些信息可以为我们所用。
bisal
2019/01/29
3.4K0
限时删除!吐血整理内部包含2980数据分析课程,仅分享一次!
无论你做财务、运营、产品、HR、市场,还是做技术研发,等不可枚举的场景下,数据分析其实是基本功。
州的先生
2020/10/26
4720
限时删除!吐血整理内部包含2980数据分析课程,仅分享一次!
BigData包含什么?
大约有那么两三年了,“互联网+”,“大数据”,“云计算”这些词语,出现在大众面前,这些词语还被政府官员和“创业者”们天天挂在嘴边,真是搞不懂,自己心里根本不明白这是怎么一回事。 说个小的事情,和本文没有什么太多的联系,算是我自己的吐槽罢了, 被这些人(指第一段的人)搞得,有什么小生和一些创业的小子在找我的时候,“我们是依托于云计算,将我们的产品360°无缝链到我们每一个客户的手中,基于互联网+的理论和思想,再通过我们的生态链......”我听他(这位是个学生,以为朋友把我推荐给他)一顿
赵腰静
2018/03/09
1.5K0

相似问题

Pandas -ValueError中的透视:索引包含重复条目,无法重塑

120

带有字符串的Pandas透视- ValueError:索引包含重复条目,无法重塑

28

"ValueError:索引包含重复条目,无法重塑“Pandas DataReader

128

数据透视返回错误:索引包含重复条目

20

Pandas pivot生成"ValueError:索引包含重复条目,无法重塑“

20
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文