首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >具有多头、填充和不同格式的转换文件

具有多头、填充和不同格式的转换文件
EN

Stack Overflow用户
提问于 2022-02-15 10:41:28
回答 1查看 21关注 0票数 -1

我有一些Excel文件与多头,这需要一些高级步骤的阅读和清理。

  1. 该文件可以在头上加上一些额外的行(有些文件有带有"Sales“文本的行,有些则没有)。因此,脚本应该自动理解标题的位置(在某些情况下是raws 4-7,在某些情况下是-3-6)。
  2. 在列名(材料组和材料旁边)中缺少值。脚本应该分别用Material和Material填充这些缺失的值。或者一般情况下,左侧++“Name”substring.
  3. There列的名称在这些列中缺少值,这些列中应该填充"ffill“方法。
  4. 以及最后-文件应该转换为平面表样式,因此列的最终列表是:

材料组:材料组名称?品牌?材料?材料名称? Ean/UPC \ Cal年月?工厂名称??工厂名称??销售数量

看起来,这个任务需要对Multiheader的高级知识,这样我们就不会使用透视表来转换数据。数据(数字)应该按原样计算,这就是我使用dtype=str参数读取数据的原因。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-02-18 08:11:17

我测试了几个不同的解决方案,发现下面的方法效果很好:

  1. 读取文件,pd.read_exce(nrow=30)
  2. 标识索引列的数目、它们的名称等。
  3. 再次读取该文件,包括参数头和索引.

这样熊猫就能很好地完成这项工作。可以使用.stack和.reset_index方法对此数据进行转换。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71125009

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档