一个订单会包含很多明细项,表中每个样本(每一行)表示一个明细项
order_id 列存在重复
item_name 是明细项物品名
前面章节讲解过的知识点,本文不再讲解!...串起来:
orders = [311, 1828, 328, 1355]
df = (
df.query('order_id in @orders')
.groupby('order_id...:
(
df.assign(item_name = df.item_name.str.split(','))
['item_name'].apply(type)
)
此时,如果你在使用...reindex 可以重复多行数据:
df.reindex([0,0,1,1,2,2,3,3])
reindex 中指定的是行索引列表
怎么知道每个订单需要拆分的行数:
dfx = df.assign...(十七):合并不规范数据
Python入门必备:细讲Python推导式