我在excel中有很多400+记录。我想尝试删除之前的特定值记录的记录,并希望再次删除该特定记录的记录到excel文件中的底部记录。当我把样本记录放在excel中时,它工作得很好。但是,当我使用原始excel文件时,它并不像预期的那样工作。
假设我们在excel文件中有10行4列。第1行和第2行在列中有不同的值(JL,RF),第3行有INS,第4行也有INS类型。第五、第六有不同的值(ED,JP)。第7、第8、第9和第10组具有INS型值。
因此,在INS类型行之前,我们必须删除,再一次,我们必须删除INS类型值从第7行到第10行。在从INS行到INS记录之前的中间,我们需要。
下面是我的示例代码:
df = pd.read_excel('file.xlsx')
groupin_df = df['content_name'].eq('rec_1').cumsum()
df[grouping_df.eq(1)].to_excel('file1_1.xlsx')样本输入:
   name      zip      content_name
1. jack     21340      JL
2. boris    12540      RF
3. smith    31245      INS
4. roy      41230      INS
5. rais     13240      ED
6. brad     10102      JP
7. surya    81023      INS
8. stones   62190      INS
9. Faizal   51231      INS在输入数据帧中,我希望在特定记录之前删除content_name INS,并再次从content_name所在的位置删除INS到底层记录。
产出:
   name      zip      content_name
3. smith    31245      INS
4. roy      41230      INS
5. rais     13240      ED
6. brad     10102      JP发布于 2022-02-04 13:43:52
如果我正确地理解了您,您希望保持第一个record_2 (包括)和第二个record_2 (排它)之间的行。
试试这个:
s = df['content_name'].eq('record_2').cumsum()
df[s == 1]https://stackoverflow.com/questions/70986855
复制相似问题