我使用只保留数据value的某些行(在一个列中值与某个regex模式匹配的行)。为此,我正在构建一个索引列表,以在循环中检查每一行是否与模式匹配: if re.match(regex_files_to_keep我的数据集存储为CSV文件。它太大了,不能在一段时间内阅读,我使用的是的大块头参数。
应用于第一个块的take工作没有任何问题。但是,从第二个块开始,
我有一个pandas数据帧,其中有5个匹配的字符串,让我们称它们为"xyz“,它们出现在初始匹配字符串的x行之后,让我们称它们为”初始string2“和”初始xyz“。2467 data "intial string2" 2487 data "xyz"
我希望能够从这些索引开始遍历dataframe,找到"xyz“的第一个匹配<