使用负先行断言提取文件名中的重复部分

是一种正则表达式的技巧，用于匹配并提取文件名中重复出现的部分。

正则表达式是一种用于匹配和处理文本的强大工具，它可以通过定义模式来搜索、替换和提取文本中的特定内容。负先行断言是正则表达式中的一种特殊语法，用于在匹配过程中排除某些内容。

在这个问题中，我们需要提取文件名中的重复部分。假设文件名的格式为"filename_duplicate1_duplicate2.extension"，其中"filename"是文件名，"duplicate1"和"duplicate2"是重复的部分，"extension"是文件扩展名。

下面是一个使用负先行断言的正则表达式示例：

(?<=(\b\w+\b_))(\w+)(?=_\w+\.\w+)

解析：

(?<=(\b\w+\b_))：负先行断言，匹配前面是以单词字符和下划线结尾的单词。
(\w+)：匹配并捕获一个或多个单词字符，即重复的部分。
(?=_\w+\.\w+)：负先行断言，匹配后面是以下划线、单词字符和文件扩展名结尾的内容。

使用这个正则表达式，我们可以提取文件名中的重复部分。以下是一个示例代码：

import re

filename = "filename_duplicate1_duplicate2.extension"
pattern = r'(?<=(\b\w+\b_))(\w+)(?=_\w+\.\w+)'
match = re.search(pattern, filename)

if match:
    duplicate_part = match.group(0)
    print("重复部分：", duplicate_part)
else:
    print("未找到重复部分")

输出结果：