我正在使用python通过regex解析出SDDL。SDDL总是以'type:some text‘的形式重复最多4次。类型可以是'O‘、'G’、'D‘或后跟冒号的'S’。“一些文本”的长度是可变的。
下面是一个SDDL示例:
O:DAG:S-1-5-21-2021943911-1813009066-4215039422-1735D:(D;;0xf0007;;;AN)(D;;0xf0007;;;BG)S:NO_ACCESS_CONTROL这是我到目前为止所拥有的。其中两个元组可以很好地返回,但另外两个- ('G','S-1-5-21-2021943911-1813009066-4215039422-1735')和('S','NO_ACCESS_CONTROL') )则不是。
import re
sddl="O:DAG:S-1-5-21-2021943911-1813009066-4215039422-1735D:(D;;0xf0007;;;AN)(D;;0xf0007;;;BG)S:NO_ACCESS_CONTROL"
matches = re.findall('(.):(.*?).:',sddl)
print matches
[('O', 'DA'), ('D', '(D;;0xf0007;;;AN)(D;;0xf0007;;;BG)')]我希望得到的回报是
[('O', 'DA'), ('G','S-1-5-21-2021943911-1813009066-4215039422-1735'), ('D', '(D;;0xf0007;;;AN)(D;;0xf0007;;;BG)'),('S','NO_ACCESS_CONTROL')]发布于 2012-08-28 02:07:48
尝试以下操作:
(.):(.*?)(?=.:|$)示例:
>>> re.findall(r'(.):(.*?)(?=.:|$)', sddl)
[('O', 'DA'), ('G', 'S-1-5-21-2021943911-1813009066-4215039422-1735'), ('D', '(D;;0xf0007;;;AN)(D;;0xf0007;;;BG)'), ('S', 'NO_ACCESS_CONTROL')]这个正则表达式的开始方式与您的相同,但不是将.:作为匹配的一部分包含在末尾,而是使用了先行。这是必要的,因为re.findall()不会返回重叠的匹配,因此您需要在下一个匹配开始之前停止每个匹配。
前视(?=.:|$)本质上意味着“仅当后面的字符是冒号后的任何字符,或者我们在字符串的末尾时才匹配”。
发布于 2012-08-28 02:25:38
看起来使用正则表达式并不是解决这个问题的最佳方法。实际上,您所要做的就是将冒号拆分,然后对结果列表进行一些转换。
chunks = sddl.split(':')
pairs = [(chunks[i][-1], chunks[i+1][:-1] \
if i < (len(chunks) - 2) \
else chunks[i+1])
for i in range(0, len(chunks) - 1)]https://stackoverflow.com/questions/12147058
复制相似问题