我尝试在表达式中分离运算符(包括圆括号)和操作数。例如,给定一个表达式
expr = "(32+54)*342-(4*(3-9))"
我在试着得到
['(', '32', '+', '54', ')', '*', '342', '-', '(', '4', '*', '(', '3', '-', '9', ')', ')']
这是我写的代码。有没有更好的方法用python来做呢?
l = list(expr)
n = ''
expr = []
try:
for c in l:
if c in string.digits:
n += c
else:
if n != '':
expr.append(n)
n = ''
expr.append(c)
finally:
if n != '':
expr.append(n)
发布于 2012-09-23 05:48:28
我们可以使用re.split()
做到这一点
>>> import re
>>> expr = "(32+54)*342-(4*(3-9))"
>>> re.split("([-()+*/])", expr)
['', '(', '32', '+', '54', ')', '', '*', '342', '-', '', '(', '4', '*', '', '(', '3', '-', '9', ')', '', ')', '']
这确实插入了一些空字符串,但这些字符串可能可以很容易地处理或剥离。例如,使用list comprehension
>>> [part for part in re.split("([-()+*/])", expr) if part]
['(', '32', '+', '54', ')', '*', '342', '-', '(', '4', '*', '(', '3', '-', '9', ')', ')']
发布于 2012-09-23 05:52:50
如果您只是尝试对流进行标记化,那么您的方法是不错的,但有点过时。您可以使用regular expression更轻松地拆分令牌。
但是,如果您还想对标记执行某些操作(比如对它们求值),那么我建议您考虑一下可以处理递归的解析模块(正则表达式不能处理递归),比如pyparsing。
发布于 2012-09-23 05:54:11
Python:Batteries Included。
>>> [x[1] for x in tokenize.generate_tokens(StringIO.StringIO('(32+54)*342-(4*(3-9))').readline)]
['(', '32', '+', '54', ')', '*', '342', '-', '(', '4', '*', '(', '3', '-', '9', ')', ')', '']
https://stackoverflow.com/questions/12547938
复制相似问题