我正在处理这个正则表达式
((([(]?[-]?[0-9]*[.]?[0-9]+)+([\/\+\-\*])+)+([0-9]*[.]?[0-9]+[)]?)+[\+\-\*\/]?([0-9]*)*)+
我需要它来接受任何表达式,比如:(2+2*7)-4+2/(5-3)+2
并且我想避免这样的表达式:(2+3)- or 2+2-(2+3
我们的目标是从用户那里获取表达式,并将其分解为标记,但在此之前,我想检查输入的有效性。
发布于 2013-10-21 18:14:32
在最一般的形式中,regular expressions可以描述regular languages。另一方面,数学公式通常被形式化为context-free languages,它是常规语言的超集。Chomsky hierarchy明确了这一区别:常规语言是类型3,而上下文无关的语言是更通用的类型2。
直观地说,这里的关键区别在于常规语言无法计数,因此它们无法平衡左括号和右括号。可以使用有限状态自动机检测常规语言,但只使用有限数量的状态,您不可能跟踪到到目前为止看到的开括号数量,因为可能有任意数量的开括号。
您可能想要研究一下lexer和parser之间的区别。通常,您可以使用正则表达式将流标记为数字、运算符等,而使用后者构建和检查由这些标记组成的表达式。
https://stackoverflow.com/questions/19464077
复制相似问题