我有以下语法。
meta : '<' TAG attribute* '>';
attribute : NAME '=' VAL;
TAG : [A-Z0-9]+;
NAME : [A-Z_-]+;
VAL : '"'.*?'"';我想要匹配下面的字符串。
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=UTF-8">但是我得到了以下错误。
ParseError extraneous input 'CONTENT' expecting {'>', NAME} clj-antlr.common/parse-error (common.clj:146)我能够用一个属性进行解析。
<META HTTP-EQUIV="Content-Type">如何解析重复属性?给attribute*不起作用。
更新:它实际上是由lexer引起的。如果我将TAG和NAME结合起来,那么它就能工作。
meta : '<' NAME attribute* '>';
NAME : [A-Z0-9_-]+;但我不想让NAME包含数字。有办法让这件事成功吗?
发布于 2016-12-12 10:49:16
您可以使用两个独立的lexer规则,然后使用一个解析器规则分别组合它们。
ID: [A-Za-z]+ ;
NUMBER: [0-9]+ ;
tag: ID+ tag? | NUMBER+ tag? ;
name: ID+ name? | ('_' | '-')+ name? 如果忽略元素之间的空格有问题,可以为其使用不同的通道--仅在上述解析器规则中启用它.它甚至可以将上述解析器规则定义为lexer规则,但我不确定.
https://stackoverflow.com/questions/41091492
复制相似问题