使用 ANTLR 4.2,我尝试对此测试数据进行非常简单的解析:
RRV0#ABC
使用最小语法:
grammar Tiny;
thing : RRV N HASH ID ;
RRV : 'RRV' ;
N : [0-9]+ ;
HASH : '#' ;
ID : [a-zA-Z0-9]+ ;
WS : [\t\r\n]+ -> skip ; // match 1-or-more whitespace but discard
根据 Terence Parr 的 Definitive ANTLR 4 参考的以下摘录,我希望词法分析器 RRV 在 ID 之前匹配:
BEGIN : 'begin' ; // match b-e-g-i-n sequence; ambiguity resolves to BEGIN
ID : [a-z]+ ; // match one or more of any lowercase letter
使用上述测试数据运行 ANTLR4 测试装置,输出为
[@0,0:3='RRV0',<4>,1:0]
[@1,4:4='#',<3>,1:4]
[@2,5:7='ABC',<4>,1:5]
[@3,10:9='<EOF>',<-1>,2:0]
line 1:0 mismatched input 'RRV0' expecting 'RRV'
我可以看到第一个令牌是 ID 的 ,值为“RRV0”
我尝试重新排列词法分析器项目顺序。我还尝试通过在语法规则中显式匹配(而不是通过显式词法分析器项)来使用隐式词法分析器项。我也尝试过让比赛变得不贪婪。这些对我来说并不成功。
如果我将词法识别 ID 项更改为不匹配大写,则 RRV 项确实匹配,并且解析将进一步进行。
我从 ANTLR 4.1 开始也遇到了同样的问题。
我在 ANTLRWorks 和命令行中进行了检查,两种方式的结果相同。
如何更改语法以匹配词法分析器项目 RRV 优先于 ID ?