ANTLR4 RegEx 词法分析器模式

2024-01-06

我正在为 XSD 内的 RegEx 开发一个 Regex 解析器。我之前的问题描述如下：ANTLR4 解析正则表达式 https://stackoverflow.com/questions/34177478/antlr4-parsing-regex

从那以后我就把词法分析器和解析器分开了。现在我在解析括号内的括号时遇到问题。它们应该被视为括号内的字符和括号外的分组标记。这是我的词法分析器语法：

lexer grammar RegExLexer;

Char    : ALPHA ;
Int     : DIGIT ;

LBrack  : '[' ;//-> pushMode(modeRange) ;
RBrack  : ']' ;//-> popMode ;
LBrace  : '(' ;
RBrace  : ')' ;
Semi    : ';' ;
Comma   : ',' ;
Asterisk: '*' ;
Plus    : '+' ;
Dot     : '.' ;
Dash    : '-' ;
Question: '?' ;
LCBrace : '{' ;
RCBrace : '}' ;
Pipe    : '|' ;
Esc     : '\\' ;

WS : [ \t\r\n]+ -> skip ;

fragment DIGIT : [0-9] ;
fragment ALPHA : [a-zA-Z] ;

这是一个例子：

[0-9a-z()]+

我觉得我应该使用括号上的模式来改变 ALPHA 片段的行为。如果我复制该片段，则会收到一条错误消息，指出我不能两次声明该声明。我已阅读有关此的参考资料，但我仍然不明白我应该做什么。

如何实施这些模式？

以下是如何使用 ANTLR4 的词法模式创建上下文敏感词法分析器的快速演示：

lexer grammar RegexLexer;

START_CHAR_CLASS
 : '[' -> pushMode(CharClass)
 ;

START_GROUP
 : '('
 ;

END_GROUP
 : ')'
 ;

PLAIN_ATOM
 : ~[()\[\]]
 ;

mode CharClass;

END_CHAR_CLASS
 : ']' -> popMode
 ;

CHAR_CLASS_ATOM
 : ~[\r\n\\\]]
 | '\\' .
 ;

生成词法分析器后，您可以使用以下类来测试它：

import org.antlr.v4.runtime.ANTLRInputStream;
import org.antlr.v4.runtime.Token;

public class Main {
    public static void main(String[] args) {
        RegexLexer lexer = new RegexLexer(new ANTLRInputStream("([()\\]])"));
        for (Token token : lexer.getAllTokens()) {
            System.out.printf("%-20s %s\n", RegexLexer.VOCABULARY.getSymbolicName(token.getType()), token.getText());
        }
    }
}

如果您运行这个 Main 类，以下内容将打印到您的控制台：

START_GROUP          (
START_CHAR_CLASS     [
CHAR_CLASS_ATOM      (
CHAR_CLASS_ATOM      )
CHAR_CLASS_ATOM      \]
END_CHAR_CLASS       ]
END_GROUP            )

如您所见，( and )在字符类外部和在字符类内部的标记化方式不同。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

regex

antlr4

ANTLR4 RegEx 词法分析器模式的相关文章

使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
Antlr 解析器运算符优先级

考虑以下语法我对运算符优先级有疑问例如 res 2 a b有一个类似的解析树res 2 a b 我知道问题出在哪里但我没有想到没有相互左递归的漂亮解决方案你能帮我一点忙吗该语法与自定义访问者一起使用 grammar Math
解析西班牙姓氏

西班牙姓氏由三部分组成父亲的名字可选的母亲姓名可选配偶的父亲姓名这三个部分中的每一部分都是一个单词前面可能带有 De Del De La De Los 或 De Las 这些前缀中的每一个都以大写字母开头并且每个部分可能只有一个
Python：删除字符串开头的数字

我有一些这样的字符串 string1 123 123 This is a string some other numbers string2 1 This is a string some numbers string3 12 3 12 T
Perl 非贪婪

我遇到非贪婪正则表达式 regex 的问题我已经看到有关于非贪婪正则表达式的问题但它们没有回答我的问题 Problem 我正在尝试匹配 lol 锚点的 href Note 我知道这可以通过 Perl HTML 解析模块来完成我的问题是
返回当前标记的最后一个字符的行号

ANTLR 4 中有没有办法能够返回当前标记的最后一个字符的行号我提到Antlr 从令牌中获取最后一行 https stackoverflow com questions 7903021 antlr get last line from
使用通配符分割字符串

我有一个变量字符串其中包含我需要的值和拆分器问题是字符串的长度是可变的分割器的类型也是可变的它们通过 XML 文件到达字符串将如下所示 1 20 51 2 name jpg 但也可以是 1 20 51 name jpg 坚实的因
如何检查php字符串是否只包含英文字母和数字？

在 JS 中我使用了这段代码 if string match A Za z0 9 但我不知道如何在 PHP 中做到这一点 Use 预匹配 http php net manual en function preg match php if p
删除emacs中多余的空行

M x flush lines 删除缓冲区中的所有空白行但是我只想删除多余的空白行也就是说如果有n个连续的空白行我想删除n 1并保留一个我知道删除空白行可以完成该点下的空白行的工作但是我想要一个适用于整个缓冲区的简单解决方案有什
请解释*贪婪量词的工作原理

Pattern ptn Pattern compile a Matcher mtch ptn matcher bbaac if mtch find System out println mtch group 输出不打印任何内容 Patte
Laravel 验证规则仅针对字母

我正在尝试添加验证规则以仅接受信件我正在使用regex规则但它仍然不起作用下面是我的代码 Validate request input this gt validate request name gt required regex p
局部变量或实例字段名称与正则表达式“[a-z]+”不匹配

将 Android studio 升级到2 1 2 当我将旧项目导入其中时我的代码中充满了警告警告是 Instance field name doesn t match regex a z Local variable name doe
使用 ANTLR4 识别单行中的多行注释

我想用 ANTLR4 解析 PostScript 代码我完成了语法但是一种特定的语言扩展由其他人引入很难被识别一个简短的例子 1 This is a line comment 2 The next line just pushes
Spark SQL 中的 SQL LIKE

我正在尝试使用 LIKE 条件在 Spark SQL 中实现联接我正在执行连接的行看起来像这样称为修订 Table A 8NXDPVAE Table B 4 8 NXD V 在 SQL Server 上执行联接 A revision
使用正则表达式提取两个短语之间的所有单词[重复]

这个问题在这里已经有答案了我正在尝试使用以下正则表达式提取两个短语之间的所有单词 b item W w W 0 2 1 one W w W 0 3 business b b item W w W 0 2 3 three W w W 0 3
使用哪个正则表达式将此字符串转换为数组？

从 mysql 中的地理空间列我得到以下字符串值我想将其转换为数组最终目标是将其转换为 geoJSON POLYGON 4 885838 52 388063 4 891061 52 388381 4 890973 52 382909 该
使用 URL 参数 ID 编号范围进行 HTACCESS 重定向

我希望有人可以提供帮助因为事实证明这很难弄清楚我试图通过 HTACCESS 和 mod rewrite 重定向许多 URL 参数 ID 值在特定范围内从 1 到 7603 的页面这是我到目前为止所拥有的
是否存在永远不会匹配任何字符串的正则表达式？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Python 正则表达式部分匹配或“hitEnd”

我正在编写一个扫描器因此我将任意字符串与正则表达式规则列表进行匹配如果我可以模拟 Java hitEnd 功能不仅知道正则表达式何时不匹配还知道何时匹配这将非常有用 can t匹配当正则表达式匹配器在决定拒绝输入之前到达输入末尾
如何在SQL Server中获取与正则表达式匹配的字符串的一部分

我有一个要求我需要解析列值以获取与其关联的工作请求编号例如列值可能包含致力于 AB 0012589 or AB 0012589 已完成或其中包含工作请求编号的任何内容 Here AB 0012589是工作请求编号工作请求编号的格

随机推荐

Mac 上的 Qt MySQL

我浪费了大约 6 个小时试图按照网上的各种说明让 MySQL 与 Qt 一起工作我现在就想把自己的手腕砍掉有谁对如何将 QMYSQL 驱动程序安装到 Qt 中有简单和详细的解释吗我有 Mac 10 6 我是初学者我将衷心感谢您的帮助
Android 中的 Facebook Like 按钮集成

我想在我的 Android 应用程序中集成 Facebook Like 按钮请告诉我如何将其集成到 Android 中的步骤我会尝试使用包含您从中获得的标准 html 集成的 webview 来完成此操作facebook http de
scp 或 sftp 使用单个命令复制多个文件

我想将文件从远程服务器复制到不同的目录中例如我想同时运行这 4 个命令 scp remote A 1 txt local A 1 txt scp remote A 2 txt local A 2 txt scp remote B 1 t
解析推送通知最终在 Android 后台崩溃

我正在使用 Parse 在 android 中推送通知但当我关闭 wifi 时它最终会在后台崩溃它给了我错误 java lang RuntimeException 无法启动接收器 com parse ParseBroadcastRec
从单个 Hive UDF 创建多个列

我正在使用 Amazon EMR 和 Hive 0 11 我正在尝试创建一个 Hive UDF 它将从一个 UDF 调用返回多个列例如我想调用如下所示的 UDF 并返回几个命名的列 SELECT get data columnnam
在 Android 中使用工具栏实现正确的后退导航和主页按钮处理

我在同一活动中使用单个活动和多个片段附有屏幕截图来提供无缝导航但是在实现了最新的工具栏和导航视图之后似乎很难处理导航和主页按钮我在以下方面遇到麻烦 Managing the Hamburger Back button at lef
System.Drawing.Point' 到 'System.Windows.Point 的转换器

我正在尝试在 WPF 中绘制一些实体我的集合包含 System Drawing Rectangle 对象当我尝试在 WPF XAML 中访问这些对象的位置时出现以下错误无法创建默认转换器来执行类型 System Drawing Po
如何创建带有标签和值的 Winforms 组合框？

我主要是一名 ASP NET 开发人员但我正在开发 WinForms 应用程序并注意到 ASP NET 组合框 html 选择和 WinForms 之间存在很大差异我发现也许是错误的 WinForm 的组合框只有一个标签而 A
github 操作上下文的完整列表

在调查如何在 github 操作中我可以将存储库中特定文件的基本版本与文件的拉取请求头版本进行比较在调查这一点时我发现了各种来源例如 github community https github community t how
Apollo Server Express：请求实体太大

我需要在 GraphQL 突变中发布大量有效负载如何提高 Apollo Server 的主体大小限制我在用着apollo server express版本 2 9 3 我的代码简化 const myGraphQLSchema new
使用（非类型）枚举参数定义内部类成员函数模板

我在定义和专门化成员函数时遇到困难update 内部类的Outer
序言中不能有内容

我正在尝试转换xml到 html 使用xslt 我正在使用java xml transform在java中执行此操作它工作得很好直到我遇到了一些xml 它说以下错误 Fatal Error 1 1 Content is not allo
哪个 Linux 进程处理系统调用？

这可能是一个愚蠢的问题但我正在使用 gdb 调试一个二进制文件试图对其进行逆向工程并到达一条指令该指令进行系统调用之后出现我想要逆向工程的效果我假设另一个进程正在接管并完成这项工作所以我想知道是否可以调试使用 gdb 处理系
如何将整数四舍五入到接近百位？

我不知道我的命名是否正确无论如何这些是我拥有的整数例如 76 121 9660 我想将它们四舍五入到接近一百例如它们必须变成 100 100 9700 如何在 C 中更快地完成此操作我想到了一种算法但也许 C 上有一些实用程序
为什么大多数序列化器使用流而不是字节数组？

我目前正在开发套接字服务器我想知道为什么序列化器喜欢 Xml序列化器 https msdn microsoft com en us library system xml serialization xmlserializer v vs
在 OpenCV 中使用 SURF 测量模式识别的准确性

我目前正在 OpenCV 中使用 SURF 进行模式识别到目前为止我有什么我已经用 C 编写了一个程序我可以在其中选择源图像和我想要查找的模板之后我将两张图片传输到 C dll 中在其中使用 OpenCV SURFDetecto
对象引用未设置为对象的实例（将列表映射到自动映射器）[重复]

这个问题在这里已经有答案了我正在尝试向 dto 添加一个列表以便使用 AutoMapper 将 dto 顶部映射到实际的上下文类出于某种原因当我将列表添加到 dto 的属性并映射它时在调试时它会抛出错误有这个特例 The obje
Spring MVC 4.2+ CORS 返回 403

我创建了一个新鲜且简单的 Spring MVC 应用程序使用 4 2 1 Release 现在切换到 4 2 7 Release 该应用程序很简单 WEB XML
如何在不使用字符串名称的情况下引发 PropertyChanged 事件

如果能够在不显式指定已更改属性的名称的情况下引发 PropertyChanged 事件那就太好了我想做这样的事情 public string MyString get return myString set ChangeProperty
ANTLR4 RegEx 词法分析器模式

我正在为 XSD 内的 RegEx 开发一个 Regex 解析器我之前的问题描述如下 ANTLR4 解析正则表达式 https stackoverflow com questions 34177478 antlr4 parsing reg

ANTLR4 RegEx 词法分析器模式

ANTLR4 RegEx 词法分析器模式 的相关文章

随机推荐

热门标签

ANTLR4 RegEx 词法分析器模式的相关文章