不区分大小写的关键字匹配

2024-05-03

我正在编写一种用于解析计算机语言的语法，可以与解析::Eyapp http://search.cpan.org/~casiano/Parse-Eyapp-1.182/lib/Parse/Eyapp.pod。这是一个 Perl 包，可以简化常规语言解析器的编写。它类似于 yacc 和其他 LALR 解析器生成器，但具有一些有用的扩展，例如根据正则表达式定义标记。

我想要解析的语言使用关键字来表示部分并描述控制流。它还支持用作数据占位符的标识符。标识符永远不能与关键字同名。

现在，棘手的部分来了：我需要将关键字与标识符分开，但它们可能看起来相似，所以我需要一个不区分大小写的匹配标识符的正则表达式模式，仅此而已。

我想出的解决方案如下：

Each keyword is identified by a token of the following form: /((?i)keyword)(?!\w)/
- (?i)将为以下子模式应用不区分大小写的匹配
- (?!\w)不接受关键字后的任何单词字符（a-z、0-9 等）
- 这些字符不会成为匹配的一部分
与另一个关键字开头相同的关键字列在较长关键字之后，因此它们首先匹配
用于匹配标识符的标记位于最后，因此仅当没有识别到关键字时才会匹配

到目前为止，我提出的标记定义和部分语法运行良好，但仍有很多工作要做。然而，这不是我的问题。

我想问的是，我走在正确的轨道上吗？有没有更好、更简单的正则表达式来匹配这些关键字？我应该停止并使用不同的语言解析方法吗？

顺便说一句，使用分词器来匹配整个字符串而不是单个字符的想法来自 Parse::Eyapp 文档。我首先从逐个字符的语法开始，但这种方法不是很优雅，并且似乎与解析器生成器的灵活性相矛盾。写起来也很麻烦。

如果你想解析一种语言，Marpa http://jeffreykegler.github.io/Marpa-web-site/也许更适合你。这是一个tutorial http://jeffreykegler.github.io/Ocean-of-Awareness-blog/individual/2012/11/pattern_search.html。你也可以使用正则表达式语法 https://metacpan.org/module/Regexp%3a%3aGrammars.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

不区分大小写的关键字匹配的相关文章

使用正则表达式正确替换缩写及其扩展

我需要更换 HYD 和 HYD 带液压但正如你所见 HYD 没有得到转换我究竟做错了什么 console log HYD bHYD b gi test HYD OK console log HYD CYLINDER bHYD b gi
如何使用斯坦福TokensRegex？

我正在尝试使用斯坦福大学TokensRegex 但是我在匹配器行中遇到错误请参阅注释它说请尽力帮助我下面是我的代码 String file A store has many branches A manager may manag
正则表达式删除块注释也删除 * 选择器

我正在尝试使用 bash 从 css 文件中删除所有块注释我有以下 sed 命令的正则表达式 sed r s w s w d 这可以很好地去除块注释例如 This is a comment this is another comment
RewriteCond REQUEST_URI - ^ 未按预期工作

我正在 codeigniter 中构建一个网站我在 htaccess 文件中有一系列重写条件和规则第一组规则根据 uri 的第一段打开或关闭 SSL 然后它再次循环如果找到匹配项则适当地重定向页面如果没有匹配项并且 uri 不以
如何从 R 运行带有特定模块的 perl 脚本？

我可以从终端运行 perl 脚本 myperlscript pl 没有任何问题但是如果我尝试从 RStudio 中运行相同的 perl 脚本则会出现以下错误 command lt myperlscript pl outputfile
JavaScript 中的正则表达式用于验证十进制数字

我想要 JavaScript 中的正则表达式来验证十进制数字它最多只允许两位小数例如它应该允许10 89但不是10 899 它还应该只允许一个句点例如它应该允许10 89但不是10 8 9 尝试使用以下表达式 d d 0 2 如果
正则表达式不等于字符串

我用正则表达式用头撞墙我正在尝试定义一个表达式该表达式完全排除此文本 System 不区分大小写但可以包含系统这个词提供的不仅仅是这个例子系统无效系统无效系统无效系统无效 asd 系统有效 asd 系统 asd
正则表达式接受 4 条规则中的 3 条

我似乎无法让正则表达式正确满足以下要求长度在 8 到 20 之间的字符串必须包含至少 1 个大写字母字符至少 1 个小写字母字符以及至少 1 个数字或至少 1 个特殊字符字符或两者假设特殊字符仅限于包括我最初是这样写的 A Z
将上部字符转换为下部字符，将下部字符转换为上部字符（反之亦然）[重复]

这个问题在这里已经有答案了我需要将某些字符串中的所有较低字符转换为较高字符并将所有较高字符转换为较低字符例如 var testString heLLoWorld 应该 HEllOwORLD 转换后在不保存临时字符串的情况下实现此目的
文件名的正则表达式模式

如果文件名符合以下条件用户可以将文件放入服务器它必须以 abc 开头然后是一个点和一个数字 Valid file names abc 2344 abc 111 Invalid abcd 11 abc ab12 正则表达式是什么我不能
Perl 中可以使用哪种语法糖来减少左/右值运算符与 if 语句的代码？

那里有很多语句因为 Perl 是一种非常甜蜜的语言但任何语言中最常用的语句都是 if 语句和设置值的组合我想我已经找到了很多但仍然存在一些空白最终目标是不必多次编写变量名这是我到目前为止所拥有的 r s r s unless
unix df 上的正则表达式帮助

我需要一些帮助来调整我的代码以查找此 UNIX 中的另一个属性df output Ex Filesystem Size Used Avail Capacity Mounted on dev ad4s1e 61G 46G 9 7G 83 ho
JavaScript：是否有完全支持环视的正则表达式库？

As JavaScript 的内置正则表达式库 https developer mozilla org en US docs Web JavaScript Guide Regular Expressions不支持向后看 http www r
检查给定字符串是否等于给定字符串集中的至少一个字符串的有效方法

给定一组字符串比如说 String1 String2 StringN C 中确定最有效的方法是什么返回true or false 是否给定string s匹配上面集合中的任何字符串吗 Boost Regex 可以用于此任务吗 std u
Perl YAML 模块无法识别标量类型

我加载以下 yaml 文件 foo bar s 1 hx 0x34 用这段代码 use YAML qw LoadFile Dump use Data Dumper my d LoadFile test yaml print Dumper d
检查条件并通过 Zend 中的 Regex 识别 url 中的模式

我正在实现 Zend Regex 路由并且必须对 url 执行多次检查例如如果这是我的网址 http localhost application public index php module controller action 这是
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
Python：删除字符串开头的数字

我有一些这样的字符串 string1 123 123 This is a string some other numbers string2 1 This is a string some numbers string3 12 3 12 T
为什么我只得到第一个捕获组？

https stackoverflow com a 2304626 6607497 https stackoverflow com a 2304626 6607497 and https stackoverflow com a 370042
在 SQLite 中搜索时排除 HTML 标签和一些 UNICODE 字符

更新 4 我已经成功运行了firstchar例如但现在的问题是使用regex 即使包含头文件它也无法识别regex操作员有什么线索可以解决这个问题吗更新 2 我已经编译了sqlite3我的项目中的库我现在正在寻找任何人帮助我为我的

随机推荐

CMake：将为 lib 构建的对象文件重用到另一个 lib 目标中

我正在尝试将我的项目转移到CMake 同时对编译过程进行一些优化这是交易我有几个子目录必须每个子目录都编译成静态库这有效我想将每个子目录中的所有目标文件收集到另一个更大的完整的静态库中它看起来像这样 libBig a mad
带图例的 Seaborn 聚类图行颜色

我找到了以下解决方案来将行颜色图例添加到 Seaborn 聚类图中如何在 Seaborn 中的热图轴上表达类 https stackoverflow com questions 27988846 how to express classe
AngularJS：如何获取 JSON 对象的密钥

我不确定这是否与 AngularJS 有任何关系以及是否仅与 JSON 相关无论如何假设我们有以下 JSON scope dataSets names Horace Slughorn Severus Snape genders Mal
如何使用 GetBobContent 获取多个文件并将其作为附件添加到 Azure 逻辑应用程序中的电子邮件？

您好我正在 Azure 逻辑应用程序中工作我正在尝试从 azure data Lake gen v2 获取多个文件并将这些多个文件附加到电子邮件中作为第一步我添加了 http 请求并提供了所需的信息以及文件路径对于一个文件来说它
如何在 JasperReports 中解码 html 实体

我有一些用 JasperReports 编写的报告它们按字面意思显示 html 实体例如项目符号点使用 html 实体文本表示显示 8226 你知道有什么办法吗 In the textField设置markup属性为html 这是如
简化情况下能否保证mqtt消息送达顺序？

如果只有一个代理一个发布者一个主题和干净的会话在这个简化的情况下能否保证订阅者端的消息传递顺序与发布者端的发送顺序相同会受到QoS的影响吗 Section 4 6 http docs oasis open org mqtt mqt
IQKeyboardManager 从 UITextField 导航到 UITextView

IQKeyboardManager在键盘上方的工具栏中提供箭头以从一个跳转UITextField到另一个但我正在寻找是否可以在混合之间跳转UITextFields and UITextViews 我知道完成此任务的正常程序但我有兴趣知道
更改 Visual Studio 2013 IDE 中选项卡的字体颜色

我找不到如何更改 Visual Studio 2013 IDE 中选项卡的字体颜色环境 gt 字体和颜色没有任何允许这样做的内容我看不出有什么其他的帮助我的问题是所选页面在相对较暗的背景上有粗体黑色字体我必须睁大眼睛才能看到选择了
导入错误：无法导入名称 urandom

我正在构建一个新的 Linux 环境并在 Python 上看到以下错误 python c import random Traceback most recent call last File
Flask-httpauth： get_password 装饰器如何为 basic-auth 工作？

我想知道有没有人用过这个烧瓶延伸 https github com miguelgrinberg flask httpauth简化 http basic auth 基本上我不明白这个example https github com migu
Sublime Text 2 将颜色粘贴到 MS Word

我想将代码粘贴到 Word 文档中同时保留突出显示的彩色文本有没有办法做到这一点您可以安装高亮插件 https github com n1k0 SublimeHighlight然后使用SublimeHighlight copy to
JavaScript 中 == 和 === 的区别[重复]

这个问题在这里已经有答案了有什么区别 and 在 JavaScript 中我也见过 and 运营商还有更多这样的运营商吗看看这里 http longgoldenears blogspot com 2007 09 triple equ
无法加载标签“s:form”的标签处理程序类“org.apache.struts2.views.jsp.ui.FormTag”

如果我在 NetbeansIDE 中运行代码它会显示以下错误 org apache jasper JasperException InvestorConfirm jsp 53 12 PWC6032 无法加载标签处理程序类 org apac
在列表视图中颤动网格视图

我想构建像 Ios 应用商店这样的设计如下图所示我想要实现的是有 5 个顶级类别每个类别都有显示图像的网格我这样尝试过 return new Scaffold backgroundColor Colors white appBar
可重用的 Tensorflow 卷积网络

我想重用来自Tensorflow 专业人士的 MNIST CNN 示例 http www tensorflow org tutorials mnist pros index md 我的图像尺寸为 388px X 191px 只有 2 个输出
Spring方法获取给定类型的所有bean

我试图从一个相同类型的豆子中获取所有豆子FileSystemXmlApplicationContext 我正在使用factory getBeansOfType SomeType class 但我注意到它只返回顶级 bean 是否有任何其他方
关于使用outer()和用户定义函数的简单问题？

gt fun1 lt function x y x y gt outer seq 1 5 length 5 seq 6 10 length 5 fun1 1 2 3 4 5 1 7 8 9 10 11 2 8 9 10 11 12 3 9
F1 2019 UDP解码

我目前正在为 F1 方向盘开发自己的显示器 F1 2019 由codemasters提供通过UDP发送数据该数据存储在字节数组中我在解码返回的数组时遇到一些问题问题是我得到了很多信息但我不知道如何处理它们我将向您介绍我所尝试过的
如何在 mysql 正则表达式中匹配大写 ÅäÖ

当我在 MySQL 中进行 REGEXP 比较时我得到了瑞典字符大写版本的一些奇怪结果我正在使用 utf8 swedish ci 排序规则我想查找大写单词 SELECT ster REGEXP BINARY A Z a z 应该返回
不区分大小写的关键字匹配

我正在编写一种用于解析计算机语言的语法可以与解析 Eyapp http search cpan org casiano Parse Eyapp 1 182 lib Parse Eyapp pod 这是一个 Perl 包可以简化常规语言解

不区分大小写的关键字匹配

不区分大小写的关键字匹配 的相关文章

随机推荐

热门标签

不区分大小写的关键字匹配的相关文章