Antlrworks - 无关输入

2024-01-01

我是这方面的新手，因此我需要你的帮助。我正在尝试解析 Wikipedia Dump，我的第一步是将它们定义的每个规则映射到 ANTLR，不幸的是我遇到了第一个障碍：

第 1 行：8 外部输入 ''''' 需要 '\'\''

我不明白发生了什么事，请帮助我。

My code:

grammar Test;

options {
    language = Java;
}

parse
    :  term+ EOF
    ;

term 
    :  IDENT
    |  '[[' term ']]'
    |  '\'\'' term '\'\''
    |  '\'\'\'' term '\'\'\''
    ;    

IDENT
    :  ('a'..'z' | 'A'..'Z' | '0'..'9' | '=' | '#' | '"' | ' ')*
    ;

Input'''''你好世界'''''

词法分析器规则必须始终匹配至少 1 个字符。你的规则：

IDENT : ('a'..'z' | 'A'..'Z' | '0'..'9' | '=' | '#' | '"' | ' ')*;

匹配一个空字符串（其数量是无限的）。改变* to a +:

IDENT : ('a'..'z' | 'A'..'Z' | '0'..'9' | '=' | '#' | '"' | ' ')+;

EDIT

Input '''''Hello World'''''

尽管您将文字标记放入解析器规则中（'\'\'\'', '\'\''等），你必须明白它们是not根据解析器的要求创建。词法分析器遵循严格的规则来创建标记：

它尝试尽可能多地匹配
如果 2 个不同的词法分析器规则匹配相同数量的字符，则第一个定义的规则将优先

让我们为您的文字标记命名：

BRACKET_OPEN  : '[[';
BRACKET_CLOSE : ']]';
Q3            : '\'\'\'';
Q2            : '\'\'';
IDENT         :  ('a'..'z' | 'A'..'Z' | '0'..'9' | '=' | '#' | '"' | ' ')+;

现在，由于规则#1（尽可能多地匹配），输入'''''Hello World'''''将被标记如下：

Q3
Q2
IDENT
Q3（是的，一个Q3!)
Q2

但是你的解析器规则term只会接受Q3 Q2 IDENT Q2 Q3，因此您的输入无法正确解析是正确的。

另外，我建议您不要使用解释器：它有很多问题。不过，调试器的工作方式就像一个魅力！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ANTLR

wikipedia

antlrworks

Antlrworks - 无关输入的相关文章

ANTLR 3 中 wikitext-to-HTML 的工作示例

我试图在 ANTLR 3 中充实一个 wikitext to HTML 翻译器但我一直陷入困境您知道我可以检查的工作示例吗我尝试了 MediaWiki ANTLR 语法和 Wiki Creole 语法但无法让它们在 ANTLR 3
如何使用Antlr实现函数调用，以便在定义之前就可以调用它？

一旦构建了 AST 实现树遍历器以便可以按任意顺序定义和调用函数的最佳方法是什么例如这在 PHP 中是有效的我猜想一定有第二遍或者树转换但我在这个主题上找不到任何有趣的东西这个问题可能不是 Antlr 特有的问题但如果你能给我
是否需要担心“解析器规则中的隐式标记定义”？

我正在使用 ANTLR 和 ANTLRWorks 2 创建我的第一个语法我已经完成了语法本身它识别用所描述的语言编写的代码并构建正确的解析树但除此之外我还没有开始任何事情让我担心的是解析器规则中第一次出现的标记都会用黄色曲线下划线
xtext 中的终端/数据类型/解析器规则

我正在使用 xtext 2 4 我想做的是类似 SQL 的语法让我困惑的是我不确定哪些东西应该被视为终端数据类型解析器规则到目前为止我的语法相关MyTerm is Model terms MyTerm MyTerm constant
维基百科文本下载

我正在寻找为我的大学项目下载完整的维基百科文本我是否必须编写自己的蜘蛛才能下载此内容或者是否有在线维基百科的公共数据集为了给你一些我的项目的概述我想找出我感兴趣的几篇文章中有趣的单词但是为了找到这些有趣的单词我计划应用 tf i
编写对空格敏感的解析器规则，同时从词法分析器中跳过 WS

我在处理空白时遇到一些麻烦在以下语法摘录中我设置了词法分析器以便解析器跳过空格 ENTITY VAR user resource INT DIGIT DIGIT ID LETTER LETTER DIGIT SPECIAL ENTIT
如何从维基百科文章中提取数据？

我有一个关于为我的 Android 应用程序解析维基百科数据的问题我有一个脚本可以通过读取源代码来下载 XMLhttp en wikipedia org w api php action parse prop text format x
ANTLR 4 - 树模式匹配

我试图理解 ANTLR 4 中的解析树匹配所以为此我有以下java代码 package sampleCodes public class fruits public static void main String args int a
在Google搜索时如何从第一页获取图像？

通常使用Google搜索城市后右侧会出现维基百科页面的一部分其中包含图像和地图谁能告诉我如何访问该图像我应该知道怎么下载实际上主图像与右侧地图图像一起很少来自维基百科因此您无法使用维基百科 API 来获取它如果您想访问实
ANTLR 实现类似Python的缩进相关语法的最简单方法是什么？

我正在尝试实现类似Python的缩进相关语法来源示例 ABC QWE CDE EFG EFG CDE ABC QWE ZXC 正如我所看到的我需要的是实现两个标记 INDENT 和 DEDENT 所以我可以编写如下内容 grammar
自动解析 PHP，将 PHP 代码与 HTML 分离

我正在开发一个大型 PHP 代码库我想将 PHP 代码与 HTML 和 JavaScript 分开我需要对 PHP 代码进行多次自动搜索和替换对 HTML 进行不同的搜索和替换对 JS 进行不同的自动搜索和替换有没有一个好的解析器
使用 Python 抓取维基百科数据

我正在尝试从以下内容中检索 3 列 NFL 球队球员姓名大学球队维基百科页面 http en wikipedia org wiki 2008 NFL draft 我是 python 新手一直在尝试使用 beautifulsoup 来
ANTLR 获取并拆分词法分析器内容

首先对我的英语感到抱歉我还在学习我为我的框架编写 Python 模块用于解析 CSS 文件我尝试了 regex ply python 词法分析器和解析器但我发现自己在 ANTLR 中第一次尝试我需要解析 CSS 文件中的注释
Python 中维基百科 API 中的 DisambiguationError 和 GuessedAtParserWarning

我想获得维基百科与搜索词相关的可能且可接受的名称列表在这种情况下是电晕当输入以下内容时 print wikipedia summary Corona 这给出了以下输出 home virej local lib python3 8 si
antlr4-tool 在 Win10 中失败，并显示：错误：命令失败：哪个 java

在Win10中运行为了尝试在Node JS中创建解析器我安装了ANTLR4工具 npm install save dev antlr4 tool Ran c prj parser node modules bin antlr4 tool
我正在尝试为 Antlr4 Python3.g4 语法文件生成解析树，以解析 python3 代码

我正在使用 ANTLR4 并尝试为我拥有的 python 文件生成解析树我使用了 ANTLR4 文档中的语法文件 python3 g4 我安装了antlr4 python3 runtime 并且运行了以下命令 antlr4 Dlangua
Antlr 词法分析器标记匹配相似的字符串，如果贪婪的词法分析器出错怎么办？

似乎有时 Antlr 词法分析器在标记字符流时对使用哪个规则做出了错误的选择我试图找出如何帮助 Antlr 做出对人类来说显而易见的正确选择我想像这样解析文本 d dt x a a d dt d 3 dt 4 这是现有语言使用的不幸语法
使用 MediaWiki API 下载图像？

是否可以使用 MediaWiki API 从维基百科下载图像不无法通过 API 获取图像 MediaWiki 中的图像仅存储在文件夹中而不是存储在数据库中并且不会动态传递更多信息请参见手册图像管理 http www mediaw
Xtext和ANTLR之间有什么关系？

我听说Xtext最终使用ANTLR 但他们的语法规范文件的格式有些不同那么两者之间是什么关系呢 Xtext 依赖于 Antlr 解析器生成器来解析输入文件除此之外该框架还提供了许多附加值例如强类型 AST 链接抽象和静态分析以及 E
ANTLR 中的布尔和算术表达式语法

我正在尝试编写算术和布尔表达式的语法我不明白我做错了什么对于我的语法 ANTLR 说致命规则logic atom 由于可从 alts 1 2 到达的递归规则调用而具有非 LL 决策通过左分解或使用语法谓词或使用 backtrack

随机推荐

Perl 无法在具有 32 GB RAM 的 Snow Leopard Mac 服务器上分配超过 1.1 GB 的空间

我有一台具有 32GB RAM 的 Mac 服务器雪豹当我尝试在 Perl v 5 10 0 中分配超过 1 1GB RAM 时出现内存不足错误这是我使用的脚本 usr bin env perl My snow leopard MA
学习 JavaScript 最好、最有效的书是什么？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
从 pandas 数据帧生成 sas7bdat 文件

我想知道是否有任何Python库支持这种转换目前我找到的选项是SASpy csv或SQL数据库但不成功这实际上不是一个编程问题但希望这不会成为问题我找到了这个帖子将 pandas 数据框导出为 SAS sas7bdat 格式 h
pandas 相当于对多列使用 STRING_AGG 进行分组

那么有没有一种方法可以对 DataFrame 对象进行分组然后对于剩余的列将所有条目放入一个集合或具有过滤的唯一值的列表中所以像这样的事情 Name Date Amount purchase 0 Jack 2016 01 31 1
绘制日志（n 除以 k）

我以前从未使用过 Matlab 我真的不知道如何修复代码我需要绘制 log 1000 over k 其中 k 从 1 到 1000 y x log nchoosek 1000 x fplot y 1 1000 Error Warning
为什么 C# 中的字典对象不能进行 XmlSerialized？

看来序列化是非常简单的假设键和值都是可序列化的还有什么比用 XML 表示键值对更简单的呢对于所有评论者首先我很欣赏您的回答但是我对 workoraunds 不太感兴趣网络上确实有很多 SerializedDictionary
jQuery 电子表格/网格插件，可从 Excel 复制/粘贴到 Excel [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个用于电子表格或网格之类的 jQuery 插件我发现了很多 jQuery Gridplugins https stackov
我可以使用自定义标签名称而不使用 Web 组件，仅用于样式设置吗？

令我惊讶的是如果我使用自定义标签名称然后将这些标签的样式设置为普通 html 标签的样式现代浏览器似乎不会抱怨它们的行为就像 span 元素并且像 div 元素如果我设置display block 我的意思是即使我不使用聚合物
如何在android中的表格布局中删除表格行

void init intcolumnwidth1 int scr wd 55 intcolumnwidth1 intcolumnwidth1 100 for int i 0 i lt strarr length 1 i strinarr
如何绕过守夜测试中的验证码人工检查？

我正在为 Backbone View 编写一个 Nightwatch 测试其中包括谷歌的 recaptcha 人工检查 https www google com recaptcha intro index html 显然测试是一个机器人
制作一个编译 Tensorflow 二进制文件的 Dockerfile 以使用：SSE4.1、SSE4.2 和 AVX 指令

那么 docker的目的之一就是轻松部署一个环境来测试软件对吧谁能告诉我如何编译 Tensorflow 二进制文件以在 docker 文件上使用 SSE4 1 SSE4 2 有人能指点我一个可以做到这一点的 docker 文件吗如果有
我可以在 Selenium 中设置远程允许源而不使用通配符吗？

我在使用 Selenium WebDriver 时遇到 WebSocket 问题描述了相同的问题here https groups google com g chromedriver users c xL5 13 qGaA 问题的解决方案
当 -adjustsFontSizeToFitWidth 设置为 YES 时，如何计算 UILabel 的字体大小？

When myLabel adjustsFontSizeToFitWidth YES 如果文本对于标签来说太长 UILabel 会自动调整字体大小例如如果我的标签只有 100px 宽并且我的文本太长无法适应当前的字体大小它会缩小字
如何在bash中转换两个日期时间的日期格式？

我必须将日期时间从 Apr 10 16 07 03 04 格式化为 10 12 16 07 03 04 BST 格式我正在使用以下功能 convert date local months Jan Feb Mar Apr May Jun J
不适用于比较字符[重复]

这个问题在这里已经有答案了
为什么使用 Git 而不是 Mercurial？（反之亦然。）[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Fig.set_figheight 和 Fig.set_figwidth 不起作用

为什么这段代码没有改变绘制的图形的大小 fig1 ax1 plt subplots nrows 1 ncols 3 fig1 set figheight 30 fig1 set figwidth 30 x np array 1 2 3 4
log4j自定义jdbc附加器，数据源

为了在我的 log4j 附加程序中使用数据源我编写了一个自定义附加程序附加程序尝试以 spring bean 的形式获取数据源但是 appender 无法获取 bean 我使用的技术栈是 mybatis tomcat spring 我
桌面应用程序 + Microsoft 身份验证错误

我对桌面应用程序开发的了解有限并且我在混合平台中开发了一个应用程序并且在从桌面应用程序进行 Microsoft 身份验证 Azure ad 期间遇到此错误消息仅当您从信任的商店或网站下载应用程序时才可以继续如果需要从 Azure 应
Antlrworks - 无关输入

我是这方面的新手因此我需要你的帮助我正在尝试解析 Wikipedia Dump 我的第一步是将它们定义的每个规则映射到 ANTLR 不幸的是我遇到了第一个障碍第 1 行 8 外部输入需要我不明白发生了什么事请帮助我 My cod

Antlrworks - 无关输入

EDIT

Antlrworks - 无关输入 的相关文章

随机推荐

热门标签

Antlrworks - 无关输入的相关文章