为什么 \R 在 Java 8 和 Java 9 之间的正则表达式中表现不同？

2024-01-01

以下代码可在 Java 8 和 9 中编译，但行为不同。

class Simple {
    static String sample = "\nEn un lugar\r\nde la Mancha\nde cuyo nombre\r\nno quiero acordarme";

    public static void main(String args[]){
        String[] chunks = sample.split("\\R\\R");
        for (String chunk: chunks) {
            System.out.println("Chunk : "+chunk);
        }
    }
}

当我使用 Java 8 运行它时，它返回：

Chunk : 
En un lugar
de la Mancha
de cuyo nombre
no quiero acordarme

但是当我使用 Java 9 运行它时，输出有所不同：

Chunk : 
En un lugar
Chunk : de la Mancha
de cuyo nombre
Chunk : no quiero acordarme

Why?

The Java 文档 https://docs.oracle.com/javase/9/docs/api/java/util/regex/Pattern.html不符合 Unicode 标准。 Javadoc 错误地说明了什么\R应该匹配。上面写着：

\R任何 Unicode 换行序列，相当于\u000D\u000A|[\u000A\u000B\u000C\u000D\u0085\u2028\u2029]

Java 文档有很多问题。在其关于 R1.6 换行符的部分，关于正则表达式的 Unicode 技术标准 #18 http://unicode.org/reports/tr18/#Line_Boundaries明确指出：

强烈建议使用正则表达式元字符，例如“\R”，用于匹配上面列出的所有行结束字符和序列（例如，#1 中）。这将对应于与以下表达式等效的内容。由于需要避免备份，该表达式稍微复杂一些。
 (?:\u{D A}|(?!\u{D A})[\u{A}-\u{D}\u{85}\u{2028}\u{2029}]

换句话说，它只能匹配两个代码点 CR+LF（回车 + 换行）序列or else该集合中的单个代码点，前提是它是not只是一个回车符，然后是一个换行符。那是因为它是不允许备份。 CRLF 必须是原子的\R才能正常运作。

因此Java 9不再符合R1.6强烈推荐的内容。此外，它现在正在做一些在 Java 8 中不应该做、也没有做的事情。

看来我又该给谢尔曼（读：沉雪明）喊一声了。我之前曾与他一起处理过这些正式一致性的具体问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 \R 在 Java 8 和 Java 9 之间的正则表达式中表现不同？的相关文章

使用 LinkedList 实现下一个和上一个按钮

这可能是一个愚蠢的问题但我很难思考清楚我编写了一个使用 LinkedList 来移动加载的 MIDI 乐器的方法我想制作一个下一个和一个上一个按钮以便每次单击该按钮时都会遍历 LinkedList 如果我硬编码itr next or
如何在java中将一个数组列表替换为另一个不同大小的数组列表

我有两个大小不同的数组列表如何从此替换 ArrayList
Pig Udf 显示结果

我是 Pig 的新手我用 Java 编写了一个 udf 并且包含了一个 System out println 其中的声明我必须知道在 Pig 中运行时该语句在哪里打印假设你的UDF 扩展了 EvalFunc 您可以使用从返回的 Log
如何在 Spring 中禁用使用 @Component 注释创建 bean？

我的项目中有一些用于重构逻辑的通用接口它看起来大约是这样的 public interface RefactorAwareEntryPoint default boolean doRefactor if EventLogService wa
来自 dll 的 Java 调用函数

我有这个 python 脚本导入zkemkeeperdll 并连接到考勤设备 ZKTeco 这是我正在使用的脚本 from win32com client import Dispatch zk Dispatch zkemkeeper ZKE
检测并缩短字符串中的所有网址

假设我有一条字符串消息您应该将 file zip 上传到http google com extremelylonglink zip http google com extremelylonglink zip not https stack
Eclipse Maven Spring 项目 - 错误

I need help with an error which make me crazy I started to study Java EE and I am going through tutorial on youtube Ever
像 Java 这样的静态类型语言中动态方法解析背后的原因是什么

我对 Java 中引用变量的动态静态类型和动态方法解析的概念有点困惑考虑 public class Types Override public boolean equals Object obj System out println i
如何在用户输入数据后重新运行java代码

嘿我有一个基本的java 应用程序显示人们是成年人还是青少年等我从java开始在用户输入年龄和字符串后我找不到如何制作它它们被归类为我希望它重新运行整个过程以便其他人可以尝试的节目我一直在考虑做一个循环但这对我来说没有用
如何对不同的参数类型使用相同的java方法？

我的问题我有 2 个已定义的记录创建对象请求更新对象请求必须通过实用方法进行验证由于这两个对象具有相同的字段因此可以对这两种类型应用相同的验证方法现在我只是使用两种方法进行重载但它很冗长 public record Crea
如何在谷歌地图android上显示多个标记

我想在谷歌地图android上显示带有多个标记的位置问题是当我运行我的应用程序时它只显示一个位置标记这是我的代码 public class koordinatTask extends AsyncTask
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
尝试将 Web 服务部署到 TomEE 时出现“找不到...的 appInfo”

我有一个非常简单的项目用于培训目的它是一个 RESTful Web 服务我使用 js css 和 html 创建了一个客户端我正在尝试将该服务部署到 TomEE 这是我尝试部署时遇到的错误我在这里做错了什么刚刚遇到这个问题我曾
使用 AsyncTask 传递值

我一直在努力解决这个问题但我已经到了不知道该怎么办的地步我想做的是使用一个类下载文件并将其解析为字符串然后将该字符串发送到另一个类来解析 JSON 内容所有部件都可以单独工作并且我已经单独测试了所有部件我只是不知道如何将值发送到
专门针对 JSP 的测试驱动开发

在理解 TDD 到底是什么之前我就已经开始编写测试驱动的代码了在没有实现的情况下调用函数和类可以帮助我以更快更有效的方式理解和构建我的应用程序所以我非常习惯编写代码 gt 编译它 gt 看到它失败 gt 通过构建其实现来修复它的过程
标准化 UTF-8 到底是什么？

The 重症监护室项目 http userguide icu project org transforms normalization 现在也有一个PHP库 http us php net manual en class normalize
如何使用mockito模拟构建器

我有一个建造者 class Builder private String name private String address public Builder setName String name this name name retur
使用正则表达式提取两个短语之间的所有单词[重复]

这个问题在这里已经有答案了我正在尝试使用以下正则表达式提取两个短语之间的所有单词 b item W w W 0 2 1 one W w W 0 3 business b b item W w W 0 2 3 three W w W 0 3
使用反射覆盖最终静态字段是否有限制？

在我的一些单元测试中我在最终静态字段上的反射中遇到了奇怪的行为下面是说明我的问题的示例我有一个基本的 Singleton 类其中包含一个 Integer public class BasicHolder private static
如果没有抽象成员，基类是否应该标记为抽象？

如果一个类没有抽象成员可以将其标记为抽象吗即使没有实际理由直接实例化它除了单元测试是的将不应该实例化的基类显式标记为抽象是合理且有益的即使在没有抽象方法的情况下也是如此它强制执行通用准则来使非叶类抽象它阻止其他程序员创建该类

随机推荐

从文本文件中提取两个分隔符之间的文本

我目前正在写关于首席执行官自恋的硕士论文为了衡量它我必须进行财报电话文本分析我按照 python 中提供的答案编写了一段代码这个链接 https stackoverflow com questions 36559356 extract
Ruby on Rails：为什么我在 Rails 后收到有关 javascript 和 css 的消息？

轨道 gt Started GET assets application css body 1 for 127 0 0 1 at 2011 10 11 03 37 03 0900 Served asset application css 3
JPA：如何覆盖@Embedded属性的列名

Person class Embeddable public class Person Column public int code 嵌入在里面Event两个不同属性的两倍 manager and operator Entity publi
ICMP 是传输层协议吗？

我正在观看有关网络的视频讲座讲师提到 ICMP 作为传输层协议然而谷歌搜索它显示了各种论坛将其描述为网络层协议这让我很困惑有人可以澄清一下吗传输层协议涉及端到端发送数据并确保或明确不确保可靠性 TCP 用于将数据从一台计算机
需要对我的 SSE/Assembly 尝试提出一些建设性的批评

我正在努力将一些代码转换为 SSE 虽然我有正确的输出但它比标准 C 代码慢我需要执行此操作的代码是 float ox p2x px c py s m float oy p2y px s py c m 我得到的 SSE 代码是 void
更改 Excel ActiveX 列表框的名称

我有一组 ActiveX 控件和子控件它们像这样组合在一起用户在 ActiveX 文本框中键入内容 TextBox Click 触发 3 个子程序的执行第一个子更新工作表上命名范围的值根据更新后的值使用偏移函数在 Excel 中创
PHP 中的共享内存文件

I use openssl pkcs7 sign and openssl pkcs7 encrypt创建加密数据这些函数仅接受文件名我想将临时文件存储在共享内存中以提高性能我明白在 Linux 中我可以file put content
Firefox 中与 JavaScript 事件相关的 F5 和 Ctrl-F5 有什么区别？

When you try this public page http slim nl shop default aspx http slim nl shop default aspx update meanwhile this site h
如何在工具提示中显示图像？

当您将鼠标放在链接上时我想在工具提示中显示图像我正在使用 HTML CSS 和 JAVASCRIPT JQUERY 我将图像保存在一个文件夹中因此我从本地主机引用它我尝试通过 JQuery 设置工具提示的内容 document re
Net Core 2 - 实体框架：更新不同环境的数据库

FACTS net核心2 0项目实体框架代码优先不同环境的不同appsettings json文件我利用包管理器控制台生成数据库脚本添加迁移更新数据库如果我运行 PM gt Get DbContext 它会带回从我的 apps
Blazor 组件：当模型从子组件更新时刷新父组件

我在 ASP NET Core 3 预览版 4 中使用服务器端 Blazor 组件我有一个父组件和子组件使用相同的共享模型如下所示 Model public class CountModel public int Count get
检查字符串是否包含 Velocity 中的特定子字符串

在 Velocity 中我有一个名为 url 的变量其中包含以下字符串 ContentId 2 7507 ContentId 2 7508 ContentId 1 44551 我想检查该字符串是否包含子字符串 1 44551 这是我到目
从 MTKView 创建的 UIImage 会导致颜色/不透明度差异

当我将 MTKView 的内容捕获到 UIImage 中时生成的图像看起来有质量上的不同如下所示我用来生成 UIImage 的代码如下 let kciOptions kCIContextWorkingColorSpace CGColo
Material UI - 禁用 DataGrid 中的多行选择

我想阻止 Material UIDataGrid多个复选框部分当我选择复选框部分时应选择特定行而其他行保持未选中状态我尝试过disableMultipleSelection选项但它不起作用
无法从 Android Studio Assistant 连接到 Firebase

我尝试从 Android Studio Assistance 连接到 Firebase 但尽管有互联网连接但仍出现以下错误当您达到 FireBase 上 FireBase 允许您为每个 FireBase 帐户创建的项目总数限制时就会出
更改循环内的变量名称

我正在尝试创建一个循环该循环将创建一个新变量但也会自动更改变量的名称例如自动增加值不确定这是否可能因为你不能有动态变量 if cin get n m Add an integer to m string 1 m Trying to
无法使用jdk8和netbeans 8打开Web服务测试器页面

我编写了一个简单的 Web 服务程序但无法在 glassfish 4 0 Web 服务器上测试它当我测试 Web 服务时我看到以下消息确保服务已成功部署并且服务器正在运行我可以在 glassfish Web 服务器上部署的 We
调用成员过程 NULL SELF 参数 Oracle

我有一个类型myType用成员过程声明insert obj 当我尝试这段代码时出现以下错误 declare v obj myType begin v obj insert obj 1 2 3 end ORA 30625 method di
找不到模块，webpack 别名与 typescript React

我正在尝试在 webpack 中实现一些别名我想要做的是不要使用它从组件文件夹导入 App js 上的组件 components layout Header Header 我要这个 components layout Header He
为什么 \R 在 Java 8 和 Java 9 之间的正则表达式中表现不同？

以下代码可在 Java 8 和 9 中编译但行为不同 class Simple static String sample nEn un lugar r nde la Mancha nde cuyo nombre r nno quiero

为什么 \R 在 Java 8 和 Java 9 之间的正则表达式中表现不同？

为什么 \R 在 Java 8 和 Java 9 之间的正则表达式中表现不同？ 的相关文章

随机推荐

热门标签

为什么 \R 在 Java 8 和 Java 9 之间的正则表达式中表现不同？的相关文章