如何在 Java 中识别/处理文本文件换行符？

2023-12-24

我从不同的系统获取不同格式的文件，我需要将它们导入到我们的数据库中。导入过程的一部分是检查行长度以确保格式正确。我们似乎在处理来自添加了一个字符的 UNIX 系统的文件时遇到了问题。我怀疑这是由于 UNIX 和 Windows 平台上的回车编码不同所致。

除了检查该行的最后一个字符之外，是否有其他方法可以检测文件是在哪个文件系统上创建的？或者也许是一种将文件读取为文本而不是二进制的方式，我怀疑这是问题所在？

多谢你们！

Unix系统使用\nwindows 使用的行结尾\r\n和Mac使用\r。您无法检测到文件系统，因为它根本不重要。例如，如果我的编辑器支持的话，我可以在 Windows 上使用 \n 。这只是这些操作系统的标准，而不是要求。

正确的方法 - 假设你没有一个可以正确标记的函数，无论文件使用哪一行结尾 - 是搜索 \n 或 \r ，然后结束当前行并从剩余数据中删除所有字符在开始下一行之前是 \r 或 \n。但是，如果您有空行并且需要保留它们，这将导致问题。在这种情况下，您必须更仔细地查看换行符：

读取 \n 时，结束当前行并开始下一行
当读取 \r 时，结束当前行，如果下一个字符是 \n，则跳过它，并开始下一行，否则立即开始新行。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 Java 中识别/处理文本文件换行符？的相关文章

如何制作行业标准的桌面Java应用程序？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Java中使用正则表达式确定字符串是否为URL [重复]

这个问题在这里已经有答案了可能的重复检查字符串是否为有效 URL 的最佳正则表达式是什么 https stackoverflow com questions 161738 what is the best regular express
我们可以实例化一个抽象类吗？

在一次采访中有人问我我们是否可以实例化一个抽象类我的回答是不我们不能但是面试官告诉我错了我们可以我对此争论了一下然后他告诉我自己在家尝试一下 abstract class my public void mymethod
为什么这个基于java配置的Spring应用程序不能正常工作

我最近开始了一个使用 Spring 框架的项目目标是在没有 XML 配置文件只有 Java 代码的情况下开发它目前我将以下文件添加到我的项目中 WebAppConfig java EnableWebMvc ComponentScan
GAE 上奇怪的 500 错误

我今天开始在我的应用程序上收到此错误根本不记得更改任何内容每当我在本地尝试时它都工作正常但部署后我会收到此错误 EXCEPTION java lang ClassNotFoundException se myApp server My
Spring 应用程序启动前的 Spring Boot 设置日志记录

我有一个项目在启动 SpringApplication 之前需要日志记录机制我怎样才能做到这一点我尝试设置自己的日志记录机制 LogManager getLogManager readConfiguration 但在 Spring 应
Java 正则表达式中 \w 和 \b 的 Unicode 等效项？

许多现代正则表达式实现解释 w字符类简写为任何字母数字或连接标点符号通常下划线这样正则表达式就像 w 匹配像这样的词hello l ve GO 432 or gefr ig 不幸的是 Java 没有在爪哇 w仅限于 A Za
如何在 JAVA servlet 中处理压缩 (gzip) HTTP 请求（不是响应） - 简单示例？

我为这个问题苦苦挣扎了很长一段时间在找到一个简单的解决方案后想问一个问题和答案这个问题在堆栈溢出时以不同的方式被多次提出并且accepted solutions是partially correct and complex或谈论res
为什么 Java 类加载器找不到我的接口？

在下面的代码中我使用动态生成一个类sun tools javac Main 我将使用反射创建此类的新实例问题是我想避免使用 Reflection 来调用我为此类定义的方法因此我创建了一个 ProxyInvoker 来引用我在项目中定
此代码签名证书对于签名小程序有效吗？

我们购买了代码签名证书来签名小程序但在签名小程序时出现以下错误 C CM WEB INF gt jarsigner keystore code signing keystore C CM SweetApplet jar code sign
Java SimpleDateFormat("yyyy-MM-dd'T'HH:mm:ss'Z'") 给出时区作为 IST

我有 SimpleDateFormat 构造函数作为 SimpleDateFormat yyyy MM dd T HH mm ss Z 我正在解析字符串 2013 09 29T18 46 19Z 我读到这里 Z 代表GMT UTC时区但是
Lcom/google/firebase/FirebaseApp 类中没有虚拟方法 zzbqo()Z；或其超类（“com.google.firebase.FirebaseApp”的声明

在我的 Android 应用程序中编译应用程序时出现错误我正在最新的 android studio 中工作并使用 Firebase UI Auth 和 Firebase 数据库所有版本在应用程序级等级文件中都相同那么为什么我收到此
Android-如何在指定时间后台下载数据

我提前很抱歉没有发布任何代码主要是因为我一生都无法弄清楚我需要如何做我需要做的事情基本上在一天中的指定时间间隔例如下午 5 点我希望我的应用程序从我的服务器下载一些数据并将其存储在设备上这是为了减少每次运行应用程序时下载数据对我
Preg_match PHP 到 java 的翻译

我在将 php preg match 转换为 java 时遇到一些问题我以为我的一切都是正确的但它似乎不起作用这是代码原始PHP Pattern for 44 Character UUID pattern 0 9A F 44 if
无法使用 jolokia 从 Kafka 提取 JMX 数据

我已经在 centos 7 机器上安装了 Jolokia 并尝试使用 Jolokia 代理提取 Kafka 指标并使用 Nagios 插件 check jmx4perl 与 Icinga 监控工具集成以下是我遵循的配置步骤步骤1 下载
使 @Schedule 在集群环境中仅运行一次

我有两个 tomee 实例集群每个都有一个方法注释如下 Schedule dayOfWeek public void runMeDaily 我只想每天运行一次这个方法每天不两次每个实例一次我可以使用此处描述的标志仅在一个WebLog
使用 Maven 将值附加到文件中

我想在文件末尾附加一个值但我无法确定要使用哪个插件例子我要附加的值 myValue file value1 value2 myValue 追加后我知道我可以使用 antrun plugin 来做到这一点但是可以使用 Maven 插
请解释*贪婪量词的工作原理

Pattern ptn Pattern compile a Matcher mtch ptn matcher bbaac if mtch find System out println mtch group 输出不打印任何内容 Patte
Jsplitpane 自动调整大小

我有一个 JSPlitPane 它们之间有 50 的分隔线这工作正常但是当我在右侧添加一些 JLabels 时 jsplitpane 会忽略我的 50 分隔符左侧窗格会增加其大小并会挤压右侧窗格为什么会发生这种情况以及如何解决
为什么 JDOM 的 getChild() 方法返回 null？

我正在做一个关于 html 文档操作的项目我想要现有 html 文档中的正文内容将其修改为新的 html 现在我正在使用 JDOM 我想在我的编码中使用 body 元素为此我在编码中使用了 getChild body 但它向我的程序返

随机推荐

gdb布局asm在mac上不起作用？

gdb test gdb start Breakpoint 1 at 0x100000ec8 Starting program private tmp test Reading symbols for shared libraries do
jQuery 显示 5 秒然后隐藏

我在用着 show成功提交表单后显示隐藏消息如何让消息显示5秒然后隐藏您可以使用 delay http api jquery com delay 在动画之前像这样 myElem show delay 5000 fadeOut 如果不是
字符串是相同的（使用 `base::identical`），但与 `grepl` / `gsub` 的行为不同

相关将大写单词转换为标题大小写 https stackoverflow com questions 51857207 convert upper case words to title case 一些使用从在线获取的字符串的代码的行为与我
覆盖 as_json 或 to_json 模型类名

我想在 AR 模型上调用 to json 时修改类名 i e Book first to json gt book created at 2010 03 23 Book first to json root gt libro gt libr
具有多个 Web 配置转换的实体框架迁移

我已使用启用了迁移的 Entity Framework 5 在 Visual Studio 2010 中创建了一个 ASP NET MVC 4 项目我有多个针对不同环境调试暂存发布的 Web 配置文件这些文件将根据环境指定不同的
是否可以在 Xcode 中禁用 Swift 文档？

我没有使用 Swift 所以我不需要 Xcode 中的文档目前它只是与 Objective C 文档混淆是否可以在 Xcode 中禁用文档的 Swift 部分我强烈推荐Dash http kapeli com dash解决 Xcode
在 Matplotlib 中循环创建子图？

我正在使用这段代码它提供了一个又一个漂亮的图使用 IPython notebook 和 Pandas for subsm in subsl H7 subsm sumsubdesc2 table subsm ax1 H7 plot plt
尝试使用 HttpWebRequest 获取身份验证 cookie

我必须从安全站点抓取表格但无法登录该页面并检索身份验证令牌和任何其他关联的 cookie 我在这里做错了什么吗 public NameValueCollection LoginToDatrose var loginUriBuilder n
禁用 ASP.NET Web API 2 中的“所有”异常处理（为我自己的异常处理腾出空间）？

我想在中间件组件中连接异常处理如下所示 public override async Task Invoke IOwinContext context try await Next Invoke context catch Exceptio
如何在我的 C# 项目中安装“Html Agility Pack”？

我是一名 PHP 程序员对 C 完全陌生我已经从以下位置下载了 Html Agility Pack http html agility pack net http html agility pack net现在我需要将程序集添加到项目中
Thread 与 CompletableFuture

与使用 CompletableFuture 相比直接将代码传递给线程有什么优势 Thread thread new Thread gt do something thread start VS CompletableFuture
Phantomjs 使用 fs.write 追加到文件

如何使用附加到文件fs write 在同一文件上使用 fs write 会覆盖内容 var fs require fs try fs write file txt Hello World w fs write file txt Hello
Play 2.0 RESTful请求后处理

关于这个问题 https stackoverflow com questions 11060761 how can my play 2 app respond to different accept headers from the cli
没有模块命名常量

我想用 Tastypie 框架做示例应用程序我将 Tastypie 添加到已安装的应用程序并进行了修改urls py根据需要添加from tastypie api import Api 但当我打开http localhost 8000
iPhone 应用程序中出现奇怪的不需要的动画

我不想发布这个但我在我正在开发的 iPhone 应用程序中看到了不需要的动画我以前从未在我的应用程序或任何其他应用程序中见过这种情况此应用程序仅适用于 iOS 4 2 和 iPhone 即使在 iPhone4 上也会发生这种奇怪的情况
元组函数的 N 元版本

是否有一个库具有 n 元版本的元组函数例如first 等通过 Template Haskell 或使用其他方法理想情况下我想说 select 3 0 1 我们用它来表示 lambda x y z gt x y 对于一个通用的对于功能
如何在 Internet Explorer 中的全高表格中制作全高单元格

我有下一个html代码 table style width 100 height 100 tr td td tr table
我如何教 ProGuard 删除它保留但我不使用的东西？

我有一个 Android 项目proguard rules pro文件为app模块仅包含以下内容 ProGuard rules dontobfuscate dontwarn android arch util paging CountedD
获取特定格式日期的唯一 ID？

我有可以生成随机唯一 ID 的代码但是有没有办法可以编辑此代码以便它以特定方式如 yyyy mm dd 0001 获取日期我希望每次单击generateid按钮时最后4位数字加1 所以它将更改为 0002 这是我当前的代码有没有可
如何在 Java 中识别/处理文本文件换行符？

我从不同的系统获取不同格式的文件我需要将它们导入到我们的数据库中导入过程的一部分是检查行长度以确保格式正确我们似乎在处理来自添加了一个字符的 UNIX 系统的文件时遇到了问题我怀疑这是由于 UNIX 和 Windows 平台上的回车

如何在 Java 中识别/处理文本文件换行符？

如何在 Java 中识别/处理文本文件换行符？ 的相关文章

随机推荐

热门标签

如何在 Java 中识别/处理文本文件换行符？的相关文章