对 unicode 文件使用 getline 时出现问题

2023-12-25

更新：感谢 @Potatoswatter 和 @Jonathan Leffler 的评论 - 相当尴尬的是，我被调试器工具提示发现没有正确显示 wstring 的值 - 但它仍然不太适合我，我已经更新了问题以下：

如果我有一个小的多字节文件，我想读入一个字符串，我使用以下技巧 - 我使用getline分隔符为'\0' e.g.

std::string contents_utf8;
std::ifstream inf1("utf8.txt");
getline(inf1, contents_utf8, '\0');

这会读入整个文件，包括换行符。
但是，如果我尝试用宽字符文件做同样的事情，它就不起作用 - 我的wstring只读到第一行。

std::wstring contents_wide;
std::wifstream inf2(L"ucs2-be.txt");
getline( inf2, contents_wide, wchar_t(0) ); //doesn't work

例如，如果 unicode 文件包含由 CRLF 分隔的字符 A 和 B，则十六进制如下所示：

FE FF 00 41 00 0D 00 0A 00 42

基于这样的事实，使用带有“\0”的多字节文件 getline 读取整个文件，我相信getline( inf2, contents_wide, wchar_t(0) )应该读取整个 unicode 文件。然而事实并非如此 - 在上面的示例中，我的宽字符串将包含以下两个 wchar_t：FF FF

（如果我删除 wchar_t(0) ，它会按预期读取第一行（即FE FF 00 41 00 0D 00)

为什么 wchar_t(0) 不能用作定界 wchar_t 以便 getline 停止00 00（或者读到我想要的文件末尾）？
谢谢

您的 UCS-2 解码器行为不正常。的结果getline( inf2, contents_wide ) on FE FF 00 41 00 0D 00 0A 00 42应该0041 0000 = L"A"。假设您使用的是 Windows，则应正确转换行结尾，并且字节顺序标记不应出现在输出中。

建议仔细检查操作系统文档以了解如何设置区域设置。

EDIT:你设置了区域设置吗？

locale::global( locale( "something if your system supports UCS-2" ) );

locale::global( encoding_support::ucs2_bigendian_encoding );

其中encoding_support是某个库。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

对 unicode 文件使用 getline 时出现问题的相关文章

EF Core Group By 翻译支持条件总和

听说 EF Core 2 1 将支持翻译小组我感到非常兴奋我下载了预览版并开始测试它但发现我在很多地方仍然没有得到翻译分组在下面的代码片段中对 TotalFlagCases 的查询将阻止翻译分组工作无论如何我可以重写这个以便我
C 编程 - 文件 - fwrite

我有一个关于编程和文件的问题 while current NULL if current gt Id Doctor 0 current current gt next id doc current gt Id Doctor if curre
没有强命名的代码签名是否会让您的应用程序容易被滥用？

尝试了解authenticode代码签名和强命名我是否正确地认为如果我对引用一些 dll 非强命名的 exe 进行代码签名恶意用户就可以替换我的 DLL 并以看似由我签名但正在运行的方式分发应用程序他们的代码假设这是真的那么您似
秒表有最长运行时间吗？

多久可以Stopwatch在 NET 中运行如果达到该限制它会回绕到负数还是从 0 重新开始 Stopwatch Elapsed返回一个TimeSpan From MSDN https learn microsoft com en us
为什么当实例化新的游戏对象时，它没有向它们添加标签？ [复制]

这个问题在这里已经有答案了 using System Collections using System Collections Generic using UnityEngine public class Test MonoBehaviou
类模板参数推导 - clang 和 gcc 不同

下面的代码使用 gcc 编译但不使用 clang 编译 https godbolt org z ttqGuL template
用于登录 .NET 的堆栈跟踪

我编写了一个 logger exceptionfactory 模块它使用 System Diagnostics StackTrace 从调用方法及其声明类型中获取属性但我注意到如果我在 Visual Studio 之外以发布模式运行代
在 Windows 窗体中保存带有 Alpha 通道的单色位图会保存不同（错误）的颜色

在 C NET 2 0 Windows 窗体 Visual Studio Express 2010 中我保存由相同颜色组成的图像 Bitmap bitmap new Bitmap width height PixelFormat Form
如何从 appsettings.json 文件中的对象数组读取值

我的 appsettings json 文件 StudentBirthdays Anne 01 11 2000 Peter 29 07 2001 Jane 15 10 2001 John Not Mentioned 我有一个单独的配置类 p
关于 C++ 转换：参数 1 从“[some_class]”到“[some_class]&”没有已知的转换

我正在研究 C 并且遇到了一个错误我不知道确切的原因我已经找到了解决方案但仍然想知道原因 class Base public void something Base b int main Base b b something Base
C++ OpenSSL 导出私钥

到目前为止我成功地使用了 SSL 但遇到了令人困惑的障碍我生成了 RSA 密钥对之前使用 PEM write bio RSAPrivateKey 来导出它们然而手册页声称该格式已经过时实际上它看起来与通常的 PEM 格式不同相
创建链表而不将节点声明为指针

我已经在谷歌和一些教科书上搜索了很长一段时间我似乎无法理解为什么在构建链表时节点需要是指针例如如果我有一个节点定义为 typedef struct Node int value struct Node next Node 为什么为了
使用 Bearer Token 访问 IdentityServer4 上受保护的 API

我试图寻找此问题的解决方案但尚未找到正确的搜索文本我的问题是如何配置我的 IdentityServer 以便它也可以接受授权带有 BearerTokens 的 Api 请求我已经配置并运行了 IdentityServer4 我还在
什么时候虚拟继承是一个好的设计？ [复制]

这个问题在这里已经有答案了 EDIT3 请务必在回答之前清楚地了解我要问的内容有 EDIT2 和很多评论有或曾经有很多答案清楚地表明了对问题的误解我知道这也是我的错对此感到抱歉嗨我查看了有关虚拟继承的问题 class B p
如何查看网络连接状态是否发生变化？

我正在编写一个应用程序用于检查计算机是否连接到某个特定网络并为我们的用户带来一些魔力该应用程序将在后台运行并执行检查是否用户请求托盘中的菜单我还希望应用程序能够自动检查用户是否从有线更改为无线或者断开连接并连接到新网络并执行魔
如何从两个不同的项目中获取文件夹的相对路径

我有两个项目和一个共享库用于从此文件夹加载图像 C MainProject Project1 Images 项目1的文件夹 C MainProject Project1 Files Bin x86 Debug 其中有project1 ex
基于 OpenCV 边缘的物体检测 C++

我有一个应用程序我必须检测场景中某些项目的存在这些项目可以旋转并稍微缩放更大或更小我尝试过使用关键点检测器但它们不够快且不够准确因此我决定首先使用 Canny 或更快的边缘检测算法检测模板和搜索区域中的边缘然后匹配边缘以查
混合 ExecutionContext.SuppressFlow 和任务时 AsyncLocal.Value 出现意外值

在应用程序中由于 AsyncLocal 的错误意外值我遇到了奇怪的行为尽管我抑制了执行上下文的流程但 AsyncLocal Value 属性有时不会在新生成的任务的执行范围内重置下面我创建了一个最小的可重现示例来演示该问题 pr
哪种 C 数据类型可以表示 40 位二进制数？

我需要表示一个40位的二进制数应该使用哪种 C 数据类型来处理这个问题如果您使用的是 C99 或 C11 兼容编译器则使用int least64 t以获得最大的兼容性或者如果您想要无符号类型 uint least64 t 这些都定
如何在文本框中插入图像

有没有办法在文本框中插入图像我正在开发一个聊天应用程序我想用图标图像更改值等但我找不到如何在文本框中插入图像 Thanks 如果您使用 RichTextBox 进行聊天请查看Paste http msdn microsoft co

随机推荐

媒体播放器准备失败

过去 8 个小时我一直在尝试开发一个简单的录音播放应用程序我希望能够以 3GP 格式录制音频然后将其自动加载到MediaPlayer这样我就可以播放它我 80 确定它正在录制并保存到代码中指定的位置但是当我尝试将其加载到我的媒体播
在 Gear S2 设备上启动 Web 应用程序时出现错误 81

我正在使用 Tizen SDK 2 4 0 Rev5 在 Gear S2 上启动演示应用程序 HelloTizen wearable 2 3 但失败并出现以下错误 Unknown Error 81 Unknown Error 81 当我尝试
Javascript 模板 - 深度嵌套是否可能

我正在构建一个任务应用程序为了好玩我只是坐下来思考这个问题我在这里用文字把这个问题记在心里模型非常简单它包含以下集合Project 每个项目包含一个TaskList这些任务列表是nestable即例如一个任务设计首页可以有设计标头
std::unique_ptr 作为 std::thread 中函数的参数[重复]

这个问题在这里已经有答案了所以我想通过std unique ptr作为在单独线程中启动的函数的参数我在编译时收到一个奇怪的错误内容如下 1 gt c program files x86 microsoft visual studio
如何正确使用“cv2.putText”在图像上绘制阿拉伯文本？（Python+OpenCV）

我使用 python cv2 window10 python3 6 在图像中写入文本当文本是英文时它可以工作但是当我使用阿拉伯文本时它会在图像中写入混乱的代码下面是我的代码 import cv2 import numpy as np
fork() 和 vfork() 有什么区别？

有什么区别fork http pubs opengroup org onlinepubs 9699919799 functions fork html and vfork http man7 org linux man pages man2
如何使用 python win32com 或 comtypes 中的 COM 访问 IRTDServer？

环境 Windows 10 python 3 6 3 64 位也尝试过 32 位我是一名 Python 开发人员几乎第一次尝试使用 COM 但遇到了这个巨大的障碍 Problem 当我尝试使用在 dll 中实现的 IRTDServe
如何在 SQL Server 事务中设置“SET XACT_ABORT ON”？

我想设置SET XACT ABORT ON在带有事务的 SQL Server 2008R2 存储过程中因此在创建脚本中执行此操作 SET ANSI NULLS ON GO SET QUOTED IDENTIFIER ON GO SET X
使用 rvest 抓取时如何重用会话以避免重复登录？

我开发了一些代码来抓取交通数据这个话题 https stackoverflow com questions 38687068 with rvest how to extract html contents from the object r
当在 Chrome 的 Omnibox 上按下 Enter 时，Keyup 事件侦听器会触发

在 Chrome 浏览器中使用此代码片段时 document on keyup function alert Hey 每次我按下enter在网址栏中例如当我剪切并粘贴页面本身的网址时事件侦听器会触发为什么会发生这种情况 EDIT
在 V8 中使用数组（性能问题）

我尝试了下一个代码它在 Google Chrome 和 Nodejs 中显示了类似的结果 var t new Array 200000 console time wtf for var i 0 i lt 200000 i t push M
将您自己的 SQLite 数据库添加到 Android 应用程序

我们如何将自己的 SQLite 数据库添加到 android 项目中试试这个代码 public class DataBaseHelper extends SQLiteOpenHelper private Context mycontext
更改页面 url 而不刷新页面

这可能吗问题是这样的我使用此 URL 进行关键字搜索搜索后 http localhost thi search keyword key http localhost thi search keyword key 然后我有一个使用 Aj
Eclipse e4 工具装饰条中的控件

我想在装饰条中创建组合框所以我开始添加一个文本框我创建了 TrimBars gt WindowTrim gt Toolbar gt Tool Control 我还提到了 Class URI public class SearchTool
Android：如何跟踪软键盘是否打开？

在我的应用程序中设备软键盘覆盖了 EditTextView 因此用户无法看到他正在输入的内容所以我想隐藏其他视图比如我的例子中的按钮以使 EditTextViews 可见但相反做类似的事情 EditText onFocus hid
如何发送 ASP.NET Web 服务的参数

我有一个大学项目我应该在其中实现一个使用 Web 服务的 java 驱动的网站一些将创建为 servlet 另一些则应创建为 NET servlet 我创建了可以称为 loginservice username md5 的 java s
ember.js 和 bootstrap Accordion - 创建视图的“ember 方式”

我的问题不是如何使引导手风琴工作而是尝试确保我理解余烬的做事方式我在这里创建了一个引导手风琴的工作示例截至 2013 年 3 月 12 日 http jsfiddle net nrionfx s59fA http jsfiddle
如何在ggplot2中使用coord_polar移动x轴标签

我无法在下图中移动轴标签现场数据辅助数据等以便它们都很大并且完全适合图表整个代码如下关于做什么的建议 Datasource lt c Field data Participatory data Remotely sensed da
Jetpack Compose 导航 - 底部导航多个返回堆栈 - 查看模型范围问题

所以我有两个选项卡选项卡 A 和选项卡 B 每个选项卡都有自己的后堆栈我使用此中的代码实现了多个返回堆栈导航谷歌文档 https developer android com jetpack compose navigation val
对 unicode 文件使用 getline 时出现问题

更新感谢 Potatoswatter 和 Jonathan Leffler 的评论相当尴尬的是我被调试器工具提示发现没有正确显示 wstring 的值但它仍然不太适合我我已经更新了问题以下如果我有一个小的多字节文件我想读入一个

对 unicode 文件使用 getline 时出现问题

对 unicode 文件使用 getline 时出现问题 的相关文章

随机推荐

热门标签

对 unicode 文件使用 getline 时出现问题的相关文章