为什么u8'A'可以是char类型，而UTF-8最多可以是4个字节，而char通常是1个字节？

2024-01-01

我正在读书wchar_t在一般编程中有什么用？ https://stackoverflow.com/questions/13509733/并在接受的答案中发现一些令人困惑的事情：

更常见的是使用 char 进行可变宽度编码，例如UTF-8 或 GB 18030。

我从我的教科书中找到了这一点：

UTF-8的Unicode编码不是最多4个字节吗？char对于大多数平台来说是 1 个字节。我是否误解了什么？

更新：

经过搜索和阅读，现在我知道：

代码点和代码单元是不同的东西。代码点是唯一的，而代码单元依赖于编码。
u8'a'（这里是一个字符，不是字符串）只允许用于基本字符集（ASCII及其控制字符），其值是相应的'a'的代码单元值，对于ascii字符，代码单位与代码点的值相同。（这是什么@codekaizer的回答说）
std::string::size()返回代码单元。

所以编辑们都在处理代码单元正确的？如果我将文件编码从 utf8 更改为 uft32，则大小ə将会4?

utf8的unicode编码不是最多4个字节吗？

As per lex.ccon/3 https://timsong-cpp.github.io/cppwp/lex.ccon#3, 强调我的:

以 u8 开头的字符文字，例如 u8'w'，是一个字符 char 类型的文字，称为 UTF-8 字符文字。的价值 UTF-8 字符文字等于其 ISO 10646 代码点值，前提是代码点值可以用单身的 UTF-8 编码单元（也就是说，只要它位于 C0 控件和基本拉丁 Unicode 块）。如果该值无法用单个 UTF-8编码单元，程序为不规范的。 UTF-8 字符文字包含多个 c 字符是不规范的.

单个UTF-8编码单元为1字节。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

为什么u8'A'可以是char类型，而UTF-8最多可以是4个字节，而char通常是1个字节？的相关文章

使用 gcc 在 Linux 上运行线程构建块 (Intel TBB)

我正在尝试为线程构建块构建一些测试不幸的是我无法配置 tbb 库链接器找不到库 tbb 我尝试在 bin 目录中运行脚本但这没有帮助我什至尝试将库文件移动到 usr local lib 但这又失败了任何的意见都将会有帮助确定您
WPF DataGrid 多选

我读过几篇关于这个主题的文章但很多都是来自 VS 或框架的早期版本我想做的是从 dataGrid 中选择多行并将这些行返回到绑定的可观察集合中我尝试创建一个属性类型并将其添加到可观察集合中它适用于单个记录但代码永远不会触发多个
在 xaml 中编写嵌套类型时出现设计时错误

我创建了一个用户控件它接受枚举类型并将该枚举的值分配给该用户控件中的 ComboBox 控件很简单我在数据模板中使用此用户控件当出现嵌套类型时问题就来了我使用这个符号来指定 EnumType x Type myNamespace
机器Epsilon精度差异

我正在尝试计算 C 中双精度数和浮点数的机器 epsilon 值作为学校作业的一部分我在 Windows 7 64 位中使用 Cygwin 代码如下 include
传递给函数时多维数组的指针类型是什么？ [复制]

这个问题在这里已经有答案了我在大学课堂上学习了 C 语言和指针除了多维数组和指针之间的相似性之外我认为我已经很好地掌握了这个概念我认为由于所有数组甚至多维都存储在连续内存中因此您可以安全地将其转换为int 假设给定的数组是in
如何连接重叠的圆圈？

我想在视觉上连接两个重叠的圆圈以便 becomes 我已经有部分圆的方法但现在我需要知道每个圆的重叠角度有多大但我不知道该怎么做有人有主意吗 Phi ArcTan Sqrt 4 R 2 d 2 d HTH Edit 对于两个不同的半
无限循环与无限递归。两者都是未定义的吗？

无副作用的无限循环是未定义的行为看here https coliru stacked crooked com view id 24e0a58778f67cd4举个例子参考参数 https en cppreference com w cpp
如何使从 C# 调用的 C（P/invoke）代码“线程安全”

我有一些简单的 C 代码它使用单个全局变量显然这不是线程安全的所以当我使用 P invoke 从 C 中的多个线程调用它时事情就搞砸了如何为每个线程单独导入此函数或使其线程安全我尝试声明变量 declspec thread 但
WPF 数据绑定到复合类模式？

我是第一次尝试 WPF 并且正在努力解决如何将控件绑定到使用其他对象的组合构建的类例如如果我有一个由两个单独的类组成的类 Comp 为了清楚起见请注意省略的各种元素 class One int first int second cla
重载 (c)begin/(c)end

我试图超载 c begin c end类的函数以便能够调用 C 11 基于范围的 for 循环它在大多数情况下都有效但我无法理解和解决其中一个问题 for auto const point fProjectData gt getPoi
C# 列表通用扩展方法与非通用扩展方法

这是一个简单的问题我希望集合类中有通用和非通用方法例如List
x:将 ViewModel 方法绑定到 DataTemplate 内的事件

我基本上问同样的问题这个人 https stackoverflow com questions 10752448 binding to viewmodels property from a template 但在较新的背景下x Bind V
两个类可以使用 C++ 互相查看吗？

所以我有一个 A 类我想在其中调用一些 B 类函数所以我包括 b h 但是在 B 类中我想调用 A 类函数如果我包含 a h 它最终会陷入无限循环对吗我能做什么呢仅将成员函数声明放在头文件 h 中并将成员函数定义放在实现文
C# 动态/expando 对象的深度/嵌套/递归合并

我需要在 C 中合并 2 个动态对象我在 stackexchange 上找到的所有内容仅涵盖非递归合并但我正在寻找能够进行递归或深度合并的东西非常类似于jQuery 的 extend obj1 obj2 http api jquer
复制目录下所有文件

如何将一个目录中的所有内容复制到另一个目录而不循环遍历每个文件你不能两者都不Directory http msdn microsoft com en us library system io directory aspx nor Dir
相当于Linux中的导入库

在 Windows C 中当您想要链接 DLL 时您必须提供导入库但是在 GNU 构建系统中当您想要链接 so 文件相当于 dll 时您就不需要链接为什么是这样是否有等效的 Windows 导入库注意我不会谈论在 Win
C# 中的 IPC 机制 - 用法和最佳实践

不久前我在 Win32 代码中使用了 IPC 临界区事件和信号量 NET环境下场景如何是否有任何教程解释所有可用选项以及何时使用以及为什么微软最近在IPC方面的东西是Windows 通信基础 http en wikipedia org
使用特定参数从 SQL 数据库填充组合框

我在使用参数从 sql server 获取特定值时遇到问题任何人都可以解释一下为什么它在 winfom 上工作但在 wpf 上不起作用以及我如何修复它我的代码 private void UpdateItems COMBOBOX1 Ite
指针和内存范围

我已经用 C 语言编程有一段时间了但对 C 语言还是很陌生有时我对 C 处理内存的方式感到困惑考虑以下有效的 C 代码片段 const char string void where is this pointer variable l
类型或命名空间“MyNamespace”不存在等

我有通常的类型或命名空间名称不存在错误除了我引用了程序集 using 语句没有显示为不正确并且我引用的类是公共的事实上我在不同的解决方案中引用并使用相同的程序集来执行相同的操作并且效果很好顺便说一句这是VS2010 有人有什么

随机推荐

比较两个文本文件并将差异写入文本文件

我想比较两个文本文件并将差异输出到另一个文本文件中 Location c temp z txt compare object get content c temp hostname old txt get content c temp ho
这句话是什么意思

unlike SwingUtilities invokeAndWait the event thread is permitted to call SwingUtilities invokeLater 我无法清楚地理解这一点请帮助我另一
Angular 6 router - 替换当前路由的一些参数

在我的 Angular 6 解决方案中网址具有以下结构语言 app section object id view queryparams 语言选择器组件由应用程序的所有部分共享并且包含在父路由之一的模板中以便它出现在所有子路由中当
如何使用 xlwings 保存工作簿？

我有一个 Excel 工作表一些按钮和一些宏我使用 xlwings 来使其工作有没有办法通过 xlwings 保存工作簿我想在执行操作后提取特定的工作表但保存的工作表是操作前提取的工作表没有生成的数据我提取所需工作表的代码如下
PowerShell 帮助文件无法正确显示

在 Windows 10 和 Windows Server 2012 上的 PowerShell 4 0 5 0 中进行了测试 clear help wmiobject or cls man job 清除屏幕后帮助文件无法正确显示结果重
Pandas 的 concat 函数中的“级别”、“键”和名称参数是什么？

问题我该如何使用pd concat 是什么levels论据是什么keys论据是否有很多示例可以帮助解释如何使用所有参数 Pandas concat函数是瑞士军刀 https en wikipedia org wiki Swiss Ar
是否可以清除 Ionic 中的视图缓存？

我目前正在开发 Angular Ionic Cordova 项目我们最近升级到了最新的 Ionic beta 从项目之前使用的版本开始这里引入了视图缓存然而这样做也带来了一个问题该应用程序面向客户并且非常以数据为中心然而目前用
ng-repeat 中的角度验证不起作用

我很难使用 ng repeat 语句进行验证我有以下代码我只是希望当名称字段为空时将 has error 添加到 div form group 中我似乎无法让它发挥作用有什么想法吗我在小提琴手中的尝试 http jsfiddle
Admob 在 Google Admob 面板中找不到转账资金链接 [已关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我在 google admob 中找不到转账资金链接我的余额超过 50 美元并且我的付款信息已填写完整但我无法转账请帮助我在哪里
如何检查网站是否支持 HTTP/2 协议

关于这个问题有很多话题HTTP 2 https en wikipedia org wiki HTTP 2协议但我想知道是否有一个使用该协议的工作网站 I e 我们可以决定使用http or https 但是我们如何编写 HTTP 2 请求
为什么我无法关闭 Hibernate SessionFactory 并重新打开它并且它仍然可以工作？

我在关闭 Hibernate 会话工厂时遇到问题我的应用程序允许用户重新创建数据库因此当他们想要这样做时我首先关闭 Hibernate 会话工厂以释放 Hibernate 对数据库的控制 public static void clos
在 VBS 脚本中使用 SAPI 语音识别？

我发现这个一行示例允许在 VBScript 中使用 Windows SAPI 文本转语音功能 CreateObject SAPI SpVoice Speak This is a test 我想知道 SAPI 语音识别是否可以以同样简单的方式
cassandra获取时间范围内的所有记录

我必须使用以 user id 时间戳作为键的列族在我的查询中我想获取给定时间范围内的所有记录与 user id 无关这是确切的表架构 CREATE TABLE userlog user id text ts timestamp a
UrlFetchApp.fetch() google.com 上的内容不完整

我从 Google Apps 脚本编码开始所以我尝试了这个例子获取网址 https developers google com apps script reference url fetch url fetch app hl de f
Android 中的 OpenGL 入门...

我是一位经验丰富的 Android 开发人员如果存在的话以前从未使用过 OpenGL Android 平台的各种优势开源开放分发可移植等使我认为它可能是最终进入 OpenGL 的绝佳环境但我也担心对于以前从未使用过 3D 图
上传后使用 LiipImagineBundle 调整图像大小？

我正在使用LiipImagine捆绑包 https github com liip LiipImagineBundle使用 Symfony 2 1 并希望在上传时调整用户上传的图像大小然后将其保存到永久文件系统位置以剥离元数据强制 j
IllegalStateException“系统服务在 onCreate() 之前不可用于活动”

我调查了这个问题但找不到适合我的代码的任何解决方案我有四节课但我确信名为 Connect 的类没有问题您将在下面的 JsonData 类上看到它的对象所以我共享其他三个类我的主要活动是 public class MainAct
在构造函数中初始化指针的正确方法

我有以下练习 Add代码使其正常运行 class MyInt public private int MyValue int main int argc char argv MyInt x 1 a bit more code where th
Tomcat 中部署的 Spring boot 应用程序中的 @ExceptionHandler 没有返回 @ResponseBody

我有一个 Spring Boot Web 应用程序它在 STS 中运行得很好但在从 WAR 文件在 Tomcat 中运行时显示出不同的行为我使用 Thymeleaf 处理所有网页但有几个页面使用 jQuery 发送异步调用并使用户体
为什么u8'A'可以是char类型，而UTF-8最多可以是4个字节，而char通常是1个字节？

我正在读书wchar t在一般编程中有什么用 https stackoverflow com questions 13509733 并在接受的答案中发现一些令人困惑的事情更常见的是使用 char 进行可变宽度编码例如UTF 8 或 GB

为什么u8'A'可以是char类型，而UTF-8最多可以是4个字节，而char通常是1个字节？

为什么u8'A'可以是char类型，而UTF-8最多可以是4个字节，而char通常是1个字节？ 的相关文章

随机推荐

热门标签

为什么u8'A'可以是char类型，而UTF-8最多可以是4个字节，而char通常是1个字节？的相关文章