ASCII - 代码点与字符编码

2024-05-01

我发现一篇有趣的文章“字符代码问题教程”（http://jkorpela.fi/chars.html#code http://jkorpela.fi/chars.html#code）解释了术语“字符代码”/“代码点”和“字符编码”。

前者只是分配给一个字符的整数。例如 65 到字符 A。字符编码定义了如何通过一个或多个字节表示这样的代码点。

对于古老的 ASCII，作者说道：“ASCII 标准指定的字符编码非常简单，对于代码编号不超过 255 的任何字符代码来说，最明显的一个是：每个代码编号都表示为一个八位位组，其中相同的值。”

因此，A 的代码点 65 将被编码为 0100 0001。

因为我有 127 个 ASCII 字符，所以有 127 个代码点，其中每个代码点始终由一个字节编码。

如果我总结一下，我有以下步骤来对 ASCII 字符进行编码：

为每个字符分配一个数字（代码点）（例如 A->65）
使用具有相同值的字节对字符进行编码（例如 0100 0001）

所以对于字母 A 和 B 来说是

A -> 65 -> 0100 0001 乙 -> 66 -> 0100 0010

我的问题是：

为什么代码点和 ASCII 编码要分离？ ASCII 只有一种编码。因此，至少对于 ASCII，我不清楚为什么要完成中间步骤（映射到整数）。直接编码如

一个-> 0100 0001 乙 -> 0100 0010

也可能吗？如果我对一个 ASCII 字符有多种编码，那么分离是合理的，但只有一种编码形式对我来说没有意义。

你说得对。每个概念不一定需要特定编码的可辨别的实现。但是，在一般讨论字符集和编码时，最好区分所有概念。

实际上，您可以认为 ASCII 有两种编码，一种是 7 位，一种是 8 位。 7 位与在字节的第 8 位具有奇偶校验位的方案一起使用。 Unicode 以其多种编码而闻名，包括 UTF-8、UTF-16 和 UTF-32。

缺少术语：代码单元。编码将代码点映射到代码单元序列。代码单元是固定大小的整数。您可能知道，大于 8 位的整数具有字节顺序（也称为字节序）。这导致 UTF-16 和 UTF-32 具有大端和小端变体。

计算机化文本的基本规则：使用写入文件或流的编码进行读取。表示文本的字节必须伴有编码知识，编码知识来自声明、标准、约定、规范……。

ASCII 中有 128 个代码点。大多数时候提到 ASCII 是不正确的。请求说明 ASCII 的规范或进行更正。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

encoding

characterencoding

ascii

ASCII - 代码点与字符编码的相关文章

.NET：如何判断编码是否支持字符串中的所有字符？

我需要输出大量文本其中包括多种语言的各种字符有时我需要以 Unicode 以外的字符编码例如 Shift JIS 或 ISO 8859 2 输出文本以便匹配它要访问的页面如果文本中包含编码无法处理的字符例如 ISO 8859 2
如何在Python 3中将文本流编码为字节流？

将字节流解码为文本流很容易 import io f io TextIOWrapper io BytesIO b Test nTest n utf 8 f readline 在这个例子中 io BytesIO b Test nTest n 是
从命令行执行查询时出现 PostgreSQL 编码问题

我正在尝试执行存储在文件中的 SQL 查询我正在使用以下命令来执行 psql d DB NAME a f QUERY NAME sql 我在 SQL 文件中有一些非英语文本例如执行查询时数据库中的文本如下所示我如何执行查询命令行以
使用python编辑html，但是lxml将漂亮的html实体转换为奇怪的编码

我正在尝试使用 python 带有 pyquery 和 lxml 来更改和清理一些 html Eg html div p It 146 s a spicy meatball p div lxml html clean 函数 clean ht
如何让 IE 以 UTF-8 格式发布 FORM 数据？

这是这个问题的延续 Java Jersey 以字节数组形式接收表单参数 https stackoverflow com questions 6282626 java jersey receive form parameter as byte
将 .parquet 编码为 io.Bytes

目标将 Parquet 文件上传到 MinIO 这需要将文件转换为字节我已经能够做到这一点了 csv json and txt bytes data to csv encode utf 8 bytes json dumps self d
SQL Server 2005 - 字符编码问题

我正在尝试将此值 llko 存储到 SQL Server 中的列中该列是 nvarchar 1000 插入语句如下所示 N llko 但里面的数据仍然显示为 a llkoa 关于我可以尝试什么的任何想法 EDIT 我刚刚意识到我已经更改了
UTF8/UTF16 和 Base64 在编码方面有什么区别

In c 我们可以使用下面的类来进行编码 System Text Encoding UTF8 System Text Encoding UTF16 System Text Encoding ASCII 为什么没有System Text En
如何将unicode文本转换为可读的utf8文本？

我遇到了关于 Unicode 和 utf8 的严重问题我将一段阿拉伯语波斯语文本文件保存到记事本中并保存现在我看到我的信息如下我的问题是如何取回我的数据取回这些数据对我来说很重要提前致谢该段落通过另存为代码页 1256 阿拉伯
Golang 结构的 XML 和 JSON 标签？

我有一个可以根据 HTTP 请求标头输出为 JSON 或 XML 的应用程序我可以通过将正确的标签添加到我正在使用的结构中来实现正确的输出但我不知道如何为 JSON 和 XML 指定标签例如序列化以纠正 XML type Foo s
在网络浏览器上显示 UTF-16 字符

我打印了一些 UTF 16 编码的字符并尝试在 Firefox 中显示它它显示为所以我进入工具 gt 编码并将编码从 UTF 8 更改为 UTF 16 我也尝试直接在 HTML 中更改字符集但是当我这样做时我的页面完全被符号淹
使用 JSON 传递 HTML

我正在使用 JSON 将数据传递到 iPhone 和 iPad 数据的一个字段是 HTML 问题是编码这是我得到的回复 gt GadgetHTML strong Hello strong gt from Catworld br n img
将 UTF-8 设置为 Heroku 中的默认字符串编码

我需要在 Heroku 中将默认的 ruby 字符串编码更改为 UTF 8 由于某种原因它是 US ASCII heroku console Ruby console for myapp heroku com gt gt a encodin
PHP 中的 JS charCodeAt 等效项（具有完整的 unicode 和 emoji 兼容性）

我在 JS 中有一个简单的代码如果涉及特殊字符我无法在 PHP 中复制它这是 JS 代码参见JSFiddle https jsfiddle net h8oca3qg 5 用于输出 var str t char t and speci
字符编码失败，为什么\xBD在PHP + HTML中显示不正确

我只是想更好地理解字符编码所以我做了一些测试我有一个保存为 UTF 8 的 PHP 文件如下所示页面本身
如何删除 utf-8 中无法识别的字符？ mysql/php

我有一个设置为 utf 8 的 mysql 数据库我已将 php 标头设置为 header Content Type text html charset utf 8 在我的html中当我返回任何带有圆引号或撇号的内容时它们显示为无法识
如何使用mb_detect_encoding检测编码是否正确？

我想检测编码是否正确但我发现 mb detect encoding 总是得到错误结果并且我添加了很多encoding list UTF8 ISO 8859 你试图做的事情只是有时作品编码检测并不是一门精确的科学因此您能做的最好的事
如何在 Rails 3 中强制对 HTML 电子邮件进行字符编码？

我正在使用 Rails 3 1 3 1 1 RC1 并且我已配置 ActionMailer 以使用windows 1252作为默认编码外部要求这与纯文本邮件完美配合但一旦我发送 HTML 邮件文本就会转换为UTF 8再次导致乱码文本
Windows-1251 到 UTF-8 代码

我在 Windows 1251 代码表中有字符代码如何获取UTF 8编码表中该字符的编码例如我有字符在 Windows 1251 中编码等于 192 适当的 utf 8 代码等于 1040 我如何使用 Windows 1251 代码
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但

随机推荐

如何循环用户输入直到输入整数？

我想运行一个交互式程序提示用户输入学生人数如果用户输入除整数之外的字母或其他字符则应再次询问他们输入学生人数我有以下代码 public int createArrays Scanner s int size System out
Neo4j 的 Cypher 查询语言是开源的吗？

Neo4j的语言Cypher的现状如何我真的很喜欢它但我想避免 Neo4j 锁定是否还有像 Gremlin 中那样的其他 Cypher 界面 Regards Cypher 完全是 OSS 请参阅https github com neo
如何使用 Perl 从纯文本中提取 URL？

我需要 Perl 正则表达式来解析纯文本输入并将所有链接转换为有效的 HTML HREF 链接我已经尝试了在网上找到的 10 个不同版本但没有一个可以正常工作我还测试了 StackOverflow 上发布的其他解决方案但似乎都不起作
带有 dplyr::do 的匿名函数 - 使用 rle 的结果来过滤数据

我有按主题 id 分组的时间序列数据这些数据保留在某个站点上并且在每个时间步骤中都有某个阶段有时受试者从一个站点切换到另一个站点并且可能会再次返回如果个人更换站点来回例如从站点 a 到站点 b 然后返回站点 a an
比较两个序列是否相等

在因其标题而将其标记为重复之前请考虑以下简短程序 static void Main var expected new List
Google 文档自动保存如何工作？

好吧我知道这听起来很普通但我指的是 AJAX 级别我尝试过使用 Firebug 来跟踪 NET 连接和帖子但这是一个谜有谁知道他们如何在不破坏网络浏览器的情况下不断进行即时自动保存我的猜测这只是一个猜测是谷歌使用推送服务
try/catch 块中的完整代码

我想知道这是一个good practice放置complete code里面一个try block或者我应该放置only the code which I feel it will cause a specific exception 我
为什么 Linux TAP 设备不处理 ARP 或 ICMPv6 数据包

我正在使用以下命令打开 TAP 设备 p gt fd open dev net tun O RDWR skipping error handling code ifr ifr flags IFF TAP IFF ONE QUEUE IFF
如何交叉引用 Sphinx 中 autodoc 生成的函数？

我正在使用Sphinx autodoc根据我的 Python 库的文档字符串生成文档的功能找到交叉引用的语法here http sphinx doc org markup inline html ref role 该部分之前必须有一个标签
sed 仅在特定字符模式之间用空格替换破折号

我有这样的行 ORIGINAL sometext1 sometext2 word A12 B34 C56 sometext3 sometext4 sometext5 sometext6 word A123 B45 C67 sometext7
Celery：有没有办法编写自定义 JSON 编码器/解码器？

我有一些对象想要发送到我的应用程序上的 celery 任务这些对象显然不能使用默认的 json 库进行 json 序列化有没有办法让 celery 使用自定义 JSON 序列化反序列化这些对象Encoder Decoder 这里有点晚
为什么Java禁止内部接口的继承？

IE 为什么以下循环依赖不可能 public class Something implements Behavior public interface Behavior 由于接口不引用外部类因此应该允许这样做然而编译器强迫我在类之
有没有办法使用无服务器框架来验证路径

我在后端使用无服务器框架使用AWS 我的 serverless yml 像这样 functions getBrand handler functions brand getBrand handler events http path se
Rails：基于关联值的ActiveRecord查询

我有 2 个型号 Report and Server具有belongs to 和has many 关系我使用创建了一个访问器方法delegate这允许Report来查找其关联的Server company id 现在我想运行一个查询Re
ASP.Net Web Api 未在 POST 上绑定模型

我正在尝试将 JSON 数据发布到 Web Api 方法但 JSON 数据未绑定到模型这是我的模型 DataContract public class RegisterDataModel DataMember IsRequired tr
在 VB.NET 中对对象列表进行排序

我有一个乘客对象列表它具有不同的属性 passenger name passenger age passenger surname 我想按年龄标准对这个列表进行排序我该怎么做我知道在整数字符串列表中 List Sort 有效但
在一个 Servlet 中同时处理

我有一个 Servlet 它接收请求必须处理 5 个任务从外部服务器获取数据并将所有数据发送回订购的客户端如何同时处理5个任务并在5个任务全部完成后继续执行servlet代码您可以使用CoundDownLatch http doc
Java 双epsilon

我目前需要一个epsilon http en wikipedia org wiki Machine epsilon类型的double 首选 java 库中的常量而不是自己的实现定义据我所知Double has MIN VALUE an
如何在 C# 日期时间选择器中设置最大时间和最小时间

我在 C Windows 窗体应用程序中使用日期时间选择器如何设置最短时间和最长时间我有一个字符串 07 52 22 我想将其设置为最大或最短时间我怎样才能做到这一点 DatetimePicker MinDate TimeOfDay
ASCII - 代码点与字符编码

我发现一篇有趣的文章字符代码问题教程 http jkorpela fi chars html code http jkorpela fi chars html code 解释了术语字符代码代码点和字符编码前者只是分配给一个字符的

ASCII - 代码点与字符编码

ASCII - 代码点与字符编码 的相关文章

随机推荐

热门标签

ASCII - 代码点与字符编码的相关文章