ED A0 80 ED B0 80 是有效的 UTF-8 字节序列吗？

2024-01-08

java.nio.charset.Charset.forName("utf8").decode http://docs.oracle.com/javase/7/docs/api/java/nio/charset/Charset.html#decode%28java.nio.ByteBuffer%29解码字节序列

 ED A0 80 ED B0 80

进入 Unicode 代码点：

 U+10000

java.nio.charset.Charset.forName("utf8").decode http://docs.oracle.com/javase/7/docs/api/java/nio/charset/Charset.html#decode%28java.nio.ByteBuffer%29还解码字节序列

 F0 90 80 80

进入 Unicode 代码点：

 U+10000

这一点已得到验证下面的代码 https://stackoverflow.com/q/8843742/632951/#snippet1.

现在这似乎告诉我UTF-8编码方案将解码ED A0 80 ED B0 80 and F0 90 80 80到相同的 unicode 代码点。

但是，如果我访问https://www.google.com/search?query=%ED%A0%80%ED%B0%80 https://www.google.com/search?query=%ED%A0%80%ED%B0%80,

可以看到和页面明显不一样https://www.google.com/search?query=%F0%90%80%80 https://www.google.com/search?query=%F0%90%80%80

由于 Google 搜索也使用 UTF-8 编码方案（如果我错了，请纠正我），

这表明 UTF-8 无法解码ED A0 80 ED B0 80 and F0 90 80 80到相同的 unicode 代码点。

所以基本上我想知道official标准，应该UTF-8解码ED A0 80 ED B0 80字节序列转换为 Unicode 代码点 U+10000 ？

Code:

public class Test {

    public static void main(String args[]) {
        java.nio.ByteBuffer bb = java.nio.ByteBuffer.wrap(new byte[] { (byte) 0xED, (byte) 0xA0, (byte) 0x80, (byte) 0xED, (byte) 0xB0, (byte) 0x80 });
        java.nio.CharBuffer cb = java.nio.charset.Charset.forName("utf8").decode(bb);
        for (int x = 0, xx = cb.limit(); x < xx; ++x) {
            System.out.println(Integer.toHexString(cb.get(x)));
        }
        System.out.println();
        bb = java.nio.ByteBuffer.wrap(new byte[] { (byte) 0xF0, (byte) 0x90, (byte) 0x80, (byte) 0x80 });
        cb = java.nio.charset.Charset.forName("utf8").decode(bb);
        for (int x = 0, xx = cb.limit(); x < xx; ++x) {
            System.out.println(Integer.toHexString(cb.get(x)));
        }
    }
}

ED A0 80 ED B0 80是 UTF-16 代理对的 UTF-8 编码D800 DC00。这是NOT允许进入UTF-8 http://www.ietf.org/rfc/rfc2279.txt:

然而，D800 和 DFFF 之间的 UCS-2 值对（代理对用 Unicode 术语来说）...需要特殊处理：UTF-16 必须撤消转变，产生一个 UCS-4 字符，然后改造如上。

然而，这样的编码is用于CESU-8 http://www.unicode.org/reports/tr26/以及Java的“修改后的UTF-8”。

由于 Google 搜索也使用 UTF-8 编码方案（如果我错了，请纠正我），

根据搜索框，谷歌似乎正在使用某种编码自动检测。如果你通过了F0 90 80 80，这是有效的 UTF-8，它将其解释为 UTF-8 (????）。如果你通过了ED A0 80 ED B0 80，这是无效的 UTF-8，它将其解释为windows-1252 http://en.wikipedia.org/wiki/Windows-1252 (í�€í°€).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ED A0 80 ED B0 80 是有效的 UTF-8 字节序列吗？的相关文章

Java EE 6 和单例

谁能解释一下在 Java EE 6 应用程序中实现 Singleton 的完整过程我假设我不应该以声明静态变量的典型方式创建单例而应该使用 Singleton注解我必须这样做吗难道只是声明一下的情况 Singleton就是这样我还
如果在 addHeader 之前写入正文，HttpServletResponse 会丢失标头吗？

环境 Java HotSpot TM 64 位服务器 VM 内部版本 16 3 b01 混合模式 tomcat6 当我使用HttpServlet发送html页面时如下所示 resp getWriter append body body i
从另一个进程捕获 system.out 消息

我有一个 JVM 1 它启动 JVM 2 我希望能够在 JVM 1 中监视来自 JVM 2 的 System out println 调用直接的方法是 JVM A 执行系统命令来启动 JVM B 然后 JVM A 读取 B 的所有输出 S
编码的 nsdata utf8 json，在 ios 中带有重音字符

我向网络服务器发出一个发布请求该服务器用 JSON 回答我这是响应的标头 Cache Control private Content Length 826 Content Type application json charset ut
AMQP Spring 集成错误处理

我的集成流程如下所示 Bean public IntegrationFlow auditFlow Qualifier eventLoggingConnectionFactory ConnectionFactory connectionFac
Java 客户端到服务器未知来源

我有一个简单的乒乓球游戏需要通过网络工作服务器将创建一个带有球和 2 个球棒位置的游戏当客户端连接到服务器时服务器将创建一个名为 PongPlayerThread 的新类它将处理客户端到服务器的输入和输出流我的服务器工作100
我可以使用 Selenium Webdriver 测试元素的顺序吗？

有一个表单其中有 3 个字段具有 3 个不同的 ID fieldset div div fieldset
如何在java中从包含.0的浮点数中删除小数部分

我只想删除包含的浮点数的小数部分 0 所有其他数字都是可以接受的例如 I P 1 0 2 2 88 0 3 56666 4 1 45 00 99 560 O P 1 2 2 88 3 567 4 1 45 99 560 有什么方法可以做到
如何在 Java 中使用 HTML 解析器和 Apache Tika 来提取所有 HTML 标签？

我下载了 tika core 和 tika parser 库但找不到将 HTML 文档解析为字符串的示例代码我必须删除网页源的所有 html 标签我能做些什么如何使用 Apache Tika 进行编码您想要 html 文件的纯文本
java.lang.ClassNotFoundException: org.jboss.logging.Logger

我有一个奇怪的问题我有一个JMS https en wiktionary org wiki JMS客户端应用程序和MDB https en wikipedia org wiki Enterprise JavaBeans Message d
不使用 length() 方法的字符串长度[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案如何在不使用字符串的情况下找到字符串的长度length String类的方法 str toCharArray length应该管用或者怎么
将 Maven 控制台与 m2eclipse 一起使用

Maven 新手在这里有没有办法在 Eclipse 中打开控制台并在 M2Eclipse 插件上执行 Maven 命令这是一个非常好的插件但我环顾四周没有找到我想要的一些功能谢谢如果你想运行特定的maven插件你可以这样做 g
“强制更新快照/版本” - 这是什么意思

在 Maven 项目中选择更新项目时有一个名为强制更新快照版本的选项它有什么作用强制更新快照版本就像运行以下命令 mvn U install U 也可以用作 update snapshot 看here http boo
Web 服务客户端的 AXIS 与 JAX-WS

我决定用Java 实现Web 服务客户端我已经在 Eclipse 中生成了 Axis 客户端并使用 wsimport 生成了 JAS WS 客户端两种解决方案都有效现在我必须选择一种来继续在选择其中之一之前我应该考虑什么 JAX
Eclipse 如何创建一个未解决编译问题的类？

当我尝试使用 javac 编译此类时出现编译错误并且未创建 Test class public class Test public static void main String args int x 1L lt this cannot
背景图像隐藏其他组件，例如按钮标签等，反之亦然

如何解决此代码中组件的隐藏问题代码运行没有错误但背景图片不显示如何更改代码以获取背景图像使用验证方法时它在validation 中创建错误 public class TEST public TEST String strm Jan
Volley 在第一次调用方法时返回 null

我正在尝试使用 volley 从服务器检索数据但是当我第一次调用此方法时我收到服务器的响应但该方法返回 null 如果我第二次调用它我会得到最后的响应 public String retrieveDataFromServer Str
将 SQL 数据中的一行映射到 Java 对象

我有一个 Java 类其实例字段以及匹配的 setter 方法与 SQL 数据库表的列名相匹配我想优雅地从表中获取一行到 ResultSet 中并将其映射到此类的实例例如我有一个 Student 类其中包含实例字段 FNA
Java有没有类似微软CHESS的工具？

是否有类似于 Microsoft 的现有 Java 工具CHESS http research microsoft com chess 或者 CHESS 源代码是否开放以便我可以尝试将其转换为 Java 谷歌的织线工 http code
removeall 和removeif 的用例

我找到了这个 fun main val list MutableList

随机推荐

Multer 文件缓冲区丢失

从以下返回的 req file 属性不包含缓冲区属性 https www npmjs com package multer https www npmjs com package multer 因此当我尝试访问 req file buff
使用 Android AccountManager 获取 gdata 的 authtoken

所以我试图同步到谷歌文档而不必询问用户的凭据我使用此代码来获取身份验证令牌 AccountManager mgr AccountManager get activity authToken mgr blockingGetAuthToke
Mac 上的 JFileChooser 看不到中文字符命名的文件？

该程序在Intellij中运行时运行良好可以看到中文命名的文件我将其构建到 jar 文件中执行了 jar 和JFileChooser无法看到那些文件我在 Windows 中尝试了该 jar 它工作得很好这个文件在 Mac OS X
PDO——真实的事实和最佳实践？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
通过 HTML 代码在 UIView 中使用透明背景色

我正在尝试在 UIView 中显示广告我需要将背景颜色设置为透明我尝试使用 viewObject setBackgroundColor UIColor clearcolor 尽管它使 UIView 透明但它显示白色背景下面是我尝试过
当 QProcess 需要用户输入 Qt 时如何读取

我使用 Qt 来实现一个允许开发嵌入式系统的接口我面临一个问题为了将程序闪存到嵌入式系统中我使用 QProcess 以便使用命令 make 和 make flash 保证没有任何问题程序编译成功但是当我尝试对 make flash
Overlay.draw() 调用多次

我有一个关于draw 的方法OverlayAndroid 地图中的类移动地图时的方法draw 接到几次电话从 4 次到 13 次这对我来说是个问题因为这个方法必须用 70000 点重新绘制我的路线这是很多资源我找不到这个问题的描
.NET 垃圾收集器之谜

在我的工作中我们遇到了 OutOfMemoryExceptions 问题我编写了一段简单的代码来模仿某些行为最终得到了以下谜团看看这段简单的代码当内存不足时它就会崩溃 class Program private static v
高分子纸波纹

我试图在按下按钮时更改元素的颜色我希望当按下按钮并且颜色发生变化时在该元素中触发纸张波纹效果我该怎么做呢目标元素
充当文件上传的div？

我只是想上传或浏览 div 本身就像作为文件输入并触发其功能但我的问题是我对 java 脚本很陌生并且为自己集思广益近一个小时并寻找互联网上同样的问题所以我别无选择只能在这里提问 my code div style border 1
Android AsyncTask 与进度对话框取消

在我的android应用程序中我使用带有进度对话框的AsyncTask 请等待登录来使用我的网页异步任务内的Web服务功能登录用户当用户单击设备上的后退按钮时我想关闭进度对话框并取消 AsynTask 我找不到用于中断 As
Swift - 从 JSON 响应创建数据模型

我正在学习 Swift 语言很高兴听到其他人输入的内容之一是如何处理来自 JSON 响应的模型例如 I have User swift model class User NSObject var user token String v
自动分配spring的bean名称以防止名称冲突？

在Spring应用程序中如果两个程序员开发两个包将 Repository注释为相同的类名 Spring将抛出 IllegalStateException 注解指定的bean名称 mybean 代表 bean 类 foobar packa
如何从 URL 方案中获取参数。

我在我的 iPhone 应用程序中使用 URL 方案从一个页面将用户切换到 safari 然后从网页单击一个按钮我将恢复到应用程序此时一些参数是由网页传递的例如 myapp parameter 1 如何从我的应用程序中找到此参数
jQuery.ajax -always() 并不总是运行

我正在使用 jQuery ajax 进行 REST 调用并检索一些 JSON 它按预期工作但是当我强制出现错误条件例如无效 URL 时 always 方法不会触发如果我设置 crossDomain false 或 dataType
Linux 文件 IO - 多线程性能 - 写入不同的文件

我目前正在开发一个音频录制应用程序该应用程序从网络获取最多 8 个音频流并将数据保存到磁盘简化的现在每个流都由一个线程处理 gt 同一线程还在磁盘上执行保存工作这意味着我有 8 个不同的线程在同一磁盘上执行写入操作每个线程写入不
有没有办法区分应用程序是在登录时由启动服务启动还是由用户启动？ [复制]

这个问题在这里已经有答案了 Cocoa 应用程序可以将自己添加到LSSharedFileList的登录项目列表这将允许应用程序在用户登录时启动但是有没有办法判断用户是启动应用程序还是应用程序在登录时自动启动这很有用因为在一种情况下
MacOS Mojave 中未找到 ntpdate 命令

我有一个 Bash 脚本可以更新我的 mac 时间但自从 Mojave 更新后找不到该命令 ntpdate u time apple com return ntpdate command not found 我哪里出错了这是重复的请检
在python中将文件从latin1转换为utf-8的最快方法

我需要在 python 中将文件从 latin1 转换为 utf 8 的最快方法文件很大 2G 我正在移动数据库数据到目前为止我已经 import codecs infile codecs open tmpfile r encoding
ED A0 80 ED B0 80 是有效的 UTF-8 字节序列吗？

java nio charset Charset forName utf8 decode http docs oracle com javase 7 docs api java nio charset Charset html decode

ED A0 80 ED B0 80 是有效的 UTF-8 字节序列吗？

ED A0 80 ED B0 80 是有效的 UTF-8 字节序列吗？ 的相关文章

随机推荐

热门标签

ED A0 80 ED B0 80 是有效的 UTF-8 字节序列吗？的相关文章