ANSI是个啥？？？

2023-11-09

来自：

https://blog.csdn.net/imxiangzi/article/details/77370160

http://www.cnblogs.com/malecrab/p/5300486.html

用Notepad++创建一个文本文件text.txt，其默认编码格式为ANSI（乍看之下，还以为是ASCII呢），输入汉字居然不是乱码：

保存为test.txt，发送给你美国的同事Bob。他也用Notepad++，不幸的是，却发现你的文件内容是这样的：

也许你会认为：你用的是中文系统，能正常显示中文；他用的是英文系统，不能显示中文！

这么想，好像很有道理呢！

但是再细想一下：一个系统显示乱码，说明它不支持这种编码格式（或者解码方式不对）。难道英文系统不支持ANSI？难道ANSI是一种中文编码？

如果你身边有一个韩文系统，也装一个Notepad++，默认还是ANSI编码，你可以输入“한국어”，发现也能正常显示：

但是你要输入“汉字”可能就会发现是乱码了...

通过这个反例，就可以说明ANSI不是一种中文编码。那么，ANSI到底是什么编码？

用十六进制编辑器打开内容为“汉字”的test.txt文件：

你会发现：其中baba和d7d6正好是“汉”和“字”两个字的GBK编码值。

同样，用十六进制编辑器打开内容为“한국어”的test.txt文件：

你会发现：其中c7d1、b1b9和beee正好是“한”、“국”和“어”三个字符的EUC-KR编码值。

由此可以看出：其实ANSI并不是某一种特定的字符编码，而是在不同的系统中，ANSI表示不同的编码。你的美国同事Bob的系统中ANSI编码其实是ASCII编码（ASCII编码不能表示汉字，所以汉字为乱码），而你的系统中（“汉字”正常显示）ANSI编码其实是GBK编码，而韩文系统中（“한국어”正常显示）ANSI编码其实是EUC-KR编码。

话说计算机是由美国佬搞出来的嘛，他们觉得一个字节（可以表示256个编码）表示英语世界里所有的字母、数字和常用特殊符号已经绰绰有余了（其实ASCII只用了前127个编码）。后来欧洲人不干了，法国人说：我需要在小写字母加上变音符号（如：é），德国人说：我也要加几个字母（Ä ä、Ö ö、Ü ü、ß）。于是，欧洲人就将ASCII没用完的编码（128-255）为自己特有的符号编码（后来称之为“扩展字符集”）。等到我们中国人开始使用计算机的时候，尼玛，256个编码哪够？我泱泱大中华，汉字起码也得N多万吧，就连小学生都得要求掌握两三千字。国标局最后拍板：一个字节不够，那我们就用多个字节来为汉字编码吧，但是，国情那么穷，字节那么贵，三个字节伤不起，那就用俩字节吧，先给常用的几千汉字编个码，等以后国家强盛了人民富裕了，咱再扩展呗---于是GB2312就产生了。台湾同胞一看，尼玛，全是简体字，还让不让我们写繁体字的活了，于是台湾同胞也自己弄了个繁体字编码---大五码（Big-5）。同时，其它国家也在为自己的文字编码。最后，微软苦逼了：顾客就是上帝啊，你们的编码我都得满足啊，这样吧，卖给美国国内的系统默认就用ASCII编码吧，卖给中国人的系统默认就用GBK编码吧，卖给韩国人的系统默认就用EUC-KR编码，...但是为了避免你们误会我卖给你们的系统功能有差异，我就统一把你们的默认编码都显示成ANSI吧。---本故事纯属虚构，但“ANSI编码”确实只存在于Windows系统。

那么Windows系统是如何区分ANSI背后的真实编码的呢？

微软用一个叫“Windows code pages”（在命令行下执行chcp命令可以查看当前code page的值）的值来判断系统默认编码，比如：简体中文的code page值为936（它表示GBK编码，win95之前表示GB2312，详见：Microsoft Windows' Code Page 936），繁体中文的code page值为950（表示Big-5编码）。

我们能否通过修改Windows code pages的值来改变“ANSI编码”呢？

命令提示符下，我们可以通过chcp命令来修改当前终端的active code page，例如：
(1) 执行：chcp 437，code page改为437，当前终端的默认编码就为ASCII编码了（汉字就成乱码了）；
(2) 执行：chcp 936，code page改为936，当前终端的默认编码就为GBK编码了（汉字又能正常显示了）。
上面的操作只在当前终端起作用，并不会影响系统默认的“ANSI编码”。（更改命令行默认codepage参看：设置cmd的codepage的方法）。

Windows下code page是根据当前系统区域（locale）来设置的，要想修改系统默认的“ANSI编码”，我们可以通过修改系统区域来实现（“控制面板” =>“时钟、语言和区域”=>“区域和语言”=>“管理”=>“更改系统区域设置...”）：

图中的系统locale为简体中文，意味着当前“ANSI编码”实际是GBK编码。当你把它改成Korean(Korea)时，“ANSI编码”实际是EUC-KR编码，“한국어”就能正常显示了；当你把它改成English(US)时，“ANSI编码”实际是ASCII编码，“汉字”和“한국어”都成乱码了。（改了之后需要重启系统的。。。）

说明：locale是国际化与本地化中重要的概念，本文不深入讲解该内容。

你上面说的都是windows的情形吧，Linux呢？

将前述内容为“汉字”的文件test.txt拷贝至Linux下，用Emacs打开：

也是乱码！原因也是locale的问题：

更改locale后再打开：

正常显示了。。。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

编码

ANSI是个啥？？？的相关文章

【无奈】Invalid byte 1 of 1-byte UTF-8 sequence解决方案

今天在eclipse中编写pom xml文件时注释中的中文被eclipse识别到错误 Invalid byte 1 of 1 byte UTF 8 sequence 曾多次遇到该问题问题的根源是 The cause of this is
计算机编码发展历史和编码方式

编码是信息从一种形式或格式转换为另一种形式的过程也称为计算机编程语言的代码简称编码用预先规定的方法将文字数字或其它对象编成数码或将信息数据转换成规定的电脉冲信号编码在电子计算机电视遥控和通讯等方面广泛使用解码是编码的逆过
base64编码上传图片java后台接收实例

思路前台传以data image jpeg base64 开头的base64编码的String字符串后台接收字符串以后先进行base64解码 decodeBuffer 转换成二进制编码然后使用字节输出流FileOutputStream
.bat文件闪退，原因及解决

之前学习mongodb 创建了一个txt文件内容是 D cd D Program Files MongoDB bin mongod exe dbpath G data db 然后更改文件名称为 bat时一运行就一闪就没了后来用cmd
GB2312编码规则与代码实现

GB2312编码范围 A1A1 FEFE 其中汉字编码范围 B0A1 F7FE 汉字编码第一字节0xB0 0xF7 对应区号 16 87 第二个字节0xA1 0xFE 对应位号 01 94 GB2312编码是第一个汉字编码国家标准是由中
unicode编码表

unicode编码表转载于近來情轉深的博客 http jlqzs blog 163 com blog static 2125298320070101826277 另附一个汉字转化unicode编码的网页工具 http www bangn
什么是Base64

一什么是Base64 百度百科中对Base64有一个很好的解释 Base64是网络上最常见的用于传输8Bit字节码的编码方式之一 Base64就是一种基于64个可打印字符来表示二进制数据的方法什么是可打印字符呢为什么要用它来传输8
锟斤拷？UTF-8与GBK互转，为什么会乱码？

作为一名程序员肯定有被乱码困扰的时候真到了百思不得其解的时候就会觉得英文程序员真幸福但其实只要明白编码之间的转换规律其实乱码so easy 我们知道计算机存储数据都是2进制就是0和1 那么这么多的字符就都需要有自己对应的0和
银行卡编码规则及检验算法详解

一银行卡结构 XXXXXX XXXXXXXXXXXX X 发卡行标识代码自定义位校验码根据ISO标准银行卡长度一般在13 19位国际上也有12位的银联标准卡卡长度一般是在16 19位双组织卡也有13 19位的二发卡行标识
字符游戏-智能蛇的学习

目标实现可以智能化移动不撞墙自由追寻果实的贪吃蛇程序即拥有感知决策行动的能力学习过程根据index中sin曲线的绘制过程可知我们可以知道可以用while循环反复打印的方式达到刷屏的效果这样我们将贪吃蛇移动的每一步都单独打
python 编码

1 ASCII Unicode和UTF 8 计算机只能处理数字如果要处理文本就必须把文字转换为数字因为计算机是美国人发明的因此最早只有127个字母被编码到计算机里包含大小写英文字母数字和一些符号这个编码表被称为ASCII编码
python3解决读取到的邮件中的乱码问题

点进来看这篇文章的你是不是有这种情况不管用什么模块去读取邮箱中的邮件都能看到类似 gb18030 B 1vfM4g 这样的仿佛像乱码一样的东西你比如说这样子的 X QQ FEAT YSSoAXAEBlFn3rgysgiXLVc6JA
base64图片编码大小与原图文件大小之间的联系

base64图片编码大小与原图文件大小之间的联系有时候我们需要把canvas画布的图画转换成图片输出页面而用canvas生成的图片就是base64编码的它是由数字字母等一大串的字符组成的但是我们需要获取它的文件流大小该怎么办呢 B
在Java中如何判断字符串的编码格式

最近我一直试图寻找一种判断Java程序中字符串编码格式的方法同时也查找了很多资料设计了一个的程序美中不足的是该方法对仅含有数字和英文字母的字符串无效原理 ASCII GBK UTF 8对数字和英文字母的编码相同对其它字符编码不
python 2、python读取.htm文件报错：UnicodeDecodeError: 'utf8' codec can't decode byte 0xb3 in position 0的解决方法

问题是这样的我用python写的程序去读取 htm文件中的数据刚开始我用 fr open 0 htm r 时程序运行后直接崩溃后来根据提示的错误信息 ValueError encoding must be one of utf 8
cookie中文乱码问题

下面是写入cookie的代码 csharp view plain copy Cookie nameCookie new Cookie name 张三 nameCookie setMaxAge 60 60 24 30 response add
JavaScript实现UTF-8字符集Base64编码

下面是代码实现 function var BASE64 MAPPING 映射表 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n
转：使用DOS命令chcp查看windows操作系统的默认编码以及编码和语言的对应关系

代码页是字符集编码的别名也有人称内码表早期代码页是IBM称呼电脑BIOS本身支持的字符集编码的名称当时通用的操作系统都是命令行界面系统这些操作系统直接使用BIOS供应的VGA功能来显示字符操作系统的编码支持也就依靠BIOS的编
Get,Post请求中文乱码问题有效解决方法

对于做Java WEB项目同学来说中文乱码问题是一个经常遇到而又非常头痛的问题而最容易出现乱码的环节就是在浏览器向服务器发送请求的过程至于出现乱码的原因不是本文的关注的重点想了解的朋友可以参考 http zhaomin819111
setlocale()/_wsetlocale()函数的使用

在C运行库提供的多字节字符宽字符转换函数 mbstowcs wcstombs 中需要用到全局变量locale locale encoding 以指定多字节字符的编码类型 1 功能用来定义全局变量 locale locale encod

随机推荐

【Docker仓库】使用华为云SWR容器镜像仓库服务

Docker仓库使用华为云SWR容器镜像仓库服务一容器镜像服务SWR介绍 1 1 SWR服务简介 1 2 SWR服务特点二本次实践介绍 2 1 本次实践简介 2 2 本次实践环境介绍 2 3 检查本地docker环境三生成do
linux内存管理

原文链接 https blog csdn net wwwlyj123321 article details 128241134 一内存管理简述在Linux内核中 RAM会将其中一部分永远分配给内核用来存放Linux内核源码以及一些静态
解决ES6.6.0开启锁定内存后不能重新，报错“memory locking requested for elasticsearch process but memory is not locked”

错误原因就是我们在配置文件里开启了 bootstrap memory lock true 不需要次需求的话改成false就好如果需要开启按照下面来亲测可行 root localhost 234 grep Ev etc elastic
【云原生】Kubeadmin安装k8s集群

目录前言一环境部署 1 1 服务器部署功能 1 2 环境准备所有节点二安装docker 所有节点三所有节点安装kubeadm kubelet和kubectl 3 1 定义kubernetes源 3 2 开机自启kubelet
【蓝桥杯每日一练：递归算法求两个数的最大公约数】

问题描述求最大公约数问题输入格式输入一行包含两个正整数 lt 1 000 000 000 输出格式输出一个正整数即这两个正整数的最大公约数输入样例 6 9 输出样例 3 代码 n m map int input split i
idea导入Web项目并配置tomcat运行

文章目录一导入项目二配置tomcat 三配置Web项目在tomcat下的运行包一导入项目 File gt Open 然后选择要导入的web项目路径二配置tomcat 第一步单机右上角的Edit Configuration
面试题：海量数据去重、Top-k、BitMap问题整理

问题引入首先直接进入正题 40亿QQ号如何设计算法去重相同的QQ号码仅保留一个内存限制为1个G 腾讯的QQ号都是4字节正整数所以QQ号码的个数是43亿左右理论值2 32 1个又因为是无符号的翻倍了一下所以43亿左右方法1
交错级数如何判断收敛_11种常数项级数敛散性判别法(审敛法)的粗糙总结&11道好玩的小题...

追不上的上古玄武告诉我们无穷个正数加在一起不一定是正无穷以此为开端有了极限的观念还有了级数的观念很多数列的Sn很难求这篇文章只讨论极其片面的判断常数项级数是否收敛的十一个方法 PART 1 对于十一种级数敛散性判别法的粗糙总
STATA：缩尾、截尾的概念和命令
Python字符串地常规操作：取值，切片，查找，替换，分割，拼接，转义

字符串操作字符串取值字符串取单个值举例从零开始每个字符对应的索引 h 0 e 1 l 3 s hell0 a tong print s 0 print s 5 在这里符号也是一个字符 print s 7 索引为7 对应的是空
eclipse 配置 Tomcat 遇到的问题以及解决办法

Eclipse是一个开发JSP的很好的工具而笔者在配置Tomcat服务器的时候遇到了一些小问题在这里给大家总结一些经验希望能帮助同样遇到这些问题的广大同行们能够简单轻松地解决这些问题笔者在以前自学JSP的时候曾经用过Tomcat E
Android ,java.io.IOException: Failed to instantiate extractor.

mediaExtractor new MediaExtractor mediaExtractor setDataSource mFilePath mFilePath 为 sd 上路径 sdcard 月亮代表我的心萨克斯2 mp3 1 检查
【Java】环境配置以及快速切换环境的技巧和方法

前言前几天想用 burp 抓包来着发现 burp 突然不能用了重装了 burp 发现还是不能用意识到是 java 环境出了问题在之前有段时间没玩 CTF 去搞开发了于是java环境糊里糊涂改成了 JAVA 18 结果之前的 bu
Android项目JNI层C/C++文件中添加LOG信息

第一步在项目的mk文件中加入 LOCAL LDLIBS llog 第二步在要添加LOG的cpp文件中引入一个头文件和添加一个定义 include
M - Mountaineers （MST+树上倍增）

将原图中点每个点四连通方向的点建边权值为两点权值中较大者的值对这个图建立最小生成树那么最小生成树上任意两点之间路径上的最大点权即为答案因为是树所以任意两点间的简单路径唯一通过树上倍增维护维护树上区间最值求出最大值即可 pragm
pid算法控制

一先来彻底搞懂PID到底是啥啥是PID PID 就是比例 proportional 积分 integral 微分 derivative 是一种很常见的控制算法在工程实际中应用最为广泛的调节器控制规律为比例积分微分控制简称PI
数据结构_串的匹配（BF和KMP算法）

数据结构串的匹配 BF和KMP算法 BF brute force 算法算法定义代码实现算法分析 KMP算法算法详解代码实现算法分析子串的定位运算通常被称为串的模式匹配或串匹配 BF brute force 算法算法定义一
cmd pc如何开多个微信_多个合伙人开公司，股权应该如何分配

伴随着互联网发展的越来越快不少的创业型的公司在这快节奏的时代以惊人的速度展现在世人面前但是这个同时创业的道路也是艰辛的不过有着志同道合的小伙伴或许能够在成功的道路上又多了几分把握有句俗话说的好你能走多远将取决于是谁与你同行虽然说
【已成功解决】使用vpn/代理后无法正常上网/无法正常访问网站

文章目录一问题描述二解决步骤三原因分析一问题描述很多同学在学习访问学校提供的资源时或者一些小伙伴在公司办公时需要使用VPN 但是当我们关闭VPN后却发现没有办法正常连接到互联网了可以尝试以下方法解决至于导致这种情况发
ANSI是个啥？？？

来自 https blog csdn net imxiangzi article details 77370160 http www cnblogs com malecrab p 5300486 html 用Notepad 创建一个文本文件

ANSI是个啥？？？

ANSI是个啥？？？ 的相关文章

随机推荐

热门标签

ANSI是个啥？？？的相关文章