二进制文件与文本文件详解

2023-11-15

二进制文件

定义： 二进制文件就是把内存中的数据按其在内存中存储的形式原样输出到磁盘中存放，即存放的是数据的原形式。二进制文件是包含在 ASCII 及扩展 ASCII 字符中编写的数据或程序指令的文件。一般是可执行程序、图形、声音等文件，有自己特殊的编解码格式。不同的应用程序对二进制文件中的每个值会有不同的解读，要打开二进制文件需要对应的二进制文件解码器。
读取流程： 用记事本打开二进制文件的流程是怎样的呢？记事本无论打开什么文件都按既定的字符编码工作（如ASCII码），用ASCII码的规则去解读二进制文件时，会出现乱码。所以当他打开二进制文件时，出现乱码也是很必然的一件事情，解码和译码不对应。例如文件流”00000000_00000000_00000000_00000001”可能在二进制文件中对应的是一个四字节的整数int 1，在记事本里解释就变成了”NULL_NULL_NULL_SOH”这四个控制符。文本文件将浮点数80.000000用了38(表示8) 30(表示0) 2E(表示.) 30(表示0) 30(表示0) 30(表示0) 30(表示0) 30(表示0) 30(表示0)，二进制文件用了4个字节表示浮点数00 00 A0 42。字符型的内容都是ASCii码的形式，没有区别。
例子: 在计算机中，所有的颜色都可以映射为一个二进制的值。图片存储时，图片上每个点都有自己的颜色值，将每个点的颜色值，以及图片本身的宽高信息储存起来，就是最基本的位图存储(bmp)，位图存储是没有压缩的。将位图信息，经过二次编码，压缩就形成了压缩后的图片。算法不同产生的图片格式也有区别。常见的包括jpg,png,gif等。文本文件基本上是定长编码的(也有非定长的编码如UTF-8)。而二进制文件可看成是变长编码的，因为是值编码，多少个比特代表一个值，完全由自定义的编解码规则决定。像BMP文件，其头部是较为固定长度的文件头信息，前2字节用来记录文件为BMP格式，接下来的8个字节用来记录文件长度，再接下来的4字节用来记录bmp文件头的长度。
linux 二进制的兼容性： Linux上二进制有一个显著的特点就是可移植性不强。我们在不同的发行版之间，不同的内核版本之间，程序往往是不能通用的，比如把ubunbtu下面编译的二进制可执行文件拷贝到CentOS上，基本不可能运行。原因是程序总需要使用或多或少的系统调用，系统调用是核心代码实现的，核心不同自然也就不兼容了。另外不同系统的对执行文件加载方式也不同。
如果应用对内核kernel版本有要求，则不建议使用docker,docker底层复用的host的kernel.,如果可以用docker，可以解决除kernel版本外的兼容性问题，build once run everywhere。

文本文件

定义： 文本文件是把数据的终端形式的二进制数据输出到磁盘上存放，即存放的是数据的终端形式. 文本文件(也称为ASCII文件)：它的每一个字节存放的是可表示为一个字符的ASCII代码的文件。它是以 “行”为基本结构的一种信息组织和存储方式的文件，可用任何文字处理程序阅读的简单文本文件。
读取流程： 文本工具打开一个文件的过程是怎样的呢？拿记事本来说，它首先读取文件物理上所对应的二进制比特流，然后按照你所选择的解码方式来解释这个流，然后将解释结果显示出来。一般来说，你选取的解码方式会是ASCII码形式（ASCII码的一个字符是８个比特），接下来，它8个比特8个比特地来解释这个文件流。例如对于这么一个文件流”01000000_01000001_01000010_01000011”, 第一个8比特”01000000”按ASCII码来解码的话，所对应的字符是字符”A”，同理其它3个8比特可分别解码为”BCD”，即这个文件流可解释成“ABCD”，然后记事本就将这个“ABCD”显示在屏幕上。
选择： 如果是需要频繁的保存和访问数据，那么应该采取二进制文件进行存放，这样可以节省存储空间和转换时间。
如果需要频繁的向终端显示数据或从终端读入数据，那么应该采用文本文件进行存放，这样可以节省转换时间。
区别： window 文本模式中，在存储\n时要转化为\r\n，读取文件时进行逆转换。window二进制模式时，则不进行转换。
^m原因： 回车和换行是不相同的，Windows中文字另起一行内存表示为<回车><换行>对应\r\n，而Linux、Unix中则是单单一个<换行>对应\n。Mac中则是一个<回车>对应\r。C语言起源于Unix的产生，对于文件中的另起一行，Unix采用单个\n表示，我们通常在输出换行时加一个\n就可以了，Windows也是如此。到了数据从内存到硬盘上进行存储时，对于unix来说，\n照样是\n，在Linux下，二进制文件和文本文件都是以’\n’作为行结束符，所以不需要转换，而Windows为了防止读取时混乱必须转换为\r\n。Windows 格式的文本文件，用\r\n 作为换行符,而Unix 的则是以\n作为换行符,所以dos 底下的文本文件到了unix的话，换行符就会多出来一个 0D(CR) 显示为 ^M。

在这里插入图片描述

结构体写入文件

结构体写入文件：C语言把文件看作一个字符（字节）的序列，即由一个一个字符（字节）的数据顺序组成。根据数据的组织形式，可分为ASCII文件和二进制文件。ASCII文件又称为文本（text）文件，它的每个字节放一个ASCII代码，代表一个字符。二进制文件是把内存中的数据按其在内在中的存储形式原样输出到磁盘上存放。二进制将数据在内存中的样子原封不动的搬到文件中，文本格式则是将每一个数据转换成字符写入到文件中，他们在大小上，布局上都有着区别。由此可以看出，二进制文件可以读出来直接用，但是文本文件还多一个“翻译”的过程，因此二进制文件的可移植性好。
C语言把一个结构体数组写入文件分三步：
1、以二进制写方式(wb)打开文件
2、调用写入函数fwrite()将结构体数据写入文件
3、关闭文件指针
相应的，读文件也要与之匹配：
1、以二进制读方式(rb)打开文件
2、调用读文件函数fread()读取文件中的数据到结构体变量
3、关闭文件指针
fwrite ：函数按照指定的数据类型将矩阵中的元素写入到文件中。写二进制文件其调用格式为：COUNT=fwrite (fd, A, precision)其中COUNT返回所写的数据元素个数，fd为文件句柄，A用来存放写入文件的数据，precision用于控制所写数据的类型，其形式与fread函数相同。当我们按照二进制方式往文件中写入数据，则将数据在内存中的存储形式原样输出到文件中。用fwrite 写入文件的如果是字符，那么就会显示为字符，写入的是数字显示不出来，写的是二进制内容（所谓的乱码）
fprintf ：写文本文件函数的调用格式为：COUNT= fprintf(fd, format, A)其中A存放要写入文件的数据。先按format指定的格式将数据矩阵A格式化，然后写入到fid所指定的文件。format用以控制读取的数据格式，由%加上格式符组成，常见的格式符有d，f，c，s。fid为文件句柄。fprintf写的是数字转换成ASCII码之后的字符。
当使用fwrite将一个int型数字65写入文本文件时，由于65对应的二进制数是1000001，十六进制数是0x41，存储的是以二进制的形式1000001.在notepad++中使用十六进制方式打开显示的是:0x0041，转换为十进制则为65。记事本打开可能存在乱码，因为fwrite在写入的时候是采用整字节的二进制写入，而文本编辑器采用的是ascll码显示，两者不兼容。
当使用fpintf将一个int型数字65写入文本文件时，将65每一位转换为ASCII码存储，6、5分别对应ASCII码54、53，存储的是ASCII码54、53.在notepad++中使用十六进制方式打开显示的是:3635，转换为十进制则为54、53，这正是数字6、5的ASCII码。使用记事本打开这个文本文件时，记事本将存储在其中的54、53当做ASCII码翻译为字符6、5显示，我们看到的是便是字符65。
二进制读写是将内存里面的数据直接读写入文本中，而文本呢，则是将数据先转换成了字符串，再写入到文本中。下面我用个例子来说明。
我们定义了一个结构体，表示一个学生信息，我们打算把学生的信息分别用二进制和文本的方式写入到文件中。

struct Student 
{
    int num;
    char name[20];
    float score;
};
我们定义两个方法，分别表示内存写入和文本写入
//使用二进制写入
void write_to_binary_file()
{
    struct Student stdu;
    stdu.num = 111;
    sprintf_s(stdu.name,20,"%s","shine");
    stdu.score = 80.0f;
    fstream binary_file("test1.dat",ios::out|ios::binary|ios::app); //此处省略文件是否打开失败的判断
    binary_file.write((char *)&stdu,sizeof(struct Student));//二进制写入的方式
    binary_file.close();
} 
//文本格式写入
void write_to_text_file()
{
    struct Student stdu;
    stdu.num = 111;
    sprintf_s(stdu.name,20,"%s","shine");
    stdu.score = 80.0f;
    FILE *fp = fopen("test2.dat","a+");   //此处省略文件是否打开失败的判断
    fprintf(fp,"%d%s%f",stdu.num,stdu.name,stdu.score); //将数据转换成字符串（字符串的格式可以自己定义）
    fclose(fp);
} 
//MAIN函数调用前面两个方法
int _tmain(int argc, _TCHAR* argv[])
{
    write_to_binary_file();
    write_to_text_file();
    
    return 0;
}

二进制图
二进制文件
文本文件图

stdu.num = 111： 二进制文件里面将111编码成6F，1个字节，这刚好是111的16进制表示，而文本文件中则写成31 31 31用了3个字节，表示111。
stdu.name = “shine”： 二进制和文本文件中73 68 69 6E 65都表示shine，这体现对字符数据处理的一致性。
stdu.score = 80.0f： 二进制文件里是几个连续的FE，而文本文件中是38 30…。文本文件将浮点数80.000000用了38(表示8) 30(表示0) 2E(表示.) 30(表示0) 30(表示0) 30(表示0) 30(表示0) 30(表示0) 30(表示0)，二进制文件用了4个字节表示浮点数00 00 A0 42
通过这里我们可以初见端倪了，二进制将数据在内存中的样子原封不动的搬到文件中，文本格式则是将每一个数据转换成字符写入到文件中，他们在大小上，布局上都有着区别。由此可以看出，二进制文件可以从读出来直接用，但是文本文件还多一个“翻译”的过程，因此二进制文件的可移植性好。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Linux

二进制文件与文本文件详解的相关文章

Docker：如何创建堆栈、多个映像或一个基础映像？

I am new using Docker and I got the doubt of using one image base for my stack or I have to define each image depending
Boost 安装在我的 Ubuntu 上的什么位置？

我从 Boost 网站下载 Boost 1 54 tar 然后按照此处 1 详细说明进行操作特别是我想将我的 boost 库安装在文件夹中 HOME BOOST 使用这个 bootstrap sh prefix HOME BOOST 但
无法使用 linux perf 对硬件缓存事件进行采样

由于某种原因我无法采样 perf record 硬件缓存事件 perf record e L1 dcache stores a c 100 sleep 5 perf record Woken up 1 times to write dat
如何在 Ubuntu x64 中使用 ptrace 插入 int3？

我正在努力追随本指南 http eli thegreenplace net 2011 01 27 how debuggers work part 2 breakpoints 通过设置断点达到相同的结果唯一的区别是我在 x64 系统上所以
在 execl 在输出中不可见之前打印

include
Linux shell 根据第二列对文件进行排序？

我有一个这样的文件 FirstName FamilyName Address PhoneNumber 如何按 FamilyName 排序如果这是 UNIX sort k 2 file txt 您可以使用多个 k用于对多列进行排序的标志例
如果文件没有行尾字符，则 wc -l 不计算文件的最后一个

我需要计算 unix 文件的所有行数该文件有 3 行但是wc l仅给出 2 个计数我知道它不计算最后一行因为它没有行尾字符任何人都可以告诉我如何计算这一行吗 grep c返回匹配行的数量只需使用一个空字符串作为您的匹配表达式
如何告诉 mex 链接到 /usr/lib 中的 libstdc++.so.6 而不是 MATLAB 目录中的 libstdc++.so.6？

现在 MATLAB 2012a 中的 mex 仅正式支持 gcc 4 4 6 但我想使用 gcc 4 7 风险自负现在如果我直接用 mex 编译一些东西它会抱怨 usr lib gcc i686 linux gnu 4 7 cc1plu
如何通过 makefile 在 Linux 上安装程序？ [复制]

这个问题在这里已经有答案了可能的重复 Linux Unix make install 应该包含什么 https stackoverflow com questions 528399 what should linux unix make
如何将一个文本文件拆分为多个 *.txt 文件？

我有一个文本文件file txt 12 MB 包含 something1 something2 something3 something4 有没有办法分开file txt分成 12 个 txt 文件比方说file2 txt file3 t
如何获取与 shell 中的文件名模式匹配的所有文件的总文件大小？

我正在尝试仅使用 shell 来计算与文件名模式匹配的所有文件在目录树中的总大小以字节为单位这是我到目前为止所拥有的 find name undo exec stat c s awk 总计 1 END 打印总计有没有更简单的方法来
使用脚本检查 git 分支是否领先于另一个分支

I have branch1 and branch2我想要某种 git branch1 isahead branch2 这将显示如果branch1已承诺branch2没有也可能指定这些提交我无法检查差异原因branch2 is在之前br
在 scapy 中通过物理环回发送数据包

我最近发现了 Scapy 它看起来很棒我正在尝试查看 NIC 上物理环回模块存根上的简单流量但是 Scapy sniff 没有给出任何结果我正在做的发送数据包是 payload data 10 snf sniff filter ic
使用 ioctl 在 C++ 中以编程方式添加路由

我编写了简单的 C 函数添加了新路线 void addRoute int fd socket PF INET SOCK DGRAM IPPROTO IP struct rtentry route memset route 0 sizeof
Linux shell 从用户输入中获取设备 ID

我正在为一个程序编写安装脚本该程序需要在其配置中使用 lsusb 的设备 ID 因此我正在考虑执行以下操作 usblist lsusb put the list into a array for each line use the arr
如何在 Linux 和 C 中使用文件作为互斥体？

我有不同的进程同时访问 Linux 中的命名管道并且我想让此访问互斥我知道可以使用放置在共享内存区域中的互斥体来实现这一点但作为一种家庭作业我有一些限制于是我想到的是对文件使用锁定原语来实现互斥我做了一些尝试但无法使其发挥作
在 x86 汇编语言中获取文件大小的简单方法

假设我已经在汇编中打开了一个文件并且在寄存器 eax 中有该文件的文件句柄我将如何获取文件的大小以便为其分配足够的缓冲区空间我在这里研究了另一个讨论建议使用sys fstat 28 系统调用来获取文件统计信息但无法实现它 My a
LINUX：如何锁定内存中进程的页面

我有一个 LINUX 服务器运行一个具有大量内存占用的进程某种数据库引擎该进程分配的内存太大需要将其中一部分换出换出我想做的是将所有其他进程或正在运行的进程的子集的内存页面锁定在内存中以便只有数据库进程的页面被换出例如
Linux无法删除文件

当我找到文件时我在删除它们时遇到问题任务必须找到带有空格的文件并将其删除我的尝试 rm find L root grep i 但我有错误 rm cannot remove root test No such file or dire
Linux 使用 boost asio 拒绝套接字绑定权限

我在绑定套接字时遇到问题并且以用户身份运行程序时权限被拒绝这行代码会产生错误 acceptor new boost asio ip tcp acceptor io boost asio ip tcp endpoint boost asi

随机推荐

AI绘图：教你几个提示词 100%生成美丽小姐姐

许多常用提示对于确保高质量的成像结果至关重要我们将教您一些基本的提示词和设置以节省您在初始探索过程中的时间本次用到的模型ChilloutMix 基础设置默认设置包括图片大小 512 x 512 采样器 DPM SDE Karras
逆序栈（使用递归）

题目一个栈依次压入1 2 3 4 5那么从栈顶到栈底分别为5 4 3 2 1 将这个栈转置后从栈顶到栈底为1 2 3 4 5 也就是实现了栈中元素的逆序请设计一个算法实现逆序栈的操作但是只能用递归函数来实现而不能用另外的数据结构
springBoot添加自定义拦截器

文章目录前言步骤如下首先新建一个自己的拦截器其次把自己的拦截器注册到spring中让其生效前言新的项目需要校验用户是否登录在springBoot项目中添加一个自定义的拦截器拦截到所有请求进行逻辑判断步骤如下首先新建一个
资讯汇总230429

230429 11 44 大华股份重点投入大模型和多模态方向会持续按需扩容算力大华股份在业绩说明会表示 GPT 的发展具有里程碑式的意义公司会重点投入大模型和多模态方向过去在大模型领域的算法和工程能力已经有一定的积累先进技术研究
内行看门道：看似“佛系”的《QQ炫舞手游》，背后的音频技术一点都不简单

欢迎大家前往腾讯云社区获取更多腾讯海量技术实践干货哦本文由腾讯游戏云发表于云社区专栏内行看门道看似佛系的 QQ炫舞手游背后的音频技术一点都不简单 3月14日腾讯旗下知名手游 QQ炫舞正式上线各大应用商店并迅速登上Ap
卡尔曼滤波与目标跟踪(由cv模型的kf推理到CTRV模型的radar与lidar))(一)

引用AdamShan 引用知乎陈光基于cv模型的行人状态预测卡尔曼滤波与目标追踪卡尔曼的理论一初始化我们认为小车在第1秒时的状态x与测量值z相等二预测 Prediction 完成初始化后我们开始写Prediction部分的
Ubuntu20.04安装各种库----简洁版

目录 Eigen3 Sophus Pangolin Ceres g2o 建议先装anaconda再装ros python opencv啥该有的都有了下面仅仅安装ros没有的库 Eigen3 作用线性代数开源库提供了有关线性代数矩阵和
汽配企业如何利用MES管理系统解决生产防错难题

汽车配件制造业是一个高效率低成本高质量的生产领域但同时也面临着一系列的挑战其中最为突出的挑战之一是如何在生产过程中避免错误提高产品的合格率本文将介绍汽车配件的制造特点以及如何通过MES管理系统解决方案实现生产防错从而提高产品合
爬虫逆向(js逆向)

异步爬虫的实现方式线程池多任务的异步协程多线程生产者消费者模型线程池前提 from flask import Flask render template from time import sleep app Flask name
【NLP】文本聚类和主题建模

大家好我是Sonhhxg 柒希望你看完之后能对你有所帮助不足请指正共同学习交流个人主页 Sonhhxg 柒的博客 CSDN博客欢迎各位点赞收藏留言系列专栏机器学习 ML 自然语言处理 NLP 深度学习 DL fore
Chrome浏览器更新之后在开发者工具中查看格式化后的js不显示行号问题

最近更新了谷歌浏览器然后在调试代码的时候发现一个问题就是当js代码是压缩后的将其格式化之后就只显示压缩之前的行号了如下未格式化的格式化之后这样就很无语了突然没有了行号就很不习惯了经过在浏览器设置里面一番找之后终于找到设置这
微信公众号开发（一）——开发模式接入，消息的接收与响应

1 想自己开一个公众号先学习一下用 Java 进行微信公众号的开发微信公众号的管理有开发模式和编辑模式两种两者是互斥的腾讯是这么讲的编辑模式编辑模式指所有的公众号运营者都可以通过简单的编辑设置按关键字回复等功能您可以设定
python 打包成可执行文件

文章目录 pyinstaller 另外一个打包工具Nuitka 常见命令选项工具很多只说两个 pyinstaller 网上很多人说 pyinstaller 打包慢啊文件大啊这那这那的可能是我还没理解别的工具的妙用我发现 pyin
Unsupported major.minor version 52.0 版本不支持问题

摘自 https blog csdn net qq 36769100 article details 78880341 Unsupported major minor version 52 0 这个错误网上一百度一大堆我就简单的记一下直
从github上下载下来的c++代码用vs或QTCreator运行起来（Cmake）

初学C 从github上下载了一份源码不知道怎么运行特此来记录一下源码下载下来如图所示 1 用VS运行的方法 1 文件里有CMake 需要我们有CMake工具来构建所以第一步就是下载CMake 下载链接 Download CMake
微信小程序tab切换，可滑动切换，导航栏跟随滚动实现

微信小程序tab切换可滑动切换导航栏跟随滚动实现简介看到今日头条小程序页面可以滑动切换而且tab导航条也会跟着滚动点击tab导航页面滑动切导航栏也会跟着滚动就想着要怎么实现这个功能像商城类商品类目如果做成左右滑动切换类目
关于：Google Chrome 官方下载地址

1 官方在线安装版 Google Chrome 网络浏览器https www google cn intl zh CN chrome 2 官方离线安装版
五大学科竞赛（二）NIOP全国青少年信息学奥林匹克分区联赛竞赛大纲

一初赛内容与要求表示普及组不涉及以下同计基算本机常的识诞生与发展特点在现代社会中的应用计算机系统的基本组成计算机的工作原理计算机中的数的表示计算机信息安全基础知识计算机网络计基算本机操的
IDEA使用JDBC连接MySQL数据库详细教程

文章目录创建项目导入驱动让导入的驱动生效注册数据库驱动连接数据库创建项目首先需要保证你已经成功安装mysql和下载连接MySQL数据库的驱动在IDEA里面创建一个java项目选择创建Java项目 JDK这里选择1 8 直接
二进制文件与文本文件详解

二进制文件定义二进制文件就是把内存中的数据按其在内存中存储的形式原样输出到磁盘中存放即存放的是数据的原形式二进制文件是包含在 ASCII 及扩展 ASCII 字符中编写的数据或程序指令的文件一般是可执行程序图形声音等文件有自

二进制文件与文本文件详解

二进制文件

文本文件

结构体写入文件

二进制文件与文本文件详解 的相关文章

随机推荐

热门标签

二进制文件与文本文件详解的相关文章