Pandas 在读取 SAS 文件时数据类型正确失败

2024-05-27

我有一个SAS数据集 http://www.principlesofeconometrics.com/sas/cars.sas7bdat当我运行它时，我在 SAS 上得到以下输出：

我还有以下 Python 代码，它获取 .sas7bdat 文件并显示输出，即这里的前五个观察结果。

import pandas as pd
file_name = "cars.sas7bdat"
my_df = pd.read_sas(file_name)
my_df = my_df.head()
print(my_df)

正如您所看到的，当涉及到整数数据类型时，它不能正确工作。 CYL 和 WGT 变量是整数，但如果我使用 pandas' 则无法正确显示read_sas函数 http://pandas.pydata.org/pandas-docs/version/0.20/generated/pandas.read_sas.html.

知道这是怎么回事吗？

SAS 将所有数字表示为 64 位（8 字节）浮点数。但是您可以通过告诉它存储少于 8 个字节来节省磁盘空间。您发布的数据集针对 CYL 和 WGT 执行了此操作。

当 SAS 从磁盘读回数据集以供使用时，它将丢失的最低有效字节设置为二进制零。显然read_sas不明白这一点，它没有将丢失的字节设置为二进制零，而是做了其他事情。因此看似随机的数据。

CYL 的第一个值是8在 IEEE 浮点数中是十六进制代码

40 20 00 00 00 00 00 00

您所显示的价值8.00046将会是这个值。

40 20 00 06 07 80 FD C1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

types

sas

Pandas 在读取 SAS 文件时数据类型正确失败的相关文章

将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
使 django 服务器可以在 LAN 中访问

我已经安装了Django服务器可以如下访问 http localhost 8000 get sms http 127 0 0 1 8000 get sms 假设我的IP是x x x x 当我这样做时从同一网络下的另一台电脑 my ip
如何在flask中使用g.user全局

据我了解 Flask 中的 g 变量它应该为我提供一个全局位置来存储数据例如登录后保存当前用户它是否正确我希望我的导航在登录后在整个网站上显示我的用户名我的观点包含 from Flask import g among other
Flask 会话变量

我正在用 Flask 编写一个小型网络应用程序当两个用户在同一网络下尝试使用应用程序时我遇到会话变量问题这是代码 import os from flask import Flask request render template
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
SQLALchemy .query：类“Car”的未解析属性引用“query”

我有一个这里已经提到的问题https youtrack jetbrains com issue PY 44557 https youtrack jetbrains com issue PY 44557 但我还没有找到解决方案我使用 Pyt
基于代理的模拟：性能问题：Python vs NetLogo & Repast

我正在 Python 3 中复制一小段 Sugarscape 代理模拟模型我发现我的代码的性能比 NetLogo 慢约 3 倍这可能是我的代码的问题还是Python的固有限制显然这只是代码的一个片段但 Python 却花费了三分
Spark KMeans 无法处理大数据吗？

KMeans 有几个参数training http spark apache org docs latest api python pyspark mllib html highlight kmeans pyspark mllib clus
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
如何使用Python创建历史时间线

So I ve seen a few answers on here that helped a bit but my dataset is larger than the ones that have been answered prev
在f字符串中转义字符[重复]

这个问题在这里已经有答案了我遇到了以下问题f string gt gt gt a hello how to print hello gt gt gt f a a gt gt gt f a File
无法在 Python 3 中导入 cProfile

我试图将 cProfile 模块导入 Python 3 3 0 但出现以下错误 Traceback most recent call last File
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
使用 Python 绘制 2D 核密度估计

I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
发送用户注册密码，django-allauth

我在 django 应用程序上使用 django alluth 进行身份验证注册我需要创建一个自定义注册表单其中只有一个字段电子邮件密码将在服务器上生成这是我创建的表格 from django import forms from

随机推荐

Java ServiceExecutor 终止条件

我对 java 执行器很陌生我正在使用 Java 的 ExecutorService 启动多个线程来处理数据 Executor executor Executors newFixedThreadPool poolSize for int
scipy cdist 与稀疏矩阵

我需要计算两组向量之间的距离 source matrix and target matrix 我有以下几行当两者source matrix and target matrix属于类型scipy sparse csr csr matrix
json 网络前导零（禁用基本转换）

Json Net 无法正确反序列化带有前导零的数字例如 number 010 被识别为 8 因为0108 基等于8以 10 为基数如果看JsonTextReader ParseNumber 你可以看到 long value2 text2
关于编写惯用的 Golang 的建议

我正在掌握 Golang 的做事方式首先是一些示例代码 package main import log os func logIt s string f os OpenFile errors log os O RDWR os O CREA
为什么 git 无法识别我的本地存储库？

我刚刚回到一个我已经使用 Git 大约 6 个月的项目看到了这个 cd d DEVELOP BlenderAe My repo root git status fatal not a git repository or any of th
当浏览器在后台运行时收到通知时，使用 Firebase 播放声音

我想知道如何使用 Firebase Cloud Messaging FCM 播放声音当Chrome Firefox等网络浏览器在后台运行时收到通知消息时 notification while running in the backgrou
如何对 SQL Server 中的数据库进行单元测试？

有哪些方法呢您可以使用哪些框架好吧我想你的意思是对访问数据库的代码进行单元测试在这种情况下有NDbUnit http www ndbunit org 它似乎是 NET 的 DbUnit 克隆我从来没有使用过它但是我使用过DbU
如何在 Three.js 中重新调整三角形面的方向

用更好的例子进行编辑我使用 Three js 来显示 MRI 胃图像的外壳外壳是从 vtk 格式的外部文件加载的这是一个演示 http www menne biomed de uni 3d alphahull html http ww
为什么在这里使用BeginInvoke？

我正在研究其他人的代码并且对与多线程有关的任何事情没有太多经验我遇到了这行代码 BeginInvoke MethodInvoker delegate btnCalibrate PerformClick 我想知道为什么要这样做因为这样就
未捕获的类型错误：无法设置未定义的属性“[任何 AMD]”

示例scrollmagic模块但它也发生在其他模块上我怀疑这是为了 Babel 但不确定我们如何重现这个错误 git克隆https github com zurb foundation zurb template https gith
在 gnuplot 中创建仅带有箭头的向量

如何创建一个没有线条而只有箭头的矢量有一个名为 nohead 的选项它删除了箭头的头部但我想做相反的事情删除矢量的线并只保留头部最优选地还能够基于单个数字重新缩放该箭头的大小找到了一些有用的建议TeX交换 https tex s
如何在没有 API 请求的情况下使用 Nuxt.js 生成 100% 静态网站？

我正在测试周围Nuxt js https nuxtjs org 生成静态网站使用API 获取数据时是否可以生成100 静态站点从而摆脱API和请求根据我到目前为止的测试所有文件都已正确生成并托管在Github 页面 https pa
重写方法时，我的自定义代码应该位于 super(base) 之前还是之后

重写方法时我的自定义代码应该在对父类的超级基调用之前还是之后这里有 3 个选择如果你想执行代码之前的基本行为然后之前调用它如果你想执行代码后的基本行为然后调用它如果你想完全覆盖基本行为根本不调用它重要的是还检查您的 A
Sidekiq 停止一项正在运行的作业

所以我需要停止running以编程方式而非预定的在 Sidekiq 3 1 2 中进行作业我确实阅读了 API 文档但没有真正找到有关取消正在运行的作业的任何内容 sidekiq 可以做到这一点吗当这不可能直接实现时我的想法是通
Python Pandas 按列对多索引进行排序，但保留树结构

使用 pandas 0 20 3 我尝试按列 D 对数据帧的 n 个多级进行排序其中的值降序以便维护组的层次结构输入示例 D A B C Gran1 Par1 Child1 3 Child2 7 Child3 2 Par2 Chil
自动部署资源

我足够了解我们需要通过单个用户操作来部署我们的应用程序但是我don t know 在 NET 商店中可以使用哪些好工具您如何管理每个环境的配置更改有人可以给我指出一些用于持续集成的好资源吗我希望看到一些理论以及逐步的实践指南 Ed
Node.js + Express.js |尝试设置 HTTPS 服务器

我正在尝试使用 Node js 和 Express js 设置 HTTPS 服务器我目前正在尝试 const filesystem require fs const express require express const server
Xamarin MasterDetailPage 看起来很难看

I m trying to create a MasterDetailPage and I am not quite sure if I am doing that right but the drawer master just look
Oracle 事务在 C++ 和 Java 之间的传播

我们有一个现有的 C 应用程序我们将逐步将其替换为新的基于 Java 的系统在我们用 Java 完全重新实现所有内容之前我们期望 C 和 Java 必须相互通信 RMI SOAP 消息传递等我们尚未决定现在我的经理认为我们需要 J
Pandas 在读取 SAS 文件时数据类型正确失败

我有一个SAS数据集 http www principlesofeconometrics com sas cars sas7bdat当我运行它时我在 SAS 上得到以下输出我还有以下 Python 代码它获取 sas7bdat 文件并

Pandas 在读取 SAS 文件时数据类型正确失败

Pandas 在读取 SAS 文件时数据类型正确失败 的相关文章

随机推荐

热门标签

Pandas 在读取 SAS 文件时数据类型正确失败的相关文章