pandas concat 用 NaN 填充非对齐索引

2023-11-21

Problem

我连接了两个 int 类型系列，而我返回的数据帧是 float 类型。发生这种情况是因为该系列的索引未对齐，并且当发生串联时，pandas 用 NaN 填充空白。然而，NaN 被认为是浮点数，不幸的是，我的所有整数都随之转换为浮点数。

Question

我的问题是，如何用其他不会将整数转换为浮点数的东西来填补空白？

MCV

import pandas as pd

s1 = pd.Series([1], index=['A'])
s2 = pd.Series([1], index=['B'])

print "s1 type: {} | s2 type: {}\n".format(s1.dtype, s2.dtype)

df = pd.concat([s1, s2], axis=1)
print df, "\n"
print df.dtypes

Prints:

s1 type: int64 | s2 type: int64

     0    1
A  1.0  NaN
B  NaN  1.0 

0    float64
1    float64
dtype: object

首先是dtype转换是由于NaN不能用整数表示，所以float选择了数据类型。

其次，当这种情况发生时，这将成为个人选择，这取决于你，没有正确的选择。

例如我们可以使用fillna具有任意值，例如0 or -1然后我们可以使用astype(int):

In [21]:
df.fillna(0).astype(int)

Out[21]:
   0  1
A  1  0
B  0  1

但这可能不是您想要的，您可能决定使用以下方法删除这些行dropna但这可能意味着您会丢失有价值的信息，如果您正在进行某种机器学习或其他分析，这些信息可能至关重要。

因此，您可能决定将这些列/行设置为最小值/最大值/平均值或中值，但如果列值依赖于其他列，这可能会产生严重后果，例如我们将所有缺失值设置为最小值/max 但该值会在预测模型丢失时产生偏差熵/信息因为如果您有大量缺失值，那么您的数据就会偏向最小值/最大值。就我个人而言，在这些情况下，我发现 Mean 工作得很好。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

pandas concat 用 NaN 填充非对齐索引的相关文章

为什么 dataclasses.astuple 返回类属性的深层副本？

在下面的代码中astuple函数正在执行数据类的类属性的深层复制为什么它不能产生与函数相同的结果my tuple import copy import dataclasses dataclasses dataclass class Dem
在 Python 中将列表元素作为单独的项目返回

Stackoverflow 的朋友们大家好我有一个计算列表的函数我想单独返回列表的每个元素如下所示接收此返回的函数旨在处理未定义数量的参数 def foo my list 1 2 3 4 return 1 2 3 4 列表中的元素数
在 Celery 任务中调用 Google Cloud API 永远不会返回

我正在尝试拨打外部电话Google Cloud Natural Language API从一个内Celery任务使用google cloud python包裹问题是对 API 的调用永远不会返回挂起 celery task def g
pandas DataFrame.join 的运行时间是多少（大“O”顺序）？

这个问题更具概念性理论性与非常大的数据集的运行时间有关所以我很抱歉没有一个最小的例子来展示我有一堆来自两个不同传感器的数据帧我需要最终将它们连接成两个very来自两个不同传感器的大数据帧 df snsr1 and df snsr2
我应该使用 Python 双端队列还是列表作为堆栈？ [复制]

这个问题在这里已经有答案了我想要一个可以用作堆栈的 Python 对象使用双端队列还是列表更好元素数量较少还是数量较多有什么区别您的情况可能会根据您的应用程序和具体用例而有所不同但在一般情况下列表非常适合堆栈 append is
python multiprocessing 设置生成进程等待

是否可以生成一些进程并将生成进程设置为等待生成的进程完成下面是我用过的一个例子 import multiprocessing import time import sys def daemon p multiprocessing curr
GUI（输入和输出矩阵）？

我需要创建一个 GUI 将数据输入到矩阵或表格中并读取此表单数据完美的解决方案是限制输入表单仅允许float 例如 A 1 02 0 25 0 30 0 515 0 41 1 13 0 15 1 555 0 25 0 14 1 21 2
为什么一旦我离开内置的运行服务器，Django 就无法找到我的管理媒体文件？

当我使用内置的简单服务器时一切正常管理界面很漂亮 python manage py runserver 但是当我尝试使用 wsgi 服务器为我的应用程序提供服务时django core handlers wsgi WSGIHandle
pandas - 包含时间序列数据的堆积条形图

我正在尝试使用时间序列数据在 pandas 中创建堆积条形图 DATE TYPE VOL 0 2010 01 01 Heavy 932 612903 1 2010 01 01 Light 370 612903 2 2010 01 01 Me
python 中的“槽包装器”是什么？

object dict 和其他地方的隐藏方法设置为这样的
Python：Goslate 翻译请求返回“503：服务不可用”[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我们不允许提出寻求书籍工具软件库等推荐的问题您可以编辑问题以便用事实和引文来回答这个问题似乎不是关于主要由程序员使用的特定编程问
Firebase Firestore：获取文档的生成 ID (Python)

我可以创建一个新文档带有自动生成的 ID 并存储对其的引用如下所示 my data key value doc ref db collection u campaigns add my data 我可以像这样访问数据本身 print d
如何使用 Boto3 启动具有 IAM 角色的 EC2 实例？

我无法弄清楚如何使用指定的 IAM 角色在 Boto3 中启动 EC2 实例以下是迄今为止我如何成功创建实例的一些示例代码 import boto3 ec2 boto3 resource ec2 region name us west 2
如何将 Django 中的权限添加到模型并使用 shell 进行测试

我在模型中添加了 Meta 类并同步了数据库然后在 shell 中创建了一个对象它返回 false 所以我真的无法理解错误在哪里或者缺少什么是否在其他文件中可能存在某种配置 class Employer User Employer in
等待子进程使用 os.system

我用了很多os system在 for 循环内调用创建后台进程如何等待所有后台进程结束 os wait告诉我没有子进程 ps 我使用的是Solaris 这是我的代码 usr bin python import subprocess imp
在virtualenv中下载sqlite3

我正在尝试使用命令创建应用程序python3 manage py startapp webapp但我收到一条错误消息 django core exceptions ImproperlyConfigured 加载时出错 pysqlite2 或
pandas.read_csv 将列名移动一倍

我正在使用位于的 ALL zip 文件here http www fec gov disclosurep PDownload do 我的目标是用它创建一个 pandas DataFrame 但是如果我跑 data pd read csv
如何在 Flask 中的视图函数/会话之间传递复杂对象

我正在编写一个 Web 应用程序当且仅当用户登录时该应用程序从第三方服务器接收大量数据这些数据被解析为自定义对象并存储在list 现在用户在应用程序中使用这些数据调用不同的视图例如发送不同的请求我不确定什么是最好的模式在视
如何将Python3设置为Mac上的默认Python版本？

有没有办法将 Python 3 8 3 设置为 macOS Catalina 版本 10 15 2 上的默认 Python 版本我已经完成的步骤看看它安装在哪里 ls l usr local bin python 我得到的输出是这样的
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS

随机推荐

什么时候 dispose 方法不会被调用？

我正在读书this前几天的文章我想知道为什么有 Finalizer 和 Dispose 方法我读here关于为什么您可能想要将 Dispose 添加到 Finalizer 中我好奇的是什么时候 Finalizer 会通过 Dispo
JSX 元素中带有 withStyles 的通用类型参数

在 React with Material ui 中我尝试创建一个接受通用参数并使用withStylesHOC 注入我的风格第一种方法是这样的 const styles theme Theme gt createStyles card
使用单个语句分配整个数组

假设我声明并初始化 int a 3 1 2 3 以后如何才能一次性分配整个数组呢 IE a 3 2 1 如果您的 C 编译器支持复合文字您可以使用memcpy memcpy a int 3 2 1 sizeof a 如果您不打算在其中添加
如何使 flatpickr datepicker 在 livewire / alpinejs 应用程序中具有反应性？

在我的 laravel 7 livewire 1 3 alpinejs 2 项目中我添加了 flatpickr datepicker 从https flatpickr js orgdatepicker 工作正常但反应式不起作用在下面的
使用 Javascript（或 Angular）在每个部分上组合具有不同 Content-Type 的 multipart/form-data

问错了问题请参阅下面的更新我需要将我的 AngularJS 项目与现有的 RESTful API 集成这些 API 使用 POST 请求upload a file 并在请求中提交表单数据不幸的是其中一个表单输入需要位于Conten
GCP：您没有足够的权限通过 SSH 连接到此实例

我在一个 GCP 项目上拥有一个非管理员帐户当我启动 Dataproc 集群时 GCP 会启动 3 个虚拟机当我尝试通过以下方式访问其中一台虚拟机时SSH 在浏览器中我收到以下错误我尝试添加推荐权限但无法添加iam servi
使用 jQuery / Phonegap 进行 Soap 查询在 Android 上总是失败

我使用 jQuery mobile 和 Phonegap 现在的 Cordova 开发了一个 iPhone Android 应用程序这个应用程序使用不同的服务没有问题其中一项服务是 Soap 服务因此我使用 jQuery 的 jsSO
如何在运行批处理文件时不打开Cmd窗口

我编写的每个批处理文件都会打开一个 Cmd 窗口并使其保持打开状态直到程序完成要在 bat 文件中包含什么命令字符串才能不打开 CMD 窗口或打开它并立即隐藏它我必须留在 MSW7 Pro 内置编程的范围内现在我只是使用 msg
串口二进制传输变回车

上周我一直在尝试用 C 实现一个原始的串行文件传输协议我遇到了一个非常奇怪的问题我似乎无法在网上找到解决方案我已经设法通过串行端口传输二进制数据并接收它但在此过程中所有 0D 字节都转换为 0A 以下是我的代码 include
遗传算法中防止近亲繁殖和单一栽培（新手问题）

我正在写一个遗传算法我的人口很快就形成了单一文化我使用的是具有少量离散基因每个个体 24 个基因的小群体 32 个个体和单点交叉交配方法将其与轮盘赌选择策略结合起来很容易看出所有遗传多样性是如何在短短几十代内消失的我想知道的
使用导航抽屉保存片段状态

我想在使用 android 导航抽屉切换片段时保存片段的状态如果之前已加载过该片段则不应刷新该片段是否可以要保持片段的状态您必须调用setRetainInstance true 片段内的onCreate 它能做什么控制fragm
$route.reload() 不适用于 ui-router

我已经切换到用户界面路由器一切都很顺利除了一件事在我的页面上我有一个可以更改应用程序上下文的选择无论如何以前当这个上下文改变时我正在执行这段代码特别是 set方法 use strict angular module mai
Firebase 10.0.：InternalFirebaseAuth.FIREBASE_AUTH_API 在此设备上不可用

我正在使用 Firebase 身份验证使用 Google 帐户开发 Android 应用程序最近每次尝试连接时都会遇到以下异常 com google firebase FirebaseApiNotAvailableException
使用 DOS 或 BIOS 显示字符

翻翻拉尔夫布朗的中断列表我发现有很多不同的方法可以将文本字符输出到屏幕上 ROM BIOS API 提供以下功能 AH 09h 在光标位置写入字符和属性 AH 0Ah 仅在光标位置写入字符 AH 0Eh 电传打字机输出 AH 13h 写
如何使用 MySQL 函数按属性删除 JSON 数组中的对象？

假设存储在 MySQL 中的以下 JSONjson数据类型 users group manager userID a123 group employee userID a456 如何删除用户对象 userID a456 不知道它在数组中的位
MaxExpansionDepth 与最新的 webapi 和微风

我最近将所有 nuget 包更新为 EF6 的最新版本 breeze 1 4 5 system web http odata 5 0 0 0 以及所有其他可用的好东西现在对于包含 x y z 这样的扩展的一个查询我收到如下错误 A f
哪里可以下载JMXMP？

我想使用 VisualVM 通过 JMX 远程分析 Java 应用程序由于它是经过 NAT 和防火墙保护的 EC2 实例因此我无法使用默认的 RMI 方法而需要使用必须首先下载的可选 JMXMP 扩展注意如果您想使用 JMXMP
如何在不重新启动服务器的情况下停止 Jenkins 上不可阻挡的僵尸作业？

我们的 Jenkins 服务器有一个作业已经运行了三天但没有做任何事情单击角落里的小 X 不会执行任何操作控制台输出日志也不会显示任何内容我检查了我们的构建服务器该作业实际上似乎根本没有运行有没有办法通过编辑某些文件或锁定或其他
ASP.NET 中的两种方式数据绑定

假设我们有一个对象 class Entity public string ID get set public string Name get set 我想将属性绑定到页面上的两个文本框如下所示
pandas concat 用 NaN 填充非对齐索引

Problem 我连接了两个 int 类型系列而我返回的数据帧是 float 类型发生这种情况是因为该系列的索引未对齐并且当发生串联时 pandas 用 NaN 填充空白然而 NaN 被认为是浮点数不幸的是我的所有整数都随之转换

热门标签