numpy var() 和 pandas var() 之间的区别

2023-11-29

最近遇到的一件事让我注意到numpy.var() and pandas.DataFrame.var() or pandas.Series.var()给出不同的值。我想知道它们之间有什么区别吗？

这是我的数据集。


     Country    GDP     Area    Continent
0      India    2.79    3.287   Asia
1      USA     20.54    9.840   North America
2      China    13.61   9.590   Asia

这是我的代码：


from sklearn.preprocessing import StandardScaler

ss = StandardScaler()

catDf.iloc[:,1:-1] = ss.fit_transform(catDf.iloc[:,1:-1])

现在检查 Pandas 方差

# Pandas Variance
print(catDf.var())
print(catDf.iloc[:,1:-1].var())
print(catDf.iloc[:,1].var())
print(catDf.iloc[:,2].var())

输出是

GDP     1.5
Area    1.5
dtype: float64
GDP     1.5
Area    1.5
dtype: float64
1.5000000000000002
1.5000000000000002

而它应该是 1，因为我已经使用了 StandardScaler。

对于 numpy 方差

print(catDf.iloc[:,1:-1].values.var())
print(catDf.iloc[:,1].values.var())
print(catDf.iloc[:,2].values.var())

输出是

1.0000000000000002
1.0000000000000002
1.0000000000000002

这似乎是正确的。

pandas var has ddof of 1默认情况下，numpy有它在0.

得到的都是一样的var在 pandas 中，就像你在 numpy 中一样

catDf.iloc[:,1:-1].var(ddof=0)

这归结为之间的差异总体方差和样本方差.

注意sklearn标准洁牙机明确提到他们使用 ddof 0，并且由于它不太可能影响模型性能（因为它只是为了缩放），因此他们没有将其公开为可配置参数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

NumPy

statistics

numpy var() 和 pandas var() 之间的区别的相关文章

DreamPie 不适用于 Python 3.2

我最喜欢的 Python shell 是DreamPie http dreampie sourceforge net 我想将它与 Python 3 2 一起使用我使用了添加解释器 DreamPie 应用程序并添加了 Python 3 2
Python 多处理示例不起作用

我正在尝试学习如何使用multiprocessing但我无法让它发挥作用这是代码文档 http docs python org 2 library multiprocessing html from multiprocessing imp
如何等到 Excel 计算公式后再继续 win32com

我有一个 win32com Python 脚本它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的这可能需要一分钟如何强制工作簿计算值
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
ExpectedFailure 被计为错误而不是通过

我在用着expectedFailure因为有一个我想记录的错误我现在无法修复但想将来再回来解决我的理解expectedFailure是它会将测试计为通过但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是当我
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
Nuitka 未使用 nuitka --recurse-all hello.py [错误] 编译 exe

我正在尝试通过 nuitka 创建一个简单的 exe 这样我就可以在我的笔记本电脑上运行它而无需安装 Python 我在 Windows 10 上并使用 Anaconda Python 3 我输入 nuitka recurse all h
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
在Python中重置生成器对象

我有一个由多个yield 返回的生成器对象准备调用该生成器是相当耗时的操作这就是为什么我想多次重复使用生成器 y FunctionWithYield for x in y print x here must be something t
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代

随机推荐

更快的 UIImage - Base64 转换

我正在做的工作必须在之间进行编码和解码UIImage和 Base 64 字符串这对于较小的图像非常有效向前和向后转换只需不到 1 秒但当我将其应用于较大的图像时需要很长时间几乎一分钟有没有其他方法来编码和解码UIImage对象字
调用 ffmpeg.c 的 main 两次导致应用程序崩溃

使用 FFmpeg 4 0 2 并调用它ffmpeg c s main函数两次导致 Android 应用程序崩溃使用 FFmpeg 共享库和 JNI A libc Fatal signal 11 SIGSEGV code 1 fault
使用通用参数作为端口数组长度

我想做的事 entity FIRfilter is generic NTAPS integer port h in array 0 to NTAPS 1 of std logic vector 15 downto 0 end FIRfitl
基于数据库数组PHP自动检查复选框

在我的页面的用户设置选项卡中我希望用户确定特定用户发布的帖子类型表格如下
Spark独立模式和本地模式有什么区别？

Spark独立模式和本地模式有什么区别 Spark Standalone是一个可以在集群上工作的资源管理器它只是内置的资源管理器而不是像纱线这样的外部资源管理器 Spark本地运行无需任何资源管理器一切都在单个jvm中运行您可以决定
Java 同步方法...不同步

对于我当前的 java 练习我必须从 2 个不同的 Gmail 帐户获取邮件我通过创建 Gmail 类的新实例来完成此操作 gmail 类扩展了线程其中有一个同步方法 readMail 用于获取邮件并打印它这个 readMail 方
使用 NLog 将记录器名称写入 Excel 文件

感谢 Rolf 在这个问题中的评论 NLog 在 C 中具有严重性和类别我能够将日志消息的类别例如热或数据库或机械记录到文本文件中我只需将名称传递给 GetLogger 方法即可完成此操作 public MainWindo
Mongoimport 带有字符串 _id 和 upsert 的 csv 文件

我正在尝试使用 mongoimport 来更新插入 id 中带有字符串值的数据由于 id 看起来像整数即使它们在引号中因此 mongoimport 将它们视为整数并创建新记录而不是更新插入现有记录我正在运行的命令 mongoimp
Android GPU 分析 - OpenGL 动态壁纸速度很慢

我正在使用 OpenGL ES 3 0 开发动态壁纸我已经根据优秀教程进行了设置http www learnopengles com how to use opengl es 2 in an android live wallpaper
如何在 NestJS 中处理 RpcException

我正在尝试构建一个包含多个微服务的 NestJS 后端和一个作为与微服务通信的网关的 REST API 对于网关和微服务之间的通信我使用 gRPC 简单的通信已经可以工作但现在我想在微服务中实现错误处理 NestJS 文档指出这可以通
RecyclerView 查看项目

我想在 RecyclerView 中显示 2 列但它们显示在 1 列中如下图所示如何在两列中显示我的视图我在我的代码中尝试了两列 rcv pro setLayoutManager new GridLayoutManager this
如何在无需用户交互且仅通过客户端 ID 和密码的情况下验证我的 Quickbook Intuit api 访问？

我正在开发一个项目其中后台 crons 创建发票我想将它们添加到我在后端创建的 Quickbook 帐户中所以问题是我想仅使用客户端 ID 和秘密参与来访问 api 如何在无需用户交互且仅通过客户端 ID 和密码的情况下验证我的 Qu
有没有办法在使用 ES6 简写方法表示法的方法中使用词法 `this` ？

关于SO的第一个问题我希望我没有重复任何内容我看过other 问题并认为我的不同足以值得询问基本上有没有办法让this它位于使用速记符号编写的方法的方法主体中或者是词法的或者是绑定到特定值的这样做的动机来自于我在实现时想要使用
如何指定 JSON 对象应采用哪一个 oneOf 项？

使用Python和jsonschema我正在尝试验证分配ObjA or ObjB等等beta test json alpha beta ObjA 在我的架构中 testschema json beta is oneOf多个项目每个项目定义
Selenium-IDE：如何验证/断言页面刷新

我的页面上有一个链接单击该链接会刷新此页面如何使用 Selenium IDE 验证页面是否确实已刷新重新加载我通过断言页面上最初存在的元素在刷新后不存在于页面上来解决这个问题然后等到页面完全刷新并断言该元素再次存在刷新并等待
React router dom 中的链接不会加载页面，仅 url 浏览器导航会更改

React router dom v5 和 React 16 我的加载应用程序组件包含 ReactDOM render
如何通过 Android 应用程序编辑日历事件

我如何通过 Android 应用程序编辑日历中的日历事件任何人都知道如何在日历应用程序中打开议程活动从日历中读取数据后试试这个将单次事件添加到日历要将条目添加到特定日历我们需要使用 ContentValues 配置要插入的日历条
unicodecsv 读取器从 unicode 字符串无法正常工作？

我在将 unicode CSV 字符串读入 python unicodescv 时遇到问题 gt gt gt import unicodecsv StringIO gt gt gt f StringIO StringIO u gt gt g
在sqlite3数据库中插入1000000行

我想向数据库中插入 10 00 000 行但是插入的时间太长了例如现在我正在尝试 2055 行需要 3 分钟才能将这些数据上传到数据库中对于 2055 个条目来说这个时间太多了以下是我将数据插入数据库的方法 public voi
numpy var() 和 pandas var() 之间的区别

最近遇到的一件事让我注意到numpy var and pandas DataFrame var or pandas Series var 给出不同的值我想知道它们之间有什么区别吗这是我的数据集 Country GDP Area Cont

numpy var() 和 pandas var() 之间的区别

numpy var() 和 pandas var() 之间的区别 的相关文章

随机推荐

热门标签

numpy var() 和 pandas var() 之间的区别的相关文章