如何解决“值对于 dtype('float32') 来说太大？”

2024-03-20

我读了很多与此类似的问题，但仍然无法弄清楚。

clf = DecisionTreeClassifier()
clf.fit(X_train, y_train)

X_to_predict = array([[  1.37097033e+002,   0.00000000e+000,  -1.82710826e+296,
          1.22703799e+002,   1.37097033e+002,  -2.56391552e+001,
          1.11457878e+002,   1.37097033e+002,  -2.56391552e+001,
          9.81898928e+001,   1.22703799e+002,  -2.45139066e+001,
          9.24341823e+001,   1.11457878e+002,  -1.90236954e+001]])

clf.predict_proba(X_to_predict)

ValueError: Input contains NaN, infinity or a value too large for dtype('float32').

我的问题都不是nan nor inf值自：

np.isnan(X_to_predict).sum()
Out[147]: 0

np.isinf(X_to_predict).sum()
Out[148]: 0

问题：我怎样才能转换X_to_predict对于 float32 来说不太大的值，同时保留小数点后尽可能多的数字？

如果您检查dtype你的数组的X_to_predict它应该显示float64.

# slightly modified array from the question
X_to_predict = np.array([1.37097033e+002, 0.00000000e+000, -1.82710826e+296,
                         1.22703799e+002, 1.37097033e+002, -2.56391552e+001,
                         1.11457878e+002, 1.37097033e+002, -2.56391552e+001,
                         9.81898928e+001, 1.22703799e+002, -2.45139066e+001]).reshape((3, 4))

print(X_to_predict.dtype)
>>> float64

sklearn RandomForestClassifier 默默地将数组转换为float32，参见讨论here https://github.com/scikit-learn/scikit-learn/issues/2809错误消息的来源。

你可以自己转换一下

print(X_to_predict.astype(np.float32)))

>>> array([[137.09703 ,   0.      ,       -inf, 122.7038  ],
           [137.09703 , -25.639154, 111.45788 , 137.09703 ],
           [-25.639154,  98.189896, 122.7038  , -24.513906]], 
          dtype=float32)

第三个值 (-1.82710826e+296) 变为-inf在 float32 中。解决这个问题的唯一方法是更换你的inf最大值为 float32 的值。你会失去一些精度，据我所知，除了更改 sklearn 中的实现并重新编译之外，目前没有参数或解决方法。

如果你使用np.nan_to_num你的数组应该是这样的：

new_X = np.nan_to_num(X_to_predict.astype(np.float32))
print(new_X)

>>> array([[ 1.3709703e+02,  0.0000000e+00, -3.4028235e+38,  1.2270380e+02],
           [ 1.3709703e+02, -2.5639154e+01,  1.1145788e+02,  1.3709703e+02],
           [-2.5639154e+01,  9.8189896e+01,  1.2270380e+02, -2.4513906e+01]],
          dtype=float32)

您的分类器应该接受它。

完整代码

import numpy as np
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris

iris = load_iris()
clf = RandomForestClassifier(n_estimators=10,
                             random_state=42)
clf.fit(iris.data, iris.target)

X_to_predict = np.array([1.37097033e+002, 0.00000000e+000, -1.82710826e+296,
                         1.22703799e+002, 1.37097033e+002, -2.56391552e+001,
                         1.11457878e+002, 1.37097033e+002, -2.56391552e+001,
                         9.81898928e+001, 1.22703799e+002, -2.45139066e+001]).reshape((3, 4))

print(X_to_predict.dtype)

print(X_to_predict.astype(np.float32))

new_X = np.nan_to_num(X_to_predict.astype(np.float32))

print(new_X)

#should return array([2, 2, 0])
print(clf.predict(new_X))



# should crash
clf.predict(X_to_predict)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

scikitlearn

如何解决“值对于 dtype('float32') 来说太大？” 的相关文章

使用 pythonbrew 编译 Python 3.2 和 2.7 时出现问题

我正在尝试使用构建多个版本的 python蟒蛇酿造 http pypi python org pypi pythonbrew 0 7 3 但我遇到了一些测试失败这是在运行的虚拟机上 Ubuntu 8 04 32 位当我使用时会发生这种情
Django 代理模型的继承和多态性

我正在开发一个我没有启动的 Django 项目我面临着一个问题遗产我有一个大模型在示例中简化称为MyModel这应该代表不同种类的物品的所有实例对象MyModel应该具有相同的字段但方法的行为根据项目类型的不同而有很大差异到目
SQLAlchemy 通过关联对象声明式多对多自连接

我有一个用户表和一个朋友表它将用户映射到其他用户因为每个用户可以有很多朋友这个关系显然是对称的如果用户A是用户B的朋友那么用户B也是用户A的朋友我只存储这个关系一次除了两个用户 ID 之外 Friends 表还有其他字段因此
使 django 服务器可以在 LAN 中访问

我已经安装了Django服务器可以如下访问 http localhost 8000 get sms http 127 0 0 1 8000 get sms 假设我的IP是x x x x 当我这样做时从同一网络下的另一台电脑 my ip
为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
如何使用Conda下载python包并随后离线安装？

我知道通过 pip 我可以使用以下命令下载 Python 包但 pip install 破坏了我的内部包依赖关系当我做 pip download
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
Python pickle：腌制对象不等于源对象

我认为这是预期的行为但想检查一下也许找出原因因为我所做的研究结果是空白我有一个函数可以提取数据创建自定义类的新实例然后将其附加到列表中该类仅包含变量然后我使用协议 2 作为二进制文件将该列表腌制到文件中稍后我重新运行脚本
OpenCV 无法从 MacBook Pro iSight 捕获

几天后我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗示例代码
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
AWS EMR Spark Python 日志记录

我正在 AWS EMR 上运行一个非常简单的 Spark 作业但似乎无法从我的脚本中获取任何日志输出我尝试过打印到 stderr from pyspark import SparkContext import sys if name m
绘制方程

我正在尝试创建一个函数它将绘制我告诉它的任何公式 import numpy as np import matplotlib pyplot as plt def graph formula x range x np array x rang
从 Flask 访问 Heroku 变量

我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
使用其构造函数初始化 OrderedDict 以便保留初始数据的顺序的正确方法？

初始化有序字典 OD 以使其保留初始数据的顺序的正确方法是什么 from collections import OrderedDict Obviously wrong because regular dict loses order d O
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate

随机推荐

如何在所有字段名称中过滤 C# dataGridView？

I see 在这个视频中 http www youtube com watch v 2h7C IL FB8添加文本框并让它驱动 datagridView 的过滤非常容易问题在于该视频中您似乎必须指定要根据哪一列进行过滤 RowFilte
错误：“getGamesClient() 未定义” - 尝试运行 Google 的示例游戏

我正在尝试运行 Google Game Play Services 示例here https github com playgameservices android samples tree master 8BitArtist 我已按照指示
为温莎城堡中的所有接口实现注册拦截器

我对温莎城堡相当陌生特别是使用拦截器我想知道是否可以在特定接口的所有实现中注册拦截器而无需依次指定每个实现例如我有一个名为IComponent这将由许多班级实施我有一个ComponentInterceptor编写的类在这些类执行
java中线程池的类型[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案 java中的线程池有哪几种类型我需要实现一个强大的多线程应用程序该应用程序使用大量计算我应该使用哪个线程池 java中有多种线程
在 Spree (RoR) 中保存产品时，价格会乘以 100

我在 Rails 3 1 3 和 Ruby 1 9 3 之上安装了在线购物框架 Spree 我还使用 Spree i18n gem 来本地化商店现在每当我保存产品时价格都会乘以 100 例如在管理区域中我输入价格 3 20 结果是
String.split() *不*用于正则表达式？

Since String split 使用正则表达式这个片段 String s str str argh s split r 产量 s t s t a g h 分割这个字符串的最优雅的方法是什么r 序列以便它产生 st st argh
Java EE7 中的多个 Web 套接字端点或单个 Web 套接字端点哪个更好

Java EE 7 允许您通过注释非常轻松地创建新端点但是我想知道使用多个端点来处理每种消息类型是一个好主意还是应该只使用一个端点外观来处理所有内容我倾向于拥有一个单一端点外观其理论基础是每个端点都会创建一个到客户端的新套接字连接
如何在没有通用视图的 post_save_redirect 参数的情况下重定向到 Django 中新创建的对象

我正在尝试将用户重定向到新创建的对象object get absolute url 保存表格后我没有使用通用视图所以我不能使用post save redirect争论的相关部分view就像这样 if form is valid for
MemorySharp 设置地址偏移量不起作用

好的我正在使用MemorySharp用于读取写入游戏内存的库我的问题是当我尝试将偏移量添加到基指针地址时 Visual Studio 在运行时会引发错误这是基本代码 using var m new MemorySharp Appl
无法比较飞行中的 ping 时间

我尝试以下命令失败 sdiff lt ping www nato int lt ping www reuters com 有什么办法可以实时比较 ping 时间吗通常我只是并排打开两个 xterm 然后在每个 xterm 中运行 ping
使用可滚动结果集在休眠中批量读取数据

我正在阅读一篇关于使用休眠进行批量获取的博客http java dzone com articles bulk fetching hibernate http java dzone com articles bulk fetching hi
编译错误：Lambda 目标类型交集类型

public class X Object o I J gt interface I public void foo interface J public void foo public void bar Oracle 编译器抛出错误 X
WCF服务路由，瓶颈？

我们的应用程序服务器体系结构经过设置以便每个服务调用都经过自定义构建的 WCF 服务路由器一个使用请求消息标头中嵌入的信息将传入请求分发到适当服务的服务我们在使用此 WCF 服务路由器时遇到性能问题对并发用户进行负载测试时超时我们
WinRT 中的应用程序间通信

Windows 8 上有两个 WinRT 应用程序 C Xaml 如果有的话第一个应用程序应该接收一些数据并将其发送到第二个应用程序中最好的方法是什么可以使用WCF吗编辑第一个应用程序知道第二个应用程序实际上第二个应用程序是一个
使用 JDBC 进行批量插入的有效方法

在我的应用程序中我需要进行大量插入它是一个 Java 应用程序我使用普通 JDBC 来执行查询数据库是Oracle 不过我启用了批处理因此它节省了执行查询的网络延迟但查询作为单独的 INSERT 串行执行 insert int
模拟来自developer.sandbox.com的recurring_ payment_skipped IPN

当定期付款失败时我需要模拟 IPN 然后我的应用程序可以创建待处理发票并将其发送给客户我搜索并发现我需要设置将在下面处理的 IPNtxn type recurring payment skipped recurring payment
验证货币输入的最佳方法？

我创建了 TextBox 和 CompareValidator 我认为它们将允许以下形式的输入 5 5 00 5 00 不幸的是它不允许带有美元符号的版本如果不允许美元符号那么对货币进行类型检查有什么意义呢有没有办法允许这个符号
如何对总和为 100% 的一组数字进行四舍五入

今天我的一位朋友向我展示了网站上的一个错误 Link http img594 imageshack us img594 7605 mrul png 您可以看到百分比之和为 100 1 49 20 7 10 9 7 5 5 7 100 1
JQuery 验证未验证

我正在尝试使用 JQuery 验证器插件来验证 Rails 应用程序但它既不会抛出任何错误也不会验证任何内容我不知道我的代码还有什么问题任何帮助将不胜感激 document ready function theform valida
如何解决“值对于 dtype('float32') 来说太大？”

我读了很多与此类似的问题但仍然无法弄清楚 clf DecisionTreeClassifier clf fit X train y train X to predict array 1 37097033e 002 0 00000000e

如何解决“值对于 dtype('float32') 来说太大？”

如何解决“值对于 dtype('float32') 来说太大？” 的相关文章

随机推荐

热门标签