KeyError：“没有 [Int64Index([ 12313,\n , 34534],\n dtype='int64', leng

2024-02-22

官方指南

我正在尝试使用官方 scikitlern 的最新示例代码分层K折 https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.StratifiedKFold.html

>>> import numpy as np
>>> from sklearn.model_selection import StratifiedKFold
>>> X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])
>>> y = np.array([0, 0, 1, 1])
>>> skf = StratifiedKFold(n_splits=2)
>>> skf.get_n_splits(X, y)
2
>>> print(skf)
StratifiedKFold(n_splits=2, random_state=None, shuffle=False)
>>> for train_index, test_index in skf.split(X, y):
...     print("TRAIN:", train_index, "TEST:", test_index)
...     X_train, X_test = X[train_index], X[test_index]
...     y_train, y_test = y[train_index], y[test_index]
TRAIN: [1 3] TEST: [0 2]
TRAIN: [0 2] TEST: [1 3]

MY CODE

我将所有日期保存在 2 个 pandas 数据框 X,y 中，采用整数和浮点值

skf = StratifiedKFold(n_splits=4) # shuffle=True, random_state=1

for train_index, test_index in skf.split(X, y):
    X_train = X[train_index]
    X_test = X[test_index]
    y_train = y[train_index]
    y_test = y[test_index]
    print("TRAIN:", train_index, "TEST:", test_index)

ERROR

---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)
<ipython-input-12-2776afce57e9> in <module>
      2 
      3 for train_index, test_index in skf.split(X, y):
----> 4     X_train = X[train_index]
      5     X_test = X[test_index]
      6     y_train = y[train_index]

~/anaconda3/lib/python3.8/site-packages/pandas/core/frame.py in __getitem__(self, key)
   2906             if is_iterator(key):
   2907                 key = list(key)
-> 2908             indexer = self.loc._get_listlike_indexer(key, axis=1, raise_missing=True)[1]
   2909 
   2910         # take() does not accept boolean indexers

~/anaconda3/lib/python3.8/site-packages/pandas/core/indexing.py in _get_listlike_indexer(self, key, axis, raise_missing)
   1252             keyarr, indexer, new_indexer = ax._reindex_non_unique(keyarr)
   1253 
-> 1254         self._validate_read_indexer(keyarr, indexer, axis, raise_missing=raise_missing)
   1255         return keyarr, indexer
   1256 

~/anaconda3/lib/python3.8/site-packages/pandas/core/indexing.py in _validate_read_indexer(self, key, indexer, axis, raise_missing)
   1296             if missing == len(indexer):
   1297                 axis_name = self.obj._get_axis_name(axis)
-> 1298                 raise KeyError(f"None of [{key}] are in the [{axis_name}]")
   1299 
   1300             # We (temporarily) allow for some missing keys with .loc, except in

KeyError: "None of [Int64Index([ 785015,  785016,  785017,  785018,  785019,  785020,  785021,\n             785022,  785023,  785024,\n            ...\n            3140252, 3140253, 3140254, 3140255, 3140256, 3140257, 3140258,\n            3140259, 3140260, 3140261],\n           dtype='int64', length=2355196)] are in the [columns]"

我尝试过的解决方案

他在不同的地方有错误 -关键错误：列中没有 [Int64Index...] dtype='int64] https://stackoverflow.com/questions/55667169/key-error-none-of-int64index-dtype-int64-are-in-the-columns
没有答案，也没有错误消息 -
不同的代码，不同，数据存储在最后——使用 sklearn 的 KFold 分离 pandas 数据框 https://stackoverflow.com/questions/45115964/separate-pandas-dataframe-using-sklearns-kfold

你必须打电话ilocpandas 数据框的函数通过索引访问值：

    X_train = X.iloc[train_index]
    X_test = X.iloc[test_index]
    y_train = y.iloc[train_index]
    y_test = y.iloc[test_index]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

NumPy

scikitlearn

KeyError：“没有 [Int64Index([ 12313,\n , 34534],\n dtype='int64', leng 的相关文章

如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
__del__ 真的是析构函数吗？

我主要用 C 做事情其中析构函数方法实际上是为了销毁所获取的资源最近我开始使用python 这真的很有趣而且很棒我开始了解到它有像java一样的GC 因此没有过分强调对象所有权构造和销毁据我所知 init 方法对我来说在 py
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
Abaqus 将曲面转化为集合

我一直试图在模型中找到两个表面的中心参见照片但未能成功它们是元素表面面查询中没有选项可以查找元素表面的中心只能查找元素集的中心找到节点集的中心也很好但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中而且我找不到
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
Geopandas 设置几何图形：MultiPolygon“等于 len 键和值”的 ValueError

我有 2 个带有几何列的地理数据框我将一些几何图形从 1 个复制到另一个这对于多边形效果很好但对于任何有效多多边形都会返回 ValueError 请指教如何解决这个问题我不知道是否如何为什么应该更改 MultiPolygon
Python - 在窗口最小化或隐藏时使用 pywinauto 控制窗口

我正在尝试做的事情我正在尝试使用 pywinauto 在 python 中创建一个脚本以在后台自动安装 notepad 隐藏或最小化 notepad 只是一个示例因为我将编辑它以与其他软件一起使用 Problem 问题是我想在安装程序
Numpy 优化

我有一个根据条件分配值的函数我的数据集大小通常在 30 50k 范围内我不确定这是否是使用 numpy 的正确方法但是当数字超过 5k 时它会变得非常慢有没有更好的方法让它更快 import numpy as np N 5000
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
Nuitka 未使用 nuitka --recurse-all hello.py [错误] 编译 exe

我正在尝试通过 nuitka 创建一个简单的 exe 这样我就可以在我的笔记本电脑上运行它而无需安装 Python 我在 Windows 10 上并使用 Anaconda Python 3 我输入 nuitka recurse all h
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
在 Python 类中动态定义实例字段

我是 Python 新手主要从事 Java 编程我目前正在思考Python中的类是如何实例化的我明白那个 init 就像Java中的构造函数然而有时 python 类没有 init 方法在这种情况下我假设有一个默认构造函数就像
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
Spark.read 在 Databricks 中给出 KrbException

我正在尝试从 databricks 笔记本连接到 SQL 数据库以下是我的代码 jdbcDF spark read format com microsoft sqlserver jdbc spark option url jdbc sql
Python：元类属性有时会覆盖类属性？

下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject

随机推荐

构造函数不接受我的信息

所以构造函数是说是预期的错误不是声明并且预期的 Person num1 num2 num3 num1 new Person Allison 6600 Crescent Ave 32 9024231421 num2 new Perso
最大夏普比率投资组合因 PortfolioAnalytics 中的错误而失败

在计算简单的最大夏普比率投资组合权重时我在 PortfolioAnalytics 中遇到了一个问题 Error in max sr opt R R constraints constraints moments moments Objec
Python：在曲线和轴之间填充颜色并区域化区域

我在 Excel 工作表上有两条曲线的一组 x y 值使用xlrd模块我已经能够将它们绘制如下问题如何使用不同的填充颜色对三个区域进行着色曾尝试过fill between但由于不知道如何与x轴和y轴关联而没有成功心中的结局如下图
PHP：如何删除索引后的所有数组元素[重复]

这个问题在这里已经有答案了是否可以删除索引后的所有数组元素 myArrayInit array 1 gt red 30 gt orange 25 gt velvet 45 gt pink 现在一些魔法 myArray delIndex
PySide：如何在 QPushButton 单击槽中获取单击的 QPushButton 对象？

我是 PySide 的新手我想在其单击的插槽中获取 QPushButton 对象例如使用它来获取其文本 button QtGui QPushButton start go button clicked connect self butt
如何向引用添加事件监听器？

如何添加事件监听器ref使用 ReactJS Hooks 版本 16 8 这是一个示例我尝试使用 Overflow auto 获取某些 div 的滚动位置 updateScrollPosition永远不会被叫到 function Exam
MongoDB minidump文件路径错误

我最近卸载了 MongoDB 3 2 以安装 MongoDB 3 6 从那时起每次我尝试启动 mongod 时都会收到以下错误 failed to open minidump file C Program Files MongoDB S
如何正确重用 Jackson ObjectMapper？

我对 ObjectMapper 的工作方式以及在我的应用程序中的一般使用感到满意我想了解的是实现 ObjectMapper 以确保它被重用并且我不会在应用程序中创建不必要的实例的最佳方法我的想法是我可以在 Utils 类中声明 Obj
RxJS SkipWhile 与过滤器

SkipWhile 和过滤器运算符有什么区别 const source interval 1000 const example source pipe skipWhile val gt val lt 5 const subscribe ex
这是一个什么样的对象，反应式的？

我的 Server R 中有这段代码 selection1 lt reactive filter filter DF1 PC in input dynamic AGE gt input age 1 AGE lt input age 2 DF
akka-camel 2.2.1 使用 Spring XML 定义路由

我使用的是 akka camel 2 2 1 需要分别配置往返于 Consumer 和 Producer Actor 的路由我目前正在定义路由并以编程方式将它们添加到 CamelExtension 内的内部 Camel 上下文中如下所示
Android：无法使用 CustomAdapter 刷新 Listview

我需要用新数据刷新列表视图下面这段代码用于获取数据OnCreateView那是在FragmentActivity在第一时间 override fun onCreateView inflater LayoutInflater contain
多处理管道 send() 块

根据Python文档只有recv 阻止但不阻止send 我编写了以下代码尝试制作 GUI 数独游戏我这样做的方式是即使我可以更新游戏板tkinter正在执行其mainloop 然而在测试运行过程中我发现如果我在游戏更新时关闭窗口 p
跨域 AJAX/Javascript - 人为地使用 sessionid

我目前有一个 RESTful Web 服务它通过会话识别客户端我有一个客户端它使用 ajax javascript 来访问 RESTful Web 服务的内容我通过使用标头响应请求来允许这种情况发生 Access Control A
Python套接字：无效的起始字节

我正在使用 Python 套接字来接收文件但是有时我会收到以下错误 Traceback most recent call last File C Users Sharkoon Nextcloud Elektronik pythonPro
在渲染期间设置 glTexParameteri() 是否不好？

我面临纹理包裹问题这会导致伪影由于我的代码库已经变得巨大我能想到的唯一方法是执行某些检查看看某些纹理是否属于导致伪影的类别并在绘制到渲染缓冲区之前更改参数那么一般情况下是可以的吗设置参数例如 glTexParameteri
找不到任何要加载的固定装置服务

我知道这个问题已经被问过多次 Symfony 3 4 和 Fixtures Bundle 捆绑版本 3 0 存在问题 https stackoverflow com questions 50252845 symfony 3 4 and fi
在 64 位系统上向 Linux Kernel 3.13 添加新的系统调用

我正在尝试添加一个简单的helloworld系统调用kernel 3 13 0 37 generic在 64 位系统上我将尝试逐步展示到目前为止我所做的事情 1 我已经通过以下方式下载了内核源代码 sudo apt get source
Haskell 中句柄是半封闭错误？

我在 GHCI 中收到此错误 Exception
KeyError：“没有 [Int64Index([ 12313,\n , 34534],\n dtype='int64', leng

官方指南我正在尝试使用官方 scikitlern 的最新示例代码分层K折 https scikit learn org stable modules generated sklearn model selection Stratified

KeyError：“没有 [Int64Index([ 12313,\n , 34534],\n dtype='int64', leng

KeyError：“没有 [Int64Index([ 12313,\n , 34534],\n dtype='int64', leng 的相关文章

随机推荐

热门标签