Pandas 和 scikit-learn：KeyError：[....] 不在索引中

2024-03-08

我不明白为什么会出现错误KeyError: '[ 1351 1352 1353 ... 13500 13501 13502] not in index'当我运行这段代码时：

cv = KFold(n_splits=10)

for train_index, test_index in cv.split(X):
    f_train_X, f_valid_X = X[train_index], X[test_index]
    f_train_y, f_valid_y = y[train_index], y[test_index]

I use X（一个 Pandas 数据框）来分割 Icv.split(X).

X.shape
y.shape
Out: (13503, 17)
Out: (13503,)

问题是您尝试索引的方式X using X[train_index]. 你需要使用.loc or .iloc既然你有pandas数据框。

Use this

cv = KFold(n_splits=10)

for train_index, test_index in cv.split(X):
    f_train_X, f_valid_X = X.iloc[train_index], X.iloc[test_index]
    f_train_y, f_valid_y = y.iloc[train_index], y.iloc[test_index]

第一种方式：使用示例`iloc`

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD'))

df[[1,2]]
#KeyError: '[1 2] not in index'

df.iloc[[1,2]]
#    A   B   C   D
#1  25  97  78  74
#2   6  84  16  21

第二种方式：提前将 pandas 转换为 numpy 的示例

df = df.values

#now this should work fine
df[[1,2]]
#array([[25, 97, 78, 74],
#      [ 6, 84, 16, 21]])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

machinelearning

scikitlearn

Pandas 和 scikit-learn：KeyError：[....] 不在索引中的相关文章

在 Celery 任务中调用 Google Cloud API 永远不会返回

我正在尝试拨打外部电话Google Cloud Natural Language API从一个内Celery任务使用google cloud python包裹问题是对 API 的调用永远不会返回挂起 celery task def g
如何从Python中的函数返回多个值？ [复制]

这个问题在这里已经有答案了如何从Python中的函数返回多个变量您可以用逗号分隔要返回的值 def get name you code return first name last name 逗号表示它是一个元组因此您可以用括号将值括
python multiprocessing 设置生成进程等待

是否可以生成一些进程并将生成进程设置为等待生成的进程完成下面是我用过的一个例子 import multiprocessing import time import sys def daemon p multiprocessing curr
在 Django Admin 中调整字段大小

在管理上添加或编辑条目时 Django 倾向于填充水平空间但在某些情况下当编辑 8 个字符宽的日期字段或 6 或 8 个字符的 CharField 时这确实是一种空间浪费字符宽然后编辑框最多可容纳 15 或 20 个字符我如何告
PyQt 使用 ctrl+Enter 触发按钮

我正在尝试在我的应用程序中触发确定按钮我当前尝试的代码是这样的 self okPushButton setShortcut ctrl Enter 然而它不起作用这是有道理的我尝试查找一些按键序列here http ftp ics
MongoEngine 查询具有以列表中指定的前缀开头的属性的对象的列表

我需要在 Mongo 数据库中查询具有以列表中任何前缀开头的特定属性的元素现在我有一段这样的代码 query mymodel terms term in query terms 并且这会匹配在列表 term 上有一个项目的对象该列表中的
Tensorboard SyntaxError：语法无效

当我尝试制作张量板时出现语法错误尽管开源代码我还是无法理解我尝试搜索张量板的代码但不清楚即使我不擅长Python 我这样写路径C Users jh902 Documents logs因为我正在使用 Windows 10 但我不确定
GUI（输入和输出矩阵）？

我需要创建一个 GUI 将数据输入到矩阵或表格中并读取此表单数据完美的解决方案是限制输入表单仅允许float 例如 A 1 02 0 25 0 30 0 515 0 41 1 13 0 15 1 555 0 25 0 14 1 21 2
如何使用 Selenium 和 ChromeDriver 解决 TypeError: 'module' object is not callable 错误 [重复]

这个问题在这里已经有答案了代码试验 from selenium import webdriver from selenium webdriver chrome options import Options as Chromeoptions
使用 Python Oauthlib 通过服务帐户验证 Google API

我不想使用适用于 Python 的 Google API 客户端库但仍想使用 Python 访问 Google APIOauthlib https github com idan oauthlib 创建服务帐户后谷歌开发者控制台 http
Python - 如何确定解析的 XML 元素的层次结构级别？

我正在尝试使用 Python 解析 XML 文件中具有特定标记的元素并生成输出 excel 文档该文档将包含元素并保留其层次结构我的问题是我无法弄清楚每个元素解析器在其上迭代的嵌套深度 XML 示例摘录 3 个元素它们可以任意嵌套
找到一个数字所属的一组范围

我有一个 200k 行的数字范围列表例如开始位置停止位置该列表包括除了非重叠的重叠之外的所有类型的重叠列表看起来像这样 3 5 10 30 15 25 5 15 25 35 我需要找到给定数字所属的范围并对 100k 个数字重复该
在 Google App Engine 中，如何避免创建具有相同属性的重复实体？

我正在尝试添加一个事务以避免创建具有相同属性的两个实体在我的应用程序中每次看到新的 Google 用户登录时我都会创建一个新的播放器当新的 Google 用户在几毫秒内进行多个 json 调用时我当前的实现偶尔会创建重复的播放器
PySpark groupByKey 返回 pyspark.resultiterable.ResultIterable

我试图找出为什么我的 groupByKey 返回以下内容 0
如何将 Django 中的权限添加到模型并使用 shell 进行测试

我在模型中添加了 Meta 类并同步了数据库然后在 shell 中创建了一个对象它返回 false 所以我真的无法理解错误在哪里或者缺少什么是否在其他文件中可能存在某种配置 class Employer User Employer in
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
pandas.read_csv 将列名移动一倍

我正在使用位于的 ALL zip 文件here http www fec gov disclosurep PDownload do 我的目标是用它创建一个 pandas DataFrame 但是如果我跑 data pd read csv
如何在 Flask 中的视图函数/会话之间传递复杂对象

我正在编写一个 Web 应用程序当且仅当用户登录时该应用程序从第三方服务器接收大量数据这些数据被解析为自定义对象并存储在list 现在用户在应用程序中使用这些数据调用不同的视图例如发送不同的请求我不确定什么是最好的模式在视
pytest找不到模块[重复]

这个问题在这里已经有答案了我正在关注pytest 良好实践 https docs pytest org en latest explanation goodpractices html test discovery或者至少我认为我是但是
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS

随机推荐

iOS 7：标签栏控制器的不同导航项目

我对 iOS 应用程序开发还比较陌生目前我正在开发一个带有标签栏的小应用程序我面临的问题是我希望每个选项卡都有不同的导航项目我尝试了很多事情但事情都不起作用我正在使用原生 iOS 语言进行编程在我的应用程序中我有一个 AppD
如何通过获取用户输入的日期来查找两个日期之间的日差

我需要通过获取日期作为用户输入来查找两个日期之间的天数差异我尝试使用获取日期raw input但我收到错误我正在使用 2 7 版本的 python import time from datetime import date day1 i
编译器会排除未使用的模板代码吗？

当您使用具有多种方法例如向量的模板并编译代码时编译器会丢弃未使用的方法中的代码吗除非使用模板否则不会实例化模板因此实际上没有任何代码可以丢弃标准说 14 7 1 10 实现不得隐式实例化不需要实例化的函数模板成员模板非虚成
查找两个字符串之间的公共子串

我想比较两个字符串并保留匹配的字符串在比较失败的地方分开所以如果我有 2 个字符串 string1 apples string2 appleses answer apples 另一个例子因为字符串可能有多个单词 string1 app
emacs 是否可以突出显示 80 个以上的字符？ [复制]

这个问题在这里已经有答案了我在这里看到了一些解决方案如果超过 80 个字符它们会突出显示整行并且还会执行line wrap一旦该行变得大于 80 我想做的是编辑我的 emacs文件以便超过 80 个字符的任何字符都呈现不同的背景
c 中的模拟器/生成的 switch 语句范围

是否有 hack 来支持 c 99 或 Objective C switch 语句中的范围情况我知道不支持这样写 switch x case 1 case 2 10 case 11 但我认为应该有一种方法可以使用 define 宏生成代码
如何统计用户输入中字母的频率？

当用户在 Ruby 中输入类似单词时如何计算 supercaliforniamightly 中出现的字母的频率并打印出星星或星号来计算出现的字母数量这是我的代码 puts Enter string text gets chomp te
解码 Pandas 中的 one-hot 数据帧

我有 2 个数据框数据如下 df1 id name age likes 0 A 21 rose 1 B 22 apple 2 C 30 grapes 4 D 21 lily df2 category Fruit Flower orange
ansible 2.13 中弃用了 hash_behavior 合并

我们有很多 group vars webserver yml 文件其结构如下如果没有 hash behaviour merge 这些站点将不再被合并并且不再可能以干净的方式配置多个虚拟主机您建议如何解决该问题项目1 yml sit
用另一个包完全覆盖 NPM 包

根据 NPM 官方文档 overrides in package json允许用另一个包完全覆盖一个包覆盖提供了一种替换依赖树中的包的方法与另一个版本或完全另一个包这些改变可以根据需要将范围设定为具体或模糊 https docs
为什么 Laravel 默认情况下通过 POST 注销（而不是 GET）？ [复制]

这个问题在这里已经有答案了在 Laravel 应用程序的上下文中 POST 执行注销的意义是什么 POST 与 GET 相比是否存在一些安全性和或会话特殊性生成的相关部分make auth ul class dropdown menu
VS2017 vstemplate自动安装Nuget包？

您好我有一个 Nuget 包希望让它在项目创建后自动安装我将其添加到我的 vstemplate 文件中
使用 Microsoft Access 作为 MySQL 数据库的前端？

我的 Microsoft Access 数据库 FE BE 已经摆脱了限制我必须导入更多数据因此 Access 不再是我的正确选择我将切换到 MySQL 不是 SQL Server 作为一个很好的替代方案但我想知道使用什么作为 My
如何在 Swift 5 中解码像“\xc3\xa6”这样的 utf8 文字？

我正在从蓝牙特性中获取 WiFi SSID 列表每个 SSID 都表示为一个字符串有些具有 UTF8 文字例如 xc3 xa6 我尝试了多种方法来解码这个像 let s xc3 xa6 let dec s utf8 由此我期望 pri
组合 Averageif 和 Averagea：将空白视为 0 进行条件平均

我需要计算可以包含空单元格或空字符串的范围内的平均值公式平均IF https support google com docs answer 3256529 hl en like AVERAGE https support google
使用 Swift 更改占位符文本颜色

我有一个实现深蓝色的设计UITextField 由于占位符文本默认为深灰色我几乎看不清占位符文本的内容我当然已经用谷歌搜索了这个问题但在使用 Swift 语言而不是 Obj c 时我还没有找到解决方案有没有办法改变占位符文本颜色UI
ShinyDashboard 动态要点

我希望有一个简单的问题可以将标签有序列表传递到闪亮的仪表板中我想做的是有一个函数可以根据过滤的类别生成项目符号的有序列表这是我希望能够使用名为 nba teams 的数据框执行的操作的一个简单示例 teams conference B
Android ViewPageAdapter 为每个选项卡提供单独的后台堆栈

我有一个只有一个 Activity 的 Android 应用程序该活动包含一个带有 ViewPageAdapter 的 SlidingTabLayout 如下所示this http www exoguru com android mate
致命错误：刷新表视图时索引超出范围

当拉动刷新时我遇到了这个奇怪的应用程序崩溃我的代码如下 var posts Posts override func viewDidLoad super viewDidLoad refreshControl gt pull to refr
Pandas 和 scikit-learn：KeyError：[....] 不在索引中

我不明白为什么会出现错误KeyError 1351 1352 1353 13500 13501 13502 not in index 当我运行这段代码时 cv KFold n splits 10 for train index test i

Pandas 和 scikit-learn：KeyError：[....] 不在索引中

Use this

第一种方式：使用示例iloc

第二种方式：提前将 pandas 转换为 numpy 的示例

Pandas 和 scikit-learn：KeyError：[....] 不在索引中 的相关文章

随机推荐

热门标签

第一种方式：使用示例`iloc`

Pandas 和 scikit-learn：KeyError：[....] 不在索引中的相关文章