sklearn.preprocessing OneHotEncoder——仅仅是数值型字段才可以,如果是字符类型字段则不能直接搞定...

2023-10-27

 

>>> from sklearn.preprocessing import OneHotEncoder
>>> enc = OneHotEncoder()

>>> enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])  

>>> enc.n_values_
array([2, 3, 4])

>>> enc.feature_indices_
array([0, 2, 5, 9]) >>> enc.transform([[0, 1, 1]]).toarray() array([[ 1., 0., 0., 1., 0., 0., 1., 0., 0.]])


注意:仅仅是数值型字段才可以,如果是字符类型字段则不能直接搞定

需要使用pandas get_dummies搞定

例如:

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot编码

  1. pd.get_dummies(df)  


还可以:
import pandas as pd
import numpy as np
from sklearn_pandas import DataFrameMapper
from sklearn.preprocessing import OneHotEncoder

data = pd.DataFrame({'text':['aaa', 'bbb'], 'number_1':[1, 1], 'number_2':[2, 2]})

#    number_1  number_2 text
# 0         1         2  aaa
# 1         1         2  bbb

# SomeEncoder here must be any encoder which will help you to get
# numerical representation from text column
mapper = DataFrameMapper([
    ('text', SomeEncoder),
    (['number_1', 'number_2'], OneHotEncoder())
])
mapper.fit_transform(data)

 

 



本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

sklearn.preprocessing OneHotEncoder——仅仅是数值型字段才可以,如果是字符类型字段则不能直接搞定... 的相关文章

随机推荐

  • conda安装PaddlePaddle

    最近在学深度学习 但是我打开c盘看见多了 keras之流的东西 又要安飞浆时突然想到conda的默认安装路径 Anaconda Prompt里执行 conda info env 查看已经安装的环境以及位置 进入百度飞浆官网 找到安装教程 W
  • 华为OD机试 - 最佳植树距离(Java & JS & Python)

    题目描述 按照环保公司要求 小明需要在沙化严重的地区进行植树防沙工作 初步目标是种植一条直线的树带 由于有些区域目前不适合种植树木 所以只能在一些可以种植的点来种植树木 在树苗有限的情况下 要达到最佳效果 就要尽量散开种植 不同树苗之间的最
  • 带你了解软件版本号的命名规则

    1 常见软件的版本号命名 软件 升级过程 说明 Linux Kernel 0 0 1 1 0 0 2 6 32 3 0 18 若用 X Y Z 表示 则偶数 Y 表示稳定版本 奇数 Y 表示开发版本 Windows Windows 98 W
  • 是创新还是天真?BlockCity推出BC众创引争议

    三个简陋的主页面 两种推广返佣奖励模式 七个用户身份等级设置 只能围绕BlockCity进行推广 就这样一个用于营销传播的返佣平台 或者说加强版的自营淘宝客平台 居然被自吹自擂地冠以 创业元宇宙 的名义 这就是BlockCity 区块城市
  • MicroBlaze系列教程(9):xilisf串行Flash驱动库的使用

    文章目录 1 xilisf库简介 2 xilisf库函数 3 xilisf配置 4 xilisf应用示例 工程下载 本文是Xilinx MicroBlaze系列教程的第9篇文章 1 xilisf库简介 xilisf库 Xilinx In s
  • 32位下printf的坑(输出错误的值)

    记一次使用printf的坑 printf输出错误 32位编译 include
  • 360校招编程题:内存管理

    题目描述 物联网技术的蓬勃发展 各种传感器纷纷出现 小B所在的项目组正在开放一个物联网项目 她们在研究设计一种新的传感器 这种传感器有自己的基本处理单元 具有一定的自主性 能够进行简单的数据收集 处理 存储和传输 为降低系统功耗并保证系统可
  • 【网络编程】网络基础知识

    前言 小亭子正在努力的学习编程 接下来将开启javaEE的学习 分享的文章都是学习的笔记和感悟 如有不妥之处希望大佬们批评指正 同时如果本文对你有帮助的话 烦请点赞关注支持一波 感激不尽 目录 网络编程 什么是网络编程 网络通信基本模式 网
  • 关于利用JavaScript中的sort方法实现自定义排序

    众所周知 javascript中的sort方法可以实现排序 但是如果只是使用默认的方法 很难拿到理想的结果 默认用法 const arr 1 3 2 12 5 9 1 arr sort console log 排列的信息 arr 1 1 1
  • Keras中文官方文档(离线版)

    点此查看
  • chatgpt赋能python:Python交互编程入门指南

    Python交互编程入门指南 Python是一种高级编程语言 适合初学者和专业人士使用 Python的互动式编程方式为开发人员提供了快速反馈的环境 从而实现更便捷和高效的开发过程 在本文中 我们将介绍Python的交互编程 为您提供Pyth
  • 计算机磁盘是如何实现存储的?

    存储原理简述 硬盘是在硬质盘片 一般是铝合金 以前 IBM 也尝试过使用玻璃 上涂敷薄薄的一层铁磁性材料 硬盘储存数据的原理和盒式磁带类似 只不过盒式磁带上存储是模拟格式的音乐 而硬盘上存储的是数字格式的数据 写入时 磁头线圈上加电 在周围
  • 极智开发

    1 logo修改 BasicLayout jsx import logo from assets example jpg 替换成自己的logo即可 1 2 文字标题 defaultSettings js const proSettings
  • 同行评审的五个方法都是怎样实现的有什么区别

    审查 小组评审 走查 同级桌查 临时评审 审查 非作者等专家在内的针对特定对象进行检查以发现缺陷的过程 最正式 小组评审 一种 轻型审查 可采用审查的指导方针和流程 走查 是产品的作者向一组同事说明该产品 希望获得他们的意见以满足自己的需要
  • 在Java中操作串口实现短信收发 收藏

    1 配置comm jar Comm jar是Sub实现底层串口操作的API 调用了本地的DLL文件 因为Java本身不具备直接访问硬件设置的能力 都是通过调用本地方法来实现的 可以Java的官方网站下载 下载之后把其中Comm jar包导入
  • CPU 矩阵的 LU分解 without pivot

    hello lu without pivot cpu simple cpp 此文件包含 main 函数 程序执行将在此处开始并结束 include
  • 备选列表排列算法的 Python 实现

    备选列表排列算法的 Python 实现 备选列表排列是一种常见的问题 它涉及对给定列表中的元素进行排列 以生成所有可能的组合 在这个问题中 我们将探讨一个用 Python 实现备选列表排列的算法 算法的思路是通过递归方式生成所有可能的排列
  • java表达式解析引擎_Go 实现的数学表达式解析计算引擎

    前言 一下内容引用作者博客 math engine demo 导读 这篇文章将从头开始 使用 Go 语言来实现一个完整的数学表达式计算引擎 本文采用的是抽象语法树 Abstract Syntax Tree AST 实现方式 虽然本文的实现代
  • cublasSgemm函数

    cublasStatus t cublasSgemm cublasHandle t handle cublasOperation t transa cublasOperation t transb int m int n int k con
  • sklearn.preprocessing OneHotEncoder——仅仅是数值型字段才可以,如果是字符类型字段则不能直接搞定...

    gt gt gt from sklearn preprocessing import OneHotEncoder gt gt gt enc OneHotEncoder gt gt gt enc fit 0 0 3 1 1 0 0 2 1 1