python卡方检验关键词,特征选择——卡方检验(使用Python sklearn进行实现)

2023-10-27

在看这篇文章之前，如果对卡方检验不熟悉，可以先参考：卡方检验

Python有包可以直接实现特征选择，也就是看自变量对因变量的相关性。今天我们先开看一下如何用卡方检验实现特征选择。

1. 首先import包和实验数据：

from sklearn.feature_selection import SelectKBest

from sklearn.feature_selection import chi2

from sklearn.datasets import load_iris

#导入IRIS数据集

iris = load_iris()

iris.data#查看数据结果输出：

array([[ 5.1, 3.5, 1.4, 0.2],

[ 4.9, 3. , 1.4, 0.2],

[ 4.7, 3.2, 1.3, 0.2],

[ 4.6, 3.1, 1.5, 0.2],

[ 5. , 3.6, 1.4, 0.2],

[ 5.4, 3.9, 1.7, 0.4],

[ 4.6, 3.4, 1.4, 0.3],

2. 使用卡方检验来选择特征

model1 = SelectKBest(chi2, k=2)#选择k个最佳特征

model1.fit_transform(iris.data, iris.target)#iris.data是特征数据，iris.target是标签数据，该函数可以选择出k个特征结果输出为：

array([[ 1.4, 0.2],

[ 1.4, 0.2],

[ 1.3, 0.2],

[ 1.5, 0.2],

[ 1.4, 0.2],

[ 1.7, 0.4],

[ 1.4, 0.3],

可以看出后使用卡方检验，选择出了后两个特征。如果我们还想查看卡方检验的p值和得分，可以使用第3步。

3. 查看p-values和scores

model1.scores_ #得分

得分输出为：

array([ 10.81782088, 3.59449902, 116.16984746, 67.24482759])

可以看出后两个特征得分最高，与我们第二步的结果一致；

model1.pvalues_ #p-values

p值输出为：

array([ 4.47651499e-03, 1.65754167e-01, 5.94344354e-26, 2.50017968e-15])

可以看出后两个特征的p值最小，置信度也最高，与前面的结果一致。

也可以参考官方的帮助文档：selectKbest帮助文档

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python卡方检验关键词

python卡方检验关键词,特征选择——卡方检验(使用Python sklearn进行实现) 的相关文章

【AnyQ】百度开源 FAQ 问答系统—AnyQ介绍

前言近年来随着人工智能技术的发展人机对话技术得到越来越多的关注人机对话产品也不断涌现其中智能客服作为人机对话的一个典型场景表现出极大的商业潜力和很强的研究价值各企业也争先恐后的推出自己的智能客服产品 FAQ 问答技术作为智能客
Servlet初识

servlet server applet 处理客户端请求工作原理 tomcat容器 Servlet容器服务器 Servlet框架 Servlet应用 1 首先客户端发起请求 2 服务器 tomcat Servlet容器收到接收到来自
C指针之初始化（三）

一引言 C C 语言中引入了指针使得程序能够直接访问内存地址使得很多复杂的操作变得简单同时也提高了程序的运行效率指针即是地址但是地址却是通过指针变量来存储的因此我们通常所说的指针在很多时候说的都是指针变量指针变量在使用之前必
使用C#版Tesseract库

上一篇介绍了Tesseract库的使用 OCR库Tesseract初探文末提到了Tesseract是用c c 开发的也有C 的开源版本本篇介绍一下如何使用C 版的Tesseract C 版本源码下载地址 https github co
用Python爬取英雄联盟（lol）全部皮肤

首先我们打开英雄联盟官网主页网址为 https lol qq com main shtml 然后向下拉可以看到英雄列表如图所示接着随意选一个英雄点击进入看一下如图所示再点击鼠标右键接着选择检查看一下皮肤的 URL 如图所示
Mysql连接数据库url的参数解析

看之前各位看官可以不可以点个赞呜呜呜更正信息错误之前在url中使用后面发现报错要进行转义才行 amp 如果在springboot中使用不需要转义即把下面的 amp 改为已经对下面url进行更正大家直接拷贝粘贴就可以用 j
数据结构_35

一线性表排序冒泡排序选择排序快速排序归并排序查找二分查找二树遍历递归前中后序层次排序大根堆小根堆哈夫曼树三图广度优先遍历深度优先遍历最小生成树 Prim算法 Kus算法最短路径 Dij算法一
可视化理解卷积神经网络（CNN）

大家好我是Sonhhxg 柒希望你看完之后能对你有所帮助不足请指正共同学习交流个人主页 Sonhhxg 柒的博客 CSDN博客欢迎各位点赞收藏留言系列专栏机器学习 ML 自然语言处理 NLP 深度学习 DL fore
用Python做一个猜拳游戏

import random while True player input 请出拳石头剪刀布玩家出拳 print 玩家出拳 player list 石头剪刀布 computer random choice list 电脑出拳随
Maven打包项目为依赖包、及包引用

Maven打包项目为依赖包及包引用一 maven配置 1 1 原配置 1 2 更改配置二 jar包引用 2 1 引入maven仓库 2 2 手动引入更方便一 maven配置 1 1 原配置
ubuntu升级python版本_ubuntu升级python版本

Ubunt16 04默认安装python2 7和3 5 注意系统自带的python千万不能卸载 1 输入python 2 输入python3 3 输入命令sudo add apt repository ppa jonathonf pyth
高级 IO(非阻塞、多路复用、异步、存储映射、文件锁)

目录非阻塞I O 阻塞I O 与非阻塞I O 读文件阻塞I O 的优点阻塞后进入休眠交出cpu资源降低使用率使用非阻塞I O实现并发读取 I O 多路复用何为I O多路复用 select 函数 poll 函数总结异步IO 优
正点原子STM32(基于HAL库)5

目录 SRAM 实验存储器简介 SRAM 方案简介硬件设计程序设计程序流程图程序解析下载验证内存管理实验内存管理简介硬件设计程序设计程序流程图程序解析下载验证 SD 卡实验 SD 卡简介 SD 物理结构命令和响应
SimOTA的简单理解

SimOTA simOTA的作用是为不同目标设定不同的正样本数量例如蚂蚁和西瓜传统的正样本分配方案常常为同一场景下的西瓜和蚂蚁分配同样的正样本数那要么蚂蚁有很多低质量的正样本要么西瓜仅仅只有一两个正样本对于哪个分配方式都是不合适的
CNN中的底层、高层特征、上下文信息、多尺度

一 CNN中的底层高层特征简短总结分类要求特征有较多的高级信息回归定位要求特征包含更多的细节信息 1 图像的低层特征对定位任务帮助大我们可以想想比如轮廓信息都不准那怎么去良好定位图像底层特征指的是轮廓边缘颜色纹理
ValueError: Image size of 55600x96000 pixels is too large. It must be less than 2^16 in each directi

ValueError Image size of 55600x96000 pixels is too large It must be less than 2 16 in each direction 问题介绍在用pycharm做图像处理
遍历指定目录获取当前目录下指定后缀（如txt和ini）的文件名

bin bash 遍历指定目录获取当前目录下指定后缀如txt和ini 的文件名
LabVIEW通过以太网（TCP）与S7-1200 PLC通信

LabVIEW通过以太网 TCP 与S7 1200 PLC通信 laiping 20170901 摘要本文介绍LabView采用以太网 TCP 方式与西门子S7 1200PLC通讯关键字 LabView S7 1200 TCP PLC
python 调用 R，使用rpy2

python 与 R 是当今数据分析的两大主流语言作为一个统计系的学生我最早接触的是R 后来才接触的python python是通用编程语言科学计算数据分析是其重要的组成部分但并非全部而R则更偏重于统计分析毕竟R是统计学家发明

随机推荐

Qt 中设置窗体(QWidget)透明度的几种方法

Qt 中设置窗体 QWidget 透明度的几种方法 1 设置窗体的背景色在构造函数里添加代码需要添加头文件qpalette或qgui QPalette pal palette pal setColor QPalette Backgrou
【注意力模型】Harmonious Attention Network for Person Re-Identification

文章目录 Abstract 1 Introduction 2 Related Work 3 Harmonious Attention Network 3 1 Harmonious Attention Learning 4 Experimen
Python循环结构——while

While是循环结构中重要的一个部分基本使用格式 while 循环条件条件成功之后的子代码代码执行时会先判断条件条件成功之后再执行子代码否则直接跳过到下一个同等级代码 count 0 count 1 count 1 count 1
pptp 防火墙设置

服务搭建成功但是dns老是出问题找了很多文档最后找到了防火墙设置规则 sbin iptables t nat A POSTROUTING o eth0 s 172 16 0 0 16 j MASQUERADE sbin iptable
visibilitychange事件，监听跳转第三方页面离开时和回来时的状态

1 通过 document hidden 与 visibilitychange 事件判断网页可见性和操作当H5页面切换到第三方页面或从第三方页面切换到H5页面时会在 docment 上触发 visibilityState 事件举个栗
基于STM32的智能小车--电机驱动设计

基于STM32的智能小车第一章基于STM32的智能小车方案设计基于STM32的智能小车电机驱动设计基于STM32的智能小车前言一电机是什么二常见电机分类 1 有刷电机 2 无刷电机二有刷电机和无刷电机在调速上的差异
go 进阶九. 定时器

目录一 Timer 内部包含的方法解释 1 创建定时器 2 停止定时器 3 重置定时器 4 After 匿名定时器 5 AfterFunc 延迟执行使用场景举例原理 1 底层结构 2 创建Timer 3 停止Timer 4 重置Tim
Vc - Qt - 仿微信聊天工具

从小白开始成神成魔之路记录评论区记录生活一年成神评论区自己可用其他人不可用 2021 11 13 8 49 仿照微信项目服务器端查找某个玩家的结果记录 2021 11 14 21 37 仿照微信服务器端实现根据usernam
DVWA-----SQL Injection(SQL手工注入）

目录一 SQL注入 1 SQL注入原理 2 SQL注入分类 3 SQL注入思路 4 SQL注入绕过方法二 SQL注入漏洞的分析 1 定义 2 原因 3 危害三 Web 程序三层架构四 SQL Injection 1 LOW 2 Me
odoo13 订单模板设置_ERP输出嵌入公章的采购订单电子档，其实真的不难

企业里采购订单的发送是最频繁的工作在过去还得打印出来领导签完字盖个章才可以传真出去到如今随着电子档的应用与通讯工具的普及都是直接从ERP中输出PDF 再通过微信或QQ发给供应商那下面我们介绍一下云上软件是怎么实现这个效果的
商业思维--反向理论的合理性

创业是一种破坏如果这种破坏不足够像美国的卡梅隆导演的电影一样格局要大步骤要细反向理论是很多初期萌生创业想法的角斗士那时候的我们总是觉得思维远超爱因斯坦然后寻找自我认知里的实现步骤往往得到是马爸说得今天很多想法睡一觉就
【LLM】微调LLM：LoRA 还是全参数？Llama 2 的深入分析

大家好我是Sonhhxg 柒希望你看完之后能对你有所帮助不足请指正共同学习交流个人主页 Sonhhxg 柒的博客 CSDN博客欢迎各位点赞收藏留言系列专栏机器学习 ML 自然语言处理 NLP 深度学习 DL fore
CAS 未认证授权服务不允许使用CAS来认证您访问的目标应用

资源环境 CAS服务端 CAS 5 3 2 服务端 CAS客户端 Spring Boot CAS 客户端访问过程 1 CAS 客户端访问本地项目指定端口 http localhost 9100 cas index 2 CAS 客户端调整至
tictoc例子理解 16-18

tictoc16 18 tictoc 16 全局信号signal tictoc 17 在仿真界面幕布上显示总条数信息 tictoc 18 tictoc 16 全局信号signal 前一步的主要问题是如果我们想要更改所收集的统计信息就必须
html msn 消息,msn.html

canvas 心 html body height 100 padding 0 margin 0 background 000 canvas position absolute width 100 height 100 Settings v
51中断系统与vhdl状态机

51中断系统与vhdl状态机 51单片机中断系统 1 为什么要引入中断 List item 51单片机中断系统 1 为什么要引入中断中断是为使单片机具有对外部或内部随机发生的事件实时的处理而设置的中断功能的存在很大程度上提高了单片机处
vue中使用MINIO将文件上传到指定的bucket库中（vue2和vue3）

步骤 MINIO官网 https docs min io docs javascript client quickstart guide html 下载minio npm install save minio 将minio集成到js中在集
分享一个基于Python和Django的产品销售收入数据分析系统源码

作者计算机源码社个人简介本人七年开发经验擅长Java Python PHP NET 微信小程序爬虫大数据等大家有这一块的问题可以一起交流学习资料程序开发技术解答文档报告 JavaWeb项目微信小程序项目 Python
VScode远程连接服务器-过程试图写入的管道不存在-could not establist connection to【已解决】

问题描述使用服务器的过程中突然与服务器断连报错如下 could not establist connection to 20 23 39 487 gt ssh connect to host 10 201 0 131 port 22 C
python卡方检验关键词,特征选择——卡方检验(使用Python sklearn进行实现)

在看这篇文章之前如果对卡方检验不熟悉可以先参考卡方检验 Python有包可以直接实现特征选择也就是看自变量对因变量的相关性今天我们先开看一下如何用卡方检验实现特征选择 1 首先import包和实验数据 from sklearn f

python卡方检验关键词,特征选择——卡方检验(使用Python sklearn进行实现)

python卡方检验关键词,特征选择——卡方检验(使用Python sklearn进行实现) 的相关文章

随机推荐

热门标签