Pycaret详细介绍该库用法及案例(分类方法案例胎儿状态分类指南)

2023-11-03

Pycaret

基本流程一般包含:读取数据->建模/对比模型->模型预测->绘图分析->模型导出

安装pycaret见此篇博文——>安装pycaret遇到的问题
使用此命令:——pip --default-timeout=100 install pycaret -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com

另附官方源码——>https://github.com/pycaret/pycaret

官方阅读——>https://pycaret.org/guide/

从PyCaret的存储库加载数据

#从pycaret中加载数据
from pycaret.datasets import get_data
data = get_data('juice') 

pycaret的资料存储库
在这里插入图片描述
核心代码方法:

anomaly.py 异常值检测(无监督)
arules.py 关联规则(无监督)
classification.py 分类(有监督)
clustering.py 聚类(无监督)
datasets.py 数据加载(辅助工具)
nlp.py 自然语言处理(无监督)
preprocess.py 预处理(辅助工具,被其它模块内部调用)
regression.py 回归(有监督)

导入模块

# Classification
from pycaret.classification import *
# Regression
from pycaret.regression import *
# Clustering
from pycaret.clustering import *
# Anomaly Detection
from pycaret.anomaly import *
# Natural Language Processing
from pycaret.nlp import *
# Association Rule Mining
from pycaret.arules import *

在这里插入图片描述
在这里插入图片描述

各个类实例

分类例

# Importing dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# Importing module and initializing setup
from pycaret.classification import *
clf1 = setup(data = diabetes, target = 'Class variable')

在这里插入图片描述

回归实例

# Importing dataset
from pycaret.datasets import get_data
boston = get_data('boston')

# Importing module and initializing setup
from pycaret.regression import *
reg1 = setup(data = boston, target = 'medv')

在这里插入图片描述
聚类示例

# Importing dataset
from pycaret.datasets import get_data
jewellery = get_data('jewellery')

# Importing module and initializing setup
from pycaret.clustering import * 
clu1 = setup(data = jewellery)

在这里插入图片描述
异常检测示例

# Importing dataset
from pycaret.datasets import get_data
anomalies = get_data('anomaly')

# Importing module and initializing setup
from pycaret.anomaly import *
ano1 = setup(data = anomalies)

在这里插入图片描述
自然语言处理示例

# Importing dataset
from pycaret.datasets import get_data
kiva = get_data('kiva')

# Importing module and initializing setup
from pycaret.nlp import *
nlp1 = setup(data = kiva, target = 'en')

在这里插入图片描述
关联规则挖掘示例

# Importing dataset
from pycaret.datasets import get_data
france = get_data('france')

# Importing module and initializing setup
from pycaret.arules import *
arules1 = setup(data = france, transaction_id = 'InvoiceNo', item_id = 'Description')

在这里插入图片描述

常用的函数方法

get_data() 读数据,例程中多为读取示例数据,用户可以使用自己的数据代替。

setup() 预处理,各种建模方法(如分类/聚类)根据自己的特点实现了不同的setup,其中几乎都包含对预处理模块的调用。

models() 列出当前建模方法支持的所有模型。

compare_models() 训练多个模型,并对比其效果。

create_model() 训练模型。

predict_model() 使用模型预测。

plot_model() 显示模型相关的各种分析图,如AUC曲线,学习曲线,还包含词云图等。

tune_model() 模型调参。

assign_model() 查看无监督模型打标签的情况。

evaluate_model() 评价模型。

deploy_model() 云端部署。

ensemble_model() 集成模型。

finalize_model() 导出最终模型和参数。

案例(分类方法案例胎儿状态分类指南)

from pycaret.datasets import get_data

import pandas as pd   
import numpy as np
import warnings     

获取数据

from pycaret.datasets import get_data
df= get_data('CTG') 
#查看前五行
df.head()

在这里插入图片描述

## 删除不需要的列  名称 日期等
df=df.drop(["FileName","Date","SegFile","b","e"],axis=1)        
#查看列名称
df.columns

在这里插入图片描述

数据预处理

df.shape
#查看缺失值
df.isnull().sum()

在这里插入图片描述

#删除包含空值的行
df = df.dropna()
#查看列的数据类型
df.dtypes
#查看数据的前五行
df.head()

在这里插入图片描述
导入机器学习库pycaret

#此命令基本上将从pychret导入分类任务所需要的所有模块
from pycaret.classification import *

#设置分类器
#将完整的数据作为数据传递  并将要预测的特征作为目标
clf=setup(data=df,target='NSP')

在这里插入图片描述

#此模型将用于比较所有模型以及交叉验证
compare_models()

在这里插入图片描述
由此可见xgboost(分类器)模型表现比较好,因此,我们将继续进行极端梯度增强模型。

#创建极端梯度提升xgboot模型
xgboost_classifier = create_model('xgboost')  

在这里插入图片描述

#查看模型参数
xgboost_classifier

在这里插入图片描述
调整参数以获得更好的性能

#当我们比较不同的模型或建立模型时,都会使用deault
tuned_xgboost_classifile = tune_model(xgboost_classifier)#调整参数函数

在这里插入图片描述
绘制分类图

plot_model(tuned_xgboost_classifile,plot='class_report')

在这里插入图片描述

#绘制混淆矩阵
plot_model(tuned_xgboost_classifile,plot='confusion_matrix')

在这里插入图片描述
保存模型以供将来预测使用。

save_model(tuned_xgboost_classifile,"XGBOOT CLASSIFIER")

在这里插入图片描述
加载保存的模型。

save_model = load_model("XGBOOT CLASSIFIER")

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Pycaret详细介绍该库用法及案例(分类方法案例胎儿状态分类指南) 的相关文章

  • Django REST序列化器:创建对象而不保存

    我已经开始使用 Django REST 框架 我想做的是使用一些 JSON 发布请求 从中创建一个 Django 模型对象 然后使用该对象而不保存它 我的 Django 模型称为 SearchRequest 我所拥有的是 api view
  • Python、Tkinter、更改标签颜色

    有没有一种简单的方法来更改按钮中文本的颜色 I use button text input text here 更改按下后按钮文本的内容 是否存在类似的颜色变化 button color red Use the foreground设置按钮
  • 将字符串转换为带有毫秒和时区的日期时间 - Python

    我有以下 python 片段 from datetime import datetime timestamp 05 Jan 2015 17 47 59 000 0800 datetime object datetime strptime t
  • 如何生成给定范围内的回文数列表?

    假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
  • 如何在 Sublime Text 2 的 OSX 终端中显示构建结果

    我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它 让我困扰的一件事是默认的构建结果显示在 ST2 的底部 我的程序产生一些很长的结果 显示它的理想方式 如在 TM2 中 是并排查看它们 如何在 Mac 操作系统
  • 更改自动插入 tkinter 小部件的文本颜色

    我有一个文本框小部件 其中插入了三条消息 一条是开始消息 一条是结束消息 一条是在 单位 被摧毁时发出警报的消息 我希望开始和结束消息是黑色的 但被毁坏的消息 参见我在代码中评论的位置 插入小部件时颜色为红色 我不太确定如何去做这件事 我看
  • pandas 替换多个值

    以下是示例数据框 gt gt gt df pd DataFrame a 1 1 1 2 2 b 11 22 33 44 55 gt gt gt df a b 0 1 11 1 1 22 2 1 33 3 2 44 4 3 55 现在我想根据
  • 如何等到 Excel 计算公式后再继续 win32com

    我有一个 win32com Python 脚本 它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的 这可能需要一分钟 如何强制工作簿计算值
  • 打破嵌套循环[重复]

    这个问题在这里已经有答案了 有没有比抛出异常更简单的方法来打破嵌套循环 在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签 并且至少继续一个外循环 for x in range 10 fo
  • Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

    据我了解 distinct 哈希分区 RDD 来识别唯一键 但它是否针对仅移动每个分区的不同元组进行了优化 想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上 所有重复键
  • 为 pandas 数据透视表中的每个值列定义 aggfunc

    试图生成具有多个 值 列的数据透视表 我知道我可以使用 aggfunc 按照我想要的方式聚合值 但是如果我不想对两列求和或求平均值 而是想要一列的总和 同时求另一列的平均值 该怎么办 那么使用 pandas 可以做到这一点吗 df pd D
  • python 集合可以包含的值的数量是否有限制?

    我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个 这个数字会随着时间的推移慢慢增长 我担心python集的最大容量 它可以包含的元素数量有限制吗 您最大
  • HTTPS 代理不适用于 Python 的 requests 模块

    我对 Python 还很陌生 我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品 我的代码如下 import requests import json import os import urllib impor
  • Python - 在窗口最小化或隐藏时使用 pywinauto 控制窗口

    我正在尝试做的事情 我正在尝试使用 pywinauto 在 python 中创建一个脚本 以在后台自动安装 notepad 隐藏或最小化 notepad 只是一个示例 因为我将编辑它以与其他软件一起使用 Problem 问题是我想在安装程序
  • 为美国东部以外地区的 Cloudwatch 警报发送短信?

    AWS 似乎没有为美国东部以外的 SNS 主题订阅者提供 SMS 作为协议 我想连接我的 CloudWatch 警报并在发生故障时接收短信 但无法将其发送到 SMS YES 经过一番挖掘后 我能够让它发挥作用 它比仅仅选择一个主题或输入闹钟
  • 设置 torch.gather(...) 调用的结果

    我有一个形状为 n x m 的 2D pytorch 张量 我想使用索引列表来索引第二个维度 可以使用 torch gather 完成 然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
  • 循环标记时出现“ValueError:无法识别的标记样式 -d”

    我正在尝试编码pyplot允许不同标记样式的绘图 这些图是循环生成的 标记是从列表中选取的 为了演示目的 我还提供了一个颜色列表 版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
  • 您可以在 Python 类型注释中指定方差吗?

    你能发现下面代码中的错误吗 米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
  • 协方差矩阵的对角元素不是 1 pandas/numpy

    我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
  • PyAudio ErrNo 输入溢出 -9981

    我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

  • docker - 部署java/python项目

    目录 1 docker 部署 java 项目 1 创建 mysql 容器 2 验证mysql dbserver 连接 mysql 服务器ip 3306 账户 root 密码 123456 3 创建tomcat容器 4 验证 http ip
  • 景联文科技助力医疗AI大模型:数据标注与专业医学资源的重要性

    随着通用人工智能 AI 与生成式人工智能 AIGC 的兴起 人工智能对一些产业的颠覆性影响开始显著加速 我们正在进入一个全新的 属于人工智能的时代 近日 谷歌对外发布谷歌医疗版ChatGPT已在多家诊所内测试 可生成诊断做总结 多个指标和真
  • matplotlib可视化之直方图plt.hist()与密度图

    函数功能 判定数据 或特征 的分布情况 调用方法 plt hist x bins 10 range None normed False weights None cumulative False bottom None histtype b
  • 【JavaScript】怎样判断一个变量是不是数组

    var arr 1 2 3 1 Array isArray console log Array isArray arr 2 instanceOf console log arr instanceof Array 3 constuctor c
  • 谷歌全球大裁员,涉及1.2万人

    Datawhale干货 方向 就业信息 来源 机器之心 最近几天科技领域的流行词不是某一项新技术 而是裁员 1 月 20 日 谷歌母公司 Alphabet 在一份员工备忘录中表示 由于面临 变化的经济现状 该公司将裁员约 1 2 万人 加大
  • unity 烘焙场景的创建、保存和使用(附demo项目)

    这是一个入门教程 demo项目 practice4 unitypackagehttps pan baidu com s 1tnDv3sDUzMlk1YnSmJV29w 密码 1234 1 打开Unity 新建一个场景 2 打开Light窗口
  • 深度linux win7分区,怎么安装Win7深度操作系统?

    安装前准备 一 为Deepin留出硬盘空间以便安装 1 打开磁盘管理 Windows徽标上右键单击 选择磁盘管理 2 选中一个分区 空闲空间大于30G 我选择的是C盘 因为是固态硬盘所以安装启动会快很多 磁盘1的200G分区是我上次安装使用
  • css锚点定位被顶部固定导航栏遮住的解决方案

    标题 css锚点定位被顶部固定导航栏遮住的解决方案 很多网站都有一个固定在上方的导航栏 方便用户搜索和跳转到其他页面 同时为了方便用户浏览长文档 都会加上目录 点击段落标题跳转到段落所在的位置 如图所示 如果使用锚点实现目录的跳转会遇到 f
  • camera理论基础和工作原理

    写在前面的话 本文是因为工作中需要编写摄像头程序 因为之前没有做过这类产品 所以网上搜索的资料 先整理如下 主要参考文章如下 如果有侵权 请联系我 另外 转载请注明出处 本文不一定全部正确 如果发现错误请指正 如果有新的理解 会继续整理 h
  • 西门子1513CPU冗余组态

    西门子1513R冗余配置 1 打开博图16软件 新建项目 添加新设备 在弹出的控制器目录下找到CPU 1513R 1 PN硬件 然后系统自动生成PLC 1和PLC 2 2 打开设备组态中的网络视图 添加接口模块 3 在硬件目录 分布式I O
  • 内存保护linux指令,Linux内存管理之MMU的过程

    之前写过一篇 CPU是如何访问内存的 的文章 简单介绍了cpu访问内存的过程 有了之前的感性认识 这篇站在arm的角度再深度讲解一下 看完你会发现不理解arm原理就直接撸内核代码简直是耍流氓 ARMv8中的访问内存流程 我喜欢用图的方式来说
  • Flutter组件之圆形进度条(CircularProgressIndicator)

    圆形进度条 可以在外面包一层SizedBox 间接改变进度条的大小 const CircularProgressIndicator Key key double value 0 1的浮点数 用来表示进度多少 如果 value 为 null
  • python为什么要使用if __name__ == “__main__”:

    python为什么要使用if name main 本文为wangluoshenghuo com原创 转载请注明出处 要说明这个问题 首先要了解 name 和 main 这两个符号是什么意思 name 是一个变量 是当前包的名称 而 main
  • Qt Creator中一些常用小技巧(总结)

    参考博客 https blog csdn net luoyayun361 article details 105431913 以下代码摘抄以上大神博客 1 代码注释 常用双斜杠 是单行注释 可以多行注释 其实在Qt creator里面还有一
  • Qt — xml读写及常用操作示例

    文章目录 1 QXML类概述 2 XML示例 2 1 示例1 3 XML节点说明 3 1QDomNode 3 2 QDomDocument 3 3 QDomElement 3 4 QDomAttr 3 5 QDomText 4 使用示例 4
  • TypeScript 接口继承

    TypeScript 接口继承 和类一样 接口也可以通过关键字 extents 相互继承 接口继承 分为 单继承和多继承 即继承多个接口 另外 接口也可以继承类 它会继承类的成员 但不包括具体的实现 只会把类的成员作为一种声明 本文主要总结
  • 7-项目成本管理

    高项第一阶段 日签 这世上没有毫不后悔的选择 生活也是没有正确答案的 只要坚信选择的道路就是正确答案 并把它变成正确答案就可以了 导图 一个过程记录
  • 第四课 小程序列表渲染特性 条件渲染特性

    小程序 列表渲染特性 1 block标签是包装元素 不是Ui现实元素 渲染后不会被显示出来 2 wx key 属性 重排序保证唯一值 提高整体渲染效率 条件渲染特性 wx if和hidden有什么区别 1 都有显示和隐藏的作用 2 if条件
  • 为什么上线要做防御?

    导语 随着5G时代到来和ipv6的普及 攻击者手段层出不穷 从一开始简单的DDOS分布式拒绝服务 后到蔓延ACK 从不同协议通讯层面发起的攻击 现在CC请求类型攻击 已经可以绕过域名验证 以及模拟正常用户访问 1 黑客勒索 2021年 8月
  • Pycaret详细介绍该库用法及案例(分类方法案例胎儿状态分类指南)

    Pycaret 基本流程一般包含 读取数据 gt 建模 对比模型 gt 模型预测 gt 绘图分析 gt 模型导出 安装pycaret见此篇博文 gt 安装pycaret遇到的问题 使用此命令 pip default timeout 100