python深度学习之用lightgbm算法实现鸢尾花种类的分类任务实战源码

2023-11-20

本代码以sklearn包中自带的鸢尾花数据集为例，用lightgbm算法实现鸢尾花种类的分类任务。
参考来源:
https://lightgbm.readthedocs.io/en/latest/Python-Intro.html

#!/usr/bin/env python 
# -*- coding:utf-8 -*-
# Author's_name_is_NIKOLA_SS
#pip install  lightgbm -i https://pypi.mirrors.ustc.edu.cn/simple/


import json
import lightgbm as lgb
import pandas as pd
from sklearn.metrics import mean_squared_error
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.datasets import  make_classification

iris = load_iris()  # 载入鸢尾花数据集
data = iris.data
target = iris.target
X_train, X_test, y_train, y_test = train_test_split( data, target, test_size=0.2 )

# 加载你的数据
# print('Load data...')
# df_train = pd.read_csv('../regression/regression.train', header=None, sep='\t')
# df_test = pd.read_csv('../regression/regression.test', header=None, sep='\t')
#
# y_train = df_train[0].values
# y_test = df_test[0].values
# X_train = df_train.drop(0, axis=1).values
# X_test = df_test.drop(0, axis=1).values

# 创建成lgb特征的数据集格式
lgb_train = lgb.Dataset( X_train, y_train )  # 将数据保存到LightGBM二进制文件将使加载更快
lgb_eval = lgb.Dataset( X_test, y_test, reference=lgb_train )  # 创建验证数据

# 将参数写成字典下形式
params = {
    'task': 'train',
    'boosting_type': 'gbdt',  # 设置提升类型
    'objective': 'regression',  # 目标函数
    'metric': {'l2', 'auc'},  # 评估函数
    'num_leaves': 31,  # 叶子节点数
    'learning_rate': 0.05,  # 学习速率
    'feature_fraction': 0.9,  # 建树的特征选择比例
    'bagging_fraction': 0.8,  # 建树的样本采样比例
    'bagging_freq': 5,  # k 意味着每 k 次迭代执行bagging
    'verbose': 1  # <0 显示致命的, =0 显示错误 (警告), >0 显示信息
}

print( 'Start training...' )
# 训练 cv and train
gbm = lgb.train( params, lgb_train, num_boost_round=20, valid_sets=lgb_eval, early_stopping_rounds=5 )  # 训练数据需要参数列表和数据集

print( 'Save model...' )

gbm.save_model( 'model.txt' )  # 训练后保存模型到文件

print( 'Start predicting...' )
# 预测数据集
y_pred = gbm.predict( X_test, num_iteration=gbm.best_iteration )  # 如果在训练期间启用了早期停止，可以通过best_iteration方式从最佳迭代中获得预测
# 评估模型
print( 'The rmse of prediction is:', mean_squared_error( y_test, y_pred ) ** 0.5 )  # 计算真实值和预测值之间的均方根误差

运行之后的结果输出如下:

Start training...
[LightGBM] [Warning] Auto-choosing row-wise multi-threading, the overhead of testing was 0.000064 seconds.
You can set `force_row_wise=true` to remove the overhead.
And if memory is not enough, you can set `force_col_wise=true`.
[LightGBM] [Info] Total Bins 90
[LightGBM] [Info] Number of data points in the train set: 120, number of used features: 4
[LightGBM] [Info] Start training from score 1.008333
[LightGBM] [Warning] No further splits with positive gain, best gain: -inf
[1]	valid_0's auc: 1	valid_0's l2: 0.702787
Training until validation scores don't improve for 5 rounds
[LightGBM] [Warning] No further splits with positive gain, best gain: -inf
[2]	valid_0's auc: 1	valid_0's l2: 0.64447
[LightGBM] [Warning] No further splits with positive gain, best gain: -inf
[3]	valid_0's auc: 1	valid_0's l2: 0.591793
[LightGBM] [Warning] No further splits with positive gain, best gain: -inf
[4]	valid_0's auc: 1	valid_0's l2: 0.542737
[LightGBM] [Warning] No further splits with positive gain, best gain: -inf
[5]	valid_0's auc: 1	valid_0's l2: 0.499044
[LightGBM] [Warning] No further splits with positive gain, best gain: -inf
[6]	valid_0's auc: 1	valid_0's l2: 0.458074
Early stopping, best iteration is:
[1]	valid_0's auc: 1	valid_0's l2: 0.702787
Save model...
Start predicting...
The rmse of prediction is: 0.8383238691881394

Process finished with exit code 0

参考来源于网络。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python2021

python

机器学习

深度学习

人工智能

python深度学习之用lightgbm算法实现鸢尾花种类的分类任务实战源码的相关文章

用于将 cython 中的许多 C++ 类包装到单个共享对象的项目结构

我在文档邮件列表和这个问题在这里 https stackoverflow com questions 10300660 cython and distutils 但我想得到一个更直接的答案来解决我的具体情况我正在通过尝试一点一点地包装我
没有名为 crypto.cipher 的模块

我现在正在尝试加密一段时间我最近得到了这个基于 python 的密码器名为PythonCrypter https github com jbertman PythonCrypter 我对 Python 相当陌生当我尝试通过终端打开 C
为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
如何在 Python 中检索 for 循环中的剩余项目？

我有一个简单的 for 循环迭代项目列表在某些时候我知道它会破裂我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
使用 on_bad_lines 将 pandas.read_csv 中的无效行写入文件

我有一个 CSV 文件我正在使用 Python 来解析该文件我发现文件中的某些行具有不同的列数 001 Snow Jon 19801201 002 Crom Jake 19920103 003 Wise Frank 19880303 l
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
Python pickle：腌制对象不等于源对象

我认为这是预期的行为但想检查一下也许找出原因因为我所做的研究结果是空白我有一个函数可以提取数据创建自定义类的新实例然后将其附加到列表中该类仅包含变量然后我使用协议 2 作为二进制文件将该列表腌制到文件中稍后我重新运行脚本
Fabric env.roledefs 未按预期运行

On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts
对年龄列进行分组/分类

我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
解释 Python 中的数字范围

在 Pylons Web 应用程序中我需要获取一个字符串例如关于如何做到这一点有什么建议吗我是 Python 新手我还没有找到任何可以帮助解决此类问题的东西该列表将是 1 2 3 45 46 48 49 50 51 77 使用
Conda SafetyError：文件大小不正确

使用创建 Conda 环境时conda create n env name python 3 6 我收到以下警告 Preparing transaction done Verifying transaction SafetyError Th
使用 Python 绘制 2D 核密度估计

I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
发送用户注册密码，django-allauth

我在 django 应用程序上使用 django alluth 进行身份验证注册我需要创建一个自定义注册表单其中只有一个字段电子邮件密码将在服务器上生成这是我创建的表格 from django import forms from
在 Qt 中自动调整标签文本大小 - 奇怪的行为

在 Qt 中我有一个复合小部件它由排列在 QBoxLayouts 内的多个 QLabels 组成当小部件调整大小时我希望标签文本缩放以填充标签区域并且我已经在 resizeEvent 中实现了文本大小的调整这可行但似乎发生了某
导入错误：没有名为 site 的模块 - mac

我已经有这个问题几个月了每次我想获取一个新的 python 包并使用它时我都会在终端中收到此错误 ImportError No module named site 我不知道为什么会出现这个错误实际上我无法使用任何新软件包因为每次我
如何使用 Pycharm 安装 tkinter？ [复制]

这个问题在这里已经有答案了 I used sudo apt get install python3 6 tk而且效果很好如果我在终端中打开 python Tkinter 就可以工作但我无法将其安装在我的 Pycharm 项目上 pip

随机推荐

【spring aop】连接点(Jointpoint)、切入点(Pointcut)、增强(Advice)、方面/切面(Aspect、Advisor)

文章目录前言 1 先来回顾一下AOP中的一些术语 2 增强方式简介 2 1 MethodBeforeAdvice前置增强 2 2 AfterReturningAdvice后置增强 2 3 ThrowsAdvice异常增强 2 4 Meth
Unity3d Terrain地形制作系列（一）

游戏简单地形地形制作地形制作第一步在场景里加载一个地形对象第二步我们在属性面板里找到绘制地形然后选择Set Height 绘制高度应该我们要制作低凹的效果所有先让他有个高度不然是不能实现低凹的效果如图我们然后选择绘制地
Node.js安装及环境配置（简单易懂全面！）

参考 https www cnblogs com liuqiyun p 8133904 html https www jianshu com p 13f45e24b1de 目录一安装环境二安装Node js步骤三前期准备四开
球迷如何在Linux纯命令行玩转谷歌浏览器，边看欧洲杯，边看足球宝贝

大家好我是Lex 喜欢欺负超人那个Lex 擅长领域 python开发网络安全渗透 Windows域控Exchange架构今日重点 1 Linux骚操作纯命令行玩转GoogleChrome浏览器 2 在Linux命令行打开足球宝贝的搜
stm32f103中断函数配置

一配置中断优先级NVIC 1 初始化中断结构体在misc h中找到 NVIC InitTypeDef 这个结构体并定义 2 中断优先级分组在misc c文件里找到 void NVIC PriorityGroupConfig uint32
U-Boot启动过程完全分析

1 1 U Boot工作过程 U Boot启动内核的过程可以分为两个阶段两个阶段的功能如下 1 第一阶段的功能硬件设备初始化加载U Boot第二阶段代码到RAM空间设置好栈跳转到第二阶段代码入口 2 第二阶段的功能初始化本阶段使
AE/VAE/DDPM

Docshttps laiye tech feishu cn docx XRKldiRcZoMDomxwrKtcWD8EnQb基于Diffusion的典型可控图片生成模型在上文扩散模型原理的基础上本文对目前最前沿的几个可控图像生成模型如D
PostgreSQL的AWR(PG_PROFILE)

PostgreSQL参数配置如下配置为使用pg profile最基本的配置 shared preload libraries pg stat statements pg stat statements max 10000 pg stat
一个人录制课程--全网独一

获取方式见文末共计八章节 1 php编程 2 web安全基础 3 中间人攻击与抓包 4 正反向代理与端口转发5 提权 6 内网 7 实战8工具 1 PHP编程 1 讲师介绍 http协议挖掘BUG mp4 2 搭建apache php
贝叶斯网络的python实现：Monty Hall问题的求解

前两节分别介绍了贝叶斯图模型的必要性以及贝叶斯网络的基本原理本节将通过一个简单的问题介绍贝叶斯网络的python实现三门问题 Monty Hall problem 亦称为蒙提霍尔问题蒙特霍问题或蒙提霍尔悖论是电视节目中一个简单的游戏
Spring Bean的三种注入方式

Spring Bean的三种注入方式 setter 方法属性注入构造方法注入注解注入 Resource和 Autowired 自动装配 Autowired 和 Resource Autowired Spring提供的注解 byTyp
SQL语言---视图操作

文章目录前言一视图 1 什么是视图 2 建立视图 3 删除视图二定义视图 1 建立视图 1 语法格式 2 举例讲解例子1 建立房间视图例子2 基于多表建立视图例子3 基于视图建立视图例子4 基于表达式的视图 2 删除视图
SpringBoot实现前端传入数值Controller层接收为枚举

定义枚举 import com fasterxml jackson annotation JsonCreator import com fasterxml jackson annotation JsonFormat import lombo
第一本 Compose 图书上市，联想大咖教你学会 Android 全新 UI 编程

朱江现任联想北京有限公司 Android 开发工程师从事 Android 开发工作多年有丰富的项目经验负责和参与开发过多款移动应用程序同时还是多个开源项目的作者 2017 年开始在 CSDN 发表 Android 技术相关博文
VLAN技术原理和配置方法

一 VLAN产生的背景虚拟局域网 VLAN 是英文Virtual Local Area Network的缩写随着网络规模不断扩大网络中的广播报文也随之增加结果就是使交换机的负担不停的加重并且一些终端设备也会收到不希望收到的报文 V
12306验证码分割

首先要从12306上面将验证码爬取下来保存到C images 下 from PIL import Image import os def get sub img im x y 截出方格图片 assert 0 lt x lt 3 asser
HTML+CSS3 5个炫酷的loading

为了方便大家方便CV 每个loading对应一个html文件文件下载压缩包下载地址 https download csdn net download m0 48850204 20432352 spm 1001 2014 3001 550
解决Glide加载图片闪烁的问题(感觉加载了两遍 !!!)

今天由于项目需求的原因需要把原来的ViewPager的长方形图片转成圆角图片一直觉得Glide很强大应该可以直接设置圆角图片但是输入之后并没有找到这个方法顿时一大片问号飘过下面来说说遇到的问题 1 之前Glide 3 0 都是
层次聚类在MATLAB中实现

层次聚类在MATLAB中实现 By Yang Liu 1 第一种方法 1 输入要聚类的数据 2 计算各个样本之间的欧氏距离 3 把距离化成矩阵矩阵中的元素 X i j X ij Xij 表示第i个样本和第j个样
python深度学习之用lightgbm算法实现鸢尾花种类的分类任务实战源码

本代码以sklearn包中自带的鸢尾花数据集为例用lightgbm算法实现鸢尾花种类的分类任务参考来源 https lightgbm readthedocs io en latest Python Intro html usr bin

python深度学习之用lightgbm算法实现鸢尾花种类的分类任务实战源码

python深度学习之用lightgbm算法实现鸢尾花种类的分类任务实战源码 的相关文章

随机推荐

热门标签

python深度学习之用lightgbm算法实现鸢尾花种类的分类任务实战源码的相关文章