调参1——随机森林贝叶斯调参

2023-10-27

贝叶斯调参教程请参考：https://blog.csdn.net/weixin_35757704/article/details/118480135

安装贝叶斯调参：

pip install bayesian-optimization

算法简介

paper地址：http://papers.nips.cc/paper/4522-practical-bayesian%20-optimization-of-machine-learning-algorithms.pdf

Snoek, Jasper, Hugo Larochelle, and Ryan P. Adams. “Practical bayesian optimization of machine learning algorithms.” Advances in neural information processing systems 25 (2012).

随机森林是树模型的Bagging集成（Bagging集成可以参考：https://blog.csdn.net/weixin_35757704/article/details/119848453）

在分类问题中，使用Gini系数作为分叉标准；基尼指数越大，说明不确定性就越大；基尼系数越小，不确定性越小。
在回归问题中，使用SE（就是MSE后两个字母SE）作为分叉标准

示例代码

这里我们对三个参数进行调参：

n_estimators
max_depth
max_leaf_nodes

from lightgbm import LGBMRegressor
from sklearn.model_selection import train_test_split
from sklearn.datasets import make_regression
import numpy as np
from bayes_opt import BayesianOptimization
from sklearn.metrics import mean_squared_error
from sklearn.ensemble import RandomForestRegressor


def train_model(n_estimators, max_depth, max_leaf_nodes):
    # 模型训练
    try:
        model = RandomForestRegressor(
            n_estimators=int(n_estimators),
            max_depth=int(max_depth),
            max_leaf_nodes=int(max_leaf_nodes),
            n_jobs=4,  # 多核
        )
        model.fit(x_train, y_train)
        score = - mean_squared_error(y_test, model.predict(x_test))
        with open(param_save_file, 'a') as file:
            file.write("mse:{},n_estimators:{},max_depth:{},max_leaf_nodes:{}".format(
                score, n_estimators, max_depth, max_leaf_nodes
            ) + '\n')
        return score
    except Exception as e:
        return -1000000


if __name__ == '__main__':
    # 构造数据
    x, y = make_regression(n_samples=1000, n_features=5)
    param_save_file = "random_forest_param.txt"
    x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)

    # 指定参数
    pbounds = {
        'n_estimators': (100, 1000),
        'max_depth': (18, 40),
        'max_leaf_nodes': (20, 200),
    }

    # 开始调优
    optimizer = BayesianOptimization(
        f=train_model,  # 黑盒目标函数
        pbounds=pbounds,  # 取值空间
        verbose=2,  # verbose = 2 时打印全部，verbose = 1 时打印运行中发现的最大值，verbose = 0 将什么都不打印
        random_state=1,
    )
    optimizer.maximize(  # 运行
        init_points=10,  # 随机搜索的步数
        n_iter=30,  # 执行贝叶斯优化迭代次数
    )
    with open(param_save_file, 'a') as file:
        file.write("optimizer_params: " + str(optimizer.max['params']) + " optimizer_target: " + str(
            optimizer.max['target']) + '\n')

参考文章

从零实现回归随机森林：https://zhuanlan.zhihu.com/p/52052903
sklearn随机森林分类任务，文档：https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html
sklearn随机森林回归任务，文档：https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestRegressor.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

特征工程

机器学习

随机森林

算法

调参1——随机森林贝叶斯调参的相关文章

代码随想录算法训练营Day18 | 二叉搜索树中的插入操作、二叉搜索树的最近公共祖先、删除二叉搜索树的节点、修剪二叉搜索树、二叉搜索树转换成累加树、将有序数组转换成二叉搜索树

LeetCode 701 二叉搜索树的插入操作本题思路既然是二叉搜索树那么插入就变得比较简单了因为二叉搜索树的左树节点值都小于根节点值右树节点值都大于根节点值直接将要插入的节点值和根节点进行对比如果比它小就往左孩子走比他大
工业异常检测AnomalyGPT-Demo试跑

写在前面如果你有大的cpu和gpu可以使用直接根据官方的安装说明就可以如果没有可以点进来试着看一下我个人的安装经验一试跑环境 NVIDIA4090显卡24g cpu内存33G 交换空间8g 操作系统ubuntu22 04 试跑过
CCF模拟题 202309-1 坐标变换（其一）

问题描述试题编号 202309 1 试题名称坐标变换其一时间限制 1 0s 内存限制 512 0MB 问题描述对于平面直角坐标系上的坐标 x y 小P定义了一个包含n个操作序列T t1 t2 tn 其中每个操作ti 1 lt i
华为OD机试真题-计算三叉搜索树的高度-2023年OD统一考试（C卷）

题目描述定义构造三叉搜索树规则如下每个节点都存有一个数当插入一个新的数时从根节点向下寻找直到找到一个合适的空节点插入查找的规则是 1 如果数小于节点的数减去500 则将数插入节点的左子树 2 如果数大于节点的数加上500 则将数
如何用GPT制作PPT和写代码？

详情点击链接如何用GPT制作PPT和写模型代码一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Gemin
【质量-弹簧-阻尼系统】基于脉冲响应约束的子空间辨识研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据文章
基于GPT4+Python近红外光谱数据分析及机器学习与深度学习建模

详情点击链接基于ChatGPT4 Python近红外光谱数据分析及机器学习与深度学习建模教程第一 GPT4 基础 1 ChatGPT概述 GPT 1 GPT 2 GPT 3 GPT 3 5 GPT 4模型的演变 2 ChatGPT对话初
毕业设计-基于深度学习的细菌微生物目标检测系统系统 YOLO python 目标检测人工智能卷积神经网络机器学习

目录前言设计思路一课题背景与意义二算法理论原理 2 1 CBAM模块 2 2 损失函数三检测的实现 3 1 数据集 3 2 实验环境搭建 3 3 实验及结果分析实现效果图样例最后前言大四是整个大学期间最忙碌的时光一
【自适应滤波】一种接近最佳的自适应滤波器，用于突发系统变化研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【状态估计】【卡尔曼-加权最小二乘(KEWLS)和KEWLS-KF(KKF)】采用低维线性卡尔曼滤波器将单个传感器测量外推/预测到单个估计瞬间，用于WLS多点定位方法的新方法（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
2024年华为OD机试真题-小明找位置-Java-OD统一考试（C卷）

题目描述小朋友出操按学号从小到大排成一列小明来迟了请你给小明出个主意让他尽快找到他应该排的位置算法复杂度要求不高于nLog n 学号为整数类型队列规模 lt 10000 输入描述 1 第一行输入已排成队列的小朋友的学号正整
【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【状态估计】【卡尔曼-加权最小二乘(KEWLS)和KEWLS-KF(KKF)】采用低维线性卡尔曼滤波器将单个传感器测量外推/预测到单个估计瞬间，用于WLS多点定位方法的新方法（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
2024年华为OD机试真题-手机App防沉迷系统-Java-OD统一考试（C卷）

题目描述智能手机方便了我们生活的同时也侵占了我们不少的时间手机App防沉迷系统能够让我们每天合理的规划手机App使用时间在正确的时间做正确的事它的大概原理是这样的 1 在一天24小时内可注册每个App的允许使用时段 2 一个时
机器学习：基于python微博舆情分析系统+可视化+Django框架 K-means聚类算法（源码）✅

博主介绍全网粉丝10W 前互联网大厂软件研发集结硕博英豪成立工作室专注于计算机相关专业毕业设计项目实战6年之久选择我们就是选择放心选择安心毕业感兴趣的可以先收藏起来点赞关注不迷路毕业设计 2023 2024年计算机毕业
LeetCode解法汇总83. 删除排序链表中的重复元素

目录链接力扣编程题解法汇总分享记录 CSDN博客 GitHub同步刷题项目 https github com September26 java algorithms 原题链接力扣 LeetCode 描述给定一个已排序的链表的头
机器学习算法实战案例：Informer实现多变量负荷预测

文章目录机器学习算法实战案例系列答疑技术交流 1 实验数据集 2 如何运行自己的数据集 3 报错分析机器学习算法实战案例系
用栈实现队列（OJ中报错的处理）

用栈实现队列 ERROR AddressSanitizer myQueueFree函数中栈的释放处现了问题没有调用StackDestory而是直接free了这个是栈初始化时 capacity与malloc申请的空间大小没有匹配请你仅使
【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分

随机推荐

实例说明列表、字典中元素的提取

经过这几天工作的忙碌我终于又静下心来让我来分享一些实际的案例并分享它的做法 1 案例获取下面列表当中的每一个值不必在同一行显示 list 1 2 3 4 5 6 7 8 9 10 11 12 for x y in list prin
java openssh_java – 将openssh公钥转换为ssh2(RFC 4716)格式

主要问题就在于此将openssh公钥解析为符合 rfc 4716格式唯一的问题是它必须在java中使用ssh keygen 它只是单行命令 ssh keygen e f openssh key pub 不幸的是我在Java中找不到
VMware下桥接设置

操作环境主机 Win7 X86 SP1 虚拟机 VMware station 8 虚拟机里的系统 Fedora 15 环境上不管什么系统什么版本的虚拟机使用上都是大同小异的毕竟核心是不变的 VM虚拟机下linux系统桥接和NAT
利用GitHub搭建一个你的博客

为什么要写博客作为一只程序猿踩到坑是一件非常正常的事当我们踩到坑的时候就会花心思去研究它可能我们能够在当时把问题弄懂并把问题给解决掉可是过一段时间我们又遇到了同样的坑的时候难道还要再去百度 Google 重新搜索一遍吗这样做
QT4.8.4安装步骤简述

QT4 8 4安装步骤简述 win10上面安装QT4 8 4 creator 的步骤如下首先需要软件 1 MinGW gcc440 1 zip 2 qt win opensource 4 8 4 mingw exe 3 qt creato
React生态之React环境搭建

React特点 Declarative 声明式编码 Component Based 组件化编码高效的DOM Diff 算法最小化页面重绘单向数据流 React 生态 React React Router Redux Axios Bab
【蓝湖前端校招一面】

蓝湖一面无笔试直接约面试时长一小时讲讲项目中的难点讲讲原型链更改原型的方法有什么 proto setPrototypeOf 讲讲闭包 es6 的新数据结构知道哪些 Object 和 Map 的区别一道 this 相关的输出题
协方差矩阵与PCA深入原理剖析

一协方差矩阵一个维度上方差的定义协方差的定义 a 协方差就是计算了两个维度之间的相关性即这个样本的这两个维度之间有没有关系协方差为0 证明这两个维度之间没有关系协方差为正两个正相关为负则负相关协方差矩阵的定义对n个维度
Unity期末AI足球游戏小项目(免费开源)

目录游戏介绍整体结构部分截图答辩论文截图答辩问题该游戏项目仅供参考下载链接在文末若需要答辩论文请私聊版本 Unity 2018 4 36 游戏介绍 Crazy Soccer 是一款有趣的足球模拟游戏玩家将看到两个球队之间
数据结构基本介绍

数据结构基本介绍 1 基本数据结构 1 数组字符串 Array String 优点构建一个数组非常简单能让我们在 O 1 的时间里根据数组的下标 index 查询到某个元素缺点构建时必须分配一段连续的空间查询某个元素是否存在时需
备忘录莫名其妙的没了_iPhone上记录重要工作事宜的备忘录突然不见了，此时该怎么办呢？...

不管是一般的安卓手机还是iPhone手机手机上都拥有备忘录功能而iPhone手机的备忘录功能非常的实用我们不仅可以在备忘录上记录文字还能够在备忘录中插入图片编写简易的表格等等对于不管是只想要用备忘录记账记事或记心情的小伙伴们
两个单链表的合并（C语言实现）

单链表的合并还是挺简单的直接上代码吧 include
【CVPR 2021】无约束生成 - NeRF in the Wild: Neural Radiance Fields for Unconstrained Photo Collections

NeRF in the Wild Neural Radiance Fields for Unconstrained Photo Collections 论文简介论文介绍 NeRF 简介 NeRF in the Wild Latent Ap
npm 安装出错 npm ERR! request to https://registry.npmjs.org/express failed, reason: unable to verify th

npm 安装 jointjs时出现 D Project demo gt npm install jointjs npm ERR code UNABLE TO VERIFY LEAF SIGNATURE npm ERR errno UNAB
Jetson开发实战记录（一）：Jetson家族的基本介绍

Jetson开发实战记录一 Jetson家族的基本介绍一 Jetson家族二 Jetson家族产品横向对比 1 Jeston Nano 2 Jetson Xavier 3 Jetson Xavier NX 4 Jetson TX2 5
条件编译#if #ifdef #ifndef

if ifdef和 ifndef区别 1 if if 常量表达式程序段1 else 程序段2 endif 如果常量表达式的值为真非0 则对程序段1 进行编译否则对程序段2进行编译 2 ifdef ifdef 标识符或 if defi
tensorflow自定义网络层、激活函数（self-defined layer）

highly based on http stackoverflow com questions 39921607 tensorflow how to make a custom activation function with only
Python每日一记193>>>AttributeError: 'DataFrame' object has no attribute 'map'

昨天在运行一段程序的时候遇到了AttributeError DataFrame object has no attribute map 错误但是很奇怪明明之前也是类似的代码不知道这次为什么出错了先看一下错误发现错误发生的代码在以
算法第二章上机报告

1 实践题目 7 1 二分查找 20 分输入n值 1 lt n lt 1000 n 个非降序排列的整数以及要查找的数x 使用二分查找算法查找x 输出x所在的下标 0 n 1 及比较次数若x不存在输出 1和比较次数输入格式输入共三行
调参1——随机森林贝叶斯调参

贝叶斯调参教程请参考 https blog csdn net weixin 35757704 article details 118480135 安装贝叶斯调参 pip install bayesian optimization 算法简介