记自动调参平台raytune和chemprop的一次实验

2023-11-07

首先介绍一下raytune这个东西，了解机器学习深度学习的朋友应该知道调参是机器学习中必不可少的一个环节，当你的模型被设计出来之后，或者你使用别人现成的模型的时候，你是要去调整模型的一个超参数从而是模型在你的数据集上达到一个比较好的效果的。通常的做法当然就是手动去设置参数然后跑一组组实验，最后选择一组结果较好的参数。但是在多GPU，你需要同时跑多组实验的时候，手动去跑多组实验是很麻烦的一件事，相信搞过的朋友一定懂。所以这里就需要一个类似于自动化训练平台的东西来帮助你找到比较优的一个参数，而raytune也就是干这个事情的。

由于这次不是主要讲raytune的，所以就简单写一下怎么用raytune，有兴趣的朋友可以自己去raytune的github首页去了解，链接已经放在最开始的部分了。raytune的搞法差不多就是将原来训练的一个个epoch拆开，一个epoch一个epoch去搞，因此你要做的事情主要有三个，分别是写好你的data_loader，train_one_epoch，evaluate_one_epoch，函数的意思很简单，就是在一个epoch下train和evaluate，具体的实现和代码可以去参考raytune主页。

今天想记录一下的主要是在小数据集上如何使用raytune进行多模型的ensemble，问题源于一次实验，我们需要在小数据集上（不到3000）进行一次二分类问题的实验，由于数据集太小，训练的时候很容易过拟合而且数据集的划分也很容易存在train，valid，test上分布特征不一致的问题，就有可能valid上效果好但是test上面不行，或者valid上面不好但是test上面反而效果很好的问题。因此但次实验的结果是不准确的，所以需要做模型的ensemble。

在raytune中，你可以设置同时跑多个sample，一个sample对应的就是一组参数，原来一个sample中是一个model，但是现在一个sample中对应的多个model了，也就是多个model会share同一个初始参数，但是会在不同seed下random split的数据集上train和validate，最后在test上取平均，这样作用也就是减轻数据集小带来的问题。但是现在问题是，如何做validate？raytune上面是你需要让一个sample在validate之后返回一个评估值，单个模型的话直接返回auc或者acc就好了，但是多个模型呢？直接取平均？我一开始确实是没有多想直接取的平均，然鹅，这样做的效果其实并不好。。。然后老板直接提出应该要取一个sample中每个mode在所有epoch中最好的model，而不是取同一个epoch下的model，简单来说前者方便后者麻烦，但是后者显而易见更有效。

前者图示：
在这里插入图片描述
后者图示：

我按照后面这样改了，但是效果还是。。不好。。后来发现是因为我给每个sample中的model分的数据用的seed不是随机的，是0，1，2，3。。。结果导致每次都是第三个mode效果不好，就很迷。于是乎后来每份数据的seed用的都是随机数，效果一下子就上来了，平均test auc直接从0.87的蹦到了0.94，真的太神奇了。附上效果图：
在这里插入图片描述

总之就是数据集小的时候一定要做ensemble，而且要严格按照ensemble的方式去分数据。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

记自动调参平台raytune和chemprop的一次实验的相关文章

如何在python中读取多个文件中的文本

我的文件夹中有许多文本文件大约有 3000 个文件每个文件中第 193 行是唯一包含重要信息的行我如何使用 python 将所有这些文件读入 1 个文本文件 os 模块中有一个名为 list dir 的函数该函数返回给定目录中所有文
InterfaceError：连接已关闭（使用 django + celery + Scrapy）

当我在 Celery 任务中使用 Scrapy 解析函数有时可能需要 10 分钟时我得到了这个信息我用姜戈 1 6 5 django celery 3 1 16 芹菜 3 1 16 psycopg2 2 5 5 我也使用了psyc
导入错误：没有名为 _ssl 的模块

带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
打破嵌套循环[重复]

这个问题在这里已经有答案了有没有比抛出异常更简单的方法来打破嵌套循环在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签并且至少继续一个外循环 for x in range 10 fo
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
Geopandas 设置几何图形：MultiPolygon“等于 len 键和值”的 ValueError

我有 2 个带有几何列的地理数据框我将一些几何图形从 1 个复制到另一个这对于多边形效果很好但对于任何有效多多边形都会返回 ValueError 请指教如何解决这个问题我不知道是否如何为什么应该更改 MultiPolygon
使用 OpenPyXL 迭代工作表和单元格，并使用包含的字符串更新单元格[重复]

这个问题在这里已经有答案了我想使用 OpenPyXL 来搜索工作簿但我遇到了一些问题希望有人可以帮助解决以下是一些障碍待办事项我的工作表和单元格数量未知我想搜索工作簿并将工作表名称放入数组中我想循环遍历每个数组项并搜索包含特
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
如何将 numpy.matrix 提高到非整数幂？

The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
循环中断打破tqdm

下面的简单代码使用tqdm https github com tqdm tqdm在循环迭代时显示进度条 import tqdm for f in tqdm tqdm range 100000000 if f gt 100000000 4 b
Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例

随机推荐

Spider(网络蜘蛛)之ajax爬取douban电影排行和kfc门店数据

爬前注意首先douban的接口请求方式是get简单一点寻找规律可以爬取数据 kfc的接口方式是post data所需要parse urlencode data encode utf 8 需要编码编码和解码是两个相反的过程字节 lt
分布式事务框架Seata

分布式事务框架Seata sei达一分布式事务前言 1 数据库管理系统中事务 transaction 的四个特性简称ACID 这种特性简称刚性事物原子性 Atomicity 原子性是指事务是一个不可再分割的工作单元事务中的操作要么
特征选择--scikit-learn

特征选择 Feature Selection choosing a subset of all the features the ones more informative 最终得到的特征选是原来特征的一个子集特征选取是机器学习领域非常重
synchronized方法和代码块

1 同步由于多线程并发存在数据不安全问题为了保证数据的安全性需要一些特殊的手段来维持数据不安全主要是针对修改来说的如果一个数据只能读不能修改几乎不会产生什么安全问题只有修改数据的时候容易产生一些差错导致多线程并发造成数据不安全从
清理 Ubuntu 系统的 4 个简单步骤

清理 Ubuntu 系统的 4 个简单步骤现在试试看这 4 个简单的步骤来清理你的 Ubuntu 系统吧这份精简指南将告诉你如何清理 Ubuntu 系统以及如何释放一些磁盘空间如果你的 Ubuntu 系统已经运行了至少一年尽管系
js类型检测

1 检测是否是字符串 function isString obj return Object prototype toString call obj object String 2 检测是否是对象 function isObject obj
《视觉SLAM十四讲》第一版源码slambook编译调试

slambook master ch2 编译正常 log如下 slambook master ch2 mkdir build cd build cmake make j8 The C compiler identification is G
python中去除字符串中表示的空格

去掉 nbsp 硬空格必须在unicode下替换才行如下所示 text replace u xa0 其中text就是包含 nbsp 的一个变量
Unity3D中API常用方法和类详细讲解（Transform类）

目录 Transform类点击这里进入官网该类表示的是对象的位置旋转和缩放 Properties Transform parent public Transform parent 让一个游戏物体成为另一游戏物体的子对象那么该物体的
计算机考研复试上机算法学习

计算机考研复试上机算法学习这篇博客是博主在准备可能到来的线下上机复试基于王道机试指南的学习将各道习题链接和代码记录下来这篇博客权且当个记录文章目录计算机考研复试上机算法学习 1 STL容器学习 1 1 vector动态数组 1 1
mongoDB 一些操作命令

如果你想创建一个 myTest 的数据库先运行use myTest命令之后就做一些操作如 db createCollection user 这样就可以创建一个名叫 myTest 的数据库一数据库常用命令 1 Help查看命令提示
微信小程序调用微信支付

1 首先肯定是要去微信公众平台申请接入微信支付 2 申请成功之后就可以调用商户号的接口进行微信支付交易了 3 携带的参数肯定是从后端接口拿取的我们回调的时候直接拉起支付就可以了 wx showLoading title 处理中调用后端接
将docker容器设置为宿主机同一网段

本文主要讲述将docker的容器ip设置为宿主机同一网段并且允许宿主机以及局域网其它机器访问它创建docker的虚拟网络本人局域网的网段为192 168 1 0 24 网关为路由器的192 168 1 1 docker networ
STM32F103ZET6【标准库函数开发】------09 高级定时器TIM1输出7个PWM，三对为互补PWM

只有高级定时器可以输出互补的PWM 所以只有TIM1和TIM8可以实现这个功能而TIM1又分为三种情况没有重映射部分重映射完全重映射一没有重映射下面展示主要的time c main c函数的代码 void TIM1 PWM In
机器人路径规划的算法有很多种，其中RRT算法是其中一种比较流行的算法之一

机器人路径规划的算法有很多种其中RRT算法是其中一种比较流行的算法之一在这篇文章中我们将为大家介绍如何使用Matlab实现基于RRT算法的机器人最短路径规划并附上相应的源代码我们首先需要明确RRT算法的基本思路 RRT全称为Rap
Android——Binder机制

1 简介 Binder是什么机制 Binder是一种进程间通信的机制驱动 Binder是一个虚拟物理设备驱动应用层 Binder是一个能发起进程间通信的JAVA类 Binder就是Android中的血管在Android中我们使用Ac
Java设计模式之七大设计原则

Java设计模式之七大设计原则本文对Java设计模式中的七大设计原则进行汇总介绍提炼最核心的概念设计模式总结笔记一设计模式七大原则设计模式的目的代码可重用性相同功能的代码不用多次编写可读性编程规范性便于其他程序员的阅
基于TCP协议实现HTTP_GET请求

前言之前一直使用MQTT的物联网协议偶然间发现互联网中HTTP的通信协议也应用广泛想要更好的理解这个协议可以基于tcp来实现这个协议这样可以更理解底层组包结构 http与mqtt类似都是基于tcp udp 的基础上规范了传输的报文
看完这篇，轻松get限流！

引言本文推选自技思广益腾讯技术人原创集专栏该专栏是腾讯云开发者社区为腾讯技术人与广泛开发者打造的分享交流窗口栏目邀约腾讯技术人分享原创的技术积淀与广泛开发者互启迪共成长作者是腾讯云开发者社区的作者一只小黄鱼限流在确保现代
记自动调参平台raytune和chemprop的一次实验

首先介绍一下raytune这个东西了解机器学习深度学习的朋友应该知道调参是机器学习中必不可少的一个环节当你的模型被设计出来之后或者你使用别人现成的模型的时候你是要去调整模型的一个超参数从而是模型在你的数据集上达到一个比较好的效果的

记自动调参平台raytune和chemprop的一次实验

记自动调参平台raytune和chemprop的一次实验 的相关文章

随机推荐

热门标签

记自动调参平台raytune和chemprop的一次实验的相关文章