贝叶斯优化神经网络参数_贝叶斯超参数优化:神经网络,TensorFlow,相预测示例

2023-11-10

贝叶斯优化神经网络参数

The purpose of this work is to optimize the neural network model hyper-parameters to estimate facies classes from well logs. I will include some codes in this paper but for a full jupyter notebook file, you can visit my Github.

这项工作的目的是优化神经网络模型的超参数,以从测井中估计相类。 我将在本文中包括一些代码,但要获取完整的jupyter笔记本文件,您可以访问我的Github

note: if you are new in TensorFlow, its installation elaborated by Jeff Heaton.

注意:如果您是TensorFlow的新手,那么其安装将由Jeff Heaton进行详细说明。

In machine learning, model parameters can be divided into two main categories:1- Trainable parameters: such as weights in neural networks learned by training algorithms and the user does not interfere in the process,2- Hyper-parameters: users can set them before training operation such as learning rate or the number of dense layers in the model.Selecting the best hyper-parameters can be a tedious task if you try it by hand and it is almost impossible to find the best ones if you are dealing with more than two parameters.One way is to divide each parameter into a valid evenly range and then simply ask the computer to loop for the combination of parameters and calculate the results. The method is called Grid Search. Although it is done by machine, it will be a time-consuming process. Suppose you have 3 hyper-parameters with 10 possible values in each. In this approach, you will run 10³ neural network models (even with reasonable training datasets size, this task is huge).Another way is a random search approach. In fact, instead of using organized parameter searching, it will go through a random combination of parameters and look for the optimized ones. You may estimate that chance of success decreases to zero for larger hyper-parameter tunings.

在机器学习中,模型参数可以分为两大类: 1-可 训练参数 :例如通过训练算法学习的神经网络权重,并且用户不会干扰过程; 2- 超参数:用户可以在设置参数之前训练操作,例如学习率或模型中的密集层数。如果您手动尝试选择最佳超参数可能是一项繁琐的任务,并且如果您要处理的参数过多,则几乎找不到最佳参数两个参数。一种方法是将每个参数平均划分为有效范围,然后简单地让计算机循环以获取参数组合并计算结果。 该方法称为“ 网格搜索” 。 尽管它是由机器完成的,但这将是一个耗时的过程。 假设您有3个超参数,每个参数都有10个可能的值。 在这种方法中,您将运行10³神经网络模型(即使具有合理的训练数据集大小,此任务也非常艰巨)。另一种方法是随机搜索方法。 实际上,它会使用参数的随机组合并寻找经过优化的参数,而不是使用有组织的参数搜索。 您可能会估计,对于较大的超参数调整,成功的机会将减少为零。

Scikit-Optimize, skopt, which we will use here to the facies estimation task, is a simple and efficient library to minimize expensive noisy black-box functions. Bayesian optimization constructs another model of search-space for parameters. Gaussian Process is one kind of these models. This generates an estimate of how model performance varies with hyper-parameter changes.

Scikit-Optimize skopt是一个简单而有效的库,可最大程度地减少昂贵的嘈杂黑盒功能,我们将在此处将其用于相估计任务。 贝叶斯优化为参数构造了另一种搜索空间模型。 高斯过程就是这些模型中的一种。 这样就可以估算模型性能如何随超参数变化而变化。

As we see in the picture, the true objective function(red dash line) is surrounded by noise (red shade). The red line shows how scikit optimize sampled the search space for hyper-parameters(one dimension). Scikit-optimize fills the area between sample points with the Gaussian process (green line) and estimates true real fitness value. In the areas with low samples or lack(like the left side of the picture between two red samples), there is great uncertainty (big difference between red and green lines causing big uncertainty green shade area such as two standard deviations uncertainty).In this process, then we ask a new set of hyper-parameter to explore more search space. In the initial steps, it goes with sparse accuracy but in later iterations, it focuses on where sampling points are more with the good agreement of fitness function with true objective function(trough area in the graph).For more study, you may refer to Scikit Optimize documentation.

如图所示,真正的目标函数(红色虚线)被噪声(红色阴影)包围。 红线显示scikit如何优化对超参数(一维)的搜索空间进行采样。 Scikit优化使用高斯过程(绿线)填充采样点之间的区域,并估算真实的实际适应度值。 在样本较少或不足的区域(例如两个红色样本之间的图片左侧),存在很大的不确定性(红色和绿色线条之间的差异很大,导致绿色阴影区域的不确定性较大,例如两个标准偏差不确定性)。过程,然后我们要求使用一组新的超参数来探索更多的搜索空间。 在最初的步骤中,它具有稀疏的准确性,但是在以后的迭代中,它着重于采样点更多,适应度函数与真实目标函数(图中的谷值区域)具有良好一致性的地方。更多的研究,您可以参考Scikit优化文档

Data ReviewThe Council Grove gas reservoir is located in Kansas. From this carbonate reservoir, nine wells are available. Facies are studied from core samples in every half foot and matched with logging data in well location. Feature variables include five from wireline log measurements and two geologic constraining variables that are derived from geologic knowledge. For more detail refer here. For the dataset, you may download it from here. The seven variables are:

数据审查 Council Grove储气库位于堪萨斯州。 从该碳酸盐岩储层中可获得九口井。 从每半英尺的岩心样本中研究岩相,并与井眼位置的测井数据相匹配。 特征变量包括来自测井测井的五个变量和来自地质知识的两个地质约束变量。 有关更多详细信息,请参见此处 。 对于数据集,您可以从此处下载。 七个变量是:

  1. GR: this wireline logging tools measure gamma emission

    GR :此电缆测井工具可测量伽马辐射

  2. ILD_log10: this is resistivity measurement

    ILD_log10 :这是电阻率测量

  3. PE: photoelectric effect log

    PE :光电效应记录

  4. DeltaPHI: Phi is a porosity index in petrophysics.

    DeltaPHI :Phi是岩石物理学中的Kong隙度指数。

  5. PNHIND: Average of neutron and density log.

    PNHIND :中子和密度对数的平均值。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

贝叶斯优化神经网络参数_贝叶斯超参数优化:神经网络,TensorFlow,相预测示例 的相关文章

随机推荐

  • 对于Colmap的三个文件讲解

    当使用Colmap进行稀疏重建时 会生成一下三个文件 依次对每个文件进行介绍 1 points3D txt 3D point list with one line of data per point POINT3D ID X Y Z R G
  • 工作上关于MySQL数据库备份与还原

    使用 mysqldump 备份数据库 默认该工具会将SQL语句信息导出至标准输出 可以通过重定向将输出保存至文件 1 备份所有的数据库 mysqldump u username ppassword all databases gt bak
  • 开机后提示no boot device detected解决方法

    我用华擎主板b360m pro4 为了提高CPU效率 打算设置BIOS提高风扇的转速 结果重启后出现提示 no boot device detected 我的硬盘是nvme的m 2 走pcie的固态硬盘 型号是建兴t10 plus 出现的原
  • Android Flutter Could not download kotlin.jar Kotlin-stdlib.jar

    原因就是无法下载包 1 科学 上网 去Google下载 2 配置阿里镜像 需要改动的地方 1 修改 工程build gradle 即 android build gradle buildscript repositories maven u
  • 文件服务器事件id8193,执行备份时的事件 ID 8193 - Windows Server

    VSS 错误 XML 文档太长 hr 0x80070018中执行备份时出现 Windows 09 17 2020 本文内容 本文提供了一种解决在备份过程中执行备份时Windows 适用于 Windows 10 所有版本 Windows Se
  • 华为OD机试真题-开心消消乐【2023.Q1】

    题目描述 给定一个N行M列的二维矩阵 矩阵中每个位置的数字取值为0或1 矩阵示例如 1100 0001 0011 1111 现需要将矩阵中所有的1进行反转为0 规则如下 1 当点击一个1时 该1便被反转为0 同时相邻的上 下 左 右 以及左
  • Net跨平台UI框架Avalonia入门-资源和样式

    Net跨平台UI框架Avalonia入门 资源和样式编写和使用 资源和样式编写和使用 样式 Styles 和资源 Resources 样式 Styles 样式定义 定义的位置 定义内容 样式文件的定义和引用 资源 Resources 资源的
  • Android VLC播放器二次开发3——音乐播放(歌曲列表+歌词同步滚动)

    今天讲一下对VLC播放器音频播放功能进行二次开发 讲解如何改造音乐播放相关功能 最近一直在忙着优化视频解码部分代码 因为我的视频播放器需要在一台主频比较低的机器上跑 800M主频 所以视频解码能力受到极大考验 VLC的解码库挺复杂 花了两三
  • Android 架构设计的思想与原则是什么?

    http www zhihu com question 19717380
  • JAVA中常见的异常

    Java 中的异常在 Java 程序中是以类的形式体现的 在 java 中每个包下都有专门的异常类 1 java lang NullPointerException 空指针异常 2 java lang ArrayIndexOutOfBoun
  • 人脸识别学习总结

    对人脸识别算法进行了一定程度的学习 从最开始的特征脸到如今的CNN人脸检测 有了较为全面的了解 重点掌握了基于PCA的特征脸检测 LDA线性判别分析 Fisher线性判别 以及基于级联器的Haar特征 LBP特征的人脸检测算法 人脸检测的学
  • asp二进制mysql_asP 读取二进制数据库

    OleContainer操作Excel以二进制方式读写数据库 需求源头 OleContainer操作Excel 想把Excel以二进制方式存入数据库 并且以二进制方式读取存入流 Procedure SaveToStream ADOTable
  • C++ String 类常用函数

    string类的构造函数 string const char s 用c字符串s初始化 string int n char c 用n个字符c初始化 此外 string类还支持默认构造函数和复制构造函数 如string s1 string s2
  • 【前端】JavaScript构造函数

    文章目录 概念 执行过程 返回值 原型与constructor 继承方式 原型链 其他继承方式 还没写 参考 概念 在JS中 通过new来实例化对象的函数叫构造函数 实例化对象 也就是初始化一个实例对象 构造函数一般首字母大写 构造函数的目
  • 赏析

    2017年秀H5赏析 排名不分先后 尽可能多得挑选了不同展现形式 或是不同行业的案例 点击相应的图片即可查看案例 本文适合手机端浏览 人 工 智 能 类 点击图片进入案例 美图秀秀 妙啊 史上最奇妙的圣诞祝福 点评 这个特别好玩 任意上传一
  • Jar的远程调试【java的远程调试Debug】

    什么是远程调试 什么是远程调试 我们使用IDEA本地的时候运行可以打本地的Debug 但是若我们的服务在线上呢 我们的服务部署到了服务器上面 比如服务器的IP为 127 0 0 1接下来我们开始远程调试 Jar包的启动命令 前面一直到 ja
  • 数据挖掘算法总结

    原文链接 http qing blog sina com cn tj 591d4f4933002uc9 html 数据挖掘的算法有很多种 我们经常会疑虑到底用哪种方法最合适 所以专门收集了常见的数据挖掘算法 让大家有一个总体的了解 一 聚类
  • Anaconda详细安装教程!!

    1 Anaconda下载 方法一 官网安装 直接点击Download即可 可自行选择Windows 64位或32位的版本进行下载 方法二 可以选择清华大学开源软件镜像站下载 2 详细安装步骤 1 双击完成后的安装包 2 点击Next 3 点
  • 查看通过Windows凭证查看浏览器保存的密码

    1 打开控制面板 2 打开凭据管理器
  • 贝叶斯优化神经网络参数_贝叶斯超参数优化:神经网络,TensorFlow,相预测示例

    贝叶斯优化神经网络参数 The purpose of this work is to optimize the neural network model hyper parameters to estimate facies classes