为什么当我尝试并行拟合多个模型时，tensorflow/keras 会阻塞？

2024-02-07

我正在尝试拟合有限混合模型，每个类别的混合模型都是神经网络。能够并行化对我来说非常有用，因为 keras 不会最大化我笔记本电脑上的所有可用内核，更不用说大型集群了。

但是当我尝试为不同的模型设置不同的学习率时在并行 foreach 循环内部整个事情都令人窒息。

到底是怎么回事？我怀疑这与范围有关 - 也许工作人员没有在张量流的单独实例上运行。但我真的不知道。我怎样才能做到这一点？我需要了解什么才能知道为什么这不起作用？

这是一个 MWE。设置foreach循环到%do%而且效果很好。将其设置为%dopar%它在试衣阶段窒息了。

library(foreach)
library(doParallel)
registerDoParallel(2)
library(keras)
library(tensorflow)
mnist <- dataset_mnist()
x_train <- mnist$train$x
y_train <- mnist$train$y
x_test <- mnist$test$x
y_test <- mnist$test$y

x_train <- array_reshape(x_train, c(nrow(x_train), 784))
x_test <- array_reshape(x_test, c(nrow(x_test), 784))
# rescale
x_train <- x_train / 255
x_test <- x_test / 255

y_train <- to_categorical(y_train, 10)
y_test <- to_categorical(y_test, 10)

# make tensorflow run single-threaded
session_conf <- tf$ConfigProto(intra_op_parallelism_threads = 1L,
                               inter_op_parallelism_threads = 1L)
# Create the session using the custom configuration
sess <- tf$Session(config = session_conf)
K <- backend()
K$set_session(sess)


models <- foreach(i = 1:2) %dopar%{
  model <- keras_model_sequential() 
  model %>% 
    layer_dense(units = 256/i, activation = 'relu', input_shape = c(784)) %>% 
    layer_dropout(rate = 0.4) %>% 
    layer_dense(units = 128/i, activation = 'relu') %>%
    layer_dropout(rate = 0.3) %>%
    layer_dense(units = 10, activation = 'softmax')

  print("A")
  model %>% compile(
    loss = 'categorical_crossentropy',
    optimizer = optimizer_rmsprop(),
    metrics = c('accuracy')
  )
  print("B")
  history <- model %>% fit(
    x_train, y_train, 
    epochs = 3, batch_size = 128, 
    validation_split = 0.2, verbose = 0
  )
  print("done")  
}

Here's sessionInfo():

R version 3.5.1 (2018-07-02)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 18.04.1 LTS

Matrix products: default
BLAS: /usr/lib/x86_64-linux-gnu/blas/libblas.so.3.7.1
LAPACK: /usr/lib/x86_64-linux-gnu/lapack/liblapack.so.3.7.1

locale:
 [1] LC_CTYPE=en_US.UTF-8       LC_NUMERIC=C               LC_TIME=en_US.UTF-8        LC_COLLATE=en_US.UTF-8     LC_MONETARY=en_US.UTF-8   
 [6] LC_MESSAGES=en_US.UTF-8    LC_PAPER=en_US.UTF-8       LC_NAME=C                  LC_ADDRESS=C               LC_TELEPHONE=C            
[11] LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C       

attached base packages:
[1] splines   parallel  stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
 [1] panelNNET_1.0       matrixStats_0.54.0  MASS_7.3-50         lfe_2.8-2           tensorflow_1.9      keras_2.1.6.9005   
 [7] mgcv_1.8-24         nlme_3.1-137        scales_1.0.0        forcats_0.3.0       stringr_1.3.1       purrr_0.2.5        
[13] readr_1.1.1         tidyr_0.8.1         tibble_1.4.2        tidyverse_1.2.1     maptools_0.9-3      rgeos_0.3-28       
[19] rgdal_1.3-4         sp_1.3-1            broom_0.5.0         ggplot2_3.0.0       randomForest_4.6-14 dplyr_0.7.6        
[25] glmnet_2.0-16       Matrix_1.2-14       doBy_4.6-2          doParallel_1.0.11   iterators_1.0.10    foreach_1.4.4      

loaded via a namespace (and not attached):
 [1] httr_1.3.1          jsonlite_1.5        modelr_0.1.2        Formula_1.2-3       assertthat_0.2.0    cellranger_1.1.0   
 [7] yaml_2.2.0          pillar_1.3.0        backports_1.1.2     lattice_0.20-35     glue_1.3.0          reticulate_1.10    
[13] digest_0.6.15       RcppEigen_0.3.3.4.0 rvest_0.3.2         colorspace_1.3-2    sandwich_2.5-0      plyr_1.8.4         
[19] pkgconfig_2.0.1     haven_1.1.2         xtable_1.8-2        whisker_0.3-2       withr_2.1.2         lazyeval_0.2.1     
[25] cli_1.0.0           magrittr_1.5        crayon_1.3.4        readxl_1.1.0        xml2_1.2.0          foreign_0.8-70     
[31] tools_3.5.1         hms_0.4.2           munsell_0.5.0       bindrcpp_0.2.2      compiler_3.5.1      rlang_0.2.2        
[37] grid_3.5.1          rstudioapi_0.7      base64enc_0.1-3     labeling_0.3        gtable_0.2.0        codetools_0.2-15   
[43] R6_2.2.2            tfruns_1.3          zoo_1.8-3           lubridate_1.7.4     zeallot_0.1.0       bindr_0.1.1        
[49] stringi_1.2.4       Rcpp_0.12.18        tidyselect_0.2.4

Keras 要求在给定的会话中只有一次训练。我会尝试为每个模型创建一个不同的会话。

我会将这部分代码插入到 %dopar% 中，为每个模型创建不同的会话

sess <- tf$Session(config = session_conf)
K <- backend()
K$set_session(sess)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

tensorflow

parallelprocessing

scope

Keras

为什么当我尝试并行拟合多个模型时，tensorflow/keras 会阻塞？的相关文章

使用 geom_tile() 的 R ggplot 热图：如何按年份排序并在 y 轴上显示所有年份？

在研究了哈德利的书并在这里搜索后我创建了一个由年和月矩阵组成的热图颜色根据时间序列变量的百分比变化而变化热图和我用来获取它的代码如下所示我还有一些我自己无法解决的问题 1 如何对矩阵进行排序排序以便 y 轴中的年份从最早到最晚
r - 选择每组最后出现的 n 次

情况我有一个数据框df df lt structure list person structure c 1L 1L 1L 1L 2L 2L 2L 3L 3L Label c pA pB pC class factor date struc
以给定的纵横比保存绘图

我正在使用非常棒的库 ggplot2 我想出了如何使用设置绘图的纵横比coord fixed 现在我想将绘图保存为具有指定宽度例如 10 厘米的 PDF 并计算所需的高度我不知道如何实现这一目标这可能吗您可以使用网格函数来计算
无法使用 tf.data.Dataset 对组件 0 中具有不同形状的张量进行批处理

我的输入管道中出现以下错误 tensorflow python framework errors impl InvalidArgumentError 不能分量 0 中具有不同形状的批量张量第一个元素有形状为 2 48 48 3 元素
将数字提高到非整数幂时出现奇怪的 NaN [重复]

这个问题在这里已经有答案了我执行了以下代码 tau lt 0 25 h lt 0 6 n 1 5 4 5 dnorm qnorm tau 4 qnorm tau 2 qnorm tau 2 1 2 1 5 R 继续生产NaN 然而 R 实
cspade() R 错误

我正在尝试从电缆调制解调器的事件中挖掘规则链接的是数千个文件当我尝试在所有设备的合并文件 1200 万行上运行 cspade 算法时它会花费数小时来消耗 RAM 直到它用完我可用的所有 64 GB 因此我尝试仅在一台设备的链接文件
带有用户输入的knitr

我正在使用 R markdown 并使用 Rstudio 来 Knit 我有以下 R markdown 文件 title Untitled author date output html document r setup include F
可以明确声明包依赖项的版本吗？

我倾向于对我编写的代码进行明确而不是隐含的描述因此在成功创建自己的包之后我立即想到的下一件事是如何最好地确保代码的健壮性和可靠性其中一部分与我的包所依赖的包有关实际问题在这方面是否可以明确声明需要期望哪个版本的包依赖项我正
从网络源获取 R 中的数据作为数据框

我正在尝试使用 RCurl 包将一些空气污染背景数据作为 data frame 直接加载到 R 中该网站有 3 个下拉框用于在下载 csv 文件之前选择选项如下图所示我试图从下拉框中选择 3 个值并使用下载 CSV 按钮将数据作
指定 R 中 hist() 中的 bin 数量？

我尝试指定垃圾箱的数量hist R为10 如下 gt hist x breaks 10 但垃圾箱的数量并不完全是 10 我尝试了几个其他数量的垃圾箱结果发生了同样的情况 hist says breaks可以指定给出直方图单元格数量的单个
如何调整ggplot直方图的时间刻度轴

我正在使用一个数据框其中一列包含POSIXct日期时间值我正在尝试使用绘制这些时间戳的直方图ggplot2但我有两个问题我不知道如何设置 binwidthgeom histogram 我想将每个垃圾箱设置为一天或一周我尝试提供 di
将summary()写入as.data.frame以在ggplot / R中使用

请查找 af 数据样本t below 我正在使用以下方法进行竞争风险分析etmCIF来自etm package 产生以下结果这很好但需要更好的图形曾经有一个ggtrans etm函数将数据导入ggplot 然而这个功能显然被删除了
使用 ggplot2 修改点子集的形状

我正在尝试绘制一个沿大量维度变化的大型散点图这是我的起始情节 p lt ggplot mtcars aes wt mpg shape cyl colour gear size carb geom point 使用mtcars数据集我只是
顺序没有属性“validation_data”

我从下面的链接下载并运行该文件https github com keunwoochoi keras callbacks example https github com keunwoochoi keras callbacks example
如何在不循环的情况下添加组ID？

我有数据框例如 productid ordernum p1 10 p2 20 p3 30 p4 5 p5 20 p6 8 我想添加另一列称为 groupid 它将产品按顺序分组在一起一旦 sum ordernum 达到 30 分配一个
将列表中的列转换为 R 中的数据框

我有使用 R 创建的以下列表 set seed 326581 X1 rnorm 10 0 1 Y1 rnorm 10 0 2 data data frame X1 Y1 lst lt replicate 100 df smpl lt dat
获取 Keras model.summary() 作为表

我在 Keras 中创建了相当大的模型我正在用 LaTeX 写一篇关于它的文章为了很好地描述 LaTeX 中的 keras 模型我想用它创建一个 LaTeX 表我可以手动实现它但我想知道是否有任何更好的方法来实现这一点我四处
tf.print() vs Python print vs tensor.eval()

看来在Tensorflow中至少有三种方法可以打印出张量的值我一直在读here https www freecodecamp org news debugging tensorflow a starter e6668ce72617 an
从 R 中的 HTTPS 连接逐行读取

当创建连接时open r 它允许逐行读取这对于批量处理大数据流非常有用例如这个脚本 https gist github com jeroenooms d33a24958d99bb969ac0通过一次读取 100 行来解析相当大的 gzi
将 VLMC 拟合到很长的序列

我正在尝试将 VLMC 拟合到最长序列为 296 个状态的数据集我这样做如下所示 Load libraries library PST library RCurl library TraMineR Load and transform d

随机推荐

正则表达式 - 贪婪量词[重复]

这个问题在这里已经有答案了我真的很纠结这个问题 import java util regex class Regex2 public static void main String args Pattern p Pattern compi
数组索引越界异常[重复]

这个问题在这里已经有答案了一直在环顾四周看看是否有什么可以帮助我但我不太明白人们在回答什么而我所理解的任何东西似乎都不能解决问题所以基本上正如标题所说我遇到了数组索引越界异常但我不知道为什么任何帮助是极大的赞赏 Code i
如何实现高效的 WhenEach 来传输 IAsyncEnumerable 任务结果？

我正在尝试使用以下提供的新工具更新我的工具集C 8 https learn microsoft com en us dotnet csharp whats new csharp 8 一种似乎特别有用的方法是Task WhenAll http
Jquery-UI 可排序列表与 Meteor 模板中的反应式更新配合不佳

我正在尝试以 JQuery UI 中描述的方式实现可排序的对象列表http Differential com blog sortable lists in meteor using jquery ui http differential c
在 Rails 中的 Globalize3 表上进行简单搜索

我希望在使用 Ruby on Rails 的 globalize3 gem 时实现一个简单的搜索功能由于模型的翻译存储在单独的表中因此下面的代码不起作用因为产品表中不再有 name 字段如何调整下面的代码以使搜索功能正确产品控制器
Twitter bootstrap div 对齐[重复]

这个问题在这里已经有答案了可能的重复如何在 Twitter Bootstrap 中居中表单 https stackoverflow com questions 12172651 how to center form in twitter
无法通过 xcodebuild 从命令行执行测试

我正在尝试使用 iOS 测试用例的命令行构建和运行测试用例我给出了以下命令 xcodebuild target AppEngineTests configuration Debug sdk iphonesimulator TEST AFT
C：将华氏度转换为摄氏度

int main void int fahrenheit fahrenheit stands for fahrenheit double c c stands for celsius printf Enter your fahrenheit
SCNText 对齐在 iOS 中不起作用

我尝试右对齐但它仍然是左对齐 let txt SCNText string TEST extrusionDepth 10 txt chamferRadius 5 0
React Native - JEST：在 haste.hasteImplModulePath 选项中找不到react-native/jest/hasteImpl.js

我正在基于 expo io 的 React Native 应用程序上实现笑话遵循实施说明后我已经能够在我的系统上成功通过笑话测试问题出在 bitbucket 管道上我遇到以下问题并且管道失败 npx jest ci Validati
更新后MySQL触发器插入到另一个有条件的表中

下面是我的触发器代码更新表 student approve插入数据到表通知但是在第 5 行发生错误 DROP TRIGGER IF EXISTS student approve CREATE TRIGGER student approve
.modal('dispose') 有什么作用？引导程序4

根据文档 modal dispose https getbootstrap com docs 4 0 components modal modaldispose 破坏模态 modal dispose 破坏元素的模态但是当我创建一个even
mix 在代理后面不起作用

我一直都在用mix至少就在两周前落后于代理但是我昨天发现 mix 无法在代理后面工作混合版本是1 1 1 mix local hex 运行但混合 deps get 会出现错误 mix deps get Registry update
Symfony：日志未显示在工具栏中

我有 Symfony 2 8 并且日志记录已激活在我的 app logs 目录中是 dev log 文件它工作正常但是日志没有显示在我的 Symfony 工具栏中而且当我打开 Profiler 时日志菜单点也没有激活我必须在配置
为什么 c_str() 对两个不同的字符串返回相同的值？ [复制]

这个问题在这里已经有答案了给定一个简单的文件加载函数 std string load file const std string filename std ifstream file filename std string line st
更改Python脚本的进程名称

Windows 任务管理器在进程选项卡中列出了所有正在运行的进程 Python脚本的图像名称始终是python exe or pythonw exe 或 Python 解释器的名称除了更改 Python 解释器的名称之外是否有更好的
使用 Boost adjacency_list 执行连接组件，其中 VertexList=listS

我在项目中使用Boost Graph Library 它被声明为 typedef adjacency list
打印下划线分隔的整数

从python3 6开始可以使用下划线来分隔整数的数字例如 x 1 000 000 print x 1000000 添加此功能是为了轻松读取多位数字我发现它非常有用但是当您打印数字时您总是会得到一个没有用数字分隔的数字有没有办
rspec - 为什么 be_valid 不起作用

我正在尝试这样做 describe should fail on create if the name is shorter than 5 characters do group Factory build group name gt a
为什么当我尝试并行拟合多个模型时，tensorflow/keras 会阻塞？

我正在尝试拟合有限混合模型每个类别的混合模型都是神经网络能够并行化对我来说非常有用因为 keras 不会最大化我笔记本电脑上的所有可用内核更不用说大型集群了但是当我尝试为不同的模型设置不同的学习率时在并行 foreach 循环内部

为什么当我尝试并行拟合多个模型时，tensorflow/keras 会阻塞？

为什么当我尝试并行拟合多个模型时，tensorflow/keras 会阻塞？ 的相关文章

随机推荐

热门标签

为什么当我尝试并行拟合多个模型时，tensorflow/keras 会阻塞？的相关文章