在 Google Cloud ML 中运行作业后出错

2024-05-06

我尝试在 Google Cloud ML 上运行来自 github 的 word-RNN 模型。提交作业后,我在日志文件中收到错误。

这是我提交的培训内容

gcloud ml-engine jobs submit training word_pred_7 \
    --package-path trainer \
    --module-name trainer.train \
    --runtime-version 1.0 \
    --job-dir $JOB_DIR \
    --region $REGION \
    -- \
    --data_dir gs://model-development/arpit/word-rnn-tensorflow-master/data/tinyshakespeare/real1.txt \
    --save_dir gs://model-development/arpit/word-rnn-tensorflow-master/save

这是我在日志文件中得到的内容。


最后,在向云 ML 提交 77 个作业后,我能够运行该作业,并且问题不在于提交作业时的参数。这是关于文件 .npy 生成的 IO 错误,该文件必须使用 file_io.FileIo 存储并读取为 StringIO。

这些 IO 错误尚未在任何地方提及,如果发现任何错误提示没有此类文件或目录,则应检查这些错误。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 Google Cloud ML 中运行作业后出错 的相关文章

随机推荐