我运行了谷歌的官方教程(链接在这里 https://cloud.google.com/ml-engine/docs/how-tos/getting-started-training-prediction)。它在本地运行良好,但我陷入了需要在 Google Cloud Platform 上训练网络的部分。我在终端上运行了以下代码:
JOB_NAME=census_single_1
OUTPUT_PATH=gs://$BUCKET_NAME/$JOB_NAME
gcloud ml-engine jobs submit training $JOB_NAME \
--job-dir $OUTPUT_PATH \
--runtime-version 1.0 \
--module-name trainer.task \
--package-path trainer/ \
--region $REGION \
-- \
--train-files $TRAIN_DATA \
--eval-files $EVAL_DATA \
--train-steps 1000 \
--verbosity DEBUG
我收到以下错误消息:
“回溯(最近一次调用最后一次):\n 文件
\“/usr/lib/python2.7/runpy.py\”,第 162 行,在 _run_module_as_main\n
\"main\", fname, loader, pkg_name)\n 文件
\"/usr/lib/python2.7/runpy.py\",第 72 行,在 _run_code\n 执行代码中
在 run_globals\n 文件中
\“/root/.local/lib/python2.7/site-packages/trainer/task.py\”,第 4 行,
在\n导入模型\n文件中
\“/root/.local/lib/python2.7/site-packages/trainer/model.py\”,行
40,在\n
tf.feature_column.categorical_column_with_vocabulary_list(\nAttributeError:
“模块”对象没有属性“feature_column”\n"
// UPDATE
没关系。我想到了。事实证明--runtime-version
参数控制 Cloud ML 运行时版本 (link https://cloud.google.com/ml-engine/docs/concepts/runtime-version-list)。在教程中它被指定为 1.0,对应于 Tensorflow v 1.0.1,它没有tf.feature_column.*
因为它刚刚于 2017 年 6 月 16 日在 Tensorflow v 1.2.0 中引入
// UPDATE 2
谷歌教程已经更新可以使用--runtime-version 1.2
代替--runtime-version 1.0
截至今天,即 2017 年 6 月 29 日。我不知道他们是否看到了我的帖子,但这在 6 月 28 日至 6 月 29 日之间发生了更改。该教程的未来用户不应遇到与我相同的问题。
更新 Google Cloud SDK 也可能会发生这种情况,在这种情况下pip install --upgrade tensorflow
应该做这项工作。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)