无法通过 SSH 连接到曾经正常工作的 GCP 虚拟机实例

2024-03-25

我昨天创建了几个 GCP 虚拟机实例,所有实例都使用相同的配置,但运行不同的任务。 我可以通过 GCP 控制台通过 SSH 连接到这些实例,它们都工作正常。
今天我想检查任务是否已完成,但我无法再通过浏览器 SSH 到任何这些实例...错误消息如下:

Connection via Cloud Identity-Aware Proxy Failed
Code: 4010
Reason: destination read failed
You may be able to connect without using the Cloud Identity-Aware Proxy.

因此,我在禁用 Cloud Identity-Award 代理的情况下重试。但随后它写道:

Connection Failed
An error occurred while communicating with the SSH server. Check the server and the network configuration.

Running

gcloud compute instances list

显示了我的所有实例,状态是RUNNING。 但当我跑的时候

gcloud compute instances get-serial-port-output [instance-name]

使用从上述命令返回的 [instance-name]。 (这是为了检查实例的启动盘是否已用完可用空间。) 它回来了

(gcloud.compute.instances.get-serial-port-output) Could not fetch serial port output: The resource '...' was not found

一些额外的信息:
我从同一互联网(我的家庭互联网)访问虚拟机实例,其他一切都相同
我是该项目的所有者
我的帐户正在使用 GCP 免费试用,并有 300 美元的赠金
这些实例的机器类型为 c2-standard-4,并使用 Linux 深度学习
gcloud 配置对我来说很合适:

$ gcloud config list
[component_manager]
disable_update_check = True
[compute]
gce_metadata_read_timeout_sec = 5
[core]
account = [my_account]
disable_usage_reporting = True
project = [my_project]
[metrics]
environment = devshell

Update:
我重置了其中一个实例,现在我可以成功通过 SSH 连接到该实例。但是,实例上运行的作业在重置后停止。
我想保持作业在其他实例上运行。有没有办法通过 SSH 连接到其他实例而无需重置?


你的问题是在VM端。您正在运行的任务使 ssh 服务无法接受传入连接,只有在重新启动后才能连接。

您应该能够看到该实例的串行控制台输出 https://cloud.google.com/compute/docs/instances/viewing-serial-port-output using gcloud compute instances get-serial-port-output [instance-name]但如果由于某种原因你没有您可以尝试使用 GCP 控制台 - 转到实例的详细信息并单击串口1(控制台) https://cloud.google.com/compute/docs/instances/viewing-serial-port-output你会看到输出。

你甚至可能通过控制台与您的虚拟机交互(登录) https://cloud.google.com/compute/docs/instances/interacting-with-serial-console。如果某些原因停止了 ssh 服务,但为此您需要登录名/密码,则这特别有用,因此您首先必须访问虚拟机或使用启动脚本使用您的密码添加用户。但话又说回来——这需要重新启动。

无论哪种情况,重新启动虚拟机似乎都是最佳选择。但是您可以尝试通过检查日志来找出导致 ssh 服务在一段时间后停止的原因。或者您可以使用以下命令创建自己的(磁盘空间、内存、CPU 等)cron with df -Th /mountpoint/path | tail -n1 >> /name_of_the_log_file.log.

例如,您可以使用cron用于检查和启动 ssh 服务。

如果某些东西没有按预期工作(根据文档) - 转到问题追踪器 https://issuetracker.google.com并创建一个新问题以获得更多帮助。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

无法通过 SSH 连接到曾经正常工作的 GCP 虚拟机实例 的相关文章

  • 谷歌云错误。 404 在此服务器上找不到请求的 URL,但该 URL 存在

    我在谷歌云中使用 Windows 2016 和 IIS 10 创建了一个新的虚拟机实例 其中对文件的某些请求被谷歌拦截并返回此响应 这是一个错误 谷歌标志 在此服务器上找不到所请求的 URL 我们知道的就这些 问题是该资源确实存在 按F5时
  • git推送后Google函数源未刷新

    我将谷歌云函数的源定义为谷歌云存储库 我更改了我的函数源代码 提交它并通过 git push all google 推送到存储库中 我在存储库中看到新版本的函数代码 但云函数采用旧版本 所以我需要部署我的函数的新版本 我知道我不能使用控制台
  • App Engine 的 Google Cloud Storage 身份验证

    我们希望开始使用 Google Cloud Storage 作为用户上传文件的持久存储 不幸的是 我无法添加应用程序标识 应用程序 ID appspot gserviceaccount com 到我们的 团队 因为我们的团队基于 Googl
  • 增强 App Engine Cloud Endpoints Frameworks 2.0 中的端点

    我收到了一封来自 GCP 的电子邮件 要求将我的项目从 Cloud Endpoints 1 0 迁移到 Cloud Endpoints Frameworks 2 0 我已按照此处概述的步骤进行操作 https cloud google co
  • Kubernetes 如何跟踪 StatefulSet 中哪个云盘挂载到哪个 Pod 上?

    我在 GKE 上创建了一个 StatefulSet 它配置了一堆附加到属于该 StatefulSet 的 Pod 的 GCE 磁盘 假设我将 StatefulSet 缩放为 0 组成的 Pod 被销毁并释放磁盘 当我扩大规模时 磁盘会重新连
  • Google云构建中的两个容器之间进行通信

    我正在 Google 云构建中运行 CI CD 管道 我的应用程序有web and wget容器 我正在努力达到web from wget 内部使用云构建cloudbuild桥接网络 同时启动容器作为步骤 所以我期待这些步骤能够使用名称进行
  • 如何将 Google Cloud Storage 中的许多文件设为私有?

    我进行了很多研究 但无法为此提出解决方案 以下是我用来在 GCP 中公开所有文件的代码 def make blob public bucket name blob name Makes a blob publicly accessible
  • GCE Windows 启动脚本

    我面临一个奇怪的问题 我的windows startup script ps1没有在启动时运行官方链接 https cloud google com compute docs startupscript providing a startu
  • 使用存储的密钥作为环境变量

    我有一个秘密密钥存储在 GCP 的秘密管理器中 我们的想法是使用该密钥通过云功能获取预算列表 现在 我可以从代码中访问该密钥 但我面临的问题是我需要使用该密钥设置一个环境变量 这是我添加密钥的方式 如果您的本地目录中有该文件 但是还有其他方
  • 无法使用 Python 3 编写的 gzip.open() 将压缩文件上传到云存储

    当我尝试在 Cloud Shell 实例上使用 python 脚本将压缩的 gzip 文件上传到云存储时 它总是上传一个空文件 这是重现错误的代码 import gzip from google cloud import storage s
  • 在 Google Cloud 中创建 OAuth 凭据的权限

    使用 IAM 我尝试允许某些用户访问 API 并允许他们创建 OAuth 客户端凭据 是否有允许这样做的预定义角色 我不想使用项目编辑器的角色 因为我试图仅允许访问必要的服务 当用户在其项目中时 他们转到 API 和服务 gt 凭据 用户会
  • 将 google 端点中的路径参数传递到后端不起作用

    我的设置包含 google endpoints 和 google cloud functions 作为我的后端 Google 端点是使用以下 swagger v2 yaml 定义的 swagger 2 0 info description
  • 将 PyPI 包添加到 Composer 环境时出现错误

    我刚刚创建了一个新的 Cloud Composer 环境 在尝试向该环境添加一些 PyPI 包时遇到错误 例如google cloud pubsub This is the data about the environment 我尝试添加时
  • 连接超时:Nodejs Google App Engine 到 Cloud MySql

    该代码非常基础 使用 mysql 的简单 Nodejs 应用程序 Error connect ETIMEDOUT当代码尝试连接到 Google App Engine 上的 Google Cloud MySql 服务器 第二代 时收到 但是应
  • 无法连接到代理“证书由未知机构签名”

    我正在尝试通过 Kubernetes 部署上的 cloudsql proxy 容器连接到 CloudSQL 实例 我已安装 cloudsql 凭据以及值GOOGLE APPLICATION CREDENTIALS set 但是 我的日志中仍
  • Google Cloud Vision 不会自动分割图像进行训练/测试

    这很奇怪 由于某种原因 GCP Vision 不允许我训练我的模型 我已经满足每个标签至少 10 张图像的要求 没有未标记的图像 并尝试上传一个 CSV 指向其中 3 个标签图像作为验证图像 但是我收到此错误 您的某些标签 例如 Label
  • Docker忽略limits.conf(试图解决“打开文件太多”错误)

    我正在运行一个 Web 服务器 该服务器正在处理数千个并发 Web 套接字连接 为了实现这一点 在 Debian linux 我的基本镜像是 google debian wheezy 在 GCE 上运行 上 打开文件的默认数量设置为 100
  • Firestore 中的多租户

    关于基于子集合值查询数据的实际限制 在 Firestore 中管理多租户的建议方法是什么 我希望能够检索和限制对与用户所属实体 公司相关的数据的访问 数据结构示例 companies companyId users companies co
  • AttributeError:模块“boto”没有属性“plugin”

    我正在 Google Cloud Platform 上使用带有 word2vec 模型的 Jupyter 笔记本运行虚拟机 我有以下代码片段 from gensim models import Word2Vec amazon word2ve
  • Google Data Studio - 刷新嵌入式网站上的数据

    我已在 html 页面上嵌入了 data studio 报告 我在一段时间后刷新 iframe 但报告没有更新 嵌入页面上的报告只能通过访问数据工作室网站上的报告并单击 刷新数据 图标来更新 如何在不手动点击 Data Studio 网站上

随机推荐

  • 使用 ARMAResult.predict() 函数的正确方法

    根据这个问题如何使用 statsmodels 和 Python 获得 AR 模型中的常数项 https stackoverflow com questions 24172454 how to get constant term in ar
  • 如何在 macOS 上更改 sourcetree 中 github 帐户的用户名密码?

    我正在使用 SourceTree 并拥有 2 个 GitHub 帐户 我连接并将我的提交推送给其中之一 第一次 SourceTree 要求我输入密码 但是当我想推送到我的其他 GitHub 帐户时 它不会要求我输入密码 只是显示此错误 我找
  • 列,宽度参数不起作用

    我在工作中运行 REHL7column V at column from util linux 2 23 2 我有 csv 文件 其中包含一些带有长字符串的列 我想将 csv 作为表格查看 并限制列宽 因为我 通常对抽查长字符串不感兴趣 c
  • 如何使用 zlib 压缩字符串并恢复字符串?

    我正在尝试利用 Zlib 进行文本压缩 例如我有一个字符串T blah blah blah blah 我需要压缩这个字符串 我在用S zlib compress T 来压缩它 现在我想要的是得到非二进制形式S这样我就可以解压T但在不同的程序
  • 从另一个应用程序中自动安装/卸载应用程序

    我正在开发 Android 设备管理服务 其功能之一是指定应在服务的注册设备上安装哪些应用程序 该场景是 经理将企业应用程序上传到该服务 以便在其员工的 Android 设备上使用 然后 他要求服务部署该应用程序 该服务与设备上预安装的应用
  • 手机关机和开机后,无声通知如何表现

    我有一个应用程序尝试在某些情况下使用静默通知来获取用户的位置 我能够向手机发送静默通知 并能够运行后台获取并将位置返回到网络服务 比较静默通知的用户负载 当应用程序处于后台 挂起模式时 我正在执行一些操作 启动位置管理器并从委托方法中获取位
  • 使用 Bootstrap 进行电子邮件模板设计[关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我必须创建一个响应式电子邮件模板设计 我已经设计了一段时间 但从未有机会创建电子邮件模板 我可以使用 Bootstrap 创建电子邮件
  • 从不同组中选择的背包

    我对背包问题有一个变体 我正在努力寻找有效的解决方案 假设您有多组项目 每个组可以有任意数量的物品 每个物品都有一个值和重量 问题是找到总价值最大 重量 也就是说 想象一下你有数百种物品可供选择 但你必须带一份三明治 一份饮料 一份零食 一
  • 如何在 Bash 中将空格与正则表达式匹配?

    我希望下面的代码会回显 是 但事实并非如此 由于某种原因 它与单引号不匹配 为什么 str templateUrl regexp templateUrl s if str regexp then echo yes else echo no
  • 我们应该使用 Material-UI 和 React [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 我正在尝试在react中设计一个登录页面并找到了material ui 现在的问题是应该使用Material UI吗 另外 在下面的示例中 我如
  • 将 TAction 重命名为另一种形式

    我有 2 份表格 我想分享一份TActionManager并分配TAction s 第一种形式是主要形式 它包含TActionManager TAction标题为 行动 Form1 的主菜单将此操作和菜单项标题属性设置为 操作 A Form
  • 在 Linux 上构建适用于 Android 的 Ionic 应用程序失败,退出代码为 2:无法找到“ANDROID_HOME”

    我正在尝试在 Linux Ubuntu 14 04 上为 Android 构建一个默认示例应用程序 我在执行时收到标准错误消息sudo ionic 构建 android 找不到 ANDROID HOME 环境变量 尝试手动设置 请参阅下面的
  • Material Ui 自动完成 - 过滤选项未按预期工作

    我有自动完成功能 我可以在其中传递一系列获取的和预定义的选项 https codesandbox io s geocoding demo forked 2f189 file src App js https codesandbox io s
  • 如何在Python中检查列表是否为空? [复制]

    这个问题在这里已经有答案了 我正在使用的 API 可能返回空 lists 以下条件语句未按预期工作 if myList is not None not working pass if myList is not not working pa
  • 无法在 IE 中将 CSS calc() 与 transform:translateX 一起使用

    我希望能够在我的 CSS 中将 calc 与 transform translateX 一起使用 E g myDiv webkit transform translateX calc 100 50px moz transform trans
  • Magento:如何在管理面板中使用 JS 显示标准错误/成功消息?

    我可以从服务器端将错误 成功消息添加到 Magento 管理面板 例如 Mage getSingleton core session gt addError 但是如何使用 JS 在客户端显示相同的消息呢 我的意思是标准方式 当然我可以创建相
  • React 路由器和任意查询参数:页面加载时无意刷新?

    过去几周我一直在使用 React Router 取得了巨大成功 但我刚刚遇到了一个我似乎无法找到解决方案的问题 每当将任意查询参数附加到 URL 时 在我们的例子中 用于从电子邮件进行 URL 跟踪 您登陆的页面就会加载 然后自动刷新 而不
  • 开发支持 Web 应用程序的移动应用程序的方法

    我的公司构建了自己的项目管理 Web 应用程序 这就像打了类固醇的大本营 该应用程序的核心功能是 创建任务列表 将任务分配给团队成员 跟踪任务项目的工时 我希望构建移动应用程序作为网络应用程序的扩展 移动应用程序必须 重现上述功能 连接到与
  • Visual Studio 2008 崩溃日志在哪里? [关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 我安装了带有 SP1 的 Visual Studio 2008 当我在 Moq 框架中使用 lambda 表达式时 它崩溃了 起初我以为是Reshar
  • 无法通过 SSH 连接到曾经正常工作的 GCP 虚拟机实例

    我昨天创建了几个 GCP 虚拟机实例 所有实例都使用相同的配置 但运行不同的任务 我可以通过 GCP 控制台通过 SSH 连接到这些实例 它们都工作正常 今天我想检查任务是否已完成 但我无法再通过浏览器 SSH 到任何这些实例 错误消息如下