IT之家于6月14日发布消息,谷歌透露,北京时间6月14日22点49分至6月15日凌晨1点49分发生的Cloud大规模宕机事故,其根源在于API管理上的问题,该事件持续时间超过三小时,对全球数百万用户造成了影响。
IT之家引用相关博文内容指出,谷歌透露,在此次大规模的服务中断事件中,Gmail、 Docs、 Drive以及Meet等关键应用均出现了无法正常运作的情况。
谷歌指出,问题产生的根本原因是API管理平台因数据无效而出现故障,加之缺少有效的测试与错误处理流程,导致问题未能被及时察觉并得到解决。
此次故障不仅影响了自身的服务,同时也波及了众多依赖于Cloud的第三方平台,诸如NPM以及其它一些平台。
某些服务因对 KV 键值存储系统的依赖而出现中断。原因在于 API 管理系统进行的一次自动化配额更新未能成功,这导致了外部 API 请求的拒绝。尽管大部分地区在两小时内得以恢复,但 us- 区域的配额策略数据库承受了过大的负载,因此恢复所需时间更长。
事后分析表明,此次系统故障并非由安全事故导致,且并未导致数据丢失。故障根源在于KV服务所依赖的底层存储设施,该设施的部分服务由一家第三方云服务提供商提供,虽然未明确指出具体名称,但已确认与Cloud平台有关。
为了防止类似事件再次发生,我们计划将KV核心存储转移到我们自建的R2对象存储系统中,这样可以降低对外部服务的依赖程度。
本站蘑菇号已成立2年,主要围绕于海外ID领域的分享平台,提供全面的ID账号分享知识,包括海外appleid、美区id、海外id、全球ID分享等,能让海外ID账号知识简单易懂。欢迎关注及分享本站。
本文来自作者[树州号]投稿,不代表蘑菇号立场,如若转载,请注明出处:https://bbs.houniaohao.com/haiwaipgid/202506-748.html
评论列表(3条)
我是蘑菇号的签约作者“树州号”
本文概览:googleIT之家 6 月 14 日消息,谷歌表示于北京时间 6 月 14 日 22 点 49 分到 6 月 15 日凌晨 1 点 49 分...
文章不错《谷歌 Cloud 大规模宕机超三小时,多核心工具受影响》内容很有帮助