据《金融时报》报道,亚马逊云服务(AWS)在 12 月遭受了一次长达 13 小时的系统中断,原因是其 AI 编码助手 Kiro 的操作。多名亚马逊员工透露,AI 代理 Kiro 对影响中国大陆部分地区 AWS 服务的中断事件负责。
发生了什么?
知情人士表示,该工具选择「删除并重新创建」它正在工作的环境,这导致了中断。虽然 Kiro 通常需要两个人类签名才能推送更改,但机器人拥有其操作员的权限,而那里的人为错误允许了比预期更多的访问权限。
亚马逊将 12 月的中断描述为「极其有限的事件」,与 10 月份导致 Alexa、Fortnite、ChatGPT 和 Amazon 等在线服务下线数小时的大规模中断相比微不足道。
这不是第一次
这并非 AI 编码工具第一次给亚马逊带来问题。一位资深 AWS 员工表示,12 月的中断是过去几个月内第二次与 AI 工具相关的生产中断,另一次与亚马逊的 AI 聊天机器人 Q Developer 有关。该员工将这些中断描述为「小但完全可以预见」。亚马逊表示第二次事件没有影响「面向客户的 AWS 服务」。
责任归谁?
亚马逊将问题归咎于人为错误,而不是失控的机器人,并表示在事件发生后已「实施了大量保障措施」,如员工培训。该公司表示「AI 工具参与其中是巧合」,并坚持认为「同样的问题可能发生在任何开发工具或手动操作上」。
这可能是真的,虽然我不是工程师,但我猜测一个人不会故意删除和重建某样东西来进行更改,除非在最极端的情况下。
AI 编码代理的安全隐患
这一事件凸显了 AI 编码代理在生产环境中的潜在风险。虽然这些工具可以显著提高开发效率,但它们也带来了新的安全考量:
- 权限管理:AI 代理继承了其操作员的权限,如果操作员拥有过多权限,代理也拥有同样多的访问能力。
- 操作审批:虽然存在双人审批机制,但如果人类操作员疏忽或误操作,系统仍然可能被绕过。
- 环境隔离:AI 代理执行的操作应该有更严格的隔离和回滚机制。
行业的警示
随着越来越多的公司采用 AI 编码代理,这类事件可能会变得更加频繁。企业需要在效率和安全之间找到平衡,确保 AI 代理的操作有足够的监督和保障机制。亚马逊作为云服务巨头,其经验教训对整个行业都有借鉴意义。
发表回复