Cirrascale Cloud Services近日宣布扩大与谷歌云的合作,通过Google Distributed Cloud在本地部署环境中提供Gemini模型,成为首家提供谷歌最先进AI模型作为完全私有、断网独立设备的新云服务商。这一消息在Google Cloud Next 2026大会期间发布,直击受监管行业自生成式AI热潮以来一直面临的顽固难题:如何在不放弃数据控制权的前提下使用前沿级AI模型。

金融与政府行业的不可能权衡终于被打破

多年来,金融服务、医疗保健、国防和政府机构面临着一个二选一的困境:要么通过公有云API访问最强大的AI模型,将敏感数据暴露给第三方基础设施;要么满足于可以自行托管但能力较弱的开源模型。Cirrascale的新产品试图彻底消除这一权衡。

Cirrascale CEO戴夫·德里格斯描述了信任问题的逐步升级。最初,企业担心将专有数据交给超大规模云服务商。然后出现了更深层的认识:“他们开始意识到,当我的用户输入内容时,他们正在泄露私人信息——输出结果也是私密的。”而超大规模云服务商却说:“你的提示和回答?那是我们的东西,我们需要这些来回答你的问题。”正是在那一刻,对完全私有AI的需求变得不可忽视。

断电即销毁:机密计算如何保护谷歌的核心资产

部署的技术细节揭示了谷歌和Cirrascale对待安全问题的严肃程度。Gemini模型完全驻留在易失性存储器中——而非持久存储。“一旦断电,模型就消失了,”德里格斯解释道。用户会话通过缓存操作,会话结束时自动清除。

最引人注目的安全特性是有人试图篡改设备时会发生什么。德里格斯描述了一种实际上使机器无法操作的机制:“你做任何违反机密计算的事情,它就没了。不仅机器关闭,模型消失,它实际上还会打上一个标记,说’你违反了机密计算’。那台机器必须返回给我们,或者返回给戴尔或谷歌。”他将这款设备形容为“如果出了问题就会自我定时销毁”。

从华尔街到药物实验室:隔离AI的需求正在加速

德里格斯指出了三大需求驱动力:信任、安全性和性能保障。金融机构位居榜首。“它们面临监管问题,不能让任何东西脱离它们的控制。它们必须是决定一切去向的一方。必须是隔离的,”德里格斯说。

最低部署规模——单台八GPU服务器——使该产品在谷歌自身私有产品无法企及的方式上变得触手可及。在谷歌基于TPU的基础设施上运行Gemini需要更大的投入。“如果你想要谷歌的私有实例,他们需要更大的投入,因为为你构建私有环境需要巨大的规模。而我们可以在单台机器上实现。”

除金融外,德里格斯还指向了药物发现、医疗数据、公共部门研究以及任何处理个人信息的企业。他还指出了一个日益关键的用例:数据主权。“想想那些在美国以外开展业务的企业,现在你在GCP不存在的地方面临数据主权法律?我们可以在这些数据不能离开的较小国家提供私有的Gemini。”

灵活的定价模型

定价模式反映了Cirrascale满足客户多样化需求的理念。德里格斯描述了几种消费选项:基于席位的许可证(包括企业版和标准版)、按token计费,以及每台设备的“不限量”统一定价。最低承诺是一台专用服务器——设备在任何配置下都不会在客户之间共享。

客户还可以选择直接购买硬件,同时仍将Gemini作为托管服务使用。这种灵活的所有制模式对于大学和政府资助的研究机构尤其相关,这些机构往往要求特定比例的资本支出、运营支出和人员投入。

该产品立即进入预览阶段,预计6月或7月全面上市。这一发布无疑将在企业AI市场掀起新的波澜,推动最强大的AI模型从超大规模数据中心向客户自身机架迁移。