Noam Shazeer 很少公开说话。正因为这样,当他和 Jeff Dean、Koray Kavukcuoglu、Oriol Vinyals 一起坐在镜头前,这期 Release Notes 就显得格外不同。不是那种发布会的圆桌客套,Google DeepMind 把 Gemini 背后四个真正做决定的人凑齐了。他们聊的不是参数和榜单,而是某种更底层的东西——当这帮人亲眼看着纸上的构想变成能推理、能看、能听的多模态系统时,他们自己信不信这东西真的在“理解”。
节目里有个细节很说明问题。谈到长上下文窗口时,Jeff Dean 没有重复那些技术指标,反而讲起团队早期对注意力机制的直觉——那种“感觉能行、但不确定为什么能行”的状态。Oriol Vinyals 接过话头,用极其技术流的方式拆解了模型从“看见”到“看懂”之间那道坎到底是怎么迈过去的。整场对话没有提“护城河”三个字,但听完你会明白,这帮人对模型边界的推演方式本身就是一道极高的壁垒。Koray 点到即止地提及多模态融合的工程取舍,没有教科书式的展开,却比任何论文都更清楚地解释了为什么有些路线他们走了,有些直接放弃。
真正有价值的是那种坦诚。Noam 罕见地聊到了对 scaling law 的反思——不是推翻,是补全。他们现在思考的不再是“更大是否更好”,而是什么样的智能涌现值得用什么样的代价去换取。当整个行业还在追逐 benchmark 时,这几个架构师已经在重新定义什么才是值得追逐的问题。四十分钟的对话,没有 roadmap,没有产品预告,却比任何战略发布都更清晰地勾勒出 Google 对下一代 AI 的认知框架。

