
进入四季度的谷歌无疑是“七巨头”中最彪悍的存在。尤其是11月以来,在领头羊英伟达股价跌跌不休的衬托之下,不断新高的走势显得格外孤绝。最新市值超过3.8万亿美元,把微软甩到身后,是仅次于英伟达、苹果的前三甲。
11月26日,谷歌及母公司Alphabet首席执行官桑达尔·皮查伊(Sundar Pichai)接受DeepMind团队洛根·基尔帕特里克(Logan Kilpatrick)的采访对话,分享了过去精彩纷呈的一周,当然,说的不是股价,是Gemini3推出后的热烈反响。
谷歌正王者归来,是过去半年多最强烈的感受。
这是三条隐线的集结:核心业务的AI商业化、云计算的加速增长,以及两位创始人谢尔盖·布林(Sergey Brin)和拉里·佩奇(Larry Page)不同程度的回归。
当初大家担心的谷歌作为一家依赖广告的周期性公司,不得不直面核心的搜索业务被AI蚕食,但不经意间,谷歌已经转型为一家高效且具备护城河的AI垂直整合基础设施巨头。
面对ChatGPT带来的“红色警报”,谷歌的反应是将其最强大的AI模型Gemini迅速植入核心产品中。数据显示,AI驱动的搜索概览和其他新功能,不仅没有侵蚀传统查询,反而带来了用户查询量的增量增长。
更关键的是,Google Cloud(GCP)业务已成为AI竞赛的算力基石。英伟达GPU供不应求的背景下,谷歌自研的TPU凭借成本和效率优势,成功吸引了大量需要训练和部署大型模型的企业客户,比如最新拿下Meta大订单。
在这次对话里,桑达尔·皮查伊把这条线讲得更清楚:从2016年喊出AI First开始,到Google Brain、DeepMind合体为Google DeepMind,再到transformer、BERT一路往搜索、相册等产品里落地,谷歌其实走的是一条全栈押注的长路——先把模型、算力、工具链一层层垒起来,再让它们同时出现在搜索、YouTube、Docs、地图、云,以及开放给开发者的生态里。
“从外面看,你可能会觉得谷歌当时很安静,好像没什么动静、是不是落后了。但其实我们是在一步步把底座搭牢,把一块块积木按对的顺序摆好,然后再在这上面开始真正地发力。”
在战略转型之外,谷歌在财务纪律上也实现了“成人礼”。2024年4月宣布首次派发季度股息,并配合700亿美元的股票回购,主动向市场释放出“我不只是成长股,也是现金流机器”的信号。
一边是重金投入AI基础设施,一边是通过精简组织和提升效率守住稳健的运营利润率,在重资产的AI时代,这给了长期资金一个可以量化、也更安心的锚。
想来,伯克希尔今年三季度投出40多亿美元将谷歌买到第十大重仓股时,这一条是很具加分项的。
更微妙、且或许更重要的一条线,是文化和创始人的回归。
谢尔盖·布林从“半退休”状态走回园区,亲自盯Gemini项目,帮谷歌完成了一次AI方向的紧急校准,打通了从研究到产品再到商业化的那条通道,也重新点燃了公司内部的创业精神和紧迫感;拉里·佩奇则更多站在幕后,从Alphabet架构、AI基础设施CapEx,到DeepMind等“登月项目”的资源分配,默默扮演一位长期主义的建筑师。
访谈里,桑达尔提到他喜欢的一个角落:Gradient Canopy楼里的茶水间,你常常会看到谢尔盖·布林在亲自做咖啡……那种“公司变小了”的密度感,像极了早期谷歌的创业氛围。
这次对话的有趣之处在于,它既是技术路线图,也是一个管理者如何看待周期和时间尺度的表达。
桑达尔一方面在谈Nano Banana Pro如何从“好玩”跨向“提高生产力”,用新的图形和交互把复杂分析压缩成一张更易读的信息图;一方面在聊vibe coding如何把“写代码”变成“编程界的YouTube时刻”,让更多本不在技术圈的人,真的开始动手做东西。
再往长看,他谈Waymo、量子计算、把数据中心送上太空的Project SunCatcher,那些听起来比较科幻的项目,都是用十年为单位做反向推演,一步步拆成20多个里程碑去执行。
当我们把这些碎片拼在一起,会发现:谷歌过去一年真正做对的,是用AI重构了自己的增长引擎,又用财务纪律和创始人回归带来的方向感,把这台新引擎牢牢固定在机身上。
既有速度,也有稳定性。
不管怎样,那些三季度新买进、加仓或者一直重注谷歌的投资人,这段时间是会开心得不行不行的。
点击阅读:
最后,聪明投资者(ID: Capital-nature)把桑达尔对话中精彩部分整理分享给大家。
1建立起一个“全栈能力”体系
洛根 我们现在身处山景城,Gemini3和Nano Banana Pro都已经发布,外界反响非常热烈。先请你从整体的角度,帮我们梳理一下这个阶段的重要性?
桑达尔 首先,很高兴能来到这儿。这一周的确可以用“精彩”来形容。
我们在公司内部埋头研发的时候,脑子里其实总会想象:要是有一天能把所有的成果都真正发布出去,会是怎样一个场景。对做产品的人来说,最激动人心的事情莫过于此。而这周,正是这样一个时刻。
但这背后并不是一蹴而就的,而是建立在多年积累和持续投入的基础上。我们一直在不断推进,而且推进的速度很快。但真正看到所有的成果在同一时间汇聚、落地,那种感觉确实非常特别。
我最近这几周在回顾,几乎每天我们都有新东西在发布,这种节奏和氛围真的非常让人振奋。
洛根 今天能走到这个节点,最关键的其实就是那种长线视角,将Gemini真正部署到谷歌各个产品中,模型做到行业最前沿,基础设施也同步搭建完成。
在这种竞争极其激烈的环境里,特别好奇你是怎么保持住那种长期思维的?
桑达尔 我一直会逼自己往那个方向去思考。
你当然会被眼前的节奏牵着走,我们这个行业节奏非常快,大家都想尽快出成果。我其实也很享受这种快节奏。
但与此同时,你也必须具备抽身而看的能力:站在一个更长的时间维度上去判断,哪些方向是值得真正下注的,然后在足够长的时间里持续专注下去。我觉得这件事非常重要。
2016年,我推动公司整体转向AIFirst,背后其实是更早一轮的积累。
比如2012年的Google Brain,那篇著名的关于猫的论文在图像识别上取得了突破;2014年我们收购了DeepMind;2016年初是AlphaG的关键时刻。很多人可能没注意到的是,那年5月我们还发布了第一代TPU。
所以在2016年的那个时间点,我已经非常清楚:我们正站在下一轮平台转移的门口。而我们做出的选择,就是一次“全栈押注”,要把谷歌真正转型成一家以AI为核心驱动的公司。
此后几年,我们不断推动AI技术落地,很多突破其实都出自谷歌,比如transformer。
我们把这些能力集成进产品中,像BERT和MUM用来提升搜索体验,也推出了Google Photos等等。
但当生成式AI的浪潮真正来临,我发现这个窗口比我们原先预计的还要大得多,无论是用户、开发者,整个世界都准备好了要以更大的规模使用这些技术。
那我们该怎么回应?
对我们来说,就是启动Gemini这个项目,由Google Brain和DeepMind跨团队协作推进,同时我们也做出决定,把这些团队整合起来,组建成今天的Google DeepMind。
我们也在基础设施上加大投入:不管是数据中心、TPU还是GPU。接下来,是要推动整个公司的工作节奏同步提速。
有了核心技术之后,GDM团队开始持续推出Gemini各版本,你也参与了很多,很高兴看到我们一起见证了这些里程碑。
再下一步,就是如何把这些技术真正应用到我们的所有产品中,这些产品每天触达的是数十亿用户。
尤其是像搜索这样的核心产品,怎么通过这些模型能力去持续迭代?这就是我们正在推进的这段旅程。
而当你退一步从全局来看,这一切又非常清晰:当我们终于真正建立起一个“全栈能力”体系后,每一层的技术创新,都能够层层传导、最终在用户体验上体现出来。
这也是让我特别兴奋的地方。
2Gemini的同步发布,加速前行
洛根 这也是我给别人讲“预训练”的时候喜欢用的说法。预训练在DeepMind的Gemini模型上效果这么好,然后在这个基础上做的后训练、强化学习,就像是在给模型本身的能力加速一样。而我觉得我们的基础设施故事也是类似的逻辑。
桑达尔 是啊,你一旦把底层基础设施打扎实了,整个模型训练的每一个阶段,无论是预训练、后训练,还是推理环节,都能更高效、更强大。
接下来的问题就是:怎么把这些能力真正变成用户能体验到的产品?比如像Nano Banana这样的能力,怎么落地到具体的产品中?
我们在搜索里上线了生成式界面,比如AI模式,这就是一个体现。你可以在不同层级、不同产品里看到这些模型的能力在被激活。
而且我们不仅自己在用,还把这些能力打包开放给开发者,让他们也能在上面继续创新。
这种从底层能力到产品体验、再到开发生态的层层放大效应,真的能带来乘法式的成果。
这种感觉永远让人热血沸腾。
当然,这种全栈式的转型不是一蹴而就的,很多东西需要时间慢慢搭起来。当我们准备应对这波生成式AI的浪潮时,其实一开始我们是缺算力的。
所以那段时间我们必须下重注,大规模加码数据中心、TPU、GPU,把整个算力的“天花板”抬上去。这个过程的固定成本非常高。
从外面看,你可能会觉得谷歌当时很安静,好像没什么动静、是不是落后了。但其实我们是在一步步把底座搭牢,把一块块积木按对的顺序摆好,然后再在这上面开始真正的发力。
现在我们已经渡过了那个准备期,正式进入执行期。你可以明显感受到,每个团队现在都在加速往前冲。
洛根 确实,现在整个节奏明显快了。
你刚才提到Gemini出现在我们所有的产品里,有一个新挑战,就是如何同步发版:不仅是产品上线的节奏要对得上,背后还涉及到算力分配,甚至要考虑模型在不同产品场景里的表现差异,要怎么调优才能确保体验一致。
以前,除了像Gaia或者Google账号这种基础设施类的系统,我们其实很少有一个东西,能真正贯穿谷歌这么多产品,从云、Waymo、搜索、Gmail,到地图、Docs等等。
而现在,Gemini就像一条主线,把所有东西都连起来了。这种统一性前所未有,有时候甚至让人感觉,它身上真的有种魔力。你是怎么看这种变化的?
桑达尔 你这个观察特别好。
对我来说,Gemini是我们AIFirst战略最清晰、最具体的体现。这个战略我们喊了很多年,以前更像是一个方向感,但现在Gemini是一个你真能看见、摸得着、体验到的东西。
就像你说的,Gemini不只是让搜索变得更好,它也在提升YouTube、Google Cloud、Waymo的体验。这种广泛的影响力,是以前任何一项技术都没做到过的。
我特别喜欢Gemini3的这次发布。
你提到的同步发版,我们在很多自家产品里同时上线,但让我更兴奋的是,你去X上看,会发现像Copilot、Replit、Figma这些公司也在同一时间上线了自己的Gemini应用。
对我来说,这才是真正的规模化创新:不只是我们谷歌在加速,全世界的其他公司也在同一个时间点集体往前冲。
这种同步推进的景象真的非常震撼。
3世界蕴藏的创造力正在被释放
洛根 回到Nano Banana Pro。你肯定自己也花了不少时间在这个模型上玩,对吧?现在大家用得都很疯,这点也说明它确实很强。有个问题想问:我们是不是在提升整个世界的生产力?
桑达尔 我们现在正从好玩阶段慢慢迈进到真正实用阶段。
我刚看到Ben Gerin在X上发了一张信息图,是他做的一个ViiV核心分析。我原本只是随手一看,结果那张图太有吸引力了,反过来让我认真读完了整个分析,想搞清楚他到底说了什么。
很早以前PowerPoint诞生的时候,也曾经带来一波内容爆发期:人们可以做幻灯片了,于是内容越堆越多,越做越复杂。
但现在有了Nano Banana Pro,也许我们能进入下一个阶段,用模型的能力把复杂信息重新压缩和重组,然后以更直观、更易懂的方式呈现出来,真正提升人们的理解力。
洛根 其实我以前一直有点怀疑:很多生成式媒体模型,到底能不能真的给世界带来多大价值?当然,从娱乐角度看肯定是有用的,但总感觉那离生产力工具还有点远。
这次我觉得Nano Banana Pro真正跨过了那条鸿沟:尤其是在信息图上,再叠加和Google搜索做结合的那个方向。
这也在提醒我们:未来还会不断冒出这种新用法。
桑达尔 这背后其实反映了一个更大的事实,就是这个世界上蕴藏着的创造力,远比我们想象中多得多。
现在我们看到一个特别令人兴奋的变化是,大家越来越愿意表达自己。而我们正在做的,就是给他们一套新的工具,让他们能够真正把脑子里想到的东西变成现实。
现在,我们不仅让工具本身更强大、更有表现力,也在尽可能让它们变得更简单、更易用,让更多人都能触达。
看到这种创造力被慢慢释放出来,真的非常震撼。
4如何衡量一个发布是否成功
洛根 像这次Gemini3这样的大规模发布,对谷歌来说算是一个里程碑事件,那你自己衡量“成功”的标准是什么?是看外界的反响?还是第一天的使用数据?又或者,你是怎么看一场发布到底有没有真正帮谷歌往前推了一大步的?
桑达尔 其实在发布当天,我自己是全程在线的,一直在密切关注产品的表现和大家的反馈。
我会看很多渠道的信息。比如,我会上X去观察大家,尤其是普通用户是怎么实际使用我们产品的。我甚至会直接回复一些评论,把有价值的反馈转给团队:“你看,这个点说得对,我们得想办法改进。”
内部也有一整套系统来做这件事。很多团队也在用Gemini来收集和整理反馈。我们有一流的数据看板,所以我会从各种来源去汇总这些信息。
但我还是一个“非得自己感受一下才放心”的人。
我当然会看汇报,但我更喜欢亲自去走一走、看一看,了解大家怎么使用产品、在讨论什么、有哪些真实的反应。
我也会跑到一些核心团队那里,他们的办公室通常有巨大的屏幕,显示着QPS(每秒请求数)、使用趋势、算力负载这些指标……这些细节能给你一种非常真实的现场感,让你知道外面到底发生了什么。
所以我衡量一个发布是否成功,是靠“线上舆情+线下交流+实时数据+用户观察”这样一个综合方式。
特别是发布当天,这种直观的感受对我很有帮助,能很快知道哪块做得好,哪块还需要加强。
洛根 我记得2.5 Pro是在 Google I/O上发布的吧?当时你就能感觉到,那的确是一个非常关键的升级。
桑达尔 没错。我现在觉得最欣慰的一点,是科拉(Cora)和Google DeepMind团队已经跑进了一个非常健康的节奏。我们基本上可以做到每六个月在模型前沿上再推一小步。
当然,这也意味着挑战越来越大。
2.5 Pro本身已经非常强了,要在它的基础上再迈出“有意义的一大步”,难度可想而知。但也正是因为难,这条路才变得格外令人兴奋。
我知道你一直对Flash特别期待(笑),开发者们也是。因为Flash能让我们服务更多用户,它在整个模型家族中会发挥非常大的作用。
我对Gemini3.0 Flash充满信心,说不定它会是我们迄今为止最强的模型。
更重要的是,内部团队已经在着手准备下一代了,我们的预训练团队已经在构思后续的版本。
这种持续创新、持续发布的文化,正是我觉得现在这个阶段特别珍贵的原因。
5内部创业文化的苏醒
洛根 我想分享一个观察,内部也提到过:在Gradient Canopy办公楼里有一个茶水间,现在很多DeepMind的重要讨论都是在那一带发生的。
我们都知道谷歌是一家庞大、全球化的公司,每天都有无数事情在发生。但当你走进那个茶水间时,会突然感觉公司变得很小,很亲密,很像一个创业时期的团队。你怎么看这种氛围?
桑达尔 我特别理解你说的这种感觉。那个地方真的让我想起了早期的谷歌。
我经常去那里,有时候你一进去,就能看到谢尔盖(Sergey Brin)在做咖啡,还有像德米斯(Demis Hassabis)、杰夫(Jeff Dean)、桑贾伊(Sanjay Ghemawat)这些人,也都在用非常严谨的方式做他们的意式浓缩咖啡(笑)。
说真的,如果要用一幅画面来浓缩谷歌的文化,那可能就是那群人在茶水间里做咖啡的样子。
我自己其实挺懂怎么做好一杯意式浓缩咖啡的,但在那样的环境下我都不敢动手,因为会有点紧张。
但你待在那里,会感觉到人才密度非常高,交流也非常密集,很多外地同事飞来拜访,大家的想法不停碰撞。那种氛围真的很像我们创业初期的状态。
像我们的一些服务团队,比如艾玛(Emma)他们就坐在那边。我之前提到会去看 QPS(每秒请求数)变化,其实就是我站在他们的大屏幕旁边,盯着数据看现在到底发生了什么。
所以对我来说,那块地方真的是我最喜欢的角落之一,也很像是这家公司运转方式的一个缩影。
洛根 如果让我给谷歌提个“产品需求”,那就是我们是不是可以把这种模式复刻到所有产品线的办公区里?我不知道该怎么做,但直觉告诉我:这事值得干。
桑达尔 其实现在已经有不少团队自己DIY出了类似的版本了(笑)。而且我觉得,这对让大家愿意回办公室上班帮助很大。
因为当你人真正坐在办公室时,你才能真切感受到这种面对面交流的价值。
当然,大家还是可以在需要专注的时候回家远程工作。但在那之前,有一个短暂但高密度的碰撞时刻,真的非常有意义。
6长期押注,倒推每一步的里程碑
洛根 从现在这个时点往前看,你觉得未来十年我们最应该下注的方向是什么?是基础设施?还是说,因为我们已经非常确定AI是那个核心,所以全部押在它身上?
桑达尔 我觉得,能以十年的时间维度思考问题,本身就很重要。
回头看十年前,我们下注的是AI,而且不是浅尝辄止,而是一次“从上到下的全栈押注”。
我们也在同步推动几项足够大的新业务,让公司的结构更健康、更有韧性,比如说YouTube,比如说云服务。
其实谷歌从诞生开始就是一家Cloud Native的公司,内部很早就用上了最先进的云架构。但当时我们并没有把这一整套能力完整地对外输出,所以后来我们在云上做了一次非常重的下注。
Waymo也是另一个长期押注的例子。这些项目往往需要足够长的时间积累,而现在回过头来看,Waymo正好到了一个关键的转折点。
类似的未来押注我们一直都在做。比如量子计算,我依然相信再过五年,我们会像今天谈论AI一样,兴奋地谈论量子。
所以我平时经常是在这种时间尺度下思考问题。
像我们前两周刚刚宣布的Project SunCatcher,要把数据中心建到太空里。听起来像个“登月计划”,现在也许有点疯狂,但你退一步想想,未来对算力的需求到底有多大?
这个设想很快就会变得合情合理,只是时间问题。
要想在这些超长期项目上真正取得进展,我们的做法是“反向推演”,即从远期目标出发,倒推每一步的里程碑。
比如SunCatcher就被拆成了27个关键节点,然后我们一步一步往前推进。
到2027年,希望我们能真的把TPU送上太空,甚至有机会在轨道上“偶遇”那辆飘着的特斯拉Roadster(笑)。
但这只是一个例子。像AlphaFold、Wing的无人机配送,还有我们正在推进的机器人项目,都是类似的思路。
你只要带着足够长线的视角去看,持续推进,终究会看到成果。
7工具降低门槛之后带来的变化
洛根 你刚才说的那条线我特别有感触,模型能力在不断提升,相当于把“创造的地板”整体抬高了,很多原本不会写代码、不会设计的人,现在都能开始动手做东西了。
你自己平时也在玩vibe coding,对吧?我很好奇你怎么看这个时刻?不只是传统的软件工程师,更多“AI构建者”都能开始动手做事了,这对你来说意味着什么?
桑达尔 这确实是一个特别让人激动的阶段。
它让我想到互联网刚兴起的那段时间。那时候博客突然爆发,结果一夜之间多了无数写作者;后来YouTube也把视频创作的门槛拉低,突然就有了无数新一代内容创作者。
我觉得现在的vibe coding,就像是“编程界的YouTube时刻”。
在谷歌内部你都能看到这种趋势:第一次提交代码变更(CL)的人数明显上升。这就是工具降低门槛之后带来的变化。
以前你可能是做市场的,有个好点子,顶多写个文档描述一下;现在你可以自己用vibe coding搭个原型demo出来,直接给团队看。
你能很明显看到,这种变化每天都在发生。
我前几天还和我们传播团队的一位同事聊天,她本身不会写代码,但为了教儿子西班牙语的动词变位,她就在Gemini3里写了一条提示语,让它生成一个带动画效果的网页。
这种事放在以前简直不可想象。现在我们看到,工具正在把原本被挡在门外的人也带入创造者的行列,这真的很有希望。
我自己平时没那么多时间玩这些东西,但每次用都会有那种“这太好玩了”的感觉。就算不是写vibe code,哪怕只是用新的IDE,编程本身也变得更有趣了。
当然我自己不会去动那些安全性要求极高的大型代码库,这些工作还是得交给专业工程师来做。
但我真切地感受到:门槛真的在下降,代码又重新变得好玩起来。
关键是,这还只是这些工具表现最初级的时候。
我以前常说一句话:你现在看到的,是Waymo有史以来开得最差的一次,它以后只会越来越好。现在我们看到的Gemini、AIStudio、vibe coding,其实也正处在类似的阶段。
所以我才特别期待接下来会发生什么,这真的是一个非常激动人心的时代。
我也很好奇,全世界的人会拿这些工具,做出什么完全想不到的东西来。
洛根 接下来我们可以期待什么?我知道研发管线里肯定还有很多新东西,你现在最兴奋的是什么?
桑达尔 我想说,首先我们都应该好好睡一觉(笑)。这段时间太密集,希望你我包括整个团队,都能稍微缓一缓,调整一下节奏。
从产品角度来说,我最兴奋的当然还是整个Gemini的roadmap。我们不仅模型越来越强,而且它正在真正深入到我们所有核心产品中。
同时我们也在持续推出一些全新的东西。比如我特别喜欢Flow,我最近也一直在玩;还有notebook类产品,它已经吸引了一个非常热情、正在快速成长的用户社区。
我看到有记者用它做采访提纲,有博士生在里面完成整个论文的研究流程。这些应用场景真的很打动我。
所以说,接下来的事情还很多,我对未来的发展非常期待。