从街道上看,我找到Physical Intelligence在旧金山总部的唯一标识就是门上一个颜色略有不同的π符号。当我走进去时,立即被眼前的活动所震撼。这里没有接待台,没有荧光灯照亮的闪亮标识。
室内是一个巨大的混凝土盒子,散落着一些长条形的金色木桌,让空间显得不那么严肃。有些桌子显然是用来吃午餐的,上面散落着女童军饼干盒、Vegemite酱罐(这里有澳大利亚人),以及装满调料的小铁丝篮。其他桌子则完全是另一番景象。更多的桌子上堆满了显示器、机器人备用零件、缠绕的黑色电线,以及处于各种状态的完整机械臂,它们正在尝试掌握一些平凡的任务。
在我参观期间,一只机械臂正在叠一条黑色裤子,或者说在尝试叠。效果并不好。另一只机械臂正在试图把衬衫翻过来,那种坚定不移的样子表明它最终会成功,只是今天不行。第三只机械臂似乎找到了自己的使命,它正在快速削一根西葫芦,然后应该把削下的皮放入另一个容器中。至少削皮这部分进展顺利。
把它想象成机器人版的ChatGPT,谢尔盖·莱文(Sergey Levine)告诉我,一边指向房间里正在展开的机械化芭蕾。莱文是加州大学伯克利分校的副教授,也是Physical Intelligence的联合创始人之一,他戴着眼镜,态度和蔼,像是那种花了大量时间向不能立即理解的人解释复杂概念的人。
他解释说,我看到的是一个连续循环的测试阶段:数据在这里和其他地点的机器人工作站收集——仓库、家庭,团队能够建立工作站的任何地方——这些数据训练通用机器人基础模型。当研究人员训练新模型时,它会回到这样的工作站进行评估。叠裤子的是某人的实验。翻衬衫的也是。削西葫芦的可能在测试模型是否能够在不同蔬菜间泛化,学会削皮的基本动作,足以处理它从未遇到过的苹果或土豆。
该公司还在这栋建筑和其他地方运营一个测试厨房,使用现成的硬件让机器人接触不同的环境和挑战。附近有一台精密的咖啡机,我原以为是给员工用的,直到莱文澄清说不,它是给机器人学习用的。任何打泡的拿铁都是数据,而不是给现场数十名工程师的福利,这些工程师大多在盯着电脑或围着他们的机械化实验。
硬件本身故意不华丽。这些机械臂售价约3500美元,莱文说这还包括供应商巨大的加价。如果他们在内部制造,材料成本会降到1000美元以下。他说,几年前,机器人专家会对这些东西能做任何事情感到震惊。但这正是重点——好的智能可以弥补差的硬件。
当莱文告辞时,拉奇·格鲁姆(Lachy Groom)走向我,他在空间中移动时显示出同时处理六件事情的目标感。31岁的格鲁姆仍然有着硅谷天才少年那种年轻的面孔,这个称号他很早就获得了,13岁时在澳大利亚老家创办第一家公司,9个月后就卖掉了(这解释了Vegemite的存在)。
当我之前第一次接近他时,他正在欢迎一小群穿着运动衫的访客进入建筑,对我请求与他交谈的回应是立即的:绝对不行,我有会议要开。现在他有10分钟,也许。
格鲁姆在开始关注莱文和切尔西·芬(Chelsea Finn)实验室的学术工作时找到了他要寻找的东西。芬是莱文之前在伯克利的博士生,现在在斯坦福运营自己专注于机器人学习的实验室。在机器人技术领域的所有有趣进展中,都能看到他们的名字。当他听到他们可能要创办什么的传言时,他找到了卡罗尔·豪斯曼(Karol Hausman),一位谷歌DeepMind研究员,也在斯坦福任教,格鲁姆了解到他参与其中。这就是那种会议,你走出来时会想,就是这个了。
格鲁姆告诉我,他从未打算成为全职投资者,尽管考虑到他的业绩记录,有些人可能会想为什么不。离开Stripe(他是早期员工)后,他花了大约五年时间做天使投资人,对Figma、Notion、Ramp和Lattice等公司进行早期投注,同时寻找合适的公司来创办或加入。他的第一个机器人投资是Standard Bots,投资时间是2021年,这让他重新接触了一个他小时候搭建Lego Mindstorms时就喜爱的领域。正如他开玩笑说的,他作为投资者时度假要多得多。但投资只是保持活跃和认识人的一种方式,不是最终目标。我在Stripe后找了五年要创办的公司,他说。好想法在好时机遇到好团队——这极其罕见。这都关乎执行,但你可以在一个坏想法上拼命执行,它仍然是个坏想法。
这家成立两年的公司现在已经筹集了超过10亿美元,当我询问资金跑道时,他很快澄清说实际上并不怎么烧钱。大部分支出用于计算。片刻后,他承认在合适的条件下,与合适的合作伙伴,他会筹集更多资金。我们能真正投入使用的资金没有限制,他说。总是有更多计算资源可以投入到问题中。
让这种安排特别不寻常的是格鲁姆不给支持者的东西:将Physical Intelligence转化为盈利企业的时间表。我不给投资者关于商业化的答案,他谈到包括Khosla Ventures、红杉资本和Thrive Capital在内的支持者时说,这些投资者对公司的估值为56亿美元。这有点奇怪,人们能容忍这一点。但他们确实容忍了,虽然他们可能不会一直容忍,这就是为什么公司现在有充足资金是明智之举。
如果不是商业化,那策略是什么?另一位联合创始人阮权(Quan Vuong)来自谷歌DeepMind,他解释说策略围绕跨实体学习和多样化数据源。如果有人明天构建了新的硬件平台,他们不需要从头开始数据收集——他们可以转移模型已有的所有知识。为新机器人平台,无论那个平台是什么,加载自主性的边际成本要低得多,他说。
该公司已经与不同垂直领域的少数公司合作——物流、杂货、街对面的巧克力制造商——测试他们的系统是否足够好用于真实世界的自动化。阮权声称在某些情况下,他们已经足够好了。凭借任何平台,任何任务的方法,成功的表面积足够大,可以开始勾选今天准备自动化的任务。
Physical Intelligence在追求这一愿景方面并不孤单。构建通用机器人智能的竞赛正在升温——这是可以构建更专业化应用的基础,就像三年前吸引世界的大语言模型一样。总部位于匹兹堡的Skild AI成立于2023年,刚刚在本月筹集了14亿美元,估值140亿美元,采取了明显不同的方法。虽然Physical Intelligence仍专注于纯研究,Skild AI已经商业化部署了其全身型Skild Brain,称其去年短短几个月内在安全、仓储和制造领域产生了3000万美元的收入。
Skild甚至在博客上公开抨击竞争对手,声称大多数机器人基础模型只是伪装的视觉语言模型,缺乏线;,因为它们过度依赖互联网规模的预训练,而不是基于物理的仿真和真实机器人数据。
这是一个相当尖锐的哲学分歧。Skild AI押注商业部署创造了一个数据飞轮,随着每个真实世界用例改进模型。Physical Intelligence押注抵制近期商业化的诱惑将使其能够产生卓越的通用智能。谁更正确需要数年时间才能解决。
与此同时,Physical Intelligence以格鲁姆所描述的不寻常清晰度运营。这是一家如此纯粹的公司。研究人员有需求,我们就去收集数据来支持那个需求——或者新硬件或其他任何东西——然后我们就去做。这不是外部驱动的。公司有一个5到10年的路线图,说明团队认为什么是可能的。到第18个月,他说他们已经突破了它。
公司有约80名员工,计划增长,尽管格鲁姆希望尽可能慢地增长。他说最具挑战性的是硬件。硬件真的很难。我们所做的一切都比软件公司难得多。硬件会坏。它到达得很慢,延误测试。安全考虑使一切变得复杂。
当格鲁姆跳起来赶下一个约会时,我继续看着机器人练习。裤子仍然没有完全叠好。衬衫仍然顽固地保持正面朝外。西葫芦削皮堆得很好。
有明显的问题,包括我自己的,关于是否真的有人想要一个机器人在他们的厨房里削蔬菜,关于安全性,关于狗对家中机械入侵者发疯,关于在这里投入的所有时间和金钱是否解决了足够大的问题或创造了新问题。与此同时,外界质疑公司的进展,其愿景是否可实现,以及押注通用智能而不是特定应用是否有意义。
如果格鲁姆有任何疑虑,他也没有表现出来。他正在与在这个问题上工作了几十年并且相信时机终于对了的人合作,这就是他需要知道的一切。
此外,硅谷自行业开始以来一直在支持像格鲁姆这样的人并给他们很多自由度,知道即使没有明确的商业化路径,即使没有时间表,即使对到达那里时市场会是什么样子没有确定性,他们也很有可能找到解决办法。这并不总是成功。但当它成功时,往往能证明很多次失败是值得的。
A:Physical Intelligence是一家开发通用机器人智能的公司,专注于创建能够让机器人执行各种任务的基础模型,类似于机器人版的ChatGPT。他们的目标是构建能够在不同硬件平台上工作的通用机器人大脑。
A:主要差异在于商业化策略。Physical Intelligence专注于纯研究,不急于商业化,而Skild AI已经开始商业部署,声称在短期内产生了3000万美元收入。这代表了两种不同的发展哲学。
A:公司已筹集超过10亿美元资金,估值56亿美元,投资者包括Khosla Ventures、红杉资本等知名机构。公司大部分支出用于计算资源,创始人表示在合适条件下愿意筹集更多资金。