正和岛丨一年狂揽12亿融资,清华学霸要造100万台机器人
正和岛
05-09 09:08
嘉 宾:唐文斌 原力灵机CEO
访 谈:孙允广 正和岛内容总监
编 辑:豆汁儿
来 源:正和岛(ID:zhengehdao)新质说
● 技术信仰:从人脸识别到具身智能,跨越AI两个时代,始终相信技术可以改变物理世界。因为相信,所以看见,也因为信仰,所以能够抵达。
● 价值务实:不满足于让机器人跳舞,而是赋予它在真实世界里解决问题的能力。让机器人拥有“大脑”,从替代人类“不想干的活”开始。
● 斜率思维:当前模型第一不重要,重要的是那一阶导。保持极高的迭代效率,让技术飞轮快速旋转,比任何一个静态节点的排名都更具意义。
在王者荣耀里,虞姬是个后期英雄,没有太多复杂和花哨的操作,前期坚定发育,到了后期爆发力极强。唐文斌很喜欢这个角色。而现实中,唐文斌的工位和普通员工在同一个大开间,没有独立办公室——很像他玩虞姬时“去繁就简、直奔本质”的作风。
唐文斌工位他坐在会议室里,面前放着一个印有“Dexmal X” Logo的杯子,这的确容易让人产生联想——马斯克对X的迷恋,SpaceX、xAI、X平台。但他说这不是刻意模仿,“X代表更科技、更多可能性的东西。”这是2026年4月的一个下午,正和岛“新质企业家”栏目走进了原力灵机。从旷视科技到原力灵机,唐文斌的创业轨迹,横跨了中国AI产业的两个时代。14年前,他和印奇、杨沐创办旷视,成为AI 1.0时代的标志性人物;14年后,他带着一群“旷视老将”重新出发,闯入具身智能这片更复杂的战场。这家成立仅一年多的机器人公司,正在试图回答一个所有人都想知道的问题:当大模型撞上物理世界,具身智能的“ChatGPT时刻”,还有多远?
原力灵机
用眼睛看世界
原力灵机
用眼睛看世界2026年的中国机器人赛道,热浪翻涌,群雄扎堆。“仿生蔡明”在春晚舞台上演小品,特斯拉的Optimus隔段时间就释放一次新进展,马斯克说未来人形机器人的数量会超过人类。各大车企、互联网巨头、创业公司纷纷入局,投资人拿着钱找项目,猎头疯狂挖人。而在前几天举办的2026北京亦庄半程马拉松上,人形机器人与人类跑者同场竞技,再次将“机器人何时真正融入现实世界”的讨论推向高潮。据不完全统计,2025年中国机器人领域融资事件超过600起,总金额超过500亿元。在这波热浪中,原力灵机无疑是资本最追逐的标的之一。成立不到一年,三轮融资累计近12亿元——2025年3月天使轮2亿元,A轮蔚来资本领投,A+轮阿里巴巴独家注资数亿元。但唐文斌对这股热潮出奇冷静:“今天大家的水平其实都挺差的。”时间倒回2011年,唐文斌和清华同学印奇、杨沐一起创办旷视科技。那时深度学习还是个学术圈的小众话题,人脸识别的准确率惨不忍睹。他们从一款手机体感游戏起步,误打误撞杀进了金融级身份认证领域,成了支付宝刷脸支付背后的技术供应商。“我们其实先做的是偏技术的东西,然后想这个技术哪里用。”唐文斌回忆,当时iPhone 4刚出前置摄像头,他们觉得可以把Kinect那种体感交互搬到手机上,于是做了一款人脸追踪小游戏。游戏火了,创业的念头也从此落地。公司取名“旷视”——旷,就是大的视觉。“我们认为未来一定会有很多机器人,机器人就像人一样需要眼睛。人的信息输入百分之九十几都靠眼睛,所以我们觉得眼睛是走向机器人的第一步。”从人脸识别到物流机器人,旷视的机器人梦一直在水面下流淌。2018年,他们正式切入物流场景,给仓库做自动化方案。最出名的一仗是优衣库上海仓库——超过1000台不同类型机器人协同作业,单体项目接近3亿元,是当年国内物流自动化领域最大的一单。但也是一场“噩梦”。唐文斌回忆,投标过程像“超女选秀”,所有供应商被一轮轮筛选,大家互相“左脚踩右脚上天”,不断over promise。拿下来之后才发现,实际能力只达到目标的百分之三四十,项目濒临失败。于是他带着团队在仓库里蹲了三个月。推倒代码重来,主动承担赔偿,向客户要了半年时间。项目最后跑通了,效率远超优衣库其他自动化仓库。因为这个项目,他被邀请去日本见了迅销集团社长柳井正。在仓库里与物理世界贴身肉搏的经历,让他比很多人都更早地看清,软件算法与硬件落地之间,存在着巨大鸿沟。
从“看懂世界”到“改变世界”
从“看懂世界”到“改变世界”2025年,唐文斌拉上旷视时期的核心团队成员,创办了原力灵机(Dexmal)。方向很明确:做机器人的“大脑”。
从“旷视”到“原力灵机”,从“大的视觉”到“原生的灵巧”,如果说旷视时代是让机器“看懂世界”,那么原力灵机则想让机器“改变世界”。而这个改变的前提,是为机器造一个真正能思考、会判断的“大脑”。为什么大脑如此重要?“你看今天的机器人,运动控制已经做得很好了,跳舞跳得比人都帅。但它没有在操作这个世界,没有在改变这个世界。”唐文斌一语道破。机器人行业内一个心照不宣的共识是,硬件本体的进化速度远快于智能水平的进化。即便是以运动控制闻名的宇树科技,也在IPO时明确表示,募资的近一半的资金——约20.22亿元,就是要用来攻克机器人的“大脑”问题。“你让它去炒个菜,成功率能有多少?切个水果呢?”在唐文斌看来,现在机器人“智商的缺失”,使得它面对真实世界的复杂任务时,几乎寸步难行。硬件已经备好,但缺少一个能指挥它的“司令部”。这个“大脑”到底难在哪儿?他一一列出。首先,模型本身该长什么样,架构怎么设计,业界还没形成共识。其次,给机器人“喂”什么数据去学习,是纯机器人数据还是加上人类数据,也没定论。再者,训练方法是什么,流程怎么搭,没人清楚。并且,即使有了一个六七十分的模型,怎么让它在干活儿的过程中自己发现错误、收集数据,再通过一个“数据飞轮”越转越快,变成八九十分?这条链条上的每一环,现在都是问题。此前在旷视做计算机视觉(CV),面对的是一个相对确定的数字游戏,评测指标清晰,数据集固定。但机器人是一个与物理世界充分交互的闭环系统。“任务没成功,天知道中间发生了什么。”原力灵机联合创始人范浩强感慨。所以唐文斌的思考并没有停留在做模型这一层,他有很务实的商业推演逻辑,然后给团队定了一个选择应用场景的标准:
第一不重要,重要的是“迭代的斜率”
从“旷视”到“原力灵机”,从“大的视觉”到“原生的灵巧”,如果说旷视时代是让机器“看懂世界”,那么原力灵机则想让机器“改变世界”。而这个改变的前提,是为机器造一个真正能思考、会判断的“大脑”。为什么大脑如此重要?“你看今天的机器人,运动控制已经做得很好了,跳舞跳得比人都帅。但它没有在操作这个世界,没有在改变这个世界。”唐文斌一语道破。机器人行业内一个心照不宣的共识是,硬件本体的进化速度远快于智能水平的进化。即便是以运动控制闻名的宇树科技,也在IPO时明确表示,募资的近一半的资金——约20.22亿元,就是要用来攻克机器人的“大脑”问题。“你让它去炒个菜,成功率能有多少?切个水果呢?”在唐文斌看来,现在机器人“智商的缺失”,使得它面对真实世界的复杂任务时,几乎寸步难行。硬件已经备好,但缺少一个能指挥它的“司令部”。这个“大脑”到底难在哪儿?他一一列出。首先,模型本身该长什么样,架构怎么设计,业界还没形成共识。其次,给机器人“喂”什么数据去学习,是纯机器人数据还是加上人类数据,也没定论。再者,训练方法是什么,流程怎么搭,没人清楚。并且,即使有了一个六七十分的模型,怎么让它在干活儿的过程中自己发现错误、收集数据,再通过一个“数据飞轮”越转越快,变成八九十分?这条链条上的每一环,现在都是问题。此前在旷视做计算机视觉(CV),面对的是一个相对确定的数字游戏,评测指标清晰,数据集固定。但机器人是一个与物理世界充分交互的闭环系统。“任务没成功,天知道中间发生了什么。”原力灵机联合创始人范浩强感慨。所以唐文斌的思考并没有停留在做模型这一层,他有很务实的商业推演逻辑,然后给团队定了一个选择应用场景的标准:第一,错误容忍度高的场景。现在做不到百分百成功,场景本身要有兜底机制;
第二,节拍容忍度高。不能要求机器人像自动化设备一样精准卡点,要允许它节奏有快慢;
第三,泛化性的作业需求。任务不能太单一,否则非标自动化就能解决,用不上通用机器人;
第四,长时间作业。让机器人持续工作,才能把价值卷出来,覆盖掉成本。
按照这个标准反推,他认为家庭场景现在还不成熟。“你买个人形机器人回家,挺贵的,能干的活还很少。而且用户的容忍度极低,1%的概率把碗摔了,你收拾都不知道谁去收拾。”相比之下,仓储物流、工业制造等B端场景,才是现阶段验证技术、积累数据、打磨迭代能力的真实场景。“需求就在那里”他说,“阿姨干的活能不能让机器人干,大街上扫地能不能让机器人好好扫,我们不是在创造需求,我们是在创造解决方案。”而创造解决方案的第一步,是先回答一个更底层的问题:这个“大脑”,到底该怎么造?
第一不重要,重要的是“迭代的斜率”2026年2月,原力灵机发布了第一个具身原生大模型DM0(DexModel 0)。在真实机器人操作的开源评测平台RoboChallenge上,DM0的成绩拿下双项世界第一。但唐文斌认为“这个第一也没那么重要”。他关心的不是当前这个点的数值f(x),而是曲线的导数。他把公司内部的文化总结为两个词:技术信仰,价值务实。而支撑这两个词落地的,是他笃信的一个更本质的竞争力——迭代的效率。“我们要的不是今天f(x)的值,我们要的是那个一阶导。”唐文斌说,创业公司和大厂竞争,拼的不是存量,是谁迭代得更快。“idea是廉价的。大家都很聪明,你知道的东西,三个月后别人也知道了。别人知道的东西,我们大概三个月后也知道了。所以真正重要的是迭代的斜率。”为了保持这个高斜率,技术路线的选择就变得至关重要。现在业内做VLA(视觉-语言-动作)模型的主流做法,是在一个现成的多模态大模型(VLM)上“嫁接”一个动作模块。这个VLM,通常是用海量互联网图文视频数据训练出来的开源模型。唐文斌打了个比方:这就像一个九年制义务教育的初中生,刚上完初中就被拉去体校狂练体育。后果有两个:一是“根骨不扎实”,因为它从没见过物理世界的数据,相当于“没有从小练体育”,体能上限不高。二是“光练体育不练文化课”,原来在互联网数据上积累的理解能力,在专攻体育三年后,也退化得差不多了。原力灵机的思路截然不同。他们要搞“原生”训练:从模型训练的第一天起,就让它同时接触互联网多模态数据和物理世界数据——视频、机器人操作数据、导航数据、力触觉数据——并且把“理解世界、操作世界、预测世界”三个目标联合训练。“我们希望打造一个德智体美劳更全面发展的模型。”这其中有一个更深层的技术分野:为什么不直接买一个现成的“世界模型”,然后在上面训练机器人?这听起来更直接。唐文斌的解释是,逻辑不对。“世界模型比机器人的操作模型要复杂得多。如果说我们都能够非常好地去模拟这个世界,那它里面几乎已经蕴含了世界的所有知识。你想,先解决一个更难的问题,然后你就能解决那个简单的问题了?”也就是说,这相当于为了教机器人拧螺丝,先去把整个工厂的物理法则都复刻一遍,代价太大,也不现实。原力灵机的做法很巧妙:他们也有一个世界模型,但它不是被当作一个完美的“模拟器”来直接驱动决策,而是在训练过程中,被当成一个“陪练”和“强化监督信号”。 简单说,就是在训练机器人操作能力时,让它在那个“虽不完美但够用”的世界模型里先“演练”一遍,用这个虚拟结果作为反馈,持续修正操作模型。但在机器人真正干活时,并不需要一边预测世界一边行动,只需要跑那一小部分执行模块,干脆利落。这套技术路线,没有追逐“世界模型”的风口,而是基于他们对问题本质的判断:先让机器人能干活,同时在训练中引入对世界的理解作为辅助。
图源:原力灵机团队将这个过程戏称为“炼丹”。这个词不是现在才有的,早在2012、2013年在旷视训练深度学习模型时,大家就开始说了。“你不知道最后炖出来是什么效果,东西先丢进去,但炼丹也是个手艺活。”十几年过去,这个词从一个内部玩笑变成了技术人的自嘲。原力灵机的代码库里,有一个项目名字就叫“铁锅炖”,联合创始人汪天才他们起的。唐文斌第一次看到TGD这个缩写时问是什么意思,答曰:铁锅炖。他觉得挺逗,就保留了。而这种扁平化、略带极客幽默感的氛围,是唐文斌刻意维持的。
务实的理想主义者
图源:原力灵机团队将这个过程戏称为“炼丹”。这个词不是现在才有的,早在2012、2013年在旷视训练深度学习模型时,大家就开始说了。“你不知道最后炖出来是什么效果,东西先丢进去,但炼丹也是个手艺活。”十几年过去,这个词从一个内部玩笑变成了技术人的自嘲。原力灵机的代码库里,有一个项目名字就叫“铁锅炖”,联合创始人汪天才他们起的。唐文斌第一次看到TGD这个缩写时问是什么意思,答曰:铁锅炖。他觉得挺逗,就保留了。而这种扁平化、略带极客幽默感的氛围,是唐文斌刻意维持的。
务实的理想主义者在金隅智造工场的两层楼里,唐文斌没有独立办公室,工位和普通员工在一起。联合创始人也是同样待遇,散落在团队中间,像没有特殊标记的NPC。如果你想找他们,直接走过去就好。整个办公区通透而简单,一如他们的沟通方式。而如果仔细看会议室的标牌,会发现它们各有来头:Flow来自《心灵奇旅》,Matrix是《黑客帝国》,Red Queen是《爱丽丝梦游仙境》里那个叫嚷着“砍掉他们的脑袋”的红桃皇后,Jarvis是钢铁侠的AI管家。
原力灵机办公区
原力灵机办公区在经历了行业起伏、从巅峰到低谷的完整周期后,再次出发的唐文斌和他身边的“新三剑客”——范浩强、周而进、汪天才——选择了一条更安静、也更tough的路。核心团队颇为年轻:唐文斌1987年出生,范浩强1994年,周而进1992年,汪天才1994年。汪天才的名字的确名副其实——他曾在某一年入选过全球前2%科学家榜单。这四个人都是旷视的老员工,一起经历过从计算机视觉到具身智能的范式转移。他们为什么愿意再次聚到唐文斌身边?联合创始人范浩强最直观的感受是“太拼了”。他说唐文斌可能是公司里工作时长最长的人,没有之一。“各个大大小小、内内外外的事情都能一把挑起来,并且哪怕非常忙,依然在做每件事的时候还能倾注百分百的热情。”他觉得,是唐文斌对机器人这件事心里有足够强的信念,所以才能驱动自己像个“铁人”一样。周而进用的词是“真诚且务实”。共事多年,他认为唐文斌的风格是实事求是,事情是怎样就怎样,该怎么解决就怎么解决。“大家也不是第一次创业,都知道创业过程中要经历哪些坎,哪些东西该扎实完成,哪些东西该给客户创造价值。文斌在这些事情上非常务实。”汪天才则认为唐文斌是“开放且务实”的。他解释说,开放在于“什么都可以聊”,员工的意见和看法都能直接提,唐文斌会从不同视角去吸收和讨论。而务实的一体两面则体现在赛道选择上,“不是一个纯讲故事的心态。投资人想听什么就讲什么,他不搞花里胡哨那一套。”这群人聚在一起的底层原因,范浩强用了一个词总结:信仰。在采访中,团队反复提到这个词。“2020年,那个时候讲端到端是很困难的,不管是研发层面还是让别人相信。我们被拒绝了很多次,paper被拒,方案被质疑。但你内心不信,你是无法坚持的。”汪天才把这种逻辑迁移到了机器人上:“从数字世界到物理世界,从开环走向闭环。自驾并不会直接改变物理世界,除非发生车祸。但具身智能时时刻刻都在与物理世界交互,导航也好,操作也好,闭环程度远超自驾。”范浩强把团队的凝聚力,归为一个很纯粹的理由:“一群有情有义的人,去干一件有意义的事情。”他说,强的同学都更喜欢跟强的同学合作,而具身智能这件事本身就足够有挑战性,也足够让人兴奋。一个人能让一群比他只年轻几岁的天才心甘情愿地跟随,没有靠职位、画饼,靠的是他们说的这些——拼、真诚、开放。还有最重要的:他自己的信念。唐文斌给自己的定义是:一个务实的理想主义者。“我自己是个比较简单的人,不太能讲很多我不信的话,”他说,“团队内部也崇尚一种简单直接的沟通文化,这其实是一帮技术同学想要追求的环境。”
100万台机器人
100万台机器人打开原力灵机官网,很显眼的一行字跳了出来:Build Intelligent, Useful, and Trustworthy Robots for A Better Life(打造智能的、有用的、可信赖的机器人,让生活更美好)。三个形容词,对应三个维度:智能,是大脑能力;有用,是生产力价值;可信赖,是安全性和可靠性。对于未来,唐文斌的目标明确:十年内,至少打造一个县城级别的生产能力。他的老家在浙江新昌,40万人口。“假设三个机器人能产生一个人的生产力,我们希望至少打造100万台机器人在持续被使用的状态。”他特意强调,“不是卖出去100万台,是100万台真正在被使用。”卖出去和用起来,就像demo和产品,是两回事。唐文斌了解这之间的距离。他经历过旷视从实验室到产业的完整周期,知道一个技术从“能work”到“能用”再到“好用”之间,存在很多次推倒重来。公司名字Dexmal,Dex来自Dexterity(灵巧),mal来自Animal(生物),他希望机器人能像生物一样灵巧和多形态。会议室Baymax的名字,取自电影《超能陆战队》里的大白——一个充气机器人,笨拙、柔软、可靠、温暖。电影主题曲里有句歌词:我将忠诚守护,你那炽热的梦想。
Baymax会议室
Baymax会议室这大概就是这群人想做的东西:打造智能的、有用的、可信赖的机器人,让它们真正关心人类的生活,解决那些繁琐的、危险的、人类不想做的事情。让人类进入一个生产力极大富足的时代,去探索更广阔的星辰大海。当被问到机器人融入现实世界,是否预示着终结者时代的来临时,唐文斌笑了:有可能。然后他补充说:“整个技术发展的斜率越来越陡。我们身处局中,但它的发展依然超出我们的预期。这是一个非常令人兴奋的时代,我们很感谢能生在这样一个时代。”窗外,北京的春天正在发生。会议室Red Queen隔壁,程序员们对着屏幕敲代码。DM0的下一个版本即将发布,评测榜单上的排名会被再次刷新。
原力灵机办公区
原力灵机办公区唐文斌的工位铭牌,名字下边只有一行字:twb@dexmal.com。没有title,没有成就。和他在公司里的工位一样,不需要任何额外的标注。Flow——一个会议室的名字,也是一个概念:流动,变化,持续向前。这大概就是他们相信的东西。不是你现在在哪里,而是你在向哪里流动,以及,有多快。原力灵机北京的金隅智造工场外,几个背着双肩包的年轻工程师,骑着自行车,呼啸而过。也许在未来的某一天,这条路上会有一个机器人正在清扫街道,或是驾驶着一辆货车驶过……那时的它,会如何看待眼前的世界?是计算路面的摩擦力,评估风阻对能耗的影响,还是像人类一样感受一阵风穿过树叶的轻柔?阳光之下,是真实、复杂、亟待被新技术改变的物理世界。而屋内这群人正在做的,或许可以被看作是一种漫长而耐心的翻译工作——将人类关于智慧与行动的朦胧想象,翻译成一行行能被机器读取并执行的代码。他们不知道自己最终会翻译出什么。就像当年的“炼丹”,东西丢进去,不知出来的是什么,但有人愿意一直守在炉子旁边。也没有人知道,当这些代码最终苏醒,理解杯子不只是像素和力矩的组合,而是某种可以被递出的善意时——它会如何描述这个春天?或许它什么都不会说。只是安静地,把一杯水端稳。
(绿岛邻事业部北京区域经理赵珊珊对此文亦有贡献)
(作者已授权大众新闻客户端共享内容,如转载请经原作者授权)

特别声明:本产品由大众新媒体大平台“大众V-IP号”号主上传发布,不代表平台观点和立场。
