对话原力灵机周而进:具身智能最大的误区,是总想走捷径

编者按:在具身智能的浪潮中,总有人站在潮头,定义流向。星河频率推出全新访谈系列《浪潮之上》。
聚焦具身智能行业内的关键人物,分享从技术拐点到商业抉择,从产品落地到产业远望。我们不谈空泛的趋势,只记录那些真正推动浪潮的思考、判断与行动。
不追热点,只抓浪尖,让更多人先听见,具身智能的下一个频率。
往期文章:
太阳底下没有新鲜事,最终把一件事做成,所有脏活、累活、难活、简单活都得干过。
这是原力灵机的联创周而进在采访中反复强调的信念,也是原力灵机最真实的创业注脚。
事实上,具身智能的世界从来不缺天才。
当一群智商顶尖的人涌入同一个赛道,年轻的天才甚至成了一个行业准入门槛。
那如果是一群天才少年攒局一起创业,会产生什么样的化学反应?
原力灵机的回答是,用最短时间,跑出行业领先的技术与落地节奏。
这次我们对话的对象,原力灵机的联创周而进,他的履历确实足够亮眼:初三保送清华、IOI信息学竞赛金牌、大二拿下ICCV冠军。
但在三个小时的采访里,他几乎没有主动提起这些。
相反,当聊起技术、聊起物理世界、聊起模型该往何处去时,他的眼睛里有一种藏不住的亮光。
我问他,你之前在采访里说自己是一个纯粹的人,现在还算吗?
他先是愣了一下,表示并不记得有这样的发言。
但答案其实不重要。
整场对话里,他提到了不下十次要从本质来看。这不是口头禅,是他在面对行业噪音时真实的本能反应。
他仍然是一个纯粹的人,那是一种被兴趣和实干打底、不计较短期回报的纯粹。
这种纯粹贯穿了他从旷视到原力灵机的每一次选择。
因为对物理世界更感兴趣,他没有去自动驾驶或大模型的热门领域,而是一头扎进了尚在混沌期的具身智能,还挑了一条最难走的路,做软硬一体的通用机器人。
在外界还在激烈争论家庭还是工厂、大脑还是小脑、端到端还是分层时,周而进只关心一件事:机器人的基础动作什么时候能被大规模做对、做稳。
因为这决定了所有宏大叙事落地的可能性。
当我们回顾天才叙事时,常常会忽略所有重大的突破,靠的从来不只是天才们想飞多高,更是他们决定站多久、走多深。
在今天的具身智能行业,太多人急于证明自己。
但原力灵机在做另一件事:先把机器人最基础的动作,一个一个做对。这件事听上去不性感,甚至有点笨。
但所有真正改变世界的技术,往往都要先经历这样一个阶段,有人愿意长期待在那些没人想反复碰的脏活、累活里。
我们与周而进进行了一场深度对话,尝试拆解这位务实主义者的技术信仰与商业拼图。对话分为七个部分:
天才的底色:兴趣、纯粹与系统作战
旷视十年:FaceID、深度学习与算法量产
原力灵机一年:定目标、抗压力、赶进度
2026 年落地:三个场景与 1000 台目标
技术信仰:原生、泛化、通用基模
数据选择:所有数采都在做妥协
直面竞争:蒸馏噪音才能快速向前
以下为对话实录,经星河频率不改变原意编辑整理:
天才的底色:兴趣、纯粹与系统作战
星河频率:初三就能保送清华,拿下 IOI 竞赛金牌,天才少年的光环一直围绕着你。那个阶段的你,最核心的能力是什么?
周而进:对事物保持高度兴趣。我很喜欢把一件事情建模、分析,预测它未来会怎么发展,甚至在某种程度上还能找到背后的规律去控制它。
星河频率:听起来有点像一个机器人的设计。
周而进:有点像,但当时我还没接触机器人,我的关注更多在于把现实中的事情变成一个可建模、可分析的事情。理解本身就能带给我很大的乐趣。
星河频率:你在清华大二就拿下 ICCV 冠军,当时为什么会选择这个方向?是感兴趣还是偶然?
周而进:完全是偶然,最早文斌(旷视、原力灵机联创)拉我去旷视实习,当时他们在做游戏,我并不感兴趣。
后来旷视转向做 AI + 计算机视觉,我觉得图像研究很有意思就加入了。机缘巧合下我领了人脸方向,做了一个月去打比赛就拿了冠军,后来就沿着人脸识别一路做下去。
星河频率:当时是处在什么学术或者技术背景呢?
周而进:那时候旷视很年轻,基本都是年轻人,我也就没什么思想包袱,当时正好深度学习刚兴起,我们就拿深度学习去试各种传统计算机视觉任务。

星河频率:在 AI 圈这么久,有没有自己比较欣赏的科学家?
周而进:我很敬佩 Hinton(AI 教父)。做研究很多时候都有波峰波谷,他不追逐热点,坚持自己相信的东西,并且跨越了很长的研究周期。
我一直觉得,好的研究工作很多时候不是靠数量堆出来的,而是靠质量。
以前孙剑(旷视首席科学家)经常跟我们说,一个学者不用比每年发多少论文,拉长时间线,能留下一两篇让人深刻记住的工作,就是成功。
星河频率:那你觉得自己达到阶段性成功了吗?
周而进:我觉得没达到,个人要求不一样。
我在人脸识别这块做了不少有意义的工作,我们也是国内最早把人脸识别做到支付级安全水准,还大范围落地各类实际场景,这件事我特别骄傲。
但人得往后看,不能停在过去,机器人就是一个新挑战。
旷视十年:FaceID、深度学习与算法量产
星河频率:在外界看来,你在旷视最让人印象深刻的产品是 FaceID,从实习生到产品规模化商业化的负责人,FaceID 的成功对你个人有什么影响?
周而进:现在想起来都挺魔幻的,最大的影响是让大家真正相信深度学习。十几年前很多人并不信深度学习能通用,FaceID 成功后,无论是旷视还是行业都坚定走深度学习路线。
对我个人来说,是从单打独斗做单点技术,变成带着团队系统化思考:数据怎么弄、训练怎么做、模型怎么训、怎么部署到 SDK、工程怎么优化。
越往后越发现,技术比拼的是整个系统的战斗力,不是单点能力。
星河频率:从个人建设者变成团队负责人,这个转变对你自身有什么影响?
周而进:角色转换还好,旷视氛围很简单,大家都聚焦把事情搞定。要做成事就要带不同团队配合,应用科学方向很难靠单打独斗完成。
星河频率:所以你是一个结果导向的人吗?
周而进:非常结果导向。带团队本质就是定清目标、匹配每个人能力与发展、对齐个人与团队目标,剩下就是资源问题。

星河频率:为什么最后会选择离开旷视,开始具身智能创业?
周而进:从我的视角看,很多事是连续变化的。
在旷视的时候,到 2019 年左右人脸这一块能做的我基本都干完了。随着业务扩大,当时包括旷视在内的 AI 四小龙都碰到了商业化不闭环、项目亏钱、成本高的困境。
除了人脸和自动驾驶,很少有高溢价单点算法能卖遍各行各业,每个行业都有大量长尾定制化算法。
所以 2019 年之后我在旷视做第二件事,算法量产,用一套标准化工程基建把视觉算法规范化,把成本拉到与海康、大华同水平。
但其实早在 2016-2018 年旷视就想做机器人,但是条件不成熟,只能先做视觉,大模型兴起后我觉得时机到了。
星河频率:旷视出来的人,也有一部分去了千里科技和阶跃星辰,你为什么没去另外两家?
周而进:我更热爱操作物理世界、改变物理世界。
机器人的灵活性、交互广度,最接近我们最初想做的方向,这一波技术节点也刚好成熟。
星河频率:但千里科技做的智驾也是要跟真实世界交互,为什么没选智驾?
周而进:这类交互本身就很受限,无人驾驶说到底就是为了顺畅行车,技术主打做好导航,尽量少和现实环境产生额外交互。
星河频率:从旷视到现在创业,哪些经验可以直接迁移复用?
周而进:非常多。从十几年前做深度学习到现在,技术是一脉相承的,外界喜欢分 AI1.0、AI2.0 时代,但我们看都是平滑渐变的。
我们对传感器、视觉、嵌入式、芯片、数据驱动的认知,都是这么多年攒下来的。
更重要的是,我们知道 AI 落地要做无数脏活累活,像是产线对接、异常处理、兜底策略、代码兼容、组织执行、项目坑点……这些十年落地经验全部能复用。
原力灵机一年:定目标、抗压力、赶进度
星河频率:创业一年多,有没有哪个阶段觉得特别难、和想象完全不一样?
周而进:创业一直不简单,我们有心理预期,市场不受控、竞争激烈、算力紧张、研发会延期,每一步都不容易。
星河频率:有没有哪个时刻压力特别大?
周而进:今年 2 月 DM0 发布之前,我们高强度工作了很久,因为要把一年的技术尝试整合进一个模型。
毕竟机器人不像大模型可以蒸馏,没有参考,大家水平都不高、动作晃晃悠悠,完全靠自己摸索路径。
星河频率:你是技术悲观还是乐观的人?
周而进:我是短期务实、长期乐观的人。
时代一直在不断加速前行,从前时间流转平缓,工业革命后发展节奏加快,信息时代效率翻倍,如今大模型更是大幅提升信息提炼效率。
从长期来看,人类整个社会变化的加速度越来越快。但短期,你得参与进去,不能当空想主义者。
星河频率:如果要你用个词形容这一年创业的状态或成长,你会用什么词?
周而进:速度。这一年不管是我们模型迭代还是行业节奏,都在高速往前跑。
在正确的路上面,一定会越滚越快,但大前提是你的方向得对。
星河频率:你们现在团队是怎么分工的?
周而进:我、范浩强、汪天才都专注算法。机器人是个非常复杂的系统,不是靠一个单点算法就能搞定的,我们三个负责系统内不同模块。
文斌更多负责客户和投融资,硬件也有专门的负责人。

星河频率:现在行业内有人先做硬件,有人软硬一体,你们则是先做算法再做硬件。你怎么看待这种路径差异?
周而进:三条路都没有捷径,你的创始团队擅长什么,自然就从哪里开始,关键是终点你想要什么。
如果目标是要做一个通用的机器人,只靠单点肯定不够。我们从算法起步,但很快就把硬件团队补齐了。
机器人里太多问题没定型,比如触觉,必须是软件算法和硬件传感器扣在一起迭代,硬件和算法就像左脚踩右脚,缺一不可,得一起往上走。
星河频率:有人说软硬一体公司中期没爆款会很尴尬,纯软件、纯硬件反而更灵活,你认同吗?
周而进:这是现实观点,但我不这么看。我们选择做具身,目标是通用机器人,这是登月级目标。
中短期的商业化都是为了活下去,但目标决定长跑方向。软硬一体是奔着通用去的,过早做垂直专用会降格目标。
星河频率:你怎么定义通用?大部分人类都是专才,但 AGI 或者具身的目标都是通用、通才,这是不是跟人有点相反?
周而进:这已经是两个标准了。我们对于人类通才的要求非常高,方方面面都要会,而且得比平常人干得好。
和人类通才标准不一样,机器人的通用,是能完成普通人日常基础操作,像递水、套手机壳、敲钉子。
这些操作对机器人已经很难了,我们要的不是全能超人,是普通人级别的通用能力。
星河频率:要不要给大众祛魅,别把通用神化?
周而进:现在还没到神化的地步。而且我有个不同的观点,信技术的无限潜力比不信好。
你信了,最后没做到无非就是预期落空,你要是不信,但最后发现技术发展真那么快,你可能就落后了。
星河频率:你们内部会怎么定义自己的模型目标?
周而进:两个维度。
第一是通用,一个模型搞定多种任务,而不是专门叠衣服一个、专门分拣一个。
第二是泛化,机器人干活的准确率得高,而且切换了不同场景机器人都能工作。
两个维度是正交的,同时考量,这可以牵引你往前走,避免走偏。
星河频率:你眼下的困难是什么?
周而进:有很多,数据不足、模型泛化弱,或者除了跳跳舞之外很难干真实活。
2026 年落地:三个场景与 1000 台目标
星河频率:你们现在的开源框架、硬件产品、评测平台这三环都涉及商业化吗?
周而进:评测平台目前免费开放,核心是打造生态和品牌;开源框架和硬件的商业化核心是销售自有硬件,但生态建设至关重要,面向开发者和科研机构,需要做好生态吸引用户。
我们最终交付的是软硬一体产品,现阶段有技术成熟度限制,模型难以通用操作各类机器人,所以会绑定自有软硬一体产品推进,未来再逐渐完善生态。
星河频率:你们目前选择哪些落地场景?
周而进:物流是第一个方向,相对更成熟一点,我们也有一些客户资源。
第二是教育方向,通过做各种开源软件框架,把它做成一个好的科研教具。
第三是商业场景,比如各种门店商超里机器人去结账、引流、导购、咨询。
星河频率:今年目标单场景部署 1000 台,为什么是 1000 台?
周而进:这是务实的一年期目标。我们原来在旷视就做物流场景,很清楚这个行业里今天有哪些任务需要被自动化解决。
1000 台这个规模是一个很有力的证明,证明你不是一个 Demo,也不是只搞了个 POC 演示一下,而是被规模化的用起来了。
星河频率:客户采购意愿加起来能到 1000 台吗?
周而进:更多的不是需求不够,是你搞不定。像我们的物流客户,整个仓库系统就是过去我们在旷视时期给他建的。
我们对于客户情况很了解,他们需要降低管理成本、提升部分环节效率,有一套自动化的方式兼顾高标准和可复制性,他们付费意愿很强。
AI 落地的核心矛盾从来不是客户不想买,而是你的能力不稳定、时灵时不灵,无法大规模交付。

星河频率:仓库除了分拣,还有哪些工序?
周而进:有很多,拿快递举例,分拣是第一类,装箱、拆箱、贴胶带、撕胶带,这些都是需求,而且要求很高。
星河频率:怎么算平账呢?三班倒工人的薪资加一起说不定比机器人实惠?
周而进:首先看你的节拍和成功率,你不能比原来速率差,影响产线运作,这是硬门槛。
过了这个门槛,算 ROI 很简单:你雇人一年花费多少,我的机器人几年能让你回本,之后就是纯赚。
尤其海外人力成本非常贵,像国内快递员效率那么高,很多人是坐一会儿歇一会儿,所以我们也非常看重海外市场。
星河频率:有人认为这轮具身机会不在工业,而在家庭,你怎么看?
周而进:要回到问题本质,模型擅长什么、场景能解决什么、能否助力通用。家庭场景确实复杂、要求高,但不能一棒子打死工业场景。
传统机械臂做固定动作那不叫具身智能,我们要解决的是非标、复杂、柔性场景:比如乱塞的衣服、散乱物料,规则写不死的任务,必须上大模型 + 具身算法。
这对算法价值极大,数据也能反哺模型。ToB 能检验你能不能把系统真正跑起来,很多团队做不了脏活累活,只能做家庭 Demo。
星河频率:行业里也有人在说机器人进工厂都是用小脑,不用大脑,你怎么看?
周而进:小脑负责控制,大脑是决策、规划、环境理解,两者没有高下之分。
比如叠衣服、堆衣服这种柔性抓取,看起来简单其实很难,属于小脑任务,但做不好照样无法落地。
大脑是复杂任务规划、自主决策、异常修补,工业不是不用大脑,而是很多公司做不到大脑,只能秀小脑。
真进厂很容易验证,直播长期跑、出货量上来、ROI 跑得通就够了。
星河频率:举一个具象场景,说明大脑 + 小脑怎么配合工作。
周而进:比如整理餐桌 30 分钟任务:大脑负责决策先做什么、后做什么、出错怎么修补;小脑负责精准抓取、摆放、稳定操作。
现在很多机器人大脑能想清楚,但小脑做不到,比如捏不住刀、切不了菜,其实小脑问题现在更关键、更难。
技术信仰:原生、泛化、通用基模
星河频率:原力灵机说要打造最强具身基础设施,该怎么理解?
周而进:最强基础设施的前提是,通过你这套设施生产出来的模型和硬件是强的。
我们觉得有三个核心:模型训练全栈框架、机器人评测系统以及高效数采软硬一体工具,这三样决定你最后的迭代速率和效率。
现在大家规模没起来,容易忽视基础设施,但我们经历过 AI 1.0,知道基建搭得好不好,才是决定生死效率的关键。
星河频率:你们年初提出具身原生概念,说今年会是具身原生元年,什么是具身原生?
周而进:原生就是不嫁接、不拼盘,不拿别人模型微调。我们相信机器人数据会大规模爆发,因此值得从零开始训练基座模型,而不是拼凑。
因为这会直接影响数据策略、基建搭建、训练规模。
星河频率:你们还提出来了今年是泛化之年,要打造泛化能力最强的具身基座模型,又该怎么理解泛化能力?
周而进:泛化分四层,难度递增:
一是被操作对象的泛化,例如换了个瓶子都能抓住;
二是场景泛化,机器人做到开箱即用,换了环境也能用;
三是任务泛化,像叠衣服、叠裤子、收拾桌子这一串任务都能做;
四是跨机型泛化。
我们今年更多关注前三类,对于跨机型来说,我们目前是支持多种机型,但完全一个新的没见过的机型,那可能得等到再下一代技术实现。
星河频率:怎么通俗理解基座模型?
周而进:未来有一个通用的模型搞定所有任务,不再一个任务一个模型。并且在四项泛化指标下面,多任务指标训练,它都取得了一个统一不错的能力。
星河频率:你们 DM0 只有 2.4B 参数量,却拿下了一段时间 Robochallenge 的第一,为什么?
周而进:核心在于智能密度。我们想证明2.4B 参数量的模型也能完成高质量具身任务,打破小参数量模型必拉胯的认知。
但这不是否定大参数量模型,我们也在训练 4B、8B 参数量模型,只是先明确我们的基础能力基线。
而且具身任务有控制频率约束,如 10-20Hz,在算力固定的情况下,参数量越大,推理频率越低,无法满足实时任务需求,小参数量在具身场景中更具适配性。

星河频率: DM0 模型是怎么训练出来的?
周而进:DM0 核心是原生多模态模型,分三阶段训练。
第一阶段从零融合物理世界数据调优,打造兼具常识认知、动作理解、开放场景导航能力的通用原生多模态底座。
第二阶段开展 VLA 预训练,灌入海量机器人数据,搭建多构型、多任务思维链,融入广义动作定义,拓展丰富动作空间,这是训练核心难点阶段。
第三阶段完成适配,定向适配各类实体机器人硬件构型。
星河频率:你们构建了一个三层智能系统,大脑规划、小脑指令、System0 精细执行,为什么是分层的,不是端到端一体的?
周而进:这个架构核心依据控制频率分层设计。
System2 为低频 0.5-1Hz 运行,搭载大模型,负责长程全局规划决策;
System1 为中高频 10-20Hz 运行,轻量化模型,执行基础原子动作;
System0 为高频 500Hz 底层运动控制,优化运动轨迹,实现机器人高速平稳执行动作。
2 给 1 下达指令,1 给 2 反馈,1 给 0 下达指令,0 给 1 反馈,整个系统信息是流动的。
很多业内讲端到端其实只做了 System 1 里面的事情。
星河频率:给 DM0 模型打个分吧。
周而进:DM0 目前还处于基础阶段,主要处理 low level 动作,泛化能力一般。
在 Robochallenge 定义的 1-3 分钟室内操作场景中,训练与测试场景一致时,能完成基础动作,但距离我们的预期还有差距。
今年计划发布的 DM0.5 和 DM1.0 版本,重点解决场景泛化和物品泛化问题,实现开箱即用。
星河频率:你们怎么看待世界模型和 VLA 的关系?
周而进:我们从去年开始就在推 VLA 加世界模型。VLA 聚焦智能体如何影响世界,世界模型聚焦世界被影响后的变化,两者结合形成自然闭环。
我们不固守单一路线,比如未来预测未必是视频形式,预测长期变化可能需要语言辅助,未来世界模型或许是视频与语言的结合体。
星河频率:你认为具身的核心牵引任务是什么?
周而进:迁移任务需要满足长期牵引发展、提升通用智能的特点,类似 Coding 对大模型的作用。
短期内,抓取是强迁移任务。看似简单的抓和放,实际需要解决多样场景的抓取需求,做到位才能解锁大量真实业务场景。
长期来看,工具使用是核心迁移任务。它要求模型超越工具本身语义,能用不同工具完成同一任务、同一工具完成不同任务,兼具想象力、探索能力和迭代调整能力,是综合考验小脑、大脑的复杂任务。
星河频率:工具使用是一定要灵巧手吗,还是夹爪也可以?
周而进:两者皆可,取决于工具类型。两指夹爪能解决很多此前认为无法完成的任务,而灵巧手的探索空间更大,我们也在推进灵巧手算法研发。
两者与工具使用是正交关系,夹爪范畴内也有很多探索点,比如人类会用手掌估测长度,而目前没有机器人会用自身手臂当尺子,自身部件的工具化利用,也是重要探索方向。

数据选择:所有数采都在做妥协
星河频率:你们 DM0 的训练数据有什么特点?为什么会加入智驾的数据?
周而进:DM0 训练数据核心围绕三点:常识、动作理解、开放场景导航。
智驾数据对低速导航有帮助,这为城区复杂路况提供了丰富的开阔环境信息和事件判断逻辑,与机器人导航需求贴近。
但智驾数据占比不高,核心还是机器人数据,不过就像训通用大模型,这类细分领域数据有和没有的差距很大。
星河频率:你们在数据采集上讲究信息密度最高,怎么理解?
周而进:这是我们的数据采集指导逻辑,因为所有数据采集都有妥协,核心是想清楚妥协什么、换取什么。
换取的必须是信息密度高、符合需求的内容,妥协的是信息密度低、可通过其他数据弥补的部分。
我们不站队任何一种数采方案,而是根据场景选择最优方式,没有合适方案就自研,核心是高效获取高价值数据。
星河频率:各种来源的数据,哪种最好、最必需?
周而进:核心看数据的信息增量,所有数据采集都是妥协的过程。
我们有数据金字塔,最高质量是遥操数据,最低质量是互联网数据,各类数据提供不同维度的信息。
外采场景像家庭、工厂、商超,主要提升场景和任务丰富度,核心是通过场景、任务、构型传感器的丰富度,获取真正有价值的信息增量,根据需求取舍即可。
星河频率:UMI(通过手持设备采集操作数据) 跟 EGO (以第一人称视角采集)是必选题吗?
周而进:不用强行贴标签,也不用做非此即彼的选择,每种方案都有获取的信息和妥协的地方。
比如精细操作无法使用 UMI,就用 EGO;根据具体需求,选择最适配的方案,甚至可以结合使用。
星河频率:仿真和真机数据呢?
周而进:仿真的优势是扩充数据、成本低,但无法模拟复杂物理接触。刚体抓取、室内低速导航可使用仿真,而叠衣服、擦桌子等复杂任务必须用真实数据。
星河频率:大家在讲数据、算力、算法三驾马车,你觉得除了这三者还有什么可能被忽视了?
周而进:数据背后的工程基建和硬件。现在算法与基建深度耦合,机器人数据采集需要完整的基建,例如硬件、遥操设备,千卡级训练也需要配套基建支撑。
硬件本身也是关键,没有硬件就无法完成数据采集。

直面竞争:蒸馏噪音才能快速向前
星河频率:你们怎么看 Physical Intelligence 这样的公司?
周而进:我们很尊敬开源的公司,当然我们自己也在一直开源。
你能把工作开源出来,说明你的工作就很扎实,但现在 PI 从π*0.6 开始已经不开源了。
星河频率:你觉得跟他们有差距吗?
周而进:是有差距的,PI 走在大家前面。
但这个行业还处在非常早期的阶段,方法、数据、算法都没定型,机器人甚至不是一个 one model,而是一个 system。
在一个赛道早期,这个差距可能变化很大,今天你领先,说不定半年后就是我领先了。
星河频率:你们又怎么看待特斯拉这样的玩家,你们会有大厂焦虑吗?
周而进:看待这个问题本身意义不是特别大,对我来说,不如尽早去把自己相信的路线往前跑。
大厂焦虑,你在任何 AI 创业时代都可以有,但大厂也未必会 focus 在这个单点上。
很多东西你不可控,你唯一能控的就是自己尽可能跑得快。对我们来说,做得好的就学习吸收,更重要的还是自己的速度。
星河频率:大家叙事上总是我们跟国外某某公司比较的话术,好像天然把自己放在下面。这一两年会把叙事位置倒换过来吗?
周而进:长期从业者更应关注本质,聚焦行业核心困难、资源约束下的突破方向、商业化场景解锁,而不是单纯攀比。
攀比往往是自身无法证明进步时的无奈选择,我们更关注技术落地,今年会在模型、数据、基建上突破,提升通用性和泛化性,解锁物流分拣、拆装箱等实际场景。
星河频率:你有说过具身智能从 Demo 到进厂,可能会淘汰掉 99% 的公司,你们怎么做到最后那 1%?
周而进:从第一天你就不应该以一个 Demo 的心态来看待这件事,最核心的还是务实。
我们之前做过非常多算法落地的事,知道坑都在什么地方,选择的一些行业也有客户合作伙伴资源,并且我们能比较好地去把落地处理好。
容易的路短期刺激回报很大,但长期来看能走得更远的路回报才更多。
太阳底下没有新鲜事,最终把一件事做成,所有脏活、累活、难活、简单活都得干过。
星河频率:今年大家的融资消息都不新鲜了,估值也水涨船高,资本为什么看好你们?
周而进:我们的差异化,第一是我们非常坚定地卯着做通用具身智能的软硬一体定位来做。
真的坚持往这个方向做,看你一年花多少时间采数据、多少钱资金采数据、有多少 GPU 在训模型,真金白银投入做这个的其实很少。
第二是我们有比较明确的短期、中期商业化落地方向和目标。
星河频率:如果跳出一家具身公司联创视角,你会用哪些维度去评判其他公司的水平?
周而进:唯一的评判标准,就是谁家的机器人大规模被用起来了。
不管你是唱歌跳舞、工厂搬砖、还是在家提供情绪价值,谁被大规模用起来,谁就拿到了进入下一个数据飞轮的船票,其他的都是虚的。
这代表了量产能力,也代表了系统稳定性。
星河频率:你觉得具身这个赛道现在什么东西被低估了?什么被捧得太过头?
周而进:被低估的是具身数据积累,一旦机器人规模化部署,数据量会快速增长,进而推动模型和具身能力快速提升。
其实一千台机器跑三个月,就能有 50 万小时的真实数据。
被捧过头的,像行业泡沫、PPT 造车式宣传,但泡沫并非全是坏事,它能带来资源、关注度和更多玩家,推动行业发展,利弊难以绝对评判。
星河频率:你觉得行业里哪些争论偏离了本质?
周而进:非黑即白、单边贴标签的争论偏离了本质,将技术方法上升为信仰更是离谱。
行业应坚持目标驱动,明确要解决的问题,选择合适的方法和工具,分析解决不了的原因,数据、技术路线等等都只是手段,而非目的。
星河频率:大家说过去旷视是 AI1.0 时代,大模型的出现是 AI2.0 时代,AI3.0 会是什么样子?
周而进:AI3.0 就是机器人本体能力成熟,能稳定完成日常任务,和大模型无缝对接,实现真正自主长期任务。
目前具身智能还在基础阶段,核心短板在于大脑与动作脱节。当具身能做好各类基础 low level 动作,实现大脑与身体衔接,能高质量完成几分钟内的日常动作任务时,就会迎来突破性发展。
当前核心是解决基础动作的成功率和泛化性。
星河频率:具身智能离通用还有多久?
周而进:可能是 3-5 年,或许更短。机器人基础动作突破后,接上大脑 + 强化学习,进步会是阶跃式的。
0
分享
好文章,需要你的鼓励












参与评论
请您注册或者登录星河频率社区账号即可发表回复
去登录
相关评论(共0条)
查看更多评论