当前位置：首页 > 详情

对话原力灵机周而进：具身智能最大的误区，是总想走捷径

毛心如 2026-05-21 14:40:00 24508

编者按：在具身智能的浪潮中，总有人站在潮头，定义流向。星河频率推出全新访谈系列《浪潮之上》。

聚焦具身智能行业内的关键人物，分享从技术拐点到商业抉择，从产品落地到产业远望。我们不谈空泛的趋势，只记录那些真正推动浪潮的思考、判断与行动。

不追热点，只抓浪尖，让更多人先听见，具身智能的下一个频率。

往期文章：

《对话千诀科技高海川：目标让行业一半机器人用上千诀大脑》

太阳底下没有新鲜事，最终把一件事做成，所有脏活、累活、难活、简单活都得干过。

这是原力灵机的联创周而进在采访中反复强调的信念，也是原力灵机最真实的创业注脚。

事实上，具身智能的世界从来不缺天才。

当一群智商顶尖的人涌入同一个赛道，年轻的天才甚至成了一个行业准入门槛。

那如果是一群天才少年攒局一起创业，会产生什么样的化学反应？

原力灵机的回答是，用最短时间，跑出行业领先的技术与落地节奏。

这次我们对话的对象，原力灵机的联创周而进，他的履历确实足够亮眼：初三保送清华、IOI信息学竞赛金牌、大二拿下ICCV冠军。

但在三个小时的采访里，他几乎没有主动提起这些。

相反，当聊起技术、聊起物理世界、聊起模型该往何处去时，他的眼睛里有一种藏不住的亮光。

我问他，你之前在采访里说自己是一个纯粹的人，现在还算吗？

他先是愣了一下，表示并不记得有这样的发言。

但答案其实不重要。

整场对话里，他提到了不下十次要从本质来看。这不是口头禅，是他在面对行业噪音时真实的本能反应。

他仍然是一个纯粹的人，那是一种被兴趣和实干打底、不计较短期回报的纯粹。

这种纯粹贯穿了他从旷视到原力灵机的每一次选择。

因为对物理世界更感兴趣，他没有去自动驾驶或大模型的热门领域，而是一头扎进了尚在混沌期的具身智能，还挑了一条最难走的路，做软硬一体的通用机器人。

在外界还在激烈争论家庭还是工厂、大脑还是小脑、端到端还是分层时，周而进只关心一件事：机器人的基础动作什么时候能被大规模做对、做稳。

因为这决定了所有宏大叙事落地的可能性。

当我们回顾天才叙事时，常常会忽略所有重大的突破，靠的从来不只是天才们想飞多高，更是他们决定站多久、走多深。

在今天的具身智能行业，太多人急于证明自己。

但原力灵机在做另一件事：先把机器人最基础的动作，一个一个做对。这件事听上去不性感，甚至有点笨。

但所有真正改变世界的技术，往往都要先经历这样一个阶段，有人愿意长期待在那些没人想反复碰的脏活、累活里。

我们与周而进进行了一场深度对话，尝试拆解这位务实主义者的技术信仰与商业拼图。对话分为七个部分：

天才的底色：兴趣、纯粹与系统作战
旷视十年：FaceID、深度学习与算法量产
原力灵机一年：定目标、抗压力、赶进度
2026 年落地：三个场景与 1000 台目标
技术信仰：原生、泛化、通用基模
数据选择：所有数采都在做妥协
直面竞争：蒸馏噪音才能快速向前

以下为对话实录，经星河频率不改变原意编辑整理：

天才的底色：兴趣、纯粹与系统作战

星河频率：初三就能保送清华，拿下 IOI 竞赛金牌，天才少年的光环一直围绕着你。那个阶段的你，最核心的能力是什么？

周而进：对事物保持高度兴趣。我很喜欢把一件事情建模、分析，预测它未来会怎么发展，甚至在某种程度上还能找到背后的规律去控制它。

星河频率：听起来有点像一个机器人的设计。

周而进：有点像，但当时我还没接触机器人，我的关注更多在于把现实中的事情变成一个可建模、可分析的事情。理解本身就能带给我很大的乐趣。

星河频率：你在清华大二就拿下 ICCV 冠军，当时为什么会选择这个方向？是感兴趣还是偶然？

周而进：完全是偶然，最早文斌（旷视、原力灵机联创）拉我去旷视实习，当时他们在做游戏，我并不感兴趣。

后来旷视转向做 AI + 计算机视觉，我觉得图像研究很有意思就加入了。机缘巧合下我领了人脸方向，做了一个月去打比赛就拿了冠军，后来就沿着人脸识别一路做下去。

星河频率：当时是处在什么学术或者技术背景呢？

周而进：那时候旷视很年轻，基本都是年轻人，我也就没什么思想包袱，当时正好深度学习刚兴起，我们就拿深度学习去试各种传统计算机视觉任务。

星河频率：在 AI 圈这么久，有没有自己比较欣赏的科学家？

周而进：我很敬佩 Hinton（AI 教父）。做研究很多时候都有波峰波谷，他不追逐热点，坚持自己相信的东西，并且跨越了很长的研究周期。

我一直觉得，好的研究工作很多时候不是靠数量堆出来的，而是靠质量。

以前孙剑（旷视首席科学家）经常跟我们说，一个学者不用比每年发多少论文，拉长时间线，能留下一两篇让人深刻记住的工作，就是成功。

星河频率：那你觉得自己达到阶段性成功了吗？

周而进：我觉得没达到，个人要求不一样。

我在人脸识别这块做了不少有意义的工作，我们也是国内最早把人脸识别做到支付级安全水准，还大范围落地各类实际场景，这件事我特别骄傲。

但人得往后看，不能停在过去，机器人就是一个新挑战。

旷视十年：FaceID、深度学习与算法量产

星河频率：在外界看来，你在旷视最让人印象深刻的产品是 FaceID，从实习生到产品规模化商业化的负责人，FaceID 的成功对你个人有什么影响？

周而进：现在想起来都挺魔幻的，最大的影响是让大家真正相信深度学习。十几年前很多人并不信深度学习能通用，FaceID 成功后，无论是旷视还是行业都坚定走深度学习路线。

对我个人来说，是从单打独斗做单点技术，变成带着团队系统化思考：数据怎么弄、训练怎么做、模型怎么训、怎么部署到 SDK、工程怎么优化。

越往后越发现，技术比拼的是整个系统的战斗力，不是单点能力。

星河频率：从个人建设者变成团队负责人，这个转变对你自身有什么影响？

周而进：角色转换还好，旷视氛围很简单，大家都聚焦把事情搞定。要做成事就要带不同团队配合，应用科学方向很难靠单打独斗完成。

星河频率：所以你是一个结果导向的人吗？

周而进：非常结果导向。带团队本质就是定清目标、匹配每个人能力与发展、对齐个人与团队目标，剩下就是资源问题。

星河频率：为什么最后会选择离开旷视，开始具身智能创业？

周而进：从我的视角看，很多事是连续变化的。

在旷视的时候，到 2019 年左右人脸这一块能做的我基本都干完了。随着业务扩大，当时包括旷视在内的 AI 四小龙都碰到了商业化不闭环、项目亏钱、成本高的困境。

除了人脸和自动驾驶，很少有高溢价单点算法能卖遍各行各业，每个行业都有大量长尾定制化算法。

所以 2019 年之后我在旷视做第二件事，算法量产，用一套标准化工程基建把视觉算法规范化，把成本拉到与海康、大华同水平。

但其实早在 2016-2018 年旷视就想做机器人，但是条件不成熟，只能先做视觉，大模型兴起后我觉得时机到了。

星河频率：旷视出来的人，也有一部分去了千里科技和阶跃星辰，你为什么没去另外两家？

周而进：我更热爱操作物理世界、改变物理世界。

机器人的灵活性、交互广度，最接近我们最初想做的方向，这一波技术节点也刚好成熟。

星河频率：但千里科技做的智驾也是要跟真实世界交互，为什么没选智驾？

周而进：这类交互本身就很受限，无人驾驶说到底就是为了顺畅行车，技术主打做好导航，尽量少和现实环境产生额外交互。

星河频率：从旷视到现在创业，哪些经验可以直接迁移复用？

周而进：非常多。从十几年前做深度学习到现在，技术是一脉相承的，外界喜欢分 AI1.0、AI2.0 时代，但我们看都是平滑渐变的。

我们对传感器、视觉、嵌入式、芯片、数据驱动的认知，都是这么多年攒下来的。

更重要的是，我们知道 AI 落地要做无数脏活累活，像是产线对接、异常处理、兜底策略、代码兼容、组织执行、项目坑点……这些十年落地经验全部能复用。

原力灵机一年：定目标、抗压力、赶进度

星河频率：创业一年多，有没有哪个阶段觉得特别难、和想象完全不一样？

周而进：创业一直不简单，我们有心理预期，市场不受控、竞争激烈、算力紧张、研发会延期，每一步都不容易。

星河频率：有没有哪个时刻压力特别大？

周而进：今年 2 月 DM0 发布之前，我们高强度工作了很久，因为要把一年的技术尝试整合进一个模型。

毕竟机器人不像大模型可以蒸馏，没有参考，大家水平都不高、动作晃晃悠悠，完全靠自己摸索路径。

星河频率：你是技术悲观还是乐观的人？

周而进：我是短期务实、长期乐观的人。

时代一直在不断加速前行，从前时间流转平缓，工业革命后发展节奏加快，信息时代效率翻倍，如今大模型更是大幅提升信息提炼效率。

从长期来看，人类整个社会变化的加速度越来越快。但短期，你得参与进去，不能当空想主义者。

星河频率：如果要你用个词形容这一年创业的状态或成长，你会用什么词？

周而进：速度。这一年不管是我们模型迭代还是行业节奏，都在高速往前跑。

在正确的路上面，一定会越滚越快，但大前提是你的方向得对。

星河频率：你们现在团队是怎么分工的？

周而进：我、范浩强、汪天才都专注算法。机器人是个非常复杂的系统，不是靠一个单点算法就能搞定的，我们三个负责系统内不同模块。

文斌更多负责客户和投融资，硬件也有专门的负责人。

星河频率：现在行业内有人先做硬件，有人软硬一体，你们则是先做算法再做硬件。你怎么看待这种路径差异？

周而进：三条路都没有捷径，你的创始团队擅长什么，自然就从哪里开始，关键是终点你想要什么。

如果目标是要做一个通用的机器人，只靠单点肯定不够。我们从算法起步，但很快就把硬件团队补齐了。

机器人里太多问题没定型，比如触觉，必须是软件算法和硬件传感器扣在一起迭代，硬件和算法就像左脚踩右脚，缺一不可，得一起往上走。

星河频率：有人说软硬一体公司中期没爆款会很尴尬，纯软件、纯硬件反而更灵活，你认同吗？

周而进：这是现实观点，但我不这么看。我们选择做具身，目标是通用机器人，这是登月级目标。

中短期的商业化都是为了活下去，但目标决定长跑方向。软硬一体是奔着通用去的，过早做垂直专用会降格目标。

星河频率：你怎么定义通用？大部分人类都是专才，但 AGI 或者具身的目标都是通用、通才，这是不是跟人有点相反？

周而进：这已经是两个标准了。我们对于人类通才的要求非常高，方方面面都要会，而且得比平常人干得好。

和人类通才标准不一样，机器人的通用，是能完成普通人日常基础操作，像递水、套手机壳、敲钉子。

这些操作对机器人已经很难了，我们要的不是全能超人，是普通人级别的通用能力。

星河频率：要不要给大众祛魅，别把通用神化？

周而进：现在还没到神化的地步。而且我有个不同的观点，信技术的无限潜力比不信好。

你信了，最后没做到无非就是预期落空，你要是不信，但最后发现技术发展真那么快，你可能就落后了。

星河频率：你们内部会怎么定义自己的模型目标？

周而进：两个维度。

第一是通用，一个模型搞定多种任务，而不是专门叠衣服一个、专门分拣一个。

第二是泛化，机器人干活的准确率得高，而且切换了不同场景机器人都能工作。

两个维度是正交的，同时考量，这可以牵引你往前走，避免走偏。

星河频率：你眼下的困难是什么？

周而进：有很多，数据不足、模型泛化弱，或者除了跳跳舞之外很难干真实活。

2026 年落地：三个场景与 1000 台目标

星河频率：你们现在的开源框架、硬件产品、评测平台这三环都涉及商业化吗？

周而进：评测平台目前免费开放，核心是打造生态和品牌；开源框架和硬件的商业化核心是销售自有硬件，但生态建设至关重要，面向开发者和科研机构，需要做好生态吸引用户。

我们最终交付的是软硬一体产品，现阶段有技术成熟度限制，模型难以通用操作各类机器人，所以会绑定自有软硬一体产品推进，未来再逐渐完善生态。

星河频率：你们目前选择哪些落地场景？

周而进：物流是第一个方向，相对更成熟一点，我们也有一些客户资源。

第二是教育方向，通过做各种开源软件框架，把它做成一个好的科研教具。

第三是商业场景，比如各种门店商超里机器人去结账、引流、导购、咨询。

星河频率：今年目标单场景部署 1000 台，为什么是 1000 台？

周而进：这是务实的一年期目标。我们原来在旷视就做物流场景，很清楚这个行业里今天有哪些任务需要被自动化解决。

1000 台这个规模是一个很有力的证明，证明你不是一个 Demo，也不是只搞了个 POC 演示一下，而是被规模化的用起来了。

星河频率：客户采购意愿加起来能到 1000 台吗？

周而进：更多的不是需求不够，是你搞不定。像我们的物流客户，整个仓库系统就是过去我们在旷视时期给他建的。

我们对于客户情况很了解，他们需要降低管理成本、提升部分环节效率，有一套自动化的方式兼顾高标准和可复制性，他们付费意愿很强。

AI 落地的核心矛盾从来不是客户不想买，而是你的能力不稳定、时灵时不灵，无法大规模交付。

星河频率：仓库除了分拣，还有哪些工序？

周而进：有很多，拿快递举例，分拣是第一类，装箱、拆箱、贴胶带、撕胶带，这些都是需求，而且要求很高。

星河频率：怎么算平账呢？三班倒工人的薪资加一起说不定比机器人实惠？

周而进：首先看你的节拍和成功率，你不能比原来速率差，影响产线运作，这是硬门槛。

过了这个门槛，算 ROI 很简单：你雇人一年花费多少，我的机器人几年能让你回本，之后就是纯赚。

尤其海外人力成本非常贵，像国内快递员效率那么高，很多人是坐一会儿歇一会儿，所以我们也非常看重海外市场。

星河频率：有人认为这轮具身机会不在工业，而在家庭，你怎么看？

周而进：要回到问题本质，模型擅长什么、场景能解决什么、能否助力通用。家庭场景确实复杂、要求高，但不能一棒子打死工业场景。

传统机械臂做固定动作那不叫具身智能，我们要解决的是非标、复杂、柔性场景：比如乱塞的衣服、散乱物料，规则写不死的任务，必须上大模型 + 具身算法。

这对算法价值极大，数据也能反哺模型。ToB 能检验你能不能把系统真正跑起来，很多团队做不了脏活累活，只能做家庭 Demo。

星河频率：行业里也有人在说机器人进工厂都是用小脑，不用大脑，你怎么看？

周而进：小脑负责控制，大脑是决策、规划、环境理解，两者没有高下之分。

比如叠衣服、堆衣服这种柔性抓取，看起来简单其实很难，属于小脑任务，但做不好照样无法落地。

大脑是复杂任务规划、自主决策、异常修补，工业不是不用大脑，而是很多公司做不到大脑，只能秀小脑。

真进厂很容易验证，直播长期跑、出货量上来、ROI 跑得通就够了。

星河频率：举一个具象场景，说明大脑 + 小脑怎么配合工作。

周而进：比如整理餐桌 30 分钟任务：大脑负责决策先做什么、后做什么、出错怎么修补；小脑负责精准抓取、摆放、稳定操作。

现在很多机器人大脑能想清楚，但小脑做不到，比如捏不住刀、切不了菜，其实小脑问题现在更关键、更难。

技术信仰：原生、泛化、通用基模

星河频率：原力灵机说要打造最强具身基础设施，该怎么理解？

周而进：最强基础设施的前提是，通过你这套设施生产出来的模型和硬件是强的。

我们觉得有三个核心：模型训练全栈框架、机器人评测系统以及高效数采软硬一体工具，这三样决定你最后的迭代速率和效率。

现在大家规模没起来，容易忽视基础设施，但我们经历过 AI 1.0，知道基建搭得好不好，才是决定生死效率的关键。

星河频率：你们年初提出具身原生概念，说今年会是具身原生元年，什么是具身原生？

周而进：原生就是不嫁接、不拼盘，不拿别人模型微调。我们相信机器人数据会大规模爆发，因此值得从零开始训练基座模型，而不是拼凑。

因为这会直接影响数据策略、基建搭建、训练规模。

星河频率：你们还提出来了今年是泛化之年，要打造泛化能力最强的具身基座模型，又该怎么理解泛化能力？

周而进：泛化分四层，难度递增：

一是被操作对象的泛化，例如换了个瓶子都能抓住；

二是场景泛化，机器人做到开箱即用，换了环境也能用；

三是任务泛化，像叠衣服、叠裤子、收拾桌子这一串任务都能做；

四是跨机型泛化。

我们今年更多关注前三类，对于跨机型来说，我们目前是支持多种机型，但完全一个新的没见过的机型，那可能得等到再下一代技术实现。

星河频率：怎么通俗理解基座模型？

周而进：未来有一个通用的模型搞定所有任务，不再一个任务一个模型。并且在四项泛化指标下面，多任务指标训练，它都取得了一个统一不错的能力。

星河频率：你们 DM0 只有 2.4B 参数量，却拿下了一段时间 Robochallenge 的第一，为什么？

周而进：核心在于智能密度。我们想证明2.4B 参数量的模型也能完成高质量具身任务，打破小参数量模型必拉胯的认知。

但这不是否定大参数量模型，我们也在训练 4B、8B 参数量模型，只是先明确我们的基础能力基线。

而且具身任务有控制频率约束，如 10-20Hz，在算力固定的情况下，参数量越大，推理频率越低，无法满足实时任务需求，小参数量在具身场景中更具适配性。

星河频率： DM0 模型是怎么训练出来的？

周而进：DM0 核心是原生多模态模型，分三阶段训练。

第一阶段从零融合物理世界数据调优，打造兼具常识认知、动作理解、开放场景导航能力的通用原生多模态底座。

第二阶段开展 VLA 预训练，灌入海量机器人数据，搭建多构型、多任务思维链，融入广义动作定义，拓展丰富动作空间，这是训练核心难点阶段。

第三阶段完成适配，定向适配各类实体机器人硬件构型。

星河频率：你们构建了一个三层智能系统，大脑规划、小脑指令、System0 精细执行，为什么是分层的，不是端到端一体的？

周而进：这个架构核心依据控制频率分层设计。

System2 为低频 0.5-1Hz 运行，搭载大模型，负责长程全局规划决策；

System1 为中高频 10-20Hz 运行，轻量化模型，执行基础原子动作；

System0 为高频 500Hz 底层运动控制，优化运动轨迹，实现机器人高速平稳执行动作。

2 给 1 下达指令，1 给 2 反馈，1 给 0 下达指令，0 给 1 反馈，整个系统信息是流动的。

很多业内讲端到端其实只做了 System 1 里面的事情。

星河频率：给 DM0 模型打个分吧。

周而进：DM0 目前还处于基础阶段，主要处理 low level 动作，泛化能力一般。

在 Robochallenge 定义的 1-3 分钟室内操作场景中，训练与测试场景一致时，能完成基础动作，但距离我们的预期还有差距。

今年计划发布的 DM0.5 和 DM1.0 版本，重点解决场景泛化和物品泛化问题，实现开箱即用。

星河频率：你们怎么看待世界模型和 VLA 的关系？

周而进：我们从去年开始就在推 VLA 加世界模型。VLA 聚焦智能体如何影响世界，世界模型聚焦世界被影响后的变化，两者结合形成自然闭环。

我们不固守单一路线，比如未来预测未必是视频形式，预测长期变化可能需要语言辅助，未来世界模型或许是视频与语言的结合体。

星河频率：你认为具身的核心牵引任务是什么？

周而进：迁移任务需要满足长期牵引发展、提升通用智能的特点，类似 Coding 对大模型的作用。

短期内，抓取是强迁移任务。看似简单的抓和放，实际需要解决多样场景的抓取需求，做到位才能解锁大量真实业务场景。

长期来看，工具使用是核心迁移任务。它要求模型超越工具本身语义，能用不同工具完成同一任务、同一工具完成不同任务，兼具想象力、探索能力和迭代调整能力，是综合考验小脑、大脑的复杂任务。

星河频率：工具使用是一定要灵巧手吗，还是夹爪也可以？

周而进：两者皆可，取决于工具类型。两指夹爪能解决很多此前认为无法完成的任务，而灵巧手的探索空间更大，我们也在推进灵巧手算法研发。

两者与工具使用是正交关系，夹爪范畴内也有很多探索点，比如人类会用手掌估测长度，而目前没有机器人会用自身手臂当尺子，自身部件的工具化利用，也是重要探索方向。

数据选择：所有数采都在做妥协

星河频率：你们 DM0 的训练数据有什么特点？为什么会加入智驾的数据？

周而进：DM0 训练数据核心围绕三点：常识、动作理解、开放场景导航。

智驾数据对低速导航有帮助，这为城区复杂路况提供了丰富的开阔环境信息和事件判断逻辑，与机器人导航需求贴近。

但智驾数据占比不高，核心还是机器人数据，不过就像训通用大模型，这类细分领域数据有和没有的差距很大。

星河频率：你们在数据采集上讲究信息密度最高，怎么理解？

周而进：这是我们的数据采集指导逻辑，因为所有数据采集都有妥协，核心是想清楚妥协什么、换取什么。

换取的必须是信息密度高、符合需求的内容，妥协的是信息密度低、可通过其他数据弥补的部分。

我们不站队任何一种数采方案，而是根据场景选择最优方式，没有合适方案就自研，核心是高效获取高价值数据。

星河频率：各种来源的数据，哪种最好、最必需？

周而进：核心看数据的信息增量，所有数据采集都是妥协的过程。

我们有数据金字塔，最高质量是遥操数据，最低质量是互联网数据，各类数据提供不同维度的信息。

外采场景像家庭、工厂、商超，主要提升场景和任务丰富度，核心是通过场景、任务、构型传感器的丰富度，获取真正有价值的信息增量，根据需求取舍即可。

星河频率：UMI（通过手持设备采集操作数据） 跟 EGO （以第一人称视角采集）是必选题吗？

周而进：不用强行贴标签，也不用做非此即彼的选择，每种方案都有获取的信息和妥协的地方。

比如精细操作无法使用 UMI，就用 EGO；根据具体需求，选择最适配的方案，甚至可以结合使用。

星河频率：仿真和真机数据呢？

周而进：仿真的优势是扩充数据、成本低，但无法模拟复杂物理接触。刚体抓取、室内低速导航可使用仿真，而叠衣服、擦桌子等复杂任务必须用真实数据。

星河频率：大家在讲数据、算力、算法三驾马车，你觉得除了这三者还有什么可能被忽视了？

周而进：数据背后的工程基建和硬件。现在算法与基建深度耦合，机器人数据采集需要完整的基建，例如硬件、遥操设备，千卡级训练也需要配套基建支撑。

硬件本身也是关键，没有硬件就无法完成数据采集。

直面竞争：蒸馏噪音才能快速向前

星河频率：你们怎么看 Physical Intelligence 这样的公司？

周而进：我们很尊敬开源的公司，当然我们自己也在一直开源。

你能把工作开源出来，说明你的工作就很扎实，但现在 PI 从π*0.6 开始已经不开源了。

星河频率：你觉得跟他们有差距吗？

周而进：是有差距的，PI 走在大家前面。

但这个行业还处在非常早期的阶段，方法、数据、算法都没定型，机器人甚至不是一个 one model，而是一个 system。

在一个赛道早期，这个差距可能变化很大，今天你领先，说不定半年后就是我领先了。

星河频率：你们又怎么看待特斯拉这样的玩家，你们会有大厂焦虑吗？

周而进：看待这个问题本身意义不是特别大，对我来说，不如尽早去把自己相信的路线往前跑。

大厂焦虑，你在任何 AI 创业时代都可以有，但大厂也未必会 focus 在这个单点上。

很多东西你不可控，你唯一能控的就是自己尽可能跑得快。对我们来说，做得好的就学习吸收，更重要的还是自己的速度。

星河频率：大家叙事上总是我们跟国外某某公司比较的话术，好像天然把自己放在下面。这一两年会把叙事位置倒换过来吗？

周而进：长期从业者更应关注本质，聚焦行业核心困难、资源约束下的突破方向、商业化场景解锁，而不是单纯攀比。

攀比往往是自身无法证明进步时的无奈选择，我们更关注技术落地，今年会在模型、数据、基建上突破，提升通用性和泛化性，解锁物流分拣、拆装箱等实际场景。

星河频率：你有说过具身智能从 Demo 到进厂，可能会淘汰掉 99% 的公司，你们怎么做到最后那 1%？

周而进：从第一天你就不应该以一个 Demo 的心态来看待这件事，最核心的还是务实。

我们之前做过非常多算法落地的事，知道坑都在什么地方，选择的一些行业也有客户合作伙伴资源，并且我们能比较好地去把落地处理好。

容易的路短期刺激回报很大，但长期来看能走得更远的路回报才更多。

太阳底下没有新鲜事，最终把一件事做成，所有脏活、累活、难活、简单活都得干过。

星河频率：今年大家的融资消息都不新鲜了，估值也水涨船高，资本为什么看好你们？

周而进：我们的差异化，第一是我们非常坚定地卯着做通用具身智能的软硬一体定位来做。

真的坚持往这个方向做，看你一年花多少时间采数据、多少钱资金采数据、有多少 GPU 在训模型，真金白银投入做这个的其实很少。

第二是我们有比较明确的短期、中期商业化落地方向和目标。

星河频率：如果跳出一家具身公司联创视角，你会用哪些维度去评判其他公司的水平？

周而进：唯一的评判标准，就是谁家的机器人大规模被用起来了。

不管你是唱歌跳舞、工厂搬砖、还是在家提供情绪价值，谁被大规模用起来，谁就拿到了进入下一个数据飞轮的船票，其他的都是虚的。

这代表了量产能力，也代表了系统稳定性。

星河频率：你觉得具身这个赛道现在什么东西被低估了？什么被捧得太过头？

周而进：被低估的是具身数据积累，一旦机器人规模化部署，数据量会快速增长，进而推动模型和具身能力快速提升。

其实一千台机器跑三个月，就能有 50 万小时的真实数据。

被捧过头的，像行业泡沫、PPT 造车式宣传，但泡沫并非全是坏事，它能带来资源、关注度和更多玩家，推动行业发展，利弊难以绝对评判。

星河频率：你觉得行业里哪些争论偏离了本质？

周而进：非黑即白、单边贴标签的争论偏离了本质，将技术方法上升为信仰更是离谱。

行业应坚持目标驱动，明确要解决的问题，选择合适的方法和工具，分析解决不了的原因，数据、技术路线等等都只是手段，而非目的。

星河频率：大家说过去旷视是 AI1.0 时代，大模型的出现是 AI2.0 时代，AI3.0 会是什么样子？

周而进：AI3.0 就是机器人本体能力成熟，能稳定完成日常任务，和大模型无缝对接，实现真正自主长期任务。

目前具身智能还在基础阶段，核心短板在于大脑与动作脱节。当具身能做好各类基础 low level 动作，实现大脑与身体衔接，能高质量完成几分钟内的日常动作任务时，就会迎来突破性发展。

当前核心是解决基础动作的成功率和泛化性。

星河频率：具身智能离通用还有多久？

周而进：可能是 3-5 年，或许更短。机器人基础动作突破后，接上大脑 + 强化学习，进步会是阶跃式的。

标签：具身智能原力灵机周而进

本文为星河频率原创文章，作者：毛心如，如需转载，请联系授权。违规转载法律必究。

好文章，需要你的鼓励

参与评论

请您注册或者登录星河频率社区账号即可发表回复

去登录

登录或注册

绑定手机

对话原力灵机周而进：具身智能最大的误区，是总想走捷径

天才的底色：兴趣、纯粹与系统作战

旷视十年：FaceID、深度学习与算法量产

原力灵机一年：定目标、抗压力、赶进度

2026 年落地：三个场景与 1000 台目标

技术信仰：原生、泛化、通用基模

数据选择：所有数采都在做妥协

直面竞争：蒸馏噪音才能快速向前

参与评论

相关评论(共0条)

相关推荐