(来源:北京商报)
鼎好大厦A座2楼的具身智能训练场内,机械臂和人形机器人正在精准地执行着各种复杂任务。这里是智源研究院具身智能组探索人工智能边界的试验田。在这里,能看到智源研究院30余家具身智能合作伙伴的机器,也能看到同一项任务更通用的解法。
去啃那些更前瞻性的研究,成为人工智能创新引领者,是智源研究院创立之初就定下的愿景。跟着智源研究院的科研布局,可以看到行业发展的趋势。作为新型研究机构,智源研究院负责向创业公司提供“安卓操作系统”,让企业专心做硬件。这样的定位让其对模型、硬件、产业有着更清晰、中立的观察。
“具身智能的发展,应该先通过专用模型在特定场景落地,形成数据闭环,再逐步向通用化发展,而不是一开始就追求‘万能具身’”,在与北京商报记者的交流中,智源研究院院长王仲远多次表达了这一核心观点。让他担忧的是,具身智能订单的需求真伪、创业公司能否活下来。让他欣喜的是,资本市场用实际行动证明了各方对具身智能的未来有了共识,技术、产业都在螺旋式上升。
Q:11月,黄仁勋、约书亚·本吉奥、李飞飞等六人同台讨论了AI泡沫等话题,您怎么看待AI泡沫?
A:和某些其他赛道不同,AI赛道本身是没有泡沫的,AI技术确实在实实在在地便利人们的生活,促进各行各业智能化升级。之所以大家担心有AI泡沫,更多是当前技术发展实际水平与资本热度、公众期待不匹配所导致的。所以拉长周期来看,AI技术依然是下一次技术革命最有可能的驱动力,是一次“智力”变成基础设施的变革。
Q:年初DeepSeek爆火后,大模型技术在C(用户)端的渗透加速,但为何公众层面没有看到另一个技术飞跃?
A:其实从专业角度来看,我们观察到今年(2025年)下半年以来AI技术发展在加速,各种新技术突破以及多模态技术的快速发展呈现新的井喷式态势。之所以公众层面没有太多感知,一方面是技术传导到产品以及实际落地场景还有一段周期,另一方面是国内缺乏类似年初DeepSeek那样质优价廉的现象级国产模型产品的出现。
Q:常会看到一些由遥控器控制的具身智能,怎样才能实现自主化?
A:从遥控操作到完全自主,核心要解决的是数据和模型泛化的问题。我们看到的遥控演示,其本质并非能力的欠缺,很多时候它本身就是为特定任务采集高质量示范数据的过程。当前通过遥控展示能力的具身智能搭载的大都是专用模型,每一个动作都是专门采集数据和专门训练的。简单来说就是下围棋的模型不能解决无人驾驶,也不能解决医疗咨询。我认为机器人时代很可能遵循深度学习和AI 1.0时代的发展路径,先用小的专用具身智能模型进行场景化落地,使机器人产业跑起来,让机器人公司活下来。这个过程中要把某一个场景或任务做到99%以上的准确度,做到能长时间运行机器不发热、硬件不损坏,形成数据闭环,我觉得这是一个让具身智能自主化更可行的路径。
Q:数据、算法和算力是人工智能的三大核心要素,具体到具身智能,应该怎么理解数据和算法之间的重要性?
A:高质量且规模化的数据非常重要,但形成真正的数据飞轮更有价值。这需要将数据、模型和场景深度绑定。智源研究院致力于研发高泛化性的、具备解决更复杂任务的模型。创业公司更多是解决具体的问题,比如让机器人做分拣、搬运、装配,它们离用户的真实订单、场景和需求更近。我们跟具身智能企业合作,希望与它们在不涉及用户隐私的基础上共享数据,用以迭代和优化我们的基座模型。企业专注解决“最后一公里”的落地问题,我们则为整个行业提供更坚实的技术底座。
Q:2025年具身智能创业火热,站在技术的角度,您对具身智能创业有什么建议?
A:创业公司应该聚焦真实的用户需求、真实的场景,把一个个场景打磨到稳定可用,真正做到机器人7×24小时或长时间工作不出意外。一些创业公司刚成立就想做“万能具身”,这种做法风险很高,因为目前技术路线还没有收敛,除非这家公司有很强的融资能力。作为研究院,智源坚持开源开放,吸引了众多合作伙伴,原因就在于我们为产业承担了前期探索的风险——我们做路径探索,做不确定性的事情,将训练出的基础模型分享给企业,让它们不用从0到1开始,可以基于我们的成果快速迭代。
Q:行业发展离不开人才,多家企业都表达了对人才的渴望,您认为具身智能领域的人才需要具备哪些特质?
A:具身智能是一个交叉领域,很多从业者都是从无人驾驶或传统机器人等行业转型或跨领域而来。我个人认为,具身智能还处在早期阶段,信念和共识是很重要的要素,从业者需要对这个方向的长期价值有深刻认同,能够坚持探索,不畏惧短期内的不确定性。另外是人才密度,因为这是一个需要软硬件结合、多学科融合的领域,单打独斗很难成功,只有密度足够高才有可能进行快速迭代。人才之外,资金和机制也很重要,高校、企业以及像智源这样的新型研发机构各有不同的使命,大家做好自己的事情,整个中国创新生态就建立起来了。
Q:当前具身智能产业发展中最大的确定性是什么?
A:最大的确定性是未来两三年机器人不会进入到消费级的家庭场景。这背后的逻辑非常清晰:具身智能产品要真正走向成熟,从“可用”进化到“好用”,必须经历一个关键的硬件迭代过程。只有当出货量达到一定规模,我们才能在真实应用中充分暴露和解决硬件层面存在的各种问题。
行业必须在真实需求催生的场景中实现规模化量产。这种由真实需求驱动的量产,不仅能帮助企业扩大规模,更重要的是能够形成一个可持续的“量产—反馈—迭代”的良性循环。这才是产业稳步向前的、最确定的道路。
北京商报记者 魏蔚