
在刚刚落幕的第八届虹桥国际经济论坛上,一个关于机器人未来发展方向的讨论,将公众的目光引向了“具身智能”的广阔前景。宇树科技创始人兼CEO王兴兴在“人形机器人创新发展合作”分论坛上的分享,无疑为这场讨论注入了一剂冷静的思考。他直言不讳地指出,当前机器人大模型的发展,虽然方向正确,但距离真正实现“ChatGPT时刻”还有一段不短的路要走,大致相当于ChatGPT问世前一到三年的阶段。
王兴兴的这番话,并非对现有技术进展的否定,而是对未来挑战的清醒认知。他肯定了过去两年生成式AI在语言和视觉领域取得的瞩目成就,认为这为机器人智能化奠定了重要基础。然而,将这份智能真正“落地”到物理世界,赋予机器人“具身智能”,则是一个更为复杂且系统性的工程。这不仅仅是模仿人类的对话能力,更是要让机器人能够像人一样,在真实环境中感知世界、控制身体、理解指令,并独立完成任务。
那么,这个被誉为机器人领域的“ChatGPT时刻”,究竟意味着什么?王兴兴给出了一个颇具操作性的标准:当一个机器人,在陌生的生活场景下,仅凭简单的语音或文字指令,就能自主完成大约80%的任务时,才算真正意义上的突破。这个标准背后,隐藏着巨大的技术鸿沟。它要求机器人不仅拥有强大的大模型推理和生成能力,更需要具备对物理世界的深刻建模能力,能够理解环境的细微变化,并建立起高效的数据反馈和实时学习机制。简单来说,就是机器人需要“活”在真实世界里,并能不断地从与世界的互动中学习和成长。
从这个角度看,当前机器人大模型的发展,虽然已找到正确的航向,但距离抵达彼岸的临界点,依然存在着不容忽视的差距。这需要技术从业者们在感知技术、运动控制、人机交互理解等多个维度上,持续进行突破性的创新。这是一场硬仗,需要耐心、投入和持续的研发。
总而言之,尽管人形机器人和具身智能的未来充满想象空间,但我们必须认识到,当前阶段的发展仍处于相对早期的探索阶段。未来的突破,将不仅仅依赖于模型的规模和算力的提升,更需要跨学科的融合与系统性的创新。这场关于“具身智能”的征程,或许比我们想象的更为漫长,但方向已定,前行的脚步也不会停止。