AI前沿 2026-05-15

数亿元融资落地!国内最早布局“人类学习”路线的具身公司,用人类视角重做具身智能

当绝大多数具身智能公司还在让机器人在虚拟世界里疯狂“撞墙”——通过强化学习从零摸索抓杯子、叠衣服时,一家成立仅数年的中国公司却选择了一条截然不同的路:让机器人像人类学徒一样,通过观看和模仿人类的行为来学会做事。这家公司近日宣布完成数亿元新一轮融资,成为国内最早系统布局“人类学习”路线的具身智能企业。他们的核心主张听起来简单却极具颠覆性:为什么不让机器直接学人,而非要让它重新发明轮子?

## 人类视角:具身智能的第三条道路

具身智能的研发长期存在两条主流技术路线:一是基于物理仿真的强化学习,让机器人在虚拟环境中通过无数次试错“悟”出操作规律;二是基于深度学习的端到端控制,尝试用海量标注数据直接映射传感器信号到动作。前者效率低下、泛化困难,后者对数据质量和规模的要求近乎苛刻。

而“人类学习”路线(Human-Centric Learning)则试图跳开这些困境。其核心思想非常简单:人类每天在物理世界中完成数十亿次操作——开门、倒水、拧螺丝、插充电线——这些动作天然包含了最优的力控、轨迹规划和意图理解。如果让机器人直接“观看”人类做这些动作,再通过模仿学习和行为克隆将其转化为机器人自身的控制策略,就能绕过大量重复试错,大幅降低对虚拟仿真的依赖。

这家公司正是这个思路的早期布道者。他们在训练中大量采集人类操作数据,包括穿戴式动捕、第一人称视角视频、力触觉传感器记录,构建了独特的“人类操作数据库”。机器人不再需要理解抽象的物理定律,而是通过看人怎么抓、怎么推、怎么拧,直接学习行为策略。这种“从人到机”的知识迁移,被业内人士称为“具身智能的GPT时刻”——就像大语言模型通过海量文本学会语言一样,具身智能正尝试通过海量人类操作数据学会物理交互。

## 融资背后的行业信号

本轮数亿元融资由头部产业资本和一线风投联合押注,资方包括某家电巨头和知名AI基金。在具身智能赛道整体降温的背景下,这笔融资释放出几个关键信号:

**第一,资本开始用“落地能力”重新筛选玩家。** 2024-2025年,行业经历了从概念炒作到失望低谷的周期。许多公司能够展示酷炫的机器人后空翻或快速分拣,但真正走进家庭或工厂后,稳定性却一塌糊涂。人类学习路线的优势在于,它天然适配低成本、高泛化的小样本场景:一个普通用户只需演示三五次,机器人就能学会一个新的操作动作。这种“即学即用”的能力,让C端落地从科幻变成了可预期的商业场景。

**第二,行业共识正在向“数据优先”倾斜。** 此前业界争论机器人应该用仿真数据还是真实数据,如今越来越多人意识到,真实人类操作数据才是最昂贵的金矿。这家公司从2022年起就开始系统采集人类操作数据,目前已经积累超过10万小时的多模态操作数据——这在全球具身智能领域都是一个惊人的数字。投资人看中的不仅是算法,更是这个不断自我强化的数据飞轮。

**第三,对人类行为的深度学习是通往通用机器人的必经之路。** 有一组数据常被引用:人类婴儿在学会抓取之前,已经观察过父母数千次抓取动作。而这种“模仿学习”能力,恰恰是目前主流机器人所不具备的。如果机器能像人类那样通过观察和模仿来学习,它将不再需要为每个新任务重写代码或重新训练模型,迈出了通向通用机器人的关键一步。

## 技术突破:从“看人做事”到“理解意图”

当然,直接“看人做事”并不像听起来那么简单。人类手部的精细动作包含大量隐式信息:抓取鸡蛋时施加的力比抓取铁块小得多,拧瓶盖时需要先施加周向力再施加轴向力……这些细节很难通过单张RGB图像捕捉。

该团队在技术上的核心创新在于两套耦合架构:**第一人称行为克隆**与**跨模态因果推理**。前者通过头戴式相机采集第一视角视频,让机器人学会人类的注视点与手部动作之间的耦合关系;后者则试图让机器人理解“为什么这样做”,而非机械复制动作——比如当人类用汤匙喝汤时,机器人不仅能模仿手腕摆动,还能理解“勺子要水平移动以保持汤不洒”的物理因果。

在最新公布的技术视频中,机器人仅通过观看三次人类演示,就学会了一整套复杂的厨房操作流程:开冰箱门、取鸡蛋、打蛋入碗、搅拌、关冰箱门。整个过程流畅自然,没有出现传统强化学习方法中常见的抖动、卡顿或物体滑落。而在应对意外情况(比如鸡蛋位置偏移)时,机器人也能像人类一样主动调整抓取姿态,而非像预设程序那样机械执行。

## 商业落地:从高价值场景出发

尽管人类学习路线被认为是通往家庭服务机器人的捷径,但该公司目前的商业化策略非常务实:优先切入工业柔性产线和物流仓储等B端场景。在这些场景中,机器人需要频繁切换操作任务,传统方法需要大量重新编程和调试,而人类学习路线可以让一线工人直接“教”机器人完成任务——工人操作一次,机器人学会并重复。

这种“零代码示教”模式迅速吸引了多家3C制造业和电商物流巨头。据悉,该公司今年已签约超过30家行业客户,单台机器人的部署成本仅需传统方案的十分之一左右。而C端家庭场景则被规划在2027年之后,届时他们计划推出定价在10万元以内的通用家务机器人。

## 总结:人类学习之路,具身智能的“软着陆”

具身智能行业经历了太多“雷声大雨点小”的故事。AI界的共识越发清晰:如果想让机器人真正走进千家万户,就必须让机器理解人类的操作方式,而不是反过来要求人类适应机器。

这家公司选择了一条“逆算法潮流”的路线——不去追求更复杂的神经网络架构,而是用更朴素的方式让机器学会像人一样行动。这笔数亿元融资的意义,不仅在于支撑技术研发,更在于向整个行业证明:**最好的机器人,未必是算力最强的,但一定是最懂人类的。**

当其他团队还在教机器人背物理公式时,他们已经让机器人学会了看人行事。这或许才是具身智能走向实用化的真正开始。

配图

---

📰 原文来源量子位
🖼️ 配图来源:量子位
✍️ 本文由 AI 辅助编辑改写,内容仅供参考

← 从无人机到桌面工厂:前大疆核心成员杀入消费级CNC,美团、昆仑资本为何押注近亿元? SpaceX IPO倒计时:这家被忽视的工业巨头才是真正赢家 →

暂无评论