《全球具身数据市场白皮书》
- 分类
- 白皮书
- 格式
- 发布时间
- 下载次数
- 34 次
简介
由艺恩数据发布,首次系统性地定义和梳理了“具身数据”这一新兴市场。报告指出,当AI从数字世界走向物理世界,真实交互数据成为决定具身智能上限的稀缺生产要素。与文本数据(公开语料趋于枯竭)不同,具身数据无法从互联网直接获取,须通过采集、仿真、蒸馏等方式生成。
一、报告概述
本白皮书由艺恩数据发布,首次系统性地定义和梳理了“具身数据”这一新兴市场。报告指出,当AI从数字世界走向物理世界,真实交互数据成为决定具身智能上限的稀缺生产要素。与文本数据(公开语料趋于枯竭)不同,具身数据无法从互联网直接获取,须通过采集、仿真、蒸馏等方式生成。报告提出了五个核心判断:数据稀缺(具身vs文本差距约20,000倍)、四范式并行(真机遥操/便携采集/仿真合成/视频蒸馏)、中美双轨(美国大额股权融资领先,中国整机量产与场景落地领先)、价值链上移(数据层毛利显著高于本体硬件)、大厂入场(NVIDIA、特斯拉、京东等构筑数据飞轮)。报告进一步梳理了四范式对应的18家具身数据公司、中美头部估值梯队、数据价值链六环节,并展望了商业化场景与规模化路径。最后,报告提出了“数据资产化”将成为产业核心驱动力的判断。
二、整体解读
1. 核心命题:数据是具身智能的“卖铲人”
报告开篇即给出一个关键量化对比:具身数据与文本数据的可用量级差距约为20,000倍。这一差距源于具身数据的根本性特征——无法从互联网直接获取。与LLM可以爬取海量公开文本不同,具身智能需要的是“真实世界交互数据”:机器人拿起一个杯子、行走一步、避让一个障碍物——这些动作-物理反馈的配对数据,无法从现有语料库中提取。
报告因此提出2026年=具身数据规模化元年的判断。当本体硬件(人形机器人)的产业化进入加速期后,数据供给成为制约行业发展的核心卡点——谁掌握了高质量、大规模、合规的具身数据,谁就掌握了具身智能的“生产资料”。
2. 三口径市场规模:产业边界不同,不可直接相加
报告谨慎地指出,高盛($38B/2035,仅本体)、摩根士丹利($5T/2040,含供应链/服务)、花旗($7T/2050,含非人形AI机器人)三家机构对“具身/人形机器人产业”的定义口径完全不同,不可横向相加。中国市场方面,IDC预测2030年用户支出$77B(CAGR 94%),中金预测2030年本体销售581亿元。
这一对比暗示了一个重要判断:本体硬件市场规模远小于包含数据、服务、应用的完整TAM。数据层作为上游价值链,其潜在价值可能被低估。
3. 五个核心判断:2026年具身数据市场的结构性特征
报告提炼了五个不可逆的趋势性判断:
| 判断 | 核心内涵 |
|---|---|
| 数据稀缺 | 具身vs文本差距约20,000倍,真实数据成产业卡点 |
| 范式分化 | 四范式(真机遥操/便携采集/仿真合成/视频蒸馏)并行,各有适用场景 |
| 中美双轨 | 美国大额股权融资领先(Figure $39B),中国整机量产领先(宇树5500+台) |
| 价值链上移 | 数据层位居上游,毛利60-70%,显著高于本体硬件 |
| 大厂入场 | NVIDIA、特斯拉、京东等以“数据飞轮”构筑竞争壁垒 |
4. 具身智能的四元拆解与数据金字塔
报告提出了一个清晰的四元拆解框架:
左脑(语言/规划):由DeepSeek等通用大模型驱动
右脑(视觉感知):环境理解与空间建模
小脑(运动控制):步态、抓取、平衡
身体(本体):硬件执行机构
在此基础上,报告构建了具身数据四层金字塔,自上而下保真度递减、规模递增:
| 层级 | 范式 | 特征 | 成本量级 |
|---|---|---|---|
| 塔尖 | 真机遥操 | VR/动捕操控真机,动作-本体天然对齐 | 最高(完整设备超20万元) |
| 第二层 | 便携采集 | 可穿戴/数据手套,降本约10倍 | 中 |
| 第三层 | 仿真合成 | 物理引擎+生成式,覆盖长尾场景 | 真机的约1/100 |
| 底座 | 视频蒸馏 | 互联网/第一人称视频,近零成本 | 近零 |
训练范式:以底层海量数据预训练、用顶层稀缺真机数据精调,是当前主流的“数据金字塔”配比逻辑。
5. 四范式的护城河对比
| 范式 | 优势 | 劣势 |
|---|---|---|
| 真机遥操 | 保真度最高,动作-本体天然对齐 | 规模化最难,设备成本高 |
| 便携采集 | 保真与成本的平衡点,降本约10倍 | 仍需人工穿戴,规模化仍有限 |
| 仿真合成 | 规模与成本最优,覆盖长尾场景 | 保真度与真实物理存在“Sim2Real鸿沟” |
| 视频蒸馏 | 成本最低,海量供给 | grounding难,缺乏动作标签 |
报告特别指出,仿真合成是当前最受资本青睐的范式(光轮智能成为全球首个具身数据独角兽,累计融资10亿元),因其兼具规模效应与成本优势,且可独立估值、可规模化。
6. 四范式下的具身数据公司全景
报告梳理了18家具身数据公司,按范式归类:
①真机遥操:
帕西尼感知:触觉传感+采集工厂,B轮超10亿元,估值破百亿
诺亦腾:动捕全球份额超50%,与智元数据工厂合作
②便携采集:
它石智航:SenseHub·AWE3.0,Pre-A轮$4.55亿,估值约130亿元
灵初智能:62+自由度触觉手套,累计10万小时数据,融资超20亿元
③仿真合成:
光轮智能(全球首个具身数据独角兽):SimReady+RoboFinals,累计融资10亿元,客户含NVIDIA、Figure、1X、字节、智元、银河,2025年营收10倍增长
群核科技:SpatialVerse·空间智能,已上市(00068.HK)
跨维智能:DexVerse·3D VLA,A1+A2轮数亿元
④视频蒸馏:
枢途科技:互联网RGB视频→训练数据,天使+数千万元
深度机智:第一人称数据+双脑,新一轮进行中
跨界/世界模型:
World Labs(美国):空间智能/世界模型,估值约$50亿
极佳视界GigaAI(中国):世界模型/物理AI,Pre-B轮10亿元
LiberAI将闲(中国):人类视频/UMI预训练,数亿元
7. 中美头部估值梯队对比
美国市场(以股权融资领先,单体估值更高):
Figure AI:$39B(整机+Helix)
Skild AI:$14B(具身大脑)
Physical Intelligence:$5.6B(VLA基础模型)
World Labs:~$5B(世界模型)
1X Technologies:~$10B(整机NEO)
Agility Robotics:~$2.1B(整机Digit)
中国市场(整机公司密集突破百亿元,量产与场景落地领先):
宇树科技:IPO上会,募42亿元(整机)
银河通用:估值210亿元(整机+仿真)
星海图:估值超200亿元(整机+VLA)
智元机器人:估值约150亿元(整机+GO-1)
帕西尼感知:估值破百亿(触觉+整机)
核心差异:美国以大额股权融资催生高估值独角兽,技术原创性强;中国以整机量产与场景落地领先,工程化速度快、成本控制优。
8. 中美数据策略对比
| 维度 | 美国 | 中国 |
|---|---|---|
| 数据来源 | 通用数据巨头(Scale)+大厂自采 | 遥操工厂+便携采集+仿真+视频蒸馏并行 |
| 核心打法 | 闭源飞轮:自采数据+基础模型一体 | 开放+专业化:独立数据公司分工协作 |
| 代表玩家 | Tesla、Figure、NVIDIA、Scale | 光轮、它石、帕西尼、智元数据工厂 |
| 成本优势 | 算力与人才密集 | 工程化快、采集成本低、场景丰富 |
| 合规环境 | 版权诉讼频发,数据获取趋严 | 数据要素政策+国资入场支持 |
报告认为,中国“开放+专业化分工”的模式更易形成数据交易市场,而美国的“闭源飞轮”模式有利于构筑技术壁垒,两者各有优劣。
9. 价值链与商业模式
报告勾勒了从采集→清洗→标注→合成→资产化→应用的六环节价值链,并指出:资产化环节毛利最高(60-70%),显著高于本体硬件的薄利区间。
商业模式三类变现路径:
数据集授权:一次性出售高质量数据集
DaaS订阅:持续数据流服务
评测基准服务:如光轮的RoboFinals开放评测基准
开放生态 vs 封闭飞轮:
开放生态:NVIDIA GROOT/Cosmos开源、智元Agibot World百万真机数据集、HuggingFace LeRobot、光轮RoboFinals——降低入门门槛,构建行业“公共底座”
封闭飞轮:Tesla Optimus、Boston Dynamics Atlas、Figure Helix——不外售数据,构筑竞争壁垒
10. 商业化场景:从试点到规模化
报告区分了已商业化与试点中两个阶段:
已商业化/最早盈利:
医疗康复:Wandercraft(FDA通过)、傅利叶(覆盖40+国,年营收超200亿)
物流仓储:Agility Digit在GXO、京东自营、Amazon(年营收30-50亿)
工业制造:Figure在BMW、银河在宁德时代、特斯拉自用(年营收50-80亿)
商业服务:银河便利店100+门店、智慧药店、餐饮(年营收50-80亿)
试点中/早期探索:
家庭服务:1X NEO、Figure 03、星动STAR(最大想象空间,年营收超1000亿+)
特殊场景:矿山巡检、应急救援、农业、国防、手术辅助(年营收10-20亿)
规模化时间轴:从近及远——工业制造/物流仓储(当前)→商业服务(1-2年)→医疗康复(2-3年)→家庭服务(3-5年)→特殊场景(5-10年)
11. 风险与展望
风险:
估值领先于商业化:多数出货流向科研/数采/展示,UBS警示泡沫风险
数据合规与版权:跨境数据管制、第一人称隐私、版权清洁待规范
Sim2Real鸿沟:仿真保真度与真实物理差距仍是核心挑战
标准缺位:具身数据采集/标注/评测标准尚在建设中
展望:
2026=数据规模化元年:真机+仿真+视频混合数据爆发
数据资产化加速:DaaS订阅+数据交易
世界模型崛起:World Model成为数据生成新引擎
中国机遇:场景丰富+工程化快+政策支持
三、总结评价
这是一份定义清晰、框架完整、数据扎实、判断前瞻的具身数据市场首份系统性白皮书。其核心价值在于:
首次系统定义“具身数据”市场边界:将具身数据从“AI数据”大范畴中独立出来,明确定义其稀缺性(20,000倍差距)、获取方式(采集/仿真/蒸馏)、价值链位置(上游高毛利),为产业研究和投资提供了清晰的分析框架。
四范式分层框架的原创性与实用性:真机遥操、便携采集、仿真合成、视频蒸馏的划分,不仅对应了技术路线,还与成本量级、保真度、规模化潜力直接挂钩,是企业选择数据策略时的实用工具。
“数据金字塔”训练范式的行业共识提炼:以底层海量数据预训练、顶层稀缺真机数据精调,已成为行业主流实践。报告对这一范式的提炼,有助于理解不同数据公司的战略定位。
18家数据公司的全景图谱:首次按范式归类梳理全球具身数据公司,包括融资额、核心产品、客户名单等关键信息,是产业研究者和投资者的重要参考资料。
中美双轨对比的深度洞察:不仅比较估值,更深入到“闭源飞轮vs开放生态”“大厂自建vs专业化分工”“合规环境差异”等结构性差异,具有战略指导意义。
商业化场景的量级测算:对医疗康复、物流仓储、工业制造、商业服务、家庭服务等场景给出了量化的年营收估算(30-50亿、50-80亿、1000亿+),为市场空间判断提供了依据。
风险提示的诚实态度:明确指出“估值领先于商业化”“Sim2Real鸿沟”“标准缺位”等问题,避免了过度乐观的叙事陷阱。
适用读者:具身智能/人形机器人企业战略决策者、AI数据基础设施创业者、投资机构(尤其关注具身赛道的一级市场投资人)、政策制定者、以及所有关注“AI如何从数字世界走向物理世界”的从业者。
核心金句:“数据,是具身智能的卖铲人。”“当AI从数字世界走向物理世界,真实交互数据成为决定具身智能上限的稀缺生产要素。”“2026年=具身数据规模化元年。”“价值链上移,数据层毛利显著高于本体硬件。”