《全球具身数据市场白皮书》

《全球具身数据市场白皮书》

分类
白皮书
格式
PDF
发布时间
下载次数
34

简介

由艺恩数据发布,首次系统性地定义和梳理了“具身数据”这一新兴市场。报告指出,当AI从数字世界走向物理世界,真实交互数据成为决定具身智能上限的稀缺生产要素。与文本数据(公开语料趋于枯竭)不同,具身数据无法从互联网直接获取,须通过采集、仿真、蒸馏等方式生成。

一、报告概述

本白皮书由艺恩数据发布,首次系统性地定义和梳理了“具身数据”这一新兴市场。报告指出,当AI从数字世界走向物理世界,真实交互数据成为决定具身智能上限的稀缺生产要素。与文本数据(公开语料趋于枯竭)不同,具身数据无法从互联网直接获取,须通过采集、仿真、蒸馏等方式生成。报告提出了五个核心判断:数据稀缺(具身vs文本差距约20,000倍)、四范式并行(真机遥操/便携采集/仿真合成/视频蒸馏)、中美双轨(美国大额股权融资领先,中国整机量产与场景落地领先)、价值链上移(数据层毛利显著高于本体硬件)、大厂入场(NVIDIA、特斯拉、京东等构筑数据飞轮)。报告进一步梳理了四范式对应的18家具身数据公司、中美头部估值梯队、数据价值链六环节,并展望了商业化场景与规模化路径。最后,报告提出了“数据资产化”将成为产业核心驱动力的判断。


二、整体解读

1. 核心命题:数据是具身智能的“卖铲人”

报告开篇即给出一个关键量化对比:具身数据与文本数据的可用量级差距约为20,000倍。这一差距源于具身数据的根本性特征——无法从互联网直接获取。与LLM可以爬取海量公开文本不同,具身智能需要的是“真实世界交互数据”:机器人拿起一个杯子、行走一步、避让一个障碍物——这些动作-物理反馈的配对数据,无法从现有语料库中提取。

报告因此提出2026年=具身数据规模化元年的判断。当本体硬件(人形机器人)的产业化进入加速期后,数据供给成为制约行业发展的核心卡点——谁掌握了高质量、大规模、合规的具身数据,谁就掌握了具身智能的“生产资料”。

2. 三口径市场规模:产业边界不同,不可直接相加

报告谨慎地指出,高盛($38B/2035,仅本体)、摩根士丹利($5T/2040,含供应链/服务)、花旗($7T/2050,含非人形AI机器人)三家机构对“具身/人形机器人产业”的定义口径完全不同,不可横向相加。中国市场方面,IDC预测2030年用户支出$77B(CAGR 94%),中金预测2030年本体销售581亿元。

这一对比暗示了一个重要判断:本体硬件市场规模远小于包含数据、服务、应用的完整TAM。数据层作为上游价值链,其潜在价值可能被低估。

3. 五个核心判断:2026年具身数据市场的结构性特征

报告提炼了五个不可逆的趋势性判断:

 
 
判断核心内涵
数据稀缺具身vs文本差距约20,000倍,真实数据成产业卡点
范式分化四范式(真机遥操/便携采集/仿真合成/视频蒸馏)并行,各有适用场景
中美双轨美国大额股权融资领先(Figure $39B),中国整机量产领先(宇树5500+台)
价值链上移数据层位居上游,毛利60-70%,显著高于本体硬件
大厂入场NVIDIA、特斯拉、京东等以“数据飞轮”构筑竞争壁垒

4. 具身智能的四元拆解与数据金字塔

报告提出了一个清晰的四元拆解框架

  • 左脑(语言/规划):由DeepSeek等通用大模型驱动

  • 右脑(视觉感知):环境理解与空间建模

  • 小脑(运动控制):步态、抓取、平衡

  • 身体(本体):硬件执行机构

在此基础上,报告构建了具身数据四层金字塔,自上而下保真度递减、规模递增:

 
 
层级范式特征成本量级
塔尖真机遥操VR/动捕操控真机,动作-本体天然对齐最高(完整设备超20万元)
第二层便携采集可穿戴/数据手套,降本约10倍
第三层仿真合成物理引擎+生成式,覆盖长尾场景真机的约1/100
底座视频蒸馏互联网/第一人称视频,近零成本近零

训练范式:以底层海量数据预训练、用顶层稀缺真机数据精调,是当前主流的“数据金字塔”配比逻辑。

5. 四范式的护城河对比

 
 
范式优势劣势
真机遥操保真度最高,动作-本体天然对齐规模化最难,设备成本高
便携采集保真与成本的平衡点,降本约10倍仍需人工穿戴,规模化仍有限
仿真合成规模与成本最优,覆盖长尾场景保真度与真实物理存在“Sim2Real鸿沟”
视频蒸馏成本最低,海量供给grounding难,缺乏动作标签

报告特别指出,仿真合成是当前最受资本青睐的范式(光轮智能成为全球首个具身数据独角兽,累计融资10亿元),因其兼具规模效应与成本优势,且可独立估值、可规模化。

6. 四范式下的具身数据公司全景

报告梳理了18家具身数据公司,按范式归类:

①真机遥操

  • 帕西尼感知:触觉传感+采集工厂,B轮超10亿元,估值破百亿

  • 诺亦腾:动捕全球份额超50%,与智元数据工厂合作

②便携采集

  • 它石智航:SenseHub·AWE3.0,Pre-A轮$4.55亿,估值约130亿元

  • 灵初智能:62+自由度触觉手套,累计10万小时数据,融资超20亿元

③仿真合成

  • 光轮智能(全球首个具身数据独角兽):SimReady+RoboFinals,累计融资10亿元,客户含NVIDIA、Figure、1X、字节、智元、银河,2025年营收10倍增长

  • 群核科技:SpatialVerse·空间智能,已上市(00068.HK

  • 跨维智能:DexVerse·3D VLA,A1+A2轮数亿元

④视频蒸馏

  • 枢途科技:互联网RGB视频→训练数据,天使+数千万元

  • 深度机智:第一人称数据+双脑,新一轮进行中

跨界/世界模型

  • World Labs(美国):空间智能/世界模型,估值约$50亿

  • 极佳视界GigaAI(中国):世界模型/物理AI,Pre-B轮10亿元

  • LiberAI将闲(中国):人类视频/UMI预训练,数亿元

7. 中美头部估值梯队对比

美国市场(以股权融资领先,单体估值更高):

  • Figure AI:$39B(整机+Helix)

  • Skild AI:$14B(具身大脑)

  • Physical Intelligence:$5.6B(VLA基础模型)

  • World Labs:~$5B(世界模型)

  • 1X Technologies:~$10B(整机NEO)

  • Agility Robotics:~$2.1B(整机Digit)

中国市场(整机公司密集突破百亿元,量产与场景落地领先):

  • 宇树科技:IPO上会,募42亿元(整机)

  • 银河通用:估值210亿元(整机+仿真)

  • 星海图:估值超200亿元(整机+VLA)

  • 智元机器人:估值约150亿元(整机+GO-1)

  • 帕西尼感知:估值破百亿(触觉+整机)

核心差异:美国以大额股权融资催生高估值独角兽,技术原创性强;中国以整机量产与场景落地领先,工程化速度快、成本控制优。

8. 中美数据策略对比

 
 
维度美国中国
数据来源通用数据巨头(Scale)+大厂自采遥操工厂+便携采集+仿真+视频蒸馏并行
核心打法闭源飞轮:自采数据+基础模型一体开放+专业化:独立数据公司分工协作
代表玩家Tesla、Figure、NVIDIA、Scale光轮、它石、帕西尼、智元数据工厂
成本优势算力与人才密集工程化快、采集成本低、场景丰富
合规环境版权诉讼频发,数据获取趋严数据要素政策+国资入场支持

报告认为,中国“开放+专业化分工”的模式更易形成数据交易市场,而美国的“闭源飞轮”模式有利于构筑技术壁垒,两者各有优劣。

9. 价值链与商业模式

报告勾勒了从采集→清洗→标注→合成→资产化→应用的六环节价值链,并指出:资产化环节毛利最高(60-70%),显著高于本体硬件的薄利区间。

商业模式三类变现路径:

  • 数据集授权:一次性出售高质量数据集

  • DaaS订阅:持续数据流服务

  • 评测基准服务:如光轮的RoboFinals开放评测基准

开放生态 vs 封闭飞轮

  • 开放生态:NVIDIA GROOT/Cosmos开源、智元Agibot World百万真机数据集、HuggingFace LeRobot、光轮RoboFinals——降低入门门槛,构建行业“公共底座”

  • 封闭飞轮:Tesla Optimus、Boston Dynamics Atlas、Figure Helix——不外售数据,构筑竞争壁垒

10. 商业化场景:从试点到规模化

报告区分了已商业化试点中两个阶段:

已商业化/最早盈利

  • 医疗康复:Wandercraft(FDA通过)、傅利叶(覆盖40+国,年营收超200亿)

  • 物流仓储:Agility Digit在GXO、京东自营、Amazon(年营收30-50亿)

  • 工业制造:Figure在BMW、银河在宁德时代、特斯拉自用(年营收50-80亿)

  • 商业服务:银河便利店100+门店、智慧药店、餐饮(年营收50-80亿)

试点中/早期探索

  • 家庭服务:1X NEO、Figure 03、星动STAR(最大想象空间,年营收超1000亿+)

  • 特殊场景:矿山巡检、应急救援、农业、国防、手术辅助(年营收10-20亿)

规模化时间轴:从近及远——工业制造/物流仓储(当前)→商业服务(1-2年)→医疗康复(2-3年)→家庭服务(3-5年)→特殊场景(5-10年)

11. 风险与展望

风险

  • 估值领先于商业化:多数出货流向科研/数采/展示,UBS警示泡沫风险

  • 数据合规与版权:跨境数据管制、第一人称隐私、版权清洁待规范

  • Sim2Real鸿沟:仿真保真度与真实物理差距仍是核心挑战

  • 标准缺位:具身数据采集/标注/评测标准尚在建设中

展望

  • 2026=数据规模化元年:真机+仿真+视频混合数据爆发

  • 数据资产化加速:DaaS订阅+数据交易

  • 世界模型崛起:World Model成为数据生成新引擎

  • 中国机遇:场景丰富+工程化快+政策支持


三、总结评价

这是一份定义清晰、框架完整、数据扎实、判断前瞻的具身数据市场首份系统性白皮书。其核心价值在于:

  1. 首次系统定义“具身数据”市场边界:将具身数据从“AI数据”大范畴中独立出来,明确定义其稀缺性(20,000倍差距)、获取方式(采集/仿真/蒸馏)、价值链位置(上游高毛利),为产业研究和投资提供了清晰的分析框架。

  2. 四范式分层框架的原创性与实用性:真机遥操、便携采集、仿真合成、视频蒸馏的划分,不仅对应了技术路线,还与成本量级、保真度、规模化潜力直接挂钩,是企业选择数据策略时的实用工具。

  3. “数据金字塔”训练范式的行业共识提炼:以底层海量数据预训练、顶层稀缺真机数据精调,已成为行业主流实践。报告对这一范式的提炼,有助于理解不同数据公司的战略定位。

  4. 18家数据公司的全景图谱:首次按范式归类梳理全球具身数据公司,包括融资额、核心产品、客户名单等关键信息,是产业研究者和投资者的重要参考资料。

  5. 中美双轨对比的深度洞察:不仅比较估值,更深入到“闭源飞轮vs开放生态”“大厂自建vs专业化分工”“合规环境差异”等结构性差异,具有战略指导意义。

  6. 商业化场景的量级测算:对医疗康复、物流仓储、工业制造、商业服务、家庭服务等场景给出了量化的年营收估算(30-50亿、50-80亿、1000亿+),为市场空间判断提供了依据。

  7. 风险提示的诚实态度:明确指出“估值领先于商业化”“Sim2Real鸿沟”“标准缺位”等问题,避免了过度乐观的叙事陷阱。

适用读者:具身智能/人形机器人企业战略决策者、AI数据基础设施创业者、投资机构(尤其关注具身赛道的一级市场投资人)、政策制定者、以及所有关注“AI如何从数字世界走向物理世界”的从业者。

核心金句:“数据,是具身智能的卖铲人。”“当AI从数字世界走向物理世界,真实交互数据成为决定具身智能上限的稀缺生产要素。”“2026年=具身数据规模化元年。”“价值链上移,数据层毛利显著高于本体硬件。”