《全球具身数据市场白皮书》

分类: 白皮书
格式: PDF
发布时间: 2026-06-10
下载次数: 34 次

简介

由艺恩数据发布，首次系统性地定义和梳理了“具身数据”这一新兴市场。报告指出，当AI从数字世界走向物理世界，真实交互数据成为决定具身智能上限的稀缺生产要素。与文本数据（公开语料趋于枯竭）不同，具身数据无法从互联网直接获取，须通过采集、仿真、蒸馏等方式生成。

一、报告概述

本白皮书由艺恩数据发布，首次系统性地定义和梳理了“具身数据”这一新兴市场。报告指出，当AI从数字世界走向物理世界，真实交互数据成为决定具身智能上限的稀缺生产要素。与文本数据（公开语料趋于枯竭）不同，具身数据无法从互联网直接获取，须通过采集、仿真、蒸馏等方式生成。报告提出了五个核心判断：数据稀缺（具身vs文本差距约20,000倍）、四范式并行（真机遥操/便携采集/仿真合成/视频蒸馏）、中美双轨（美国大额股权融资领先，中国整机量产与场景落地领先）、价值链上移（数据层毛利显著高于本体硬件）、大厂入场（NVIDIA、特斯拉、京东等构筑数据飞轮）。报告进一步梳理了四范式对应的18家具身数据公司、中美头部估值梯队、数据价值链六环节，并展望了商业化场景与规模化路径。最后，报告提出了“数据资产化”将成为产业核心驱动力的判断。

二、整体解读

1. 核心命题：数据是具身智能的“卖铲人”

报告开篇即给出一个关键量化对比：具身数据与文本数据的可用量级差距约为20,000倍。这一差距源于具身数据的根本性特征——无法从互联网直接获取。与LLM可以爬取海量公开文本不同，具身智能需要的是“真实世界交互数据”：机器人拿起一个杯子、行走一步、避让一个障碍物——这些动作-物理反馈的配对数据，无法从现有语料库中提取。

报告因此提出2026年=具身数据规模化元年的判断。当本体硬件（人形机器人）的产业化进入加速期后，数据供给成为制约行业发展的核心卡点——谁掌握了高质量、大规模、合规的具身数据，谁就掌握了具身智能的“生产资料”。

2. 三口径市场规模：产业边界不同，不可直接相加

报告谨慎地指出，高盛（$38B/2035，仅本体）、摩根士丹利（$5T/2040，含供应链/服务）、花旗（$7T/2050，含非人形AI机器人）三家机构对“具身/人形机器人产业”的定义口径完全不同，不可横向相加。中国市场方面，IDC预测2030年用户支出$77B（CAGR 94%），中金预测2030年本体销售581亿元。

这一对比暗示了一个重要判断：本体硬件市场规模远小于包含数据、服务、应用的完整TAM。数据层作为上游价值链，其潜在价值可能被低估。

3. 五个核心判断：2026年具身数据市场的结构性特征

报告提炼了五个不可逆的趋势性判断：

判断	核心内涵
数据稀缺	具身vs文本差距约20,000倍，真实数据成产业卡点
范式分化	四范式（真机遥操/便携采集/仿真合成/视频蒸馏）并行，各有适用场景
中美双轨	美国大额股权融资领先（Figure $39B），中国整机量产领先（宇树5500+台）
价值链上移	数据层位居上游，毛利60-70%，显著高于本体硬件
大厂入场	NVIDIA、特斯拉、京东等以“数据飞轮”构筑竞争壁垒

4. 具身智能的四元拆解与数据金字塔

报告提出了一个清晰的四元拆解框架：

左脑（语言/规划）：由DeepSeek等通用大模型驱动
右脑（视觉感知）：环境理解与空间建模
小脑（运动控制）：步态、抓取、平衡
身体（本体）：硬件执行机构

在此基础上，报告构建了具身数据四层金字塔，自上而下保真度递减、规模递增：

层级	范式	特征	成本量级
塔尖	真机遥操	VR/动捕操控真机，动作-本体天然对齐	最高（完整设备超20万元）
第二层	便携采集	可穿戴/数据手套，降本约10倍	中
第三层	仿真合成	物理引擎+生成式，覆盖长尾场景	真机的约1/100
底座	视频蒸馏	互联网/第一人称视频，近零成本	近零

训练范式：以底层海量数据预训练、用顶层稀缺真机数据精调，是当前主流的“数据金字塔”配比逻辑。

5. 四范式的护城河对比

范式	优势	劣势
真机遥操	保真度最高，动作-本体天然对齐	规模化最难，设备成本高
便携采集	保真与成本的平衡点，降本约10倍	仍需人工穿戴，规模化仍有限
仿真合成	规模与成本最优，覆盖长尾场景	保真度与真实物理存在“Sim2Real鸿沟”
视频蒸馏	成本最低，海量供给	grounding难，缺乏动作标签

报告特别指出，仿真合成是当前最受资本青睐的范式（光轮智能成为全球首个具身数据独角兽，累计融资10亿元），因其兼具规模效应与成本优势，且可独立估值、可规模化。

6. 四范式下的具身数据公司全景

报告梳理了18家具身数据公司，按范式归类：

①真机遥操：

帕西尼感知：触觉传感+采集工厂，B轮超10亿元，估值破百亿
诺亦腾：动捕全球份额超50%，与智元数据工厂合作

②便携采集：

它石智航：SenseHub·AWE3.0，Pre-A轮$4.55亿，估值约130亿元
灵初智能：62+自由度触觉手套，累计10万小时数据，融资超20亿元

③仿真合成：

光轮智能（全球首个具身数据独角兽）：SimReady+RoboFinals，累计融资10亿元，客户含NVIDIA、Figure、1X、字节、智元、银河，2025年营收10倍增长
群核科技：SpatialVerse·空间智能，已上市（00068.HK）
跨维智能：DexVerse·3D VLA，A1+A2轮数亿元

④视频蒸馏：

枢途科技：互联网RGB视频→训练数据，天使+数千万元
深度机智：第一人称数据+双脑，新一轮进行中

跨界/世界模型：

World Labs（美国）：空间智能/世界模型，估值约$50亿
极佳视界GigaAI（中国）：世界模型/物理AI，Pre-B轮10亿元
LiberAI将闲（中国）：人类视频/UMI预训练，数亿元

7. 中美头部估值梯队对比

美国市场（以股权融资领先，单体估值更高）：

Figure AI：$39B（整机+Helix）
Skild AI：$14B（具身大脑）
Physical Intelligence：$5.6B（VLA基础模型）
World Labs：~$5B（世界模型）
1X Technologies：~$10B（整机NEO）
Agility Robotics：~$2.1B（整机Digit）

中国市场（整机公司密集突破百亿元，量产与场景落地领先）：

宇树科技：IPO上会，募42亿元（整机）
银河通用：估值210亿元（整机+仿真）
星海图：估值超200亿元（整机+VLA）
智元机器人：估值约150亿元（整机+GO-1）
帕西尼感知：估值破百亿（触觉+整机）

核心差异：美国以大额股权融资催生高估值独角兽，技术原创性强；中国以整机量产与场景落地领先，工程化速度快、成本控制优。

8. 中美数据策略对比

维度	美国	中国
数据来源	通用数据巨头(Scale)+大厂自采	遥操工厂+便携采集+仿真+视频蒸馏并行
核心打法	闭源飞轮：自采数据+基础模型一体	开放+专业化：独立数据公司分工协作
代表玩家	Tesla、Figure、NVIDIA、Scale	光轮、它石、帕西尼、智元数据工厂
成本优势	算力与人才密集	工程化快、采集成本低、场景丰富
合规环境	版权诉讼频发，数据获取趋严	数据要素政策+国资入场支持

报告认为，中国“开放+专业化分工”的模式更易形成数据交易市场，而美国的“闭源飞轮”模式有利于构筑技术壁垒，两者各有优劣。

9. 价值链与商业模式

报告勾勒了从采集→清洗→标注→合成→资产化→应用的六环节价值链，并指出：资产化环节毛利最高（60-70%），显著高于本体硬件的薄利区间。

商业模式三类变现路径：

数据集授权：一次性出售高质量数据集
DaaS订阅：持续数据流服务
评测基准服务：如光轮的RoboFinals开放评测基准

开放生态 vs 封闭飞轮：

开放生态：NVIDIA GROOT/Cosmos开源、智元Agibot World百万真机数据集、HuggingFace LeRobot、光轮RoboFinals——降低入门门槛，构建行业“公共底座”
封闭飞轮：Tesla Optimus、Boston Dynamics Atlas、Figure Helix——不外售数据，构筑竞争壁垒

10. 商业化场景：从试点到规模化

报告区分了已商业化与试点中两个阶段：

已商业化/最早盈利：

医疗康复：Wandercraft（FDA通过）、傅利叶（覆盖40+国，年营收超200亿）
物流仓储：Agility Digit在GXO、京东自营、Amazon（年营收30-50亿）
工业制造：Figure在BMW、银河在宁德时代、特斯拉自用（年营收50-80亿）
商业服务：银河便利店100+门店、智慧药店、餐饮（年营收50-80亿）

试点中/早期探索：

家庭服务：1X NEO、Figure 03、星动STAR（最大想象空间，年营收超1000亿+）
特殊场景：矿山巡检、应急救援、农业、国防、手术辅助（年营收10-20亿）

规模化时间轴：从近及远——工业制造/物流仓储（当前）→商业服务（1-2年）→医疗康复（2-3年）→家庭服务（3-5年）→特殊场景（5-10年）

11. 风险与展望

风险：

估值领先于商业化：多数出货流向科研/数采/展示，UBS警示泡沫风险
数据合规与版权：跨境数据管制、第一人称隐私、版权清洁待规范
Sim2Real鸿沟：仿真保真度与真实物理差距仍是核心挑战
标准缺位：具身数据采集/标注/评测标准尚在建设中

展望：

2026=数据规模化元年：真机+仿真+视频混合数据爆发
数据资产化加速：DaaS订阅+数据交易
世界模型崛起：World Model成为数据生成新引擎
中国机遇：场景丰富+工程化快+政策支持

三、总结评价

这是一份定义清晰、框架完整、数据扎实、判断前瞻的具身数据市场首份系统性白皮书。其核心价值在于：

首次系统定义“具身数据”市场边界：将具身数据从“AI数据”大范畴中独立出来，明确定义其稀缺性（20,000倍差距）、获取方式（采集/仿真/蒸馏）、价值链位置（上游高毛利），为产业研究和投资提供了清晰的分析框架。
四范式分层框架的原创性与实用性：真机遥操、便携采集、仿真合成、视频蒸馏的划分，不仅对应了技术路线，还与成本量级、保真度、规模化潜力直接挂钩，是企业选择数据策略时的实用工具。
“数据金字塔”训练范式的行业共识提炼：以底层海量数据预训练、顶层稀缺真机数据精调，已成为行业主流实践。报告对这一范式的提炼，有助于理解不同数据公司的战略定位。
18家数据公司的全景图谱：首次按范式归类梳理全球具身数据公司，包括融资额、核心产品、客户名单等关键信息，是产业研究者和投资者的重要参考资料。
中美双轨对比的深度洞察：不仅比较估值，更深入到“闭源飞轮vs开放生态”“大厂自建vs专业化分工”“合规环境差异”等结构性差异，具有战略指导意义。
商业化场景的量级测算：对医疗康复、物流仓储、工业制造、商业服务、家庭服务等场景给出了量化的年营收估算（30-50亿、50-80亿、1000亿+），为市场空间判断提供了依据。
风险提示的诚实态度：明确指出“估值领先于商业化”“Sim2Real鸿沟”“标准缺位”等问题，避免了过度乐观的叙事陷阱。

适用读者：具身智能/人形机器人企业战略决策者、AI数据基础设施创业者、投资机构（尤其关注具身赛道的一级市场投资人）、政策制定者、以及所有关注“AI如何从数字世界走向物理世界”的从业者。

核心金句：“数据，是具身智能的卖铲人。”“当AI从数字世界走向物理世界，真实交互数据成为决定具身智能上限的稀缺生产要素。”“2026年=具身数据规模化元年。”“价值链上移，数据层毛利显著高于本体硬件。”