新眸原创·作者 | 棠宁
“看发布会演示的时候什么都能做,一到自己家,就跟换了个脑子一样。”类似这样有关人形机器人的吐槽,社交媒体上并不少。后来也和几位做机器人研发的朋友聊起这件事,他们说这几乎是整个行业的通病。
现在的具身智能模型,在实验室的固定场景里,完成指定任务的准确率能到90%以上,可一旦放到充满不确定性的真实环境里,性能直接腰斩,甚至直接失灵。问他们核心瓶颈是什么,几乎所有人的答案都一样:缺数据,缺真实世界里的、有血有肉的场景数据。
就在全行业都在卷模型参数、卷硬件性能、卷仿真环境的时候,京东悄悄扔出了一个重磅动作。最近举行的中国发展高层论坛上,京东集团CEO许冉对外披露:京东正在建设全球规模最大、场景最全的具身智能数据中心,两年内将积累超过1000万小时的真实场景数据,覆盖物流、家庭、城市等五大核心场景,未来会向全行业开放这些数据资源。
很多人听到这个消息的第一反应是,京东不是做零售和物流的吗,怎么突然下场做具身智能的数据基础设施了?但如果你了解京东这家公司的发展逻辑,就会发现,这件事不仅不跨界,反而恰恰是京东为自己的下半场,埋下的最关键的一步棋。
具身智能狂奔三年
终于撞上了数据的天花板
具身智能已经连续两年被写入政府工作报告,明确列入未来产业的重点培育方向,资本端的热度更是居高不下。2026年开年不到三个月,国内具身智能领域已经披露的融资总额就接近150亿元,估值超百亿的企业扩容到了7家。不管是科技巨头还是创业公司,都在往这个赛道里挤,所有人都知道,这是下一代人工智能的核心方向,也是未来十年最大的产业机会之一。
但热闹的背后,行业的瓶颈已经越来越清晰。之前大家都觉得,制约具身智能发展的是算力,是模型,是硬件本体。但随着这两年技术的快速迭代,这些门槛都在快速降低。根据IDC发布的数据,2025年中国智能算力规模达到1037.3EFLOPS,同比增长43%,预计2028年将突破2700EFLOPS。
算力的价格越来越低,只要有资金,就能买到足够的算力支撑模型训练。模型架构也日趋同质化,开源社区的成熟,让很多创业公司都能基于开源模型,快速做出自己的具身智能方案。硬件方面,电机、减速器这些核心零部件的成本,也在快速下降,人形机器人的整机价格,已经从几年前的几十万,降到了现在的几万块。
这个时候,整个行业的核心矛盾,已经从“有没有足够的算力和模型”,变成了“有没有足够的真实数据喂饱模型”。多位行业研发人员都提到过,目前全行业可用于具身智能训练的真实场景数据,加起来也只有几十万小时,和实现智能涌现需要的千万甚至上亿小时的规模,差了一个数量级都不止。
之前很多人觉得,仿真环境可以解决这个问题。在虚拟环境里,我们可以无限生成场景,无限生成训练数据,成本低,效率高。但这几年的实践下来,大家发现仿真和真实世界之间,有一道很难跨越的鸿沟。
就像我们在驾校里练车,哪怕把每一个点位都背得滚瓜烂熟,考试次次满分,真的开到真实的马路上,还是会手忙脚乱。因为驾校的场景是固定的,路线是固定的,甚至连突发状况都是预设好的,而真实的马路,每一秒都在发生变化,你永远不知道下一个路口会窜出来什么。
具身智能也是一样。在仿真环境里,机器人训练的场景,都是程序员预设好的,地面永远是平整的,物体永远是固定的,光线永远是均匀的。但真实的家庭里,地上会有散落的玩具和拖鞋,桌子上的杯子会随意摆放,早上和晚上的光线天差地别;真实的仓库里,货物的包装千奇百怪,托盘的位置会有偏差,甚至连地面都会因为货物的重压有轻微的变形。
这些细微的、不确定的变化,仿真环境很难完全模拟,而恰恰是这些变化,决定了机器人在真实场景里能不能用。
许冉在论坛演讲中提到,2026年春节期间,人形机器人成为最抢手的电子年货,相关产品的搜索量同比增长超过300%,但当前机器人消费的增长,很大程度上受限于供给的不足。这里的供给不足,不仅是硬件产能的不足,更是智能能力的不足——没有足够的真实数据喂养,机器人很难具备应对复杂真实场景的能力,也就无法真正走进普通人的生活。
今年3月,京东发布了2025年的全年财报,总营收首次突破1.3万亿元,达到13091亿元,同比增长13%。这个成绩,在当下的电商行业里,已经相当稳健。但拆开来看,增长的结构已经发生了根本性的变化。全年商品收入10238亿元,同比增长10.3%;而服务收入达到2853亿元,同比增长23.6%,增速是商品收入的两倍还多,占总营收的比重,也提升到了21.8%,创下了历史新高。
这个数据的变化,背后是京东增长逻辑的切换。过去二十多年,京东的核心增长引擎,是零售电商,靠自营模式和自建物流,建立起了自己的行业壁垒。但现在,国内电商行业的流量红利已经基本见顶,增速持续放缓,仅靠商品销售的增长,已经很难支撑京东的长期发展。
京东的下半场,必须从一个“卖商品的交易平台”,转向一个“提供技术服务的服务商”。
这一点,从京东这几年的布局里就能看出来。京东物流已经独立上市,从服务京东自身,转向服务全行业的供应链客户;京东工业也在港交所上市,专注于工业供应链的技术服务;还有京东云,这几年一直在快速扩张,为企业提供数字化转型的解决方案。服务收入的持续高增长,已经证明了京东的转型方向是成立的。
但想要在技术服务这条路上走得更远,京东需要一个更核心的抓手,一个能把自己过去二十多年积累的核心能力,完全释放出来的载体。而具身智能,就是这个最合适的载体。
很多人对京东的认知,还停留在“电商公司”,但其实从成立的第一天起,京东就在和物理世界打交道。零售的本质,是商品的流通,而商品的流通,全都是在物理世界里完成的。从采购、仓储、分拣,到配送、售后,京东的整个业务链条,都是扎根在真实的物理场景里的。
过去二十多年,京东一直在做的事情,就是用技术优化物理世界的供应链效率,自建物流是这样,亚洲一号智能仓储是这样,现在的具身智能数据中心,也是这样。
就在三个月前,京东全国首个机器人数据采集中心在江苏宿迁正式启用。这个总投资超亿元、占地面积5000平方米的项目,已经入选江苏省2025年度具身智能机器人产业发展资金支持项目。从宿迁的落地项目到全国性的布局,京东在具身智能基础设施上的动作正在加速。
这也是京东和其他科技巨头最大的不同。京东拥有国内几乎独一无二的场景资源,根据官方披露的信息,京东在全国布局了超过1400个仓库,其中亚洲一号智能仓储园区已经超过50个,园区里运行着数万台AGV机器人、分拣机器人、码垛机器人,每天要完成数百万次的货物搬运、分拣、码垛操作。
这些机器人,不是在实验室里跑测试,而是在真实的业务环境里,每天24小时不间断地工作,它们的每一次移动、每一次操作、每一次应对突发状况的调整,都会产生完整的、多维度的真实数据。这些数据,就是训练具身智能模型最优质的素材。
除了仓储物流,京东还有零售门店、京东到家的本地生活场景、京东健康的医疗服务场景、京东城市的城市运维场景,这些场景,全都是真实的、每天都在运转的物理世界场景,每天都在产生海量的、和人类真实活动相关的数据。这些场景资源,是其他大厂花再多钱,也很难在短时间内复制的。
京东正在建设的具身智能数据中心,本质上就是把这些场景资源,转化成可复用的数据资产。这个数据中心,和我们传统认知里的IDC机房、通用智算中心,完全不是一回事。传统的数据中心,核心是提供算力存储和通用计算能力,处理的是文本、图像、视频这些线上的数字内容。而具身智能数据中心,是针对具身智能的技术特点,搭建的一套“采集-标注-训练-验证”全流程的基础设施,它的核心,是真实物理世界数据的生产、处理和应用。
除了自有的业务场景,京东还在通过大规模的众包采集,扩充数据的覆盖范围。按照规划,京东将发动内部超过10万名各类职业的员工,以及外部最多50万名各行业的人员,参与数据采集工作,仅在江苏宿迁一地,就将发动超过10万名市民参与,覆盖家庭、办公室、工厂、餐厅、医疗、环卫等上百个细分场景,全面还原人类的真实活动。
最终的目标,是一年内积累500万小时的人类真实场景视频数据,两年内突破1000万小时,同步采集机器人本体数据100万小时。这个规模,不仅超过了目前行业所有公开数据集的总和,更重要的是,它构建了一个覆盖人类生产生活全场景的、持续更新的真实世界数字孪生体。
在具身智能这条万亿级的赛道上,几乎所有的科技巨头都已经下场,只是各自的路径选择有所不同。
华为的核心思路是全栈布局,从底层的算力芯片、操作系统,到上层的智能体开发平台,形成完整的技术闭环;阿里的布局则是软硬一体,比如最近阿里成立了直接由CEO吴泳铭负责的ATH 事业群,整合了通义实验室、千问大模型等核心技术资源,从底层模型向应用场景大扩容,To B和To C双线并进。腾讯的重点是机器人操作系统,推出了TAIROS平台,整合了AI Lab的强化学习算法与云计算能力,为第三方机器人提供感知、决策与交互的通用大脑。百度则是依托文心大模型的技术积累,重点推进大模型与具身智能的结合,在工业、交通等场景落地智能解决方案。
对比这些巨头的布局可以发现,他们的优势,都集中在技术层、软件层,有很强的模型能力、算力能力、系统能力,但都有一个共同的短板:缺乏大规模的、持续运转的、自己完全可控的真实物理场景。他们可以做出很牛的模型,但很难拿到足够的真实场景数据,来让模型真正落地。
而京东,恰恰补上了这块行业最缺的拼图。
熟悉人工智能发展历史的人应该都知道,2009年ImageNet数据集的出现,直接推动了计算机视觉技术的爆发式发展,让CV技术从实验室,真正走向了大规模的商业应用。而京东正在构建的这个千万小时级的具身智能数据集,很有可能成为具身智能领域的“ImageNet时刻”,推动整个行业,从仿真模拟的实验室阶段,真正走向真实数据驱动的商用落地阶段。
更重要的是,京东可以通过这个数据中心,形成一个完整的商业闭环。用自有场景产生的数据,训练出更优的具身智能模型,再把模型应用到自己的物流、零售等业务中,提升供应链的效率,降低运营成本。而业务的优化,又会产生更多、更优质的数据,进一步优化模型,形成一个正向的飞轮。
当模型的能力足够成熟之后,再把数据和模型能力,开放给全行业的机器人企业、科研机构和开发者,带来新的服务收入,同时又能从更多的行业场景中,获取新的数据,让飞轮转得越来越快。
这个飞轮的起点,就是这个具身智能数据中心。它不仅是京东自身技术升级的基础设施,更是京东向产业互联网服务商转型的核心抓手。
当然,这条路也并非一片坦途,京东依然要跨越多重挑战。
首先是大规模的资金投入压力。具身智能数据中心的建设,不管是数据采集设备的部署、算力集群的搭建,还是大规模的众包采集、数据标注,都需要巨额的资金投入。虽然目前核心零售业务能提供稳定的现金流,但持续的大规模投入,依然会给集团的盈利表现带来不小的压力。
其次是数据标准化和合规的问题。京东的数据集来自五大核心场景、上百个细分场景,不同场景的数据格式、标注标准都有很大的差异,如何把这些分散的数据,统一成标准化的、全行业都能通用的数据集,是一个不小的技术难题。同时,大规模的众包采集,涉及到大量的个人信息和场景数据,如何确保数据采集的合规性,保护用户的隐私,也是京东必须解决的问题。
第三是底层技术的短板。京东在场景和数据上,有着无可替代的优势,但在底层的大模型算法、算力芯片、机器人操作系统等核心技术上,和华为、百度等厂商相比,还有一定的差距。具身智能的发展,是数据、算法、算力的协同进化,只有数据,没有足够强的算法和算力支撑,也很难充分发挥数据的价值。
不过回头看,京东这家公司,从来都不是靠走捷径取胜的。2007年,刘强东力排众议要自建物流的时候,几乎所有人都觉得他疯了,一个电商公司,要做这么重的资产,烧这么多钱,根本就是死路一条。但京东扛住了连续多年的亏损,把物流做成了自己最核心的壁垒,也彻底改变了中国电商行业的履约体验。
现在的具身智能数据中心,其实和当年的自建物流,是一模一样的逻辑。行业里的所有人都知道真实数据重要,但愿意花这么大的代价,去做这么重、这么苦、这么慢的事情的公司,少之又少。而京东,恰恰最擅长做这种难而正确的事情。
互联网发展到今天,上半场的竞争,是数字世界的竞争,大家拼的是流量,是信息分发的效率,是线上体验的优化。而下半场的竞争,已经变成了数字世界和物理世界融合的竞争,谁能把数字技术,真正落地到物理世界的真实场景里,提升物理世界的运行效率,谁就能拿到下半场的船票。
京东的上半场,用了二十多年的时间,把中国商品流通的效率,做到了极致。而京东的下半场,很有可能就是从这个具身智能数据中心开始,把物理世界的智能效率,做到新的极致。时间总会给坚持做长期正确事情的人,最好的答案。
