很多人没看懂，京东做具身智能数据中心的真正逻辑

发布时间：2026-03-23 21:38 作者：棠宁阅读量：16.4W

新眸原创·作者 | 棠宁

“看发布会演示的时候什么都能做，一到自己家，就跟换了个脑子一样。”类似这样有关人形机器人的吐槽，社交媒体上并不少。后来也和几位做机器人研发的朋友聊起这件事，他们说这几乎是整个行业的通病。

现在的具身智能模型，在实验室的固定场景里，完成指定任务的准确率能到90%以上，可一旦放到充满不确定性的真实环境里，性能直接腰斩，甚至直接失灵。问他们核心瓶颈是什么，几乎所有人的答案都一样：缺数据，缺真实世界里的、有血有肉的场景数据。

就在全行业都在卷模型参数、卷硬件性能、卷仿真环境的时候，京东悄悄扔出了一个重磅动作。最近举行的中国发展高层论坛上，京东集团CEO许冉对外披露：京东正在建设全球规模最大、场景最全的具身智能数据中心，两年内将积累超过1000万小时的真实场景数据，覆盖物流、家庭、城市等五大核心场景，未来会向全行业开放这些数据资源。

很多人听到这个消息的第一反应是，京东不是做零售和物流的吗，怎么突然下场做具身智能的数据基础设施了？但如果你了解京东这家公司的发展逻辑，就会发现，这件事不仅不跨界，反而恰恰是京东为自己的下半场，埋下的最关键的一步棋。

具身智能狂奔三年

终于撞上了数据的天花板

具身智能已经连续两年被写入政府工作报告，明确列入未来产业的重点培育方向，资本端的热度更是居高不下。2026年开年不到三个月，国内具身智能领域已经披露的融资总额就接近150亿元，估值超百亿的企业扩容到了7家。不管是科技巨头还是创业公司，都在往这个赛道里挤，所有人都知道，这是下一代人工智能的核心方向，也是未来十年最大的产业机会之一。

但热闹的背后，行业的瓶颈已经越来越清晰。之前大家都觉得，制约具身智能发展的是算力，是模型，是硬件本体。但随着这两年技术的快速迭代，这些门槛都在快速降低。根据IDC发布的数据，2025年中国智能算力规模达到1037.3EFLOPS，同比增长43%，预计2028年将突破2700EFLOPS。

算力的价格越来越低，只要有资金，就能买到足够的算力支撑模型训练。模型架构也日趋同质化，开源社区的成熟，让很多创业公司都能基于开源模型，快速做出自己的具身智能方案。硬件方面，电机、减速器这些核心零部件的成本，也在快速下降，人形机器人的整机价格，已经从几年前的几十万，降到了现在的几万块。

这个时候，整个行业的核心矛盾，已经从“有没有足够的算力和模型”，变成了“有没有足够的真实数据喂饱模型”。多位行业研发人员都提到过，目前全行业可用于具身智能训练的真实场景数据，加起来也只有几十万小时，和实现智能涌现需要的千万甚至上亿小时的规模，差了一个数量级都不止。

之前很多人觉得，仿真环境可以解决这个问题。在虚拟环境里，我们可以无限生成场景，无限生成训练数据，成本低，效率高。但这几年的实践下来，大家发现仿真和真实世界之间，有一道很难跨越的鸿沟。

就像我们在驾校里练车，哪怕把每一个点位都背得滚瓜烂熟，考试次次满分，真的开到真实的马路上，还是会手忙脚乱。因为驾校的场景是固定的，路线是固定的，甚至连突发状况都是预设好的，而真实的马路，每一秒都在发生变化，你永远不知道下一个路口会窜出来什么。

具身智能也是一样。在仿真环境里，机器人训练的场景，都是程序员预设好的，地面永远是平整的，物体永远是固定的，光线永远是均匀的。但真实的家庭里，地上会有散落的玩具和拖鞋，桌子上的杯子会随意摆放，早上和晚上的光线天差地别；真实的仓库里，货物的包装千奇百怪，托盘的位置会有偏差，甚至连地面都会因为货物的重压有轻微的变形。

这些细微的、不确定的变化，仿真环境很难完全模拟，而恰恰是这些变化，决定了机器人在真实场景里能不能用。

许冉在论坛演讲中提到，2026年春节期间，人形机器人成为最抢手的电子年货，相关产品的搜索量同比增长超过300%，但当前机器人消费的增长，很大程度上受限于供给的不足。这里的供给不足，不仅是硬件产能的不足，更是智能能力的不足——没有足够的真实数据喂养，机器人很难具备应对复杂真实场景的能力，也就无法真正走进普通人的生活。

京东的下半场

把场景做成了最核心的资产

今年3月，京东发布了2025年的全年财报，总营收首次突破1.3万亿元，达到13091亿元，同比增长13%。这个成绩，在当下的电商行业里，已经相当稳健。但拆开来看，增长的结构已经发生了根本性的变化。全年商品收入10238亿元，同比增长10.3%；而服务收入达到2853亿元，同比增长23.6%，增速是商品收入的两倍还多，占总营收的比重，也提升到了21.8%，创下了历史新高。

这个数据的变化，背后是京东增长逻辑的切换。过去二十多年，京东的核心增长引擎，是零售电商，靠自营模式和自建物流，建立起了自己的行业壁垒。但现在，国内电商行业的流量红利已经基本见顶，增速持续放缓，仅靠商品销售的增长，已经很难支撑京东的长期发展。

京东的下半场，必须从一个“卖商品的交易平台”，转向一个“提供技术服务的服务商”。

这一点，从京东这几年的布局里就能看出来。京东物流已经独立上市，从服务京东自身，转向服务全行业的供应链客户；京东工业也在港交所上市，专注于工业供应链的技术服务；还有京东云，这几年一直在快速扩张，为企业提供数字化转型的解决方案。服务收入的持续高增长，已经证明了京东的转型方向是成立的。

但想要在技术服务这条路上走得更远，京东需要一个更核心的抓手，一个能把自己过去二十多年积累的核心能力，完全释放出来的载体。而具身智能，就是这个最合适的载体。

很多人对京东的认知，还停留在“电商公司”，但其实从成立的第一天起，京东就在和物理世界打交道。零售的本质，是商品的流通，而商品的流通，全都是在物理世界里完成的。从采购、仓储、分拣，到配送、售后，京东的整个业务链条，都是扎根在真实的物理场景里的。

过去二十多年，京东一直在做的事情，就是用技术优化物理世界的供应链效率，自建物流是这样，亚洲一号智能仓储是这样，现在的具身智能数据中心，也是这样。

就在三个月前，京东全国首个机器人数据采集中心在江苏宿迁正式启用。这个总投资超亿元、占地面积5000平方米的项目，已经入选江苏省2025年度具身智能机器人产业发展资金支持项目。从宿迁的落地项目到全国性的布局，京东在具身智能基础设施上的动作正在加速。

这也是京东和其他科技巨头最大的不同。京东拥有国内几乎独一无二的场景资源，根据官方披露的信息，京东在全国布局了超过1400个仓库，其中亚洲一号智能仓储园区已经超过50个，园区里运行着数万台AGV机器人、分拣机器人、码垛机器人，每天要完成数百万次的货物搬运、分拣、码垛操作。

这些机器人，不是在实验室里跑测试，而是在真实的业务环境里，每天24小时不间断地工作，它们的每一次移动、每一次操作、每一次应对突发状况的调整，都会产生完整的、多维度的真实数据。这些数据，就是训练具身智能模型最优质的素材。

除了仓储物流，京东还有零售门店、京东到家的本地生活场景、京东健康的医疗服务场景、京东城市的城市运维场景，这些场景，全都是真实的、每天都在运转的物理世界场景，每天都在产生海量的、和人类真实活动相关的数据。这些场景资源，是其他大厂花再多钱，也很难在短时间内复制的。

京东正在建设的具身智能数据中心，本质上就是把这些场景资源，转化成可复用的数据资产。这个数据中心，和我们传统认知里的IDC机房、通用智算中心，完全不是一回事。传统的数据中心，核心是提供算力存储和通用计算能力，处理的是文本、图像、视频这些线上的数字内容。而具身智能数据中心，是针对具身智能的技术特点，搭建的一套“采集-标注-训练-验证”全流程的基础设施，它的核心，是真实物理世界数据的生产、处理和应用。

除了自有的业务场景，京东还在通过大规模的众包采集，扩充数据的覆盖范围。按照规划，京东将发动内部超过10万名各类职业的员工，以及外部最多50万名各行业的人员，参与数据采集工作，仅在江苏宿迁一地，就将发动超过10万名市民参与，覆盖家庭、办公室、工厂、餐厅、医疗、环卫等上百个细分场景，全面还原人类的真实活动。

最终的目标，是一年内积累500万小时的人类真实场景视频数据，两年内突破1000万小时，同步采集机器人本体数据100万小时。这个规模，不仅超过了目前行业所有公开数据集的总和，更重要的是，它构建了一个覆盖人类生产生活全场景的、持续更新的真实世界数字孪生体。

一个数据中心

能改写具身智能的行业格局吗？

在具身智能这条万亿级的赛道上，几乎所有的科技巨头都已经下场，只是各自的路径选择有所不同。

华为的核心思路是全栈布局，从底层的算力芯片、操作系统，到上层的智能体开发平台，形成完整的技术闭环；阿里的布局则是软硬一体，比如最近阿里成立了直接由CEO吴泳铭负责的ATH 事业群，整合了通义实验室、千问大模型等核心技术资源，从底层模型向应用场景大扩容，To B和To C双线并进。腾讯的重点是机器人操作系统，推出了TAIROS平台，整合了AI Lab的强化学习算法与云计算能力，为第三方机器人提供感知、决策与交互的通用大脑。百度则是依托文心大模型的技术积累，重点推进大模型与具身智能的结合，在工业、交通等场景落地智能解决方案。

对比这些巨头的布局可以发现，他们的优势，都集中在技术层、软件层，有很强的模型能力、算力能力、系统能力，但都有一个共同的短板：缺乏大规模的、持续运转的、自己完全可控的真实物理场景。他们可以做出很牛的模型，但很难拿到足够的真实场景数据，来让模型真正落地。

而京东，恰恰补上了这块行业最缺的拼图。

熟悉人工智能发展历史的人应该都知道，2009年ImageNet数据集的出现，直接推动了计算机视觉技术的爆发式发展，让CV技术从实验室，真正走向了大规模的商业应用。而京东正在构建的这个千万小时级的具身智能数据集，很有可能成为具身智能领域的“ImageNet时刻”，推动整个行业，从仿真模拟的实验室阶段，真正走向真实数据驱动的商用落地阶段。

更重要的是，京东可以通过这个数据中心，形成一个完整的商业闭环。用自有场景产生的数据，训练出更优的具身智能模型，再把模型应用到自己的物流、零售等业务中，提升供应链的效率，降低运营成本。而业务的优化，又会产生更多、更优质的数据，进一步优化模型，形成一个正向的飞轮。

当模型的能力足够成熟之后，再把数据和模型能力，开放给全行业的机器人企业、科研机构和开发者，带来新的服务收入，同时又能从更多的行业场景中，获取新的数据，让飞轮转得越来越快。

这个飞轮的起点，就是这个具身智能数据中心。它不仅是京东自身技术升级的基础设施，更是京东向产业互联网服务商转型的核心抓手。

当然，这条路也并非一片坦途，京东依然要跨越多重挑战。

首先是大规模的资金投入压力。具身智能数据中心的建设，不管是数据采集设备的部署、算力集群的搭建，还是大规模的众包采集、数据标注，都需要巨额的资金投入。虽然目前核心零售业务能提供稳定的现金流，但持续的大规模投入，依然会给集团的盈利表现带来不小的压力。

其次是数据标准化和合规的问题。京东的数据集来自五大核心场景、上百个细分场景，不同场景的数据格式、标注标准都有很大的差异，如何把这些分散的数据，统一成标准化的、全行业都能通用的数据集，是一个不小的技术难题。同时，大规模的众包采集，涉及到大量的个人信息和场景数据，如何确保数据采集的合规性，保护用户的隐私，也是京东必须解决的问题。

第三是底层技术的短板。京东在场景和数据上，有着无可替代的优势，但在底层的大模型算法、算力芯片、机器人操作系统等核心技术上，和华为、百度等厂商相比，还有一定的差距。具身智能的发展，是数据、算法、算力的协同进化，只有数据，没有足够强的算法和算力支撑，也很难充分发挥数据的价值。

不过回头看，京东这家公司，从来都不是靠走捷径取胜的。2007年，刘强东力排众议要自建物流的时候，几乎所有人都觉得他疯了，一个电商公司，要做这么重的资产，烧这么多钱，根本就是死路一条。但京东扛住了连续多年的亏损，把物流做成了自己最核心的壁垒，也彻底改变了中国电商行业的履约体验。

现在的具身智能数据中心，其实和当年的自建物流，是一模一样的逻辑。行业里的所有人都知道真实数据重要，但愿意花这么大的代价，去做这么重、这么苦、这么慢的事情的公司，少之又少。而京东，恰恰最擅长做这种难而正确的事情。

互联网发展到今天，上半场的竞争，是数字世界的竞争，大家拼的是流量，是信息分发的效率，是线上体验的优化。而下半场的竞争，已经变成了数字世界和物理世界融合的竞争，谁能把数字技术，真正落地到物理世界的真实场景里，提升物理世界的运行效率，谁就能拿到下半场的船票。

京东的上半场，用了二十多年的时间，把中国商品流通的效率，做到了极致。而京东的下半场，很有可能就是从这个具身智能数据中心开始，把物理世界的智能效率，做到新的极致。时间总会给坚持做长期正确事情的人，最好的答案。

评论

最新评论

Copyright © 2020-2021 苏州凌石信息咨询有限公司版权所有 | 苏ICP备2021005624号

评论

最新评论

Copyright © 2020-2021 苏州凌石信息咨询有限公司 版权所有 | 苏ICP备2021005624号

Copyright © 2020-2021 苏州凌石信息咨询有限公司版权所有 | 苏ICP备2021005624号