机器东谈主为什么还不够贤人？具身智能不缺融资、缺数据

发布日期：2026-06-26 13:42 点击次数：100

具身智能无疑是科技行业最火热的赛谈之一，老本无间涌入，创业公司不竭刷新估值，机器东谈主也在从演示视频走向着实场景。但淆乱之下，一个中枢问题恒久莫得被信得过处分：机器东谈主为什么已经不够“通用”？

好多机器东谈主在特定任务上推崇出色，“但换个物体操作就失效，换个场景可能就得再行锤真金不怕火。”RoboScience机器科学策动创举东谈主汪涛觉得，这背后最大的瓶颈是数据。

大言语模子的发展真实考证了一条共鸣：更大的模子、更大的算力以及更大的数据范围，会无间带来才调提高。但这套Scaling Law（缩放定律）到了机器东谈主领域，却遭逢了履行间隔。

互联网蓄积了海量文本数据，而机器东谈主需要学习的是东谈主与物体、环境之间的着实互动，这么的物理交互数据自然稀缺。

在汪涛看来，一个信得过具备通用操作才调的具身智能大模子，所需的数据范围致使可能超过今天的大言语模子，“千万小时、亿万小时齐偶然够。”而当今大师头部企业掌抓的高质地真机数据，大多仍停留在数十万小时量级，最高约30万小时摆布。

按照RoboScience机器科学的测算，比较大言语模子所领有的数据范围，具身智能领域的数据缺口大要在10⁶至10⁸倍之间。这意味着，天天爽夜夜爽夜夜爽精品视频机器东谈主行业距离我方的“ChatGPT时刻”，可能还有高达1亿倍的数据鸿沟。

濒临数据短少，传统的破局念念路是真机汇聚。这一神色照实灵验，业内瞻望，本年真机数据总量有望达到百万小时量级。但短期来看，成本与产能的问题相似澄莹。

如若算一笔账：靠东谈主汇聚数据，每个东谈主每天惟有几百条，月产也仅仅万条级别，远弗成清脆大模子对数据范围的指数级需求；后锤真金不怕火阶段，少妇人妻一区二区三区视频为了让机器东谈主学会一个复杂操作，动辄需要上万条东谈主工标注，成本随任务数目线性累加。

行业正在再行念念考具身智能的技能道路。畴昔几年，VLA（视觉言语步履模子）和师法学习曾被视为主流决策。但跟着践诺久了，越来越多团队初始遭逢架构和数据的瓶颈。

一个念念路是用“算力换时候”：期骗海量互联网视频以及自研仿真器生成的数据，替代多数东谈主工汇聚流程，勉力坐窝初始基座模子的预锤真金不怕火。

RoboScience机器科学将“物体在三维空间中的通顺轨迹（Object Trajectory）”当作数据步伐，搭建了一条全自动数据管线，数据成本被压缩至“几分钱一条”，仅为真机汇聚的几独特之一，而产能则饱和取决于算力，“表面莫得上限”。

据先容，本年年头，RoboScience的视频数据量超过百万小时，仿真数据达到了十亿、百亿量级。按照筹画，本年他们的视频数据体量要超过千万小时，仿真数据要作念到TB级别，基本上接近ChatGPT数据量的独特之一。

尽管属于机器东谈主的“ChatGPT时刻”还未到来，但老本市集的关爱无间于今。

IT桔子的数据剖释，2026年上半年国内具身智能及机器东谈主领域共发生288起融资事件，触及226家企业，表露融资额超460亿元，有49家公司在半年内完成了两轮及以上融资。

但老本会愈加严慎和聚焦，汪涛提到，机构投资者会嗜克己分中枢问题的团队，同期比较见地和故事，本年投资者会更关注着实的落地以及客户复购率，这些商酌信得过概况考证团队才调。