作者:Mike Kalil
编译:Felix, PANews
在中国,一批由 AI 驱动的人形机器人正在一条平板电脑组装线上自主工作,这场直播被称为业内首创。
在这场具有历史意义的多日直播中,这些人形机器人与人类同事并肩进行质量检测工作。它们由一家成立仅三年的初创公司开发,该公司的崛起正给全球顶尖的机器人企业带来巨大的竞争压力。
随着投资者投入数十亿美元重新定义未来的工作模式,这或许预示着未来工厂的发展方向。在 AI 物理领域的淘金热潮中,机器人公司正采取大胆举措,以证明他们的机器已经准备好投入实际工作。
企业开始让机器人负责那些长期以来被认为太难、太精细且充满变数而无法自动化的任务。在日益复杂的工作流程中,不同形态的机器人正变得越来越擅长协同合作。随着其更加智能,它们正以一种愈发像人的方式进行学习,但其规模是任何个人或劳动力都无法比拟的。
在上海,新兴机器人初创公司智元机器人(AgiBot)启动了一场堪称业内首创的直播,展示了一系列自主人形机器人在真实的平板电脑生产线上运行。
这家机器人公司由前华为“天才少年”彭志辉于 2023 年 2 月创立,该公司表示,计划在 2026 年上半年生产超过 1 万台机器人。据报道,智元机器人正积极拓展其全球业务,并计划与深圳的众擎机器人(EngineAI)和普渡机器人(Pudu Robotics)以及北京的银河通用(Galbot)等竞争对手一起在香港上市。
智元机器人的崛起对总部位于杭州的宇树科技(Unitree Robotics)以及 Figure AI 等西方公司构成了挑战。宇树科技曾于 2025 年在人形机器人和四足机器人领域处于全球领先地位。
来源:智元机器人
在硅谷公司 Figure 多日直播而爆红的几周后,智元机器人也开始了为期 6 天的直播。Figure 的直播展示了其一小批双足人形机器人 Figure 03 在模拟物流场景中轮流分拣包裹。它们在受控环境中连续 8 天 24 小时不间断工作。当其中一台机器人工作约 4 小时后电量不足时,它会自动走到充电站充电,另一台机器人则接替其工作。
相比之下,智元机器人的直播展示了一支规模更大的轮式双臂移动操作机器人。它们在南昌龙旗科技的平板电脑制造工厂里与人类协同工作。它们按照标准工厂班次从早上 8:00 工作到下午 6:00(含午休),主要进行质量检测。
平板电脑装配线上的机器人是智元机器人的 G2 型号,专为工业应用而设计。G2 身高 1.7 米,重量可达 100 公斤。据报道,G2 全身拥有 26 个自由度,并可集成可选的灵巧机械手。
在发布会直播中,AgiBot G2 准备用弓箭射中一个粉色气球(来源:智元机器人)
这款人形机器人搭载了智元机器人自主研发的 AI 系统,该系统将运动、交互和操作智能整合到一个统一的架构中。据称,G2 可以通过现实世界的强化学习以及来自其世界模型 Agibot World 的大规模数据集不断提升性能。
这款机器人被设计为全天候运行,其轮式底座内置可热插拔电池。每次充电可支持 4 至 8 小时的持续运行,具体时长取决于有效载荷和运动强度。电池可在几分钟内完成更换,无需关闭机器人。但目前它还无法像优必选 (UBTECH) 的 Walker S2、海克斯康 (Hexagon) 的 AEON 和波士顿动力 (Boston Dynamics) 的 Atlas 那样自主完成更换。
在龙旗装配线上工作的机器人使用专用机械臂抓取平板电脑,利用传感器进行检测,然后将其放入托盘中。这家厂商为小米、三星和联想等科技巨头生产电子产品。
智元机器人 G2 人形机器人抓手(来源:智元机器人)
据报道,智元机器人的 G2 起售价约为 13.8 万美元,这实际上是目前工厂部署中较为实惠的选择之一。
这家初创公司最受关注的其实是灵犀 X2(Lingxi X2)机器人,起售价约为 1.3 万美元(高端型号接近 5 万美元)。X2 身高 1.3 米,重 34 公斤,专为轻度操作和娱乐应用设计。然而,智元机器人最近分享了一段高端型号在受控环境中移动迷你冰箱的视频。
智元机器人的 X2(左)和波士顿动力公司的 Atlas 在不同的演示中举起了迷你冰箱(来源:智元机器人/波士顿动力)
这显然是在向波士顿动力“隔空喊话”。前一周,这家马萨诸塞州的机器人企业刚展示了 Atlas 人形机器人完成类似任务的过程。
两场演示的总体思路相同,但存在一些关键差异。在波士顿动力的演示中,Atlas 用其灵巧的机械臂抓取一台迷你冰箱,过程中造成了明显的损坏;而 AgiBot 的 X2 则利用冰箱上的定制把手,用机械臂将其提起。此外,Atlas 抓取的冰箱看起来也比 AgiBot 实验室里的那台更大。
然而,Atlas 的重量也超过了 X2 的两倍,达到 90 公斤。它的身高也比 X2 高出许多,接近 2 米。两款机器人均利用其内置 AI,通过大量的模拟训练和实时传感器反馈来完成任务,但 Atlas 的优势在于其超乎常人的旋转关节。
目前,随着智元机器人计划在 2026 年实现 2 万台机器人的产能目标,你更有可能在公共场合看到 AgiBot 的人形机器人。波士顿动力公司也在积极推广其 Atlas、另一款知名机器人 Spot 以及物流解决方案 Stretch,将其推向劳动力市场。据报道,其母公司现代汽车正寻求完全收购波士顿动力公司,以期实现 3 万台机器人的产能。
加拿大初创公司 Sanctuary AI 表示,他们训练了一套 Universal Robots 双臂协作机器人系统,成功完成了汽车制造中最难自动化的任务之一。
Sanctuary AI 最为人熟知的产品是通用人形机器人 Phoenix,但现在该公司正将业务拓展至所有工业机器人领域。他们正在开发一种名为 Carbon 的物理 AI 模型,该模型适用于各种外形尺寸的机器人。
Sanctuary AI 表示,其 Carbon AI 模型赋能这套双臂协作机器人系统,使其能在汽车制造中完成线束和连接器的插入工作(来源:Sanctuary AI)
这家总部位于温哥华的机器人公司分享了 UR 机器人为一家一级汽车供应商进行线束和连接器插入工作的视频。对于人类来说,反复插入连接器轻而易举,但对于机器人而言却十分困难,因为它们的灵活性有限。
Sanctuary 公司表示,该系统以超过 99.5% 的成功率和 2.5 秒的时间完成了任务。这意味着它的性能足够快速可靠,能够满足这家未透露名称的客户的生产线需求。
另一家致力于研发通用 AI 机器人大脑的初创公司:“灵启万物” (MindOn Tech)近日发布了一段演示视频,展示了一组人形机器人和协作机器人完成物流工作流程的过程。
这家总部位于深圳的公司由前腾讯研究人员于 2025 年创立,该公司表示,这些机器人能够完全自主运行。视频中,一台 Unitree G1 人形机器人从货箱中取出物品,并将其放置在传送带上,由两台双臂协作机器人进行包装,以便发货。包装完成后,另一台 Unitree 双足机器人会取走待发货的物品。包装上印有亚马逊 Prime 的品牌标识,但目前尚无证据表明双方存在官方合作关系。
灵启万物的演示视频显示,人形机器人和协作机器人利用同一个 AI 大脑协同工作(来源:灵启万物)
灵启万物表示,其 Mind0 模型基于以人为中心的数据进行训练。这些数据包括头部摄像头拍摄的以人为中心的视频、手持抓取设备采集的操作数据以及动作捕捉服捕捉的全身动作。此外,该模型还结合少量物理机器人测试数据,以缩小模拟行为与真实世界行为之间的差距。
这家初创公司称,Mind0 是该系统的早期版本。他们计划进一步提升 AI 机器人大脑的规模、智能程度和通用性,使机器人团队能够在工厂、仓库乃至最终的家庭中承担更长时间、更复杂的工作。
目前,各个实验室正在研究如何利用互联网上海量的视频素材。例如,佐治亚理工学院的研究人员刚刚推出了一款名为 EgoEngine 的 AI 系统,该系统能够通过现有的第一人称视角视频片段,来训练机器人操作技能。
EgoEngine GitHub 主页
其规模可能非常庞大,仅 YouTube 每天就有超过 2000 万个视频上传。即使只有极小一部分是自我中心的视频,也意味着数千万个视频可用于教机器人学习从烹饪到电子产品组装等各种技能。
EgoEngine 首先识别并移除每个视频帧中的人类手臂和手部。然后,它在数字孪生模型中重建场景,生成机器人执行相同任务的新视频。人类动作被转换为机器人运动数据并进行优化,以确保机器人能够安全地执行这些动作。
研究人员使用 Rainbow Robotics 的双臂机械臂(配备两个五指机械手)测试了该系统。他们表示,该系统的性能几乎与通过远程操作训练的机器人一样出色。
加州大学伯克利分校和英伟达的研究人员共同开发了一种新的 AI 系统,该系统利用以自我为中心的记录,使机器人的眼手触觉协调能力更接近人类水平。
他们将这套名为 T-Rex 的系统安装在 Dexmate Vega-1 机器人上进行测试,该机器人集成了 Sharpa 的 Wave 机械手。Wave 机械手是目前市场上最先进的末端执行器之一,据称每个执行器都拥有 22 个自由度。
T-Rex 系统训练 Sharpa Wave 机械手
据研究人员称,T-Rex 完成了 12 项需要大量触觉操作的任务,例如给牙刷挤牙膏和拧灯泡。它依靠 AI 大脑自主工作,该大脑经过超过 2.2 万小时的第一人称视频和 100 小时的触觉数据集的训练。
该机器人遵循自然语言指令,利用头部摄像头理解场景,并利用手腕摄像头监控每只手的动作。同时,其手部的触觉传感器持续测量不断变化的力。
T-Rex 追踪这些信号的瞬时变化,其所谓的“变形金刚混合架构”如同一个由多个专业 AI 代理组成的团队协同工作。其中一个代理负责规划人形机器人的动作,而另一个代理则利用触觉进行快速修正。
T-Rex 的平均成功率达到了 65%,比目前最强的系统高出约 30%。然而,该团队表示,这项技术仍需更先进的传感器和更精准的控制才能实现全面自主运行。
斯坦福大学、松下公司、罗马大学和 ItalAI 的研究人员也参与了这项研究。
相关阅读:不只会后空翻,波士顿动力的人形机器人Atlas开始“打工”了


