首页/新闻资讯/正文
星动纪元发布ERA-42端到端原生机器人大模型,五指灵巧手学会100多种复杂操作任务

 2025年02月23日  阅读 12

摘要:从发送量子位|官方帐户只需使用一个本机机器人模型,您就可以用五个指的手来学习100多个复杂的操作任务。拿起随机放置在桌子上的螺钉钻头,用锤子拧紧螺丝,撞到指甲,将倒置的水杯拉直,然后将水倒入水杯中等等。这是行业中第一次仅通过使用相同的压花模型来实现五...

从 发送

量子位|官方帐户

只需使用一个本机机器人模型,您就可以用五个指的手来学习100多个复杂的操作任务。

拿起随机放置在桌子上的螺钉钻头,用锤子拧紧螺丝,撞到指甲,将倒置的水杯拉直,然后将水倒入水杯中等等。

这是行业中第一次仅通过使用相同的压花模型来实现五指手。五指的手像人类手一样灵活,自由地完成了数百个敏捷和复杂的操作任务。

这是由ERA主演的最新端到端本地机器人模型ERA-42。

结合自我开发的熟练手,它学会了使用不同的工具来完成100多种复杂和敏捷的操作任务,并继续在同一模型下学习新技能。

该模型不需要任何预编程的技能,并且完全基于其强大的概括和适应性,并且可以在不到2个小时内收集少量数据来学习执行新任务。同时,ERA-42也正在快速,连续学习更多的新技能。

ERA-42也是世界上第一个真正的五指手形模型,它开辟了体现模型的一般和敏捷操作时代。

在一般压花的情报行业中,压纹模型被广泛认为是未来开发的趋势,这主要是由于其强大的跨模式功能,适应性和概括能力以及有效且灵活的任务执行能力。

压纹模型的三个要素

“真实”体现模型是打开通用体现智能机构的关键。它需要以下三个要素:

首先,统一模型来概括多个任务和环境:通过构建统一的本机模型,集成了视觉,语言,触摸和身体姿势等全模式信息,可以实现不同的任务和环境的概括。此外,通过数据共享和不同任务之间的迁移,模型的概括能力可以进一步提高。

第二个是端到端:从接收全模式数据到生成最终输出(例如决策,动作等)的整个过程,都是通过简单的神经网络链接完成的。此过程不需要人工设计功能,预先编程或介入的处理步骤,从而使体现的代理可以实时适应不同的任务和环境,从而显着提高了灵活性和开发效率。

第三个是(规模):只有真正统一的端到端算法才能使该模型通过连续数据积累实现自我完善,因此体现的大型模型不仅可以提高性能,同时呈指数增长的数据量,而且可以提高数据的量。还可以提高未知的性能。在任务中显示出极好的适应性和概括功能。

例如,行业发布的π0模型(简称PI)在行业中广为人知,并且具有上述元素,并且是真正意义上典型的端到端体现模型。

星际时代42与世界领先水平相媲美

Star ERA-42是中国第一个真正的端到端本地机器人模型,与世界领先水平相当。

在早期,Star运动时代和PI几乎同时同时吻合,使用端到端算法来改善其本地机器人模型的性能。 PI启动的π0模型与级视觉语言预训练和机器人操作数据集相结合。培训使机器人可以在人类环境中自动执行多个复杂的任务,从而证明了在物理世界中实现普遍人工智能的潜力。

这是从“专家”到多任务的“通才”的“专家”开发过程中的重要步骤,它也是体现大型模型领域的里程碑。

该研究结果在恒星动态时代的早期发布几乎与(PI) Hirt相吻合:与

然后, ERA探索了本机机器人模型培训的另一条路径,采用了大规模的视频数据学习策略,涵盖了未标记的视频数据,各种类型的机器人数据,人类活动数据和远程操作数据。

此外,在使用上述数据时,时代并不能直接模仿视频中的人们的方式,而是在学习动作后会产生结果。以这种方式学习因果关系的优点是它可以实现完全的概括,因为物理定律是统一的。只要它们发生在真实的物理世界中,数据中包含的因果关系就必须确定和统一。

这种方法允许学习效果不受数据质量的限制,这可以大大降低数据收集成本,并在全球构建一般操作模型的过程中解决了大量数据消耗和大量高质量数据的问题。

此外,《星际运动时代的技术团队》将世界模型纳入了本地机器人模型,因此其模型不仅具有移动能力,而且具有了解物理世界的能力,并且可以预测未来的行动轨迹,有效提高机器人的执行效率和任务的准确性。

后来,Star运动时代探索了一种融合世界模型的本地机器人模型。恒星动态纸:通过:2024年出版

通过整合世界模型的方法,占星术机器人还可以快速响应外部干扰,并继续适应任务执行过程中的行为,直到完成任务为止。这种方法为训练通用本地机器人模型的新途径打开了。

ERA创建的端到端本地机器人型ERA-42是本地AI学习的新范式,是行业中原始的。 ERA-42凭借其预测能力具有强大的概括,适应性和规模能力。结合时代为AI创建的新硬件平台,它可以快速实现软件的协调演化和商业化以及具体的智能机构的硬件。

体现模型进入一般敏捷操作的时代

端到端的本地机器人型号ERA-42将压花模型带入了一般灵巧操作时代。

1)与下颌夹紧相比,根据ERA-42的能力,五指聪明的手动移动可以真正使用更多多样化的工具,例如螺丝钻,锤子,锤子,液体提取枪等超过100多个操作任务,具有更大的敏捷性和更大的复杂性。

根据ERA-42,五指聪明的手星运动可以使用更多不同的工具来执行比夹具夹更聪明的操作。

2)恒星运动时代本地机器人模型ERA-42可以理解物理世界并预测未来

在整合了世界模型之后,ERA-42具有了解物理世界并预测未来的能力,从而大大提高了概括能力和任务成功率。例如,下图上的图显示了在真实物理世界中打开冰箱的逐帧操作,而下图显示了ERA-42生成的环境建模和逐帧预测打开冰箱的任务。您可以看到这两个图片非常接近,这表明模型预测非常准确,并且符合物理定律,例如对象遮挡关系和动作时机。该模型甚至可以进一步预测打开冰箱门后可能放置在冰箱中的物品。

这与其他直接学习动作,忽略他们理解世界本身的方式或仅使用世界模型仅生成模拟数据的机器人模型本质上有所不同。

实际执行任务和ERA-42预测执行任务的比较图表

3)Star运动时代本地机器人模型ERA-42具有更强的概括能力。

以基于大规模视频数据的预训练为例,以巧妙的手的概括能力为例,只收集了一小部分数据。根据ERA-42的概括能力,您可以在短时间内学习执行新策略。操作任务。每个操作都是通过自然语言文本或语音的句子直接执行端到端输出的,并直接执行操作,即使面对新的,看不见的环境或任务,也可以推广到新的,看不见的环境或任务未触及。通过的对象可以用巧妙的手顺利完成操作任务。

以前,时代技术团队收集了简单的红色,黄色和蓝色块,通过这种训练方法捕获数据,成功地实现了以前从未见过的各种物体(例如胡萝卜,茄子等)的捕获和概括,并且相对较不见其他模型算法显着提高了概括任务中的成功率。

通过简单彩色正方形的抓取数据的概括和抓取不同对象的操作

4)Star ERA本地机器人模型ERA-42具有更强的适应性

得益于世界模型的整合,ERA-42可以快速响应外部干扰并自适应地适应完成任务。从下面的视频中,我们可以看到,面对长期任务,它可以快速响应干扰,而中间没有任何停顿。敏捷手恒星可以立即认识到东西已经移开,可以独立优化并调整操作,直到操作完成为止。

可以看出,ERA-42在单个任务和长期任务中都表明了其行业领先的强大反干扰能力。

5)Star ERA本地机器人模型ERA-42最初反映了“效应”

研究结果表明,随着模型量表的扩展,任务成功率也显着增加,最初反映了与大型语言模型训练的“效果”,即模型量表与性能之间的正相关性。

“效果”表明该模型与机器人性能和硬件协调的迭代进化显示正相关

Star ERA的端到端本地机器人型号ERA-42与AI共同建立本地体现的智能机构的新硬件平台合作。

构建通用体现的代理需要软件和硬件的迭代,这与大语言模型的本质不同。大型语言模型本质上仅需要数据和算法的迭代,而体现的智能需要将本体论包括在内,即本体论,算法和数据共同迭代,优化和进化。就像人的大脑和身体从小到大生长一样。

因此,主演ERA创建了一个为AI定义的新硬件平台。以人形机器人的核心执行端敏感手为例,发射的五指敏感手共有12个活跃的自由度,其中三个自由度每个都有拇指和夹具手指,还有两个自由度的其他三个手指。 ,食指可以侧面摆动,拇指具有广泛的活动能力,并且可以在多个手指之间实现柔性和协调的运动,例如拇指可以连接到小手指,扭动瓶盖,等等。

此外,采用了纯电动驱动方法,每个程度的自由度都有相应的驾驶源,可以独立控制所有手指的每个自由度,实现完全自主的五重驾驶,具有高灵活性和准确性,能够执行高精度任务。

每个手指都配备了高分辨率(> 100点)触觉阵列传感器,可提供精确的三维力触觉和温度信息。一只手的最大握力达到80n,可以将哑铃提升到25公斤以上。

在操作能力方面表现出更强的操作灵活性,准确性,负载能力和可靠性。在与ERA-42合作之后,它为完成多元化,精致且聪明和敏捷的操作任务奠定了坚实的基础。 ,导致该行业进入体现智能机构的一般和灵活运作的时代。依靠ERA-42,将大大改善Star ERA执行的任务的普遍性和概括。结合先前释放的运动性能在复杂而多样的地形上稳定步行和奔跑,再加上上肢和下肢一起工作的能力,应用程序方案的潜力也将变得更加多样化,真正实现了本地通用体现的工业化聪明的身体。

基于端到端的本地机器人模型和为AI定义的硬件平台,正在促进本地通用体现的智能机构的广泛应用,加速了对数千个行业的机器人服务的实现,并进入了数千个家庭。

- 超过-

量子位签名

关注我们并尽快了解最先进的技术趋势

版权声明:本文为 “博览广文网” 原创文章,转载请附上原文出处链接及本声明;

原文链接:http://wen.bjhwtx.com/post/5810.html

标签:

博览广文网

博览广文网为所有文学爱好者、新闻爱好者、关注生活多方面内容的观众朋友提供多方位的内容呈现、提升阅读空间、填充碎片时间,开阔读者的视野、增长见识、了解民生、一个让您不出户尽知天下事的网站平台!
热门标签
关于我们
广文舒阅网—让天下读者有家可归!这里汇聚了各类优质文化信息,无论是全球热点、历史故事,还是实用百科、趣味探索,您都能轻松获取。我们希望用阅读点亮您的世界,让每一次浏览都充满收获和乐趣。
导航栏A标题
广文舒阅网
扫码关注
联系方式
全国服务热线:0755-88186625
Q Q:8705332
Email:admin@lanyu.com
地址:深圳市福田区海雅缤纷国际大厦5层501
Copyright 深圳市蓝宇科技有限公司 版权所有 备案号:京ICP备20013102号-1