安博体育APP官方网站-OpenAI 的前沿 AI 系统,让机器人手臂有人类灵活性

本年 6 月,由马斯克、霍夫曼、彼得·蒂尔等一众硅谷年夜佬结合成立的非营利 AI 研究公司 OpenAI 曾占据了新闻头条,由于其最新的人工智能 Dota 2 玩家——OpenAI Five——成功击败了业余人类玩家。今天,它再次吸引了人们的眼球:一个可以或许以人类矫捷度来操控物体的机械人系统。 在一篇行将颁发的论文“Dexterous In-Hand Manipulation”(工致的手工操作)中,OpenAI 的研究人员展现了一种利用加强模子的系统,它在一系列频频的实验与试错中让 AI 进行进修,终究指点机械人用手臂以精准的标准抓取并操控物体。更使人不测的是,它完全在计较机摹拟中进行数字练习,没有供给任何人类演示。 “对人类而言,工致地操控物体属在根基平常,但对机械人却颇具挑战,”团队写道。“今朝的机械人凡是是在有限的设置中完成特定的使命,良多都不克不及把握复杂的结尾履行器。在这项研究中,我们演示了节制策略的培训方式,这些节制策略可以进行手工操作,而且可以摆设在机械人上。” 那末他们是若何做到的?研究人员用 MuJoCo 物理引擎来摹拟物理情况,让真实的机械人可以在此中进行操作。他们还用 Unity 衬着图象,经由过程培训计较机视觉模子来让机械人辨认姿式。但这类方式有局限性,摹拟只是物理模子的“粗略近似”,过渡到实际世界中可能就有点坚苦了。图丨 OpenAI 的机械人系统开辟的新型物体操控手臂 他们的解决方案是将各个情况变量随机化,好比物理(磨擦、重力、关节限制、物体尺寸等)和视觉外不雅(亮度、姿式、材料和纹理)。这既下降了过度拟合(神经收集在练习中受噪音干扰而对其机能发生负面影响的现象)的可能性,又增添了生成有用算法的机遇,让机械人基在真实世界手势与姿式选择动作。 接下来,研究人员最先练习轮回神经收集模子。384 台计较机,每台配备 16 核 CP安博体育下载官网U,每小时可以发生约两年的摹拟经验。在一个 8 核 CPU 电脑长进行优化后,他们又进入下一步:练习卷积神经收集。卷积神经收集可以经由过程三个摹拟摄像机图象来猜测机械人手中物体的位置和标的目的。图丨模子练习流程图 模子练习完成后便可以最先验证测试了。研究人员利用的是幻影手臂(Shadow Dexterous Hand),它是一个具有 24 个自由度的五指机械人手臂。为了操控物体,手臂被安装在铝制框架上。研究人员同时用两组摄像机(动作捕获摄像机与 RGB 摄像机)作为系统的眼睛,它可以追踪物体的扭转与标的目的。(固然幻影手臂有触摸传感器,但团队仅选择利用其关节感应功能敌手指位置进行细粒度节制。) 团队测试了两次。第一次测试中,算法的使命是将标有字母的立方体从头定向。团队随机拔取字母,AI 系统完成以后就改换新字母,如斯一向反复,直到立方体从机械人手中脱落,或操控一个立方体要所需时候跨越 1 分钟,又或机械人成功操作 50 次。在第二次测试中,研究人员将立方体替代为八角棱柱。 成果若何呢?这些模子不但有“史无前例”的表示,而前还趁便发现了人类的抓取动作,好比三角抓取(用拇指、食指和中指抓取),棱镜抓取(拇指与其它手指彼此对峙),还指尖捏握。它们还学会了若何扭转机械人手臂,和若何操纵重力、平移和改变力将物体放入抱负位置。 “我们的系统不但能从头发现人类的抓取技术,还能让抓取动作更好地顺应本身的局限和能力,”他们写道。安博体育平台app下载 但它还不敷完善。它还没有接管操控多个物体的练习,抓取球形物体很费力。在第二次测试中,摹拟和真实的机械人操作之间存在丈量获得的机能差距。 但终究,该研究揭示了今世深度进修算法的潜力。研究人员总结说:“实际世界中有一些问题是那些非进修型机械人没法解决的,我们的算法可以解决这些问题”。-安博体育APP官方下载