安博体育APP官方网站-研究人员研发出能听懂英语指令并执行家务的机器人

普林斯顿年夜学、斯坦福年夜学和谷歌的一组研究人员,操纵 OpenAI 的 GPT-3 Davin安博体育app下载ci 模子,研发出了一款能听懂英语指令并履行家务的机械人,名为 TidyBot。这款机械人可以按照用户的爱好,主动完成如分类洗衣服、捡起地上的垃圾、整理玩具等使命。

4034970a304e251fe552c921a379e21b7d3e5348.jpg

GPT-3 Davinci 模子是一种深度进修模子,属在 GPT 模子系列的一部门,可以理解和生成天然说话。该模子具有壮大的总结能力,可以从年夜量的文本数据中进修复杂的对象属性和关系。研究人员操纵这类能力,让机械人按照用户供给的几个示例对象放置位置,如“黄色衬衫放在抽屉里,深紫色衬衫放在衣柜里,白色袜子放在抽屉里”,然后让模子总结出用户的一般偏好法则,并利用到将来的交互中。

研究人员在论文中写道:“我们的根基看法是,LLM(年夜型说话模子)的总结能力与个性化机械人的泛化需求很是匹配。LLM 展现了经由过程总坚固现泛化的惊人能力,操纵从海量文本数据集中进修到的复杂对象属性和关系。”

他们还写道:“与需要昂贵的数据搜集和模子练习的传统方式分歧,我们展现了 LLM 可以直接开箱即用地实现机械人范畴的泛化,操纵它们从海量文本数据中进修到的壮大的总结能力。”

研究人员在论文网站上展现了一个机械人,它可以或许将洗衣服分为淡色和深色,收受接管饮料罐,扔失落垃圾,整理包和餐具,将散落的物品放回原处,并将玩具放入抽屉。

研究人员起首测试了一个基在文本的基准数据集,此中输入了用户偏好,并要求模子建立个性化法则来肯定物品归属。模子将示例总结为一般法则,并利用总结来肯定新物品的放置位置。基准场景界说在四个房间中,每一个房间有 24 个场景。每一个场景包括两到五个放置物品的处所,而且有不异数目的已见和未见物品供模子分类。他们写道,这个测试在未见物品上到达了 91.2% 的正确率。

当他们将这类方式利用到真实世界的机械人 TidyBot 时,他们发现它可以或许成功地整理 85% 的物体。TidyBot 在八个真实场景中进行了测试,每一个场景有一组十个物品,并在每一个场景中运行机械人 3 次。据IT之家领会,除 LLM,TidyBot 还利用了一个叫做 CLIP 的图象分类器和一个叫做 OWL-ViT 的物体检测器。

佐治亚理工学院交互计较学院的助理传授徐丹飞(Danfei Xu)在谈到谷歌安博体育官网入口的 PaLM-E 模子时暗示,LLM 使机械人具有更多的问题解决能力。“之前的使命计划系统年夜多依靠在一些情势的搜刮或优化算法,这些算法不太矫捷,也很难构建。LLM 和多模态 LLM 使这些系统可以或许从互联网范围的数据中受益,并轻松地用在解决新问题。”他说。(来历:IT之家)

-安博体育APP官方下载