Science Robotics 麻省理工学院最新研究,从仿真中学习的精确选择、定位和抓放物体的视触觉方法

现有的机器人系统在通用性和精确性两个性能目标上难以同时兼顾,往往会陷入一个机器人解决单个任务的情况,缺乏"精确泛化"。本文针对精准和通用的同时兼顾提出了解决方法。提出了SimPLE(Pick Localize和placE的仿真模拟)作为精确拾取和放置的解决方案。该方法在仅给定物体的计算机辅助设计(CAD)模型的情况下,学习在仿真模拟中拾取、抓取和放置物体。它由三个部分组成:任务感知抓取、视触觉物体位姿估计和手对手抓取的运动规划。
在这里插入图片描述

图1 精确拾取和放置
之后使用对象的几何形状在模拟中设计组件,然后将SimPLE转移到真实系统,而不需要任何与对象相关的实际经验。
在这里插入图片描述

图2 模拟生成模型

在这里插入图片描述

图3 现实中的部署情况
1.任务感知抓取
SimPLE根据场景的深度图像对对映抓取进行采样并计算物体姿态的初始估计。之后,我们使用在模拟中学习到的任务感知质量指标来评估每个采样抓取的质量,并命令机器人执行最佳的反足抓取(图3-A)。任务感知抓取是指选择与拾取和放置任务兼容的抓取。
2.视觉触觉物体位姿估计
一旦抓取到物体,机器人就会接收触觉观察结果并作为输入信号。将触觉图像与初始深度图像相结合,同时对可能抓取的物体姿势分布估计做了更新。(图 3-B)。
3.运动规划
给定物体姿态的最佳估计,之后机器人计算出一组运动,这其中也包括必要的物体重新抓取的情况,并将物体放置在所需的配置之中(图3-C)。最后,机器人执行开环运动(图3-D)。
SimPLE在拾放任务中的实验评估
1.精确拾放任务:
通过精确拾放任务来验证了这一方法,其中需要拾取不同形状的刚性物体并将其精确地放置在刚性夹具上。对于每个测试的对象,SimPLE首先利用该对象的CAD模型并且仅在模拟中学习其感知、掌握稳定性和规划的模型。除此之外,机器人系统由带有平行颌夹具的双臂机器人组成,手指部分安装有触觉传感器。对于每个无碰撞抓取样本,截取了以抓取点为中心对齐的原始深度图像,并将其作为视觉模型的输入。将触觉观察与之前的深度图像相结合,就可以更新物体姿态的视觉估计。最后,采用最佳视觉触觉姿势估计来计算最短路径,并找到了机器人可以执行的最简单的运动计划来放置物体。在15个物体的抓取对SimPLE进行了评估。每个物体进行20次试验。
在这里插入图片描述

图5 15个物体
2.基线实验
对于15个物体中的5个,还进行了一组基线实验来评估SimPLE每个核心组件的影响:任务感知抓取、触觉定位和视觉定位。每个基线消除了其中一个组件,但保留了其他两个组件。在触觉基线中,执行任务感知抓取后,姿势估计仅使用触觉信息,而不是同时使用视觉和触觉观察。在视觉基线中,执行任务感知抓取后,姿势估计仅使用视觉信息,而不是同时使用视觉和触觉观察。最后,对于与任务无关的基线,该基线没有使用任务感知的抓取选择,而是根据Dex-Net (2)的抓取质量指标选择抓取。对该基线的感知使用视觉和触觉信息来估计抓取后的物体姿势。
在这里插入图片描述

图6 任务感知抓取有助于感知

在这里插入图片描述

图7 任务感知抓取提供更好的规划解决方案
结论
在这项工作中提出了一种精确拾取和放置的方法,该方法利用离线计算来实现高度的适应性。使用相同算法以及系统来精确放置从非结构化场景中获取的对象是仍然是许多操纵问题的难题。本文所提及的方法不需要机器人或人类对这些物体的先前经验,展示了可以构建快速适应其他物体而不影响准确性的系统。实验表明,通过视觉触觉感知,在模拟中学习的机器人模型可以成功地转移到真实系统中。与基线相比的结果验证了视触觉传感的需求,以及部署端到端考虑任务要求的策略的好处。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/775541.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

昇思25天学习打卡营第9天|MindSpore使用静态图加速(基于context的开启方式)

在Graph模式下,Python代码并不是由Python解释器去执行,而是将代码编译成静态计算图,然后执行静态计算图。 在静态图模式下,MindSpore通过源码转换的方式,将Python的源码转换成中间表达IR(Intermediate Repr…

电气-伺服(6)脉冲控制

一、脉冲模式原理: 运动控制器输出脉冲信号给伺服驱动器 伺服驱动器工作于位置模式 伺服驱动器内部要完成三闭环(位置闭环 、速度闭环、电流环) 脉冲和伺服控制环:脉冲的个数作用于位置环。脉冲的频率作用于速度环 二、脉冲的两…

ATFX汇市:美国大非农数据来袭,美指与欧元或迎剧烈波动

ATFX汇市:今日20:30,美国劳工部将公布6月非农就业报告,其中新增非农就业人口数据最受关注,前值为27.2万人,预期值19万人,预期降幅高达8.2万人。如果公布值确实如预期一般,美联储降息预期将增强&…

mysql 字符集(character set)和排序规则(collation)

文章目录 概念1、字符集1.1、举例1.2、常见字符集 utf8 和 utf8mb4 区别1.3、字符集 使用 2、排序规则2.1、举例2.2、常见的排序规则 utf8mb4_bin 、utf8mb4_general_ci、utf8mb4_unicode_ci2.3、使用 概念 在 MySQL 中,字符集(character set&#xff0…

昇思25天学习打卡营第8天|ResNet50迁移学习

一、迁移学习定义 迁移学习(Transfer Learning):在一个任务上训练得到的模型包含的知识可以部分或全部地转移到另一个任务上。允许模型将从一个任务中学到的知识应用到另一个相关的任务中。适用于数据稀缺的情况,可减少对大量标记…

【代码大全2 选读】看看骨灰级高手消灭 if-else 逻辑的瑞士军刀长啥样

文章目录 1 【写在前面】2 【心法】这把瑞士军刀长啥样3 【示例1】确定某个月份的天数(Days-in-Month Example)4 【示例2】确定保险费率(Insurance Rates Example)5 【示例3】灵活的消息格式(Flexible-Message-Format …

Windows10删除文件有较长延误的修复方法

Windows10删除文件有较长延误的修复方法 问题描述处理方法 问题描述 电脑配置很好,但是执行文件等删除操作时很长时间才有反应,才会弹出是否删除对话框。或者将文件移动到回收站,也是同样如此。 处理方法 第一步:以管理员身份启…

gitLab使用流程

标题1.配置账户 git config --global user.name git config --global user.email mygitlabmali.cn 标题2.生成秘匙 ssh-keygen -t rsa -C “mygitlabmail.cn” 。 //输入命令后一直回车 ,输入命令后一直回车(密码可以不填),至…

国际上备考所有AWS云计算/IT证书的五大优质免费课程网站

最近越来越多的小伙伴来问小李哥,小李哥亚马逊云科技AWS认证大满贯是在哪里上课复习的呢?全部上付费课程那不是一笔巨款吗?小李哥这次来盘点备考国际上IT证书的5大优质免费课程网站(不只是亚马逊云科技AWS的课程,其他课程同样可以…

Jemeter--独立变参接口压测

Jemeter–独立不变参接口压测 Jemeter–独立变参接口压测 Jemeter–关联接口压测 从数据库获取变参数据源 1、压测计划处添加对应数据库驱动包 左键点击压测计划,进入压测计划页面,点击浏览添加数据库链接jar包 2、线程组添加 JDBC配置原件 填写数据…

技术驱动:探索SpringBoot的大文件上传策略

1.分片上传技术 为了处理大文件上传并保证性能,前后端可以使用分片上传(也称为分块上传)技术。 1.选择原因 分片上传(也称为分块上传)是一种处理大文件上传的技术,主要目的是提高上传的可靠性和效率。 网…

用requirements.txt配置环境

1. 在anaconda创建环境 创建Python版本为3.8的环境,与yolov5所需的包适配。 2. 在Anaconda Prompt中激活环境 (base) C:\Users\吴伊晴>conda activate yolov5 3. 配置环境 用指定路径中的requirements.txt配置环境。 (yolov5) C:\Users\吴伊晴>pip insta…

LeetCode热题100刷题4:76. 最小覆盖子串、239. 滑动窗口最大值、53. 最大子数组和、56. 合并区间

76. 最小覆盖子串 滑动窗口解决字串问题。 labuladong的算法小抄中关于滑动窗口的算法总结&#xff1a; class Solution { public:string minWindow(string s, string t) {unordered_map<char,int> need,window;for(char c : t) {need[c];}int left 0, right 0;int …

【手机取证】如何使用360加固助手给apk加固

文章关键词&#xff1a;手机取证、电子数据取证、数据恢复 一、前言 APP加固是对APP代码逻辑的一种保护。原理是将应用文件进行某种形式的转换&#xff0c;包括不限于隐藏&#xff0c;混淆&#xff0c;加密等操作&#xff0c;进一步保护软件的利益不受损坏&#xff0c;下面给…

Java并发编程知识整理笔记

目录 ​1. 什么是线程和进程&#xff1f; 线程与进程有什么区别&#xff1f; 那什么是上下文切换&#xff1f; 进程间怎么通信&#xff1f; 什么是用户线程和守护线程&#xff1f; 2. 并行和并发的区别&#xff1f; 3. 创建线程的几种方式&#xff1f; Runnable接口和C…

pycharm如何使用jupyter

目录 配置jupyter新建jupyter文件别人写的方法&#xff08;在pycharm种安装&#xff0c;在网页中使用&#xff09; pycharm专业版 配置jupyter 在pycharm终端启动一个conda虚拟环境&#xff0c;输入 conda install jupyter会有很多前置包需要安装&#xff1a; 新建jupyter…

中国IDC圈探访北京•光子1号金融算力中心

今天&#xff0c;“AI”、“大模型”是最炙手可热的话题&#xff0c;全球有海量人群在工作生活中使用大模型&#xff0c;大模型产品涉及多模态&#xff0c;应用范围已涵盖电商、传媒、金融、短视频、制造等众多行业。 而回看2003年的互联网记忆&#xff0c; “上网”“在线”是…

空状态页面设计的艺术与科学

空状态界面是用户在网站、APP中遇到的因无数据展示而中断体验的界面&#xff0c;这个界面设计对于解决用户疑惑有着很大的帮助。那么我们应该如何设计空状态界面呢&#xff1f;空状态是指在界面设计中&#xff0c;没有内容或数据时所显示的状态。它可能出现在各种情况下&#x…

可视化大屏的强势在于预警和感知的科学依据可靠性强

**可视化大屏的强势&#xff1a;预警与感知的科学依据可靠性探究** 数据可视化已成为信息传递的重要手段。其中&#xff0c;可视化大屏作为一种直观、高效的展示方式&#xff0c;广泛应用于各个领域&#xff0c;如智慧城市、智慧交通、智慧医疗等。可视化大屏的强势不仅体现在…

【最详细】PhotoScan(MetaShape)全流程教程

愿天下心诚士子&#xff0c;人人会PhotoScan&#xff01; 愿天下惊艳后辈&#xff0c;人人可剑开天门&#xff01; 本教程由CSDN用户CV_X.Wang撰写&#xff0c;所用数据均来自山东科技大学视觉测量研究团队&#xff0c;特此鸣谢&#xff01;盗版必究&#xff01; 一、引子 Ph…