看见门就开?CMU研发新型机器人算法,准确预测日常家具*纵方法
在日常生活中,我们接触的家具多为“铰接物体(articulated objects)“。何谓铰接物体呢?
比如,抽屉有一条可以**的轨道,门有一个垂直的旋转轴,烤箱有一个水平的旋转轴。这种由关节连接起来的物品,我们就叫它“铰接物体 ”。 由于特定关节的存在,铰接物体的零件会受到关节的运动学约束,让这些零件只有一个**度(DoF)。
铰接物体在我们生活中无处不在,构成了我们日常生活重要的一部分。而作为人类的我们,无论是看到什么样的铰接结构的家具,我们都能快速地知道如何去*纵以及开动它。好似我们知道这些物体的每个关节都是如何运动的。
那么机器人能不能也像人类一样,拥有这种可以预测家具如何开动的能力呢?如果可以的话,那将对居家机器人来说是一种很大的提升。
CMU 研发新算法
近日,来自 CMU(卡内基梅隆大学)机器人学院 David Held 教授的 R-PAD 实验室的两名学生 Ben Eisner 和 Harry Zhang 在有效*控复杂铰接物体(articulated objects)方面取得了重大突破,推出了一种基于3D神经网络,能有效表达,预测日常家具等铰接物体的零件运动轨迹的算法 FlowBot 3D。
该算法包含两个主要子策略,其一是利用3D深度神经网络(PointNet++)去预测**纵的物体点云数据(pointcloud)的瞬时运动轨迹 (3D Articulated Flw/3DAF),其二是利用预测出来的运动轨迹去选择机器人下一步的动作。二者完全在模拟器中学习,并可以直接部署到真实世界中,不需要重新训练或者微调。在 FlowBot 3D 算法的帮助下,机器人可以像人一样随意*纵日常家具等铰接物体。
该**已被机器人**会议 Robotics Science and Systems (RSS) 录取,并将会在7月于纽约展出
以往的日常家具*控要么是已知**纵物体的几何特征(比如连接轴的位置及方向),要么通过模仿人类去学习如何*控一个给定的物体。二者都没有较好的可泛化性并且需要大量人类数据去训练。
与这些不同,FlowBot 3D 是第一个基于模拟器学习,通过学习每个零件的瞬时运动轨迹,使机器人可以计算出一条最优的物体*纵路径。这个特性使 FlowBot 3D 可以泛化到训练没有见到的物体上,并且可以直接部署到真实世界。
具体来说,FlowBot 3D 完全在模拟器中进行监督学习,从而学习出日常家具等铰接物体零件的瞬时运动轨迹 (3D Articulated Flow/3DAF)。3DAF 是一种 3D 视觉表达方式,它能够极大简化策略的复杂度,从而提高*纵效率。机器人只需要紧密跟随这条瞬时轨迹,并闭环地重新预测,就能成功*纵一个铰接物体。
开动冰箱门
开动马桶盖
开动抽屉
FlowBot 3D 赋能的 Sawyer 机器人不仅可以迅速识别哪个家具零件可以**控,还可以准确预测出开动零件的预测轨迹。
对于这篇工作,审稿人表示:“是对机器人*控学可观贡献”
机器人是如何做到的?
手动编码(hardcoding)的策略可以提高机器人在受控环境中的性能,但是想要机器人真正的理解家用物品的*控方式,唯一的方法是教机器人像人一样去预测这些物体的运动轨迹以及运动学约束(kinematic constraint)。
想要赋予机器人预测物体运动轨迹能力,研究者通过监督学习在模拟器中训练机器人的视觉模块,因为家用物体的运动轨迹在模拟器中可以准确计算出来。
在训练中,机器人观测到一个**纵物体的点云(pointcloud)数据,然后在这个点云数据上,机器人的视觉模块利用 PointNet++ 来对每一个点(per-point)预测其在受外力下的下一步的位置。此运动轨迹的真实数据可以通过顺向运动学(forward kinematics)准确计算出来。将计算出来的下一步坐标减去目前的坐标就能得到**控物体零件的运动轨迹(3D articulated flow/3DAF)。因此,训练的时候只需要去最小化预测出的 3DAF 和真实数据的 3DAF 的 L2 loss 。
这里的红色向量就代表预测出的门的运动轨迹
FlowBot 3D 通过在模拟器中学习多种铰接物体在运动学约束下运动的轨迹,来预测新物体的*纵方向。常见的家用绞接物品分为**式(pri**atic)和旋转式(revolute)两种。对于这两种类别,研究者用物理定律证明了直接跟随长度最长的 3DAF 方向(比如最远离门旋转轴的点)是可以最大化物体的加速度来达到*纵目的**策略。
有了理论加成,机器人只需要选择可抓取的最大 3DAF 预测点就可以有效率地*控这些物体。由于机器人的视觉模块学习的是在运动学约束下的每点(per-point)运动轨迹,此视觉模块对机器人对物体可能的遮挡有一定的鲁棒性。另外,由于 FlowBot 3D 算法是闭环算法,机器人可以在下一步对自己可能出现的错误进行修正。
在真实世界中部署
FlowBot 通过使用两个子**(视觉和*纵**)克服了泛化性的挑战。在真实世界中,FlowBot 3D 可以准确预测出 3D AF 物体运动轨迹。只要这个轨迹可以准确预测出,那么*纵物体就只需要跟随这个轨迹这么简单。在真实世界中,FlowBot 3D 只需要使用模拟器中训练出来的一个模型就可以*控真实物体。
FlowBot3D在真实世界中部署的设置
即使真实世界中的物体和模拟器中的外貌上有很大不同,只要两者的运动学约束相似(**式或者旋转式),那么 FlowBot 3D 就可以准确预测出*控物体的策略。
在模拟器中,机器人使用部分类别的家用物品进行训练。训练的物体包括订书机,垃圾箱,抽屉,窗户,冰箱等。研究者在模拟器中利用这些物体去训练出来一个能准确预测 3DAF 方向和大小的模型。
通过高准确度视觉模块和比较简单的*作策略模块的这种组合,机器人可以快速的预测并且*控没见过的物体。
相比较而言,先前基于模仿学习或者强化学习的方法训练的机器人需要几百万的训练数据,有时还需要人工指导才会学习新型物体的*控方式,使得这些机器人在现实世界中,尤其是家用机器人场景中不现实。
实验表明,支持 FlowBot 3D 部署的机器人成功地在*控较有难度的新型铰接物体,表现优于基于模仿学习部署的机器人。研究者使用相同的策略执行所有现实世界的部署,而不需要任何模拟校准或现实世界的微调。
实验结果显示,FlowBot 3D 在*作多数物体时都能将对“全开”的距离达到10%以下。然而其他基于模仿学习或者强化学习的方法差了很远。
FlowBot 3D 是机器人技术一项激动人心的进步,它可以无需微调在现实世界中部署高效且准确性强的家用机器人。这项工作还表明,计算机视觉的进步可以改变机器人领域,增强机器人的能力,同时使这些改进更易于扩展到新的条件。纯粹依靠模拟器学习的方法有可能在直接部署到真实世界里,并且有较强的泛化性,这将大大降低未来家用机器人训练和学习的成本。
关于实验室及课题组
这篇工作是在卡内基梅隆大学机器人学院的 Robots Doing and Perceiving (R-PAD) 实验室进行及完成的。R-PAD 实验室在可变形物体*纵(如学习理解布料)课题上处于世界领先地位。实验室的负责人是 PhD 毕业于斯坦福大学的 David Held 副教授,师从Silvio Savarese。实验室的主旨是利用计算机视觉方法(perceiving)帮助机器人去完成复杂的任务(doing)。
David Held 副教授相信,即使端对端学习方式很简单,但是真正部署到机器人上的时候会遇到许多问题,所以研究者应该将视觉(perception)与策略(policy)分开考虑,但是同时思考二者如何互相增加能力。在 FlowBot 3D 这篇工作中,这个主旨深度体现了出来:3D Articulated Flow 是一个可以极大简化策略和规划的视觉表示方式,在正确 3D Articulated Flow 预测的基础上,策略会被简化成追踪 flow 向量。
本文的第一作者是 R-PAD 实验室二年级学生 Ben Eisner,他对 3D 视觉学习有极大兴趣,本科毕业于普林斯顿大学,师从 Sebastian Seung,加入 CMU 之前,Ben Eisner 曾在谷歌和三星北美研究所工作,从事机器人学习(robot learning)的研究。本文的共同第一作者是 R-PAD 实验室一年级学生 Harry Zhang,他对视觉和控制学都有极大兴趣,本科毕业于加州大学伯克利分校,师从 Ken Goldberg,加入 CMU 之前,Harry Zhang 在伯克利的 BAIR 实验室负责可变形物体动态*纵(learning dynamic deformable objects manipulation)项目。
课题组合影
下一步,**作者在尝试将 flow 这种视觉理解方式应用到铰接物体以外的物体上面,比如如何用 flow 预测6**度的物体轨迹。同时,作者在尝试将 flow 应用到强化学习里,以增加强化学习的学习效率。
强化学习与灵巧机器人
得益于 DeepMind 开发的计算机 AlphaGo 在围棋领域取得的惊人成就,强化学习这项技术在近几年备受关注。而随着设备计算速度的提升,以及深度学习架构的兴起,强化学习也得到了快速的成长。
(图片来源:MIT Technology Review)
强化学习的优势在于可以不依赖标注,而是由奖励函数来主导学习过程,这一点与人类在大多数情况下的学习方式是如出一辙的。2017年,强化学习被评选为《麻省理工科技评论》“全球十大突破性技术”之一。
强化学习的出现,不仅改善了自动驾驶汽车的技术,还让机器人可以在无需明确指导的情况下,掌握对一些物体的简单*作。就像前文提到的那样,机器人也能做到和人一样,在看到物体后就立刻明白如何将其拿起或打开。
相信在不久的将来,各种能够模仿人类行为的灵巧机器人(2019年《麻省理工科技评论》“全球十大突破性技术”之一),将以不同的方式走进千家万户。
(图片来源:MIT Technology Review)
相关链接
**地址:https://arxiv.org/pdf/2205.04382.pdf
项目主页:https://sites.google.com/view/articulated-flowbot-3d
David Held副教授的主页:https://davheld.github.io/
Ben Eisner的主页:https://beisner.me/
Harry Zhang的主页:https://harryzhangog.github.io/
一 公司基本情况速览总股本:1.879亿 总发行量 :4690万 发行**:10.69元 募资总额:5.01亿发行市盈率:20.42倍 行业市盈率:19.12倍所属行业:燃气生产和供应 所属区域:陕西
美能能源(001299)12月6日主力资金净买入1125.28万元
截至2022年12月6日收盘,美能能源(001299)报收于27.53元,上涨2.92%,换手率39.8%,成交量18.67万手,成交额5.05亿元。12月6日的资金流向数据方面,主力资金净流入112
截至2022年11月8日收盘,美能能源(001299)报收于22.69元,上涨3.18%,换手率71.38%,成交量33.48万手,成交额7.75亿元。资金流向数据方面,11月8日主力资金净流出399
专访美能能源董事长晏立群:紧随绿色低碳能源**大潮 捕捉清洁能源发展新商机
90年代初,****前沿的深圳还处在草莽创业的时期,那时候,深圳吸引了一批又一批来自全国各地的年轻人,晏立群就是其中之一。从外出闯荡到回乡扎根,从推销液化气灶具到推广应用天然气,从“打工人”到创业者,
美能能源(001299)7月20日股东户数2万户,较上期减少6.82%
近日美能能源披露,截至2023年7月20日公司股东户数为2.0万户,较7月10日减少1465.0户,减幅为6.82%。户均持股数量由上期的8731.0股增加至9370.0股,户均持股市值为15.18万
美能能源2023年3月22日在深交所互动易中披露,截至2023年3月20日公司股东户数为2.27万户,较上期(2023年2月10日)减少3573户,减幅为13.59%。美能能源股东户数低于行业平均水平
美能能源7月24日在交易所互动平台中披露,截至7月20日公司股东户数为20020户,较上期(7月10日)减少1465户,环比降幅为6.82%。证券时报•数据宝统计,截至发稿,美能能源收盘价为16.20
记者 | 陈慧东编辑 | 10月31日上市首日,美能能源(001299.SZ)高开后一路上涨,两次触及涨停**,于10时01分许封上涨停板。截至收盘,该股股价上涨43.97%,报15.39元/股,成交
美能能源2023年7月18日在深交所互动易中披露,截至2023年7月10日公司股东户数为2.15万户,较上期(2023年6月30日)增加59户,增幅为0.28%。美能能源股东户数低于行业平均水平。根据
多主力现身**榜,美能能源换手率达67.90%(11-24)
深交所2022年11月24日交易***息显示,美能能源因属于当日换手率达到20%的证券而登上**榜。美能能源当收22.57元,涨跌幅为-1.53%,换手率67.90%,振幅10.43%,成交额7.
多主力现身**榜,美能能源换手率达47.30%(11-23)
深交所2022年11月23日交易***息显示,美能能源因属于当日换手率达到20%的证券而登上**榜。美能能源当收22.92元,涨跌幅为9.98%,换手率47.30%,振幅12.57%,成交额4.9
11月30日美能能源(001299)**榜数据:机构净买入6.49万元
沪深交易所2022年11月30日公布的交易***息显示,美能能源(001299)因日换手率达到20%的前5只证券登上**榜。此次是近5个交易日内第5次上榜。截至2022年11月30日收盘,美能能源(0
美能能源将开启申购:上半年增收不增利,预计上市时市值20亿元
10月17日,陕西美能清洁能源集团股份有限公司(下称“美能能源”,SZ:001299)披露发行公告,并将于2022年10月18日开启申购。本次上市,美能能源的发行价为10.69元/股,发行市盈率20.
美能能源(001299)11月15日主力资金净卖出2095.05万元
截至2022年11月15日收盘,美能能源(001299)报收于20.1元,下跌1.03%,换手率21.43%,成交量10.05万手,成交额2.01亿元。11月15日的资金流向数据方面,主力资金净流出2
深交所2022年10月31日交易***息显示,美能能源因属于无**涨跌幅**的证券而登上**榜。美能能源当收15.39元,涨跌幅为43.97%,换手率7.15%,振幅23.95%,成交额5142.
陕西又一城燃公司IPO过会,美能能源“内生式增长”成效几何?
华夏时报(www.chinatimes.net.cn)记者 苗诗雨 陆肖肖 北京报道继陕天然气(002267.SZ)后,陕西第二家区域性城燃公司即将于近日上市发售。天然气资源和油气资源丰富的陕西地区,
加码新能源领域投资 美能能源拟投建集团总部暨西安智慧能源研究院
本报记者 殷高峰11月14日,美能能源发布公告称,公司与西安高新区管委会拟签订《美能能源总部暨西安智慧能源研究院建设项目协议书》,公司计划在西安高新区上市企业园建设美能能源总部暨西安智慧能源研究院,总
多主力现身**榜,美能能源换手率达55.10%(11-25)
深交所2022年11月25日交易***息显示,美能能源因属于连续三个交易日内收盘**涨幅偏离值累计20%、当日换手率达到20%的证券而登上**榜。美能能源当收24.83元,涨跌幅为10.01%,换
多主力现身**榜,美能能源换手率达32.22%(05-29)
深交所2023年5月29日交易***息显示,美能能源因属于当日换手率达到20%的证券而登上**榜。美能能源当收18.72元,涨跌幅为3.43%,换手率32.22%,振幅12.43%,成交额2.73
11月7日美能能源(001299)**榜数据:机构净卖出1216.39万元
沪深交易所2022年11月7日公布的交易***息显示,美能能源(001299)因日换手率达到20%的前5只证券登上**榜。此次是近5个交易日内第3次上榜。截至2022年11月7日收盘,美能能源(001