双足机器人Cassie Cal学会变戏法 | 智能技术

发布日期:2019-12-15 10:00
Cassie可能没有任何武器可以使用,但这并不能阻止它在头上晃动。


图片:加州大学伯克利分校

Cerebras Systems CS-1的高度为67厘米,其性能是Google TPU2系统的三倍,后者占用的空间是后者的29倍。

并没有特别的原因,为什么会变戏法对于机器人来说是有用的技能。尽管如此,仍经常教会机器人如何处理事物。盲人机器人可以玩耍,人形机器人可以玩耍,甚至无人机都可以玩耍。为什么?因为杂耍很难,老兄!您必须立即考虑一堆不同的事情,也要立即做一堆不同的事情,这个特定的人至少会觉得压力太大。尽管杂耍可能不会使机器人感到压力,但它确实需要仔细协调感测,计算和驱动,这意味着它与测试系统功能一样是一项好任务(并且比大多数任务更具娱乐性)。
加州大学伯克利分校的Cassie Cal机器人由两条腿组成,如果您感到慈善,可以称其为躯干。她刚刚学会了通过将球弹跳到她的头(如果她有一根的话)上来变戏法。这个想法是,如果Cassie可以同时兼顾平衡,那么她也将能够做其他需要动态多任务处理的事情。如果那还不成功,她仍然可以加入马戏团。


Cassie的玩杂耍由一个外部运动捕捉系统辅助,该系统可以跟踪球的位置,但是除此之外,其他一切都是自主的。卡西能够通过前后倾斜,左右倾斜以及上下移动来改变球的位置。她在保持自己平衡的同时做到了这一点,这是本研究的重点–成功执行了两种动态行为,有时这些行为可能彼此矛盾。这里的最终目标不是制造一个更好的杂耍机器人,而是探索动态多任务处理,这是机器人在人类环境中取得成功所必需的技能。
这项工作是由Koushil Sreenath领导的加州大学伯克利分校的混合机器人实验室完成的,由Katherine Poggensee,Albert Li,Daniel Sotsaikich,Bike Zhang和Prasanth Kotaru完成。
有关更多详细信息,我们通过电子邮件与Albert Li进行了交谈。


图片:加州大学伯克利分校

加州大学伯克利分校的卡西·卡尔(Cassie Cal)正准备变戏法
IEEE Spectrum在不依靠运动捕捉的情况下让Cassie玩弄些什么?
李彦宏(Albert Li):我们从运动捕捉开始的动机是首先解决在两足动物上玩杂耍的控制难题,而不必担心实现感知。实际上,我们确实有一个在摄像机上工作的测球器,这意味着我们不必依赖运动捕捉系统。但是,我们需要以能够提供最佳向上视野的方式安装摄像机,并且我们还开发了一种可靠的估算器。估算器尤其重要,因为当球离相机足够近时,我们实际上无法跟踪球,必须假设我们的动态模型足够准确地描述其运动,直到弹回为止。
是什么让Cassie无限期地变戏法?
有几个因素影响Cassie可以维持玩杂耍的时间。在仿真过程中,桨叶显示出均匀的特性(如刚度和阻尼),但实际上每个表面都具有各向异性的接触特性。因此,桨的某些部分可能比其他部分更好玩(并且重要的是,其响应方式与建模方式不同)。由于桨叶安装在Cassie上时如何悬臂,这些接触差异也会加剧。当球击中这些区域时,会导致变戏法中的错误大于预期。由于桨的尺寸较小,因此球可能刚好碰到桨的边缘并结束了杂耍。从长远来看,这很可能会发生。此外,一些较大的杂耍错误可能会导致Cassie的脚稍微滑倒,最终会随着时间改变稳定的站立姿势。由于此版本的控制器假定Cassie处于静止状态,因此这种位置变化最终会导致变戏法和故障。
Cassie会在走路(或胡佛)时玩杂耍吗?
玩杂耍时走路(和交叉行走)是一个更具挑战性的问题,并且无疑是未来研究的目标。这些挑战中的一些挑战包括使球拍以精确的姿势摆弄球,同时还要避免避免错误地踩踏而产生不稳定的影响。每走一步的玩杂耍的数量也可能变化,并使问题的数学更具挑战性。控制器目标也涉及更多。虽然杂耍控制器的当前目标是将球杂耍到静态的顶点位置,但使用步行杂耍控制器,我们可能想向前击球,也向前走以弹跳它,沿着特定路径杂耍球,解决这些挑战将是后续研究的主要方向。
您能否举一个实际的任务示例,该任务可以通过使用像这样的控制器来实现?
研究杂耍意味着研究接触行为并利用我们的模型来达到已知的目的。杂耍也可以用来研究可预测的接触后飞行行为。请考虑以下情形:机器人尝试进行接球,但失败了,让球从其手中弹起,然后恢复了接球。这种行为也可能是故意的:通常更容易先执行弹跳以指引目标,然后执行后续操作。例如,排球运动员原则上可以直接将尖刺的球击回,但几乎总是将球击回然后再将其返回。
甚至在这个激励人心的例子之外,我们用于杂耍工作的模型更普遍地适用于任何涉及接触的任务,其中可能包括诸如弹跳和滚动之类的弹跳之外的任务。例如,通过将物体推向侧面来清理桌子上的空间可能比单独操纵桌面上的每个物体要好。
您提到了协作性杂耍或杂耍多个球-您是否尝试过?您能否再谈谈下一步的工作?
我们尚未开始进行协作或多球杂耍的工作,但这也是未来工作的目标。静态地打多个球可能是最合理的下一个目标,但也带来了其他挑战。例如,您必须编码一个杂耍性紧迫性的概念(如果第二个球没有受到足够的重击,则在回到第二个球之前,您有较少的时间来举起第一个球)。
另一方面,协作式人机交互需要一个更高级的决策框架。为了获得强大的多智能体玩法,机器人将需要采用某种概率模型来预测人类的行为(他们可能会移动到某个地方吗?他们是试图将球高低抓住吗?将球击中安全吗?背部?)。通常,开发这样的人类模型很困难,因为人类是相当不可预测的,并且通常不会表现出理性的行为。这将是未来工作的重点。