如何确保由神经网络控制的机器人的稳定性?
发布时间:2024-08-02 作者:Alex Shipps
神经网络控制器为复杂机器人提供了稳定性保障,为自动驾驶汽车和工业机器的更安全部署铺平了道路。麻省理工学院的研究人员开发了一种高效的算法来认证复杂系统中的Lyapunov函数,确保神经网络控制的机器人在各种环境中实现稳定性和安全性。
神经网络对工程师如何设计机器人控制器产生了巨大的影响,催生了自适应能力更强、效率更高的机器。不过,这些类似大脑的机器学习系统也是一把双刃剑:其复杂性使其功能强大,但也难以保证由神经网络驱动的机器人能够安全地完成任务。
验证安全性和稳定性的传统方法是通过称为 Lyapunov 函数的技术。如果你能找到一个 Lyapunov 函数的值持续下降,那么你就可以知道,与较高值相关的不安全或不稳定情况将永远不会发生。不过,对于由神经网络控制的机器人来说,之前验证 Lyapunov 条件的方法并不能很好地扩展到复杂的机器。
麻省理工学院计算机科学与人工智能实验室(CSAIL)和其他机构的研究人员现在已经开发出新的技术,可以在更复杂的系统中严格认证Lyapunov计算。该算法高效搜索并验证了Lyapunov函数,为系统提供了稳定性保障。这种方法有可能使机器人和自动驾驶车辆(包括飞机和航天器)的部署更加安全。
图:研究人员设计了一种新算法,可以保证由神经网络控制的机器人的稳定性,
最终可能带来更安全的自动驾驶汽车和工业机器人。
为了超越以往的算法,研究人员在训练和验证过程中找到了一条省钱的捷径。他们生成了成本更低的反例——例如,来自传感器的对抗性数据可能会使控制器失灵——然后对机器人系统进行优化,以应对这些反例。了解这些边缘案例有助于机器学习如何处理具有挑战性的情况,从而使它们能够在比以往更广泛的条件下安全运行。然后,他们开发了一种新颖的验证公式,能够使用可扩展的神经网络验证器α,β-CROWN,在反例之外提供严格的最坏情况保证。
“我们已经在人形机器人和机器狗等AI控制的机器上看到了一些令人印象深刻的经验性能,但这些AI控制器缺乏对安全关键型系统至关重要的形式保证。”麻省理工学院电气工程与计算机科学(EECS)博士生、CSAIL 附属研究员Lujie Yang说:“我们的工作缩小了神经网络控制器的性能水平与在现实世界中部署更复杂的神经网络控制器所需的安全保证之间的差距。”
在数字演示中,该团队模拟了带有激光雷达传感器的四旋翼无人机如何在二维环境中保持稳定。他们的算法成功地将无人机引导到稳定的悬停位置,仅使用激光雷达传感器提供的有限环境信息。
在另外两个实验中,他们的方法使两个模拟机器人系统能够在更广泛的条件下稳定运行:倒立摆和路径跟踪车辆。这些实验虽然规模不大,但比以前的神经网络验证可能做的要复杂得多,特别是因为它们包含传感器模型。
“与常见的机器学习问题不同,严格使用神经网络作为Lyapunov函数需要解决困难的全局优化问题,因此可扩展性是关键瓶颈,”加州大学圣地亚哥分校计算机科学与工程副教授Sicun Gao说, “目前的工作通过开发算法方法做出了重要贡献,这些算法方法更适合神经网络的特定使用,因为Lyapunov在控制问题中的作用。”
与现有方法相比,它在可扩展性和解决方案质量方面取得了显著的改进。这项工作为进一步开发神经Lyapunov方法的优化算法,以及深度学习在控制和机器人技术中的严格使用开辟了令人兴奋的方向。
新的稳定性方法具有潜在的广泛应用。在这些应用中,保证安全至关重要。它可以帮助确保飞机和航天器等自动驾驶汽车的行驶更顺畅。同样,运送物品或绘制不同地形的无人机也可以从这种安全保证中受益。
新方法不仅限于机器人技术,在未来可能会帮助其他应用,如生物医学和工业加工等。虽然该技术在可扩展性方面比以前的工作有所提升,但研究人员正在探索它如何在具有更高维度的系统中表现得更好。他们还希望考虑激光雷达读数以外的数据,例如图像和点云。
作为未来的研究方向,该团队希望为处于不确定环境和易受干扰的系统提供相同的稳定性保证。例如,如果一架无人机面临一阵强风,研究人员希望确保它仍然能稳定飞行并完成预期的任务。
此外,他们打算将他们的方法应用于优化问题,其目标是在保持稳定的同时最小化机器人完成任务所需的时间和距离。并计划将他们的技术扩展到类人机器人和其他现实世界的机器,在这些机器中,机器人需要在与周围环境接触时保持稳定。