原创 Synced 机器之心
机器之心报道
作者:蛋酱
多亏昇腾 AI 的助力,我们才能看到这么稳的「机器狗巡检员」。
自上世纪「机器人」概念被提出以来,人们就对各种形态的机器人产品寄予厚望。在普通人最初的想象中,机器人能和我们聊天,帮我们打扫房间、端茶递水,甚至能帮我们驾驶车辆……
直到近年来大数据技术、人工智能专用芯片、人工智能算法突飞猛进,智能机器人才真正进入增长爆发期,让我们有了「梦想照进现实」的感觉。
从爆火的四足机器狗,到初具雏形的人形机器人,众多先进的机器人产品开始走进人类社会生活的方方面面。当然,除了生活服务之外,机器人也正在积极打入广阔的产业场景:物流分拣、农业上的喷洒采摘、巡检救援,都是机器人可以贡献价值的空间。
在近日的 2022 昇腾 AI 开发者创享日 · 南京站活动中,我们见到了这样一只超级靠谱的「机器狗巡检员」。熟悉机器狗产品的朋友会发现,它就是当年央视春晚后台拉盒饭的「网红打工机器狗」。来自宇树科技 Unitree,在华为昇腾 AI 加持下,现在的它变成了「机器狗巡检员」。
当无人值守的电站发出警报,是它熟练地捏住把手,并且果断打开了门:
接下来,它一顿操作,迈过地面的台阶障碍,精准地拉下了电闸。至此,警报解除:这位「机器狗巡检员」来自昇腾 AI。你可能已经发现了一些特别之处——它有一支威风凛凛的「机械臂」。
那么,这只机器狗究竟是如何打造的呢?它的机械臂又有什么妙用呢?
走近这位「机器狗巡检员」
一般来说,要想让机器狗在真实世界中圆满地完成任务,主要挑战就在于运动控制。
众所周知,人类的运动是由中枢神经系统控制的。其中大脑的运动皮质和运动前皮质负责自主运动的计划和执行,基底神经节和小脑负责调节运动皮层神经元的反应,帮助协调、运动和平衡。
对于机器狗的运动控制来说,AI 处理器就相当于「大脑」,负责任务决策、感知识别、导航规划等功能的实现。
传统机器狗运动控制算法存在建模复杂、开发耗时长、高度依赖经验等局限性,近年来,很多研究者开始将强化学习应用到实体机器人上,增强机器狗的环境适应能力。比如这一次,华为就使用了「Teacher-student」策略进行机器狗运动控制算法训练。
使用「Teacher-student Policy」完成机器狗运动控制算法训练
具体而言,Teacher 部分通过强化学习训练一个最优的参考控制策略,它能获取完美的特权信息(如地面摩擦系数),让机器狗能在随机生成的地形上遵循期望的速度指令行走;Student 部分通过监督学习把 Teacher policy 蒸馏成一个 Student policy,它在带传感噪声的环境中训练,且只能获取真实机器人能得到的传感器信息。最终,团队将训练好的 Student policy 部署在真实机器狗上。
为了让机器狗在更多的应用场景中「发光发热」,华为还给机器狗加了一条「AI 机械臂」。有了这条机械臂之后,它 的动作技能直线飞升,不仅可以轻松开门,还能平稳地跨越地面障碍: