《自然》杂志刊文:乒乓球机器人Ace击败人类精英选手;下一步职业赛场?
系统有潜力执行复杂的实时互动任务,并预示其在快速准确的物理交互领域有更广泛的应用前景。
与棋类或电子游戏不同,乒乓球比赛要求系统一边做出瞬时决策,一边完成对高速飞行球体的精准击打,并持续适应对手难以预判的变化。
而这款名为“Ace”的,将视觉传感器、无模型强化学习以及高速机器人硬件结合在一起,其结构类似一根带有乒乓球拍的起重机式机械臂。
它能够自主在空间中定位乒乓球,判断应采用的回球技术,将球击回对方球台,并不断重复这一过程,直到回合结束。
像Ace这样的系统被称为“AI代理”——能在有限人类干预下,通过推理与行动解决多步骤问题。
研究显示,AI的研究人员将Ace与多位高水平乒乓球选手进行了一系列对战测试。
在事先并不了解对手打法风格的情况下,Ace与五名不同精英乒乓球选手(定义为接受过超过10年高强度训练的人)进行了13场比赛,赢下7场。
论文第一作者、AI苏黎世分部总监、索尼AI Ace项目负责人德尔表示,“Ace的出现表明,类似技术可应用于其他需要快速实时控制和人机交互的领域——例如制造和服务机器人,以及体育、娱乐和安全关键型物理领域中的应用。”
1997年,美国超级计算机“深蓝”击败当时世界排名第一的国际象棋大师卡斯帕罗夫;2016年,AlphaGo以4:1战胜韩国著名九段棋手李世石;2019年,OpenAI Five在《Dota 2》中力克人类冠军战队。
为了捕捉时速超过70公里(20米/秒)、转速高达近千弧度/秒的乒乓球,Ace配备了9个同步摄像头和3套视觉系统,其中包括索尼半导体解决方案公司提供的事件视觉。
这套系统能在200Hz的频率下定位球的位置,在700Hz的频率下测算旋转,端到端延迟仅为20.2毫秒。
作为对比,人类精英选手的反应时间通常在230毫秒左右。“这足以捕捉到肉眼看来会变得模糊的运动细节。”德尔解释道。
除了敏锐的“眼睛”,Ace还拥有一只灵活的“手臂”。研究团队开发了一款拥有8个关节的定制机器人平台,这是执行竞技级击球的“最小必要数”:3个关节控制球拍位置,2个调整角度,3个调节击球的速度与力度。
通过拓扑结构优化和3D打印的轻质合金材料,这只机械臂在保证刚性的同时实现了高速运动。研究人员称,该机器人还能精准处理旋转球,以及由球擦网导致的意外轨迹变化。
去年4月的比赛中,在“发球直接得分”方面,Ace以16比8领先于精英选手。
报告还提到一点,在乒乓球台前,Ace带来了另一种压迫感——无法解读的情绪和难以预测的球路。
职业乒乓球选手Taira Mayuka在与Ace对决后坦言,Ace的优势在于“它非常难以预测,且毫无情绪表现”。
“面对人类选手,你可以通过观察对方的微表情或习惯性动作来预判;但面对Ace,由于无法解读它的反应,你很难找到它‘讨厌’或‘难以应对’的球路,这让对决变得异常困难。”
这种“难以捉摸”源于Ace独特的学习方式。它并非通过模仿人类比赛录像来学习,而是模拟训练中自主学习,因此其反应方式与人类选手不同,常会制造出令人意外的局面。
在3000小时的虚拟训练中,它自己摸索出了各种人类选手不常用的击球角度和旋转组合。当精英选手试图用复杂旋转的发球施压时,Ace往往能用更复杂的旋转回击。
精英选手Rui Takenaka在与Ace的对抗中发现了其“吃软不吃硬”的特点:“当我使用带有复杂旋转的发球时,Ace回球也很复杂;但当我改用简单的‘不转球’时,Ace的回球也变简单了。”这让她得以在第三拍发起有效进攻并获得胜利。
对此,德尔承认:“职业人类选手非常擅长适应对手并找出其弱点,这是我们正在努力改进的方面。”
