继围棋、德州扑克和星际争霸后,AI技术再次在大众娱乐领域找到了新的突破口——斗地主。最近,网易互娱AI Lab携手上海交通大学及CMU,共同推出了斗地主AI模型“PerfectDou”。这一模型不仅打败了市面上现有的所有开源AI对手,成为了目前最强的斗地主AI之一,而且其研究成果登上了AI顶级学术会议NeurIPS 2022,赢得了国际学术界的广泛赞誉。
斗地主作为一种看似简单的纸牌游戏,却蕴含着复杂的策略和合作元素。在AI眼中,它的挑战性远超常人想象。作为非完美信息游戏,斗地主的牌型组合多达27472种,这使得传统搜索类算法如CFR难以有效应用,也对算法设计提出了更高的要求。
面对这一挑战,“PerfectDou”采用了基于完美信息蒸馏(PTIE)的方法,构建了一个虚拟角色,可以观察到所有玩家的手牌。这个角色通过信息传递,指导每位玩家在未知条件下做出最佳决策,从而提高团队的整体胜率。
为解决游戏中的大量出牌组合问题,模型对动作空间进行了优化,将27472种出牌方式压缩至621种,显著加速了AI的学习和训练过程。
经过与多个AI模型的较量,包括1万局与其他斗地主AI的对战以及10万局与SOTA级别模型DouZero的对决,实验数据证明,“PerfectDou”的表现超越了所有已知的AI斗地主模型,达到了新的SOTA水平。
为了推动AI技术在游戏领域的应用和发展,网易互娱AI Lab不仅公开了“PerfectDou”的完整论文,还开源了其代码,并提供了在线试玩平台,欢迎AI研究者深入探讨和研究。
此外,除了“PerfectDou”,网易互娱AI Lab的AI游戏智能体成果还包括了集成于自研游戏AI系统Athena AI中的多种先进算法,如模仿学习、强化学习和进化学习等,为网易旗下多款热门游戏提供了丰富的AI解决方案,包括竞技对战、友好陪玩和平衡性测试等。
成立于2017年的网易互娱AI Lab,作为游戏行业领先的AI实验室,致力于利用计算机视觉、自然语言处理、语音信号处理等技术,为游戏开发提供全方位的AI支持。其成果已应用于《梦幻西游》、《哈利波特:魔法觉醒》、《阴阳师》、《大话西游》、《荒野行动》等多款热门游戏之中,为玩家带来了更加智能、丰富和个性化的游戏体验。