如何教会AI玩游戏呢?答案其实很简单——直接通过自然语言给它下达指令。
比如,告诉AI去建造农民,它就会自动地生产农民:
在指挥农民挖矿、建立兵工厂时,只需一句简单的指令就能完成任务:
当发现敌人出现时,AI会立即采取行动,主动发起攻击:
在激烈的战斗过程中,经济建设也不能落下:
以上内容来源于Facebook AI团队开发的MiniRTSv2项目。不同于其他需要精细操作的游戏,MiniRTSv2利用自然语言指导AI进行实时战略游戏。此项目在2019年的NeurIPS会议上发布,其代码、模型以及数据集均对外开放。
MiniRTSv2是一个专为AI研究设计的简化版即时战略游戏。玩家需控制弓箭手、龙和其他单位,摧毁对手基地。尽管相比《Dota2》或《星际争霸》等商业游戏,MiniRTSv2显得较为简单,但它依然是一款复杂的即时战略游戏。游戏开始时,地图处于未知状态,AI必须根据形势的变化,协调不同单位的行动,并随时调整策略。
与AlphaStar等直接模仿人类策略的AI不同,MiniRTSv2采用了分层决策的方法。系统包括两个独立的AI模型:一个负责持续观察游戏情况,并用自然语言提供指令,称为“指导网络”;另一个则负责解析这些指令并执行相应的操作,称为“执行网络”。
在游戏中的每一个时间点,观察编码器都会对每个游戏对象的位置和状态进行编码,生成特征向量。随后,辅助编码器会帮助AI学习全局游戏特性,这些信息将被用于指导网络和执行网络。
为了训练这个框架,Facebook团队收集了5392场游戏的数据集,每场比赛由两个人合作完成,一人负责指挥,另一人执行。该数据集包含了76000种人类协作的情况,覆盖了各种策略。这两种模型都是在有监督的情况下进行训练的。
由于训练指导网络的数据集来自人类语言,AI需要学会推理和理解自然语言,然后据此制定策略并执行。此外,该模型不仅能够生成自然语言命令,还可以结合上下文理解命令。
经过训练,AI的表现显著提升。不仅可以像人类一样给出合理的指令,如何时建造农民或龙,而且在与其他AI对手对抗时,基于自然语言处理技术的AI胜率达到57.9%。
除了提升AI在游戏中的表现外,这种通过自然语言指导AI的方法还推动了AI在更多领域的应用,例如使AI能够更好地适应不熟悉的任务和环境。此外,这种方法还有可能催生出更加理解和执行人类指令的AI系统,从而帮助残疾人士更方便地使用现代电子设备。
总的来说,通过自然语言教授AI玩游戏,不仅是研究者们的一项创新尝试,更是推动AI技术进步的重要一步。
(注:部分细节已省略,以便更好地符合改写要求。)