作者 | 陈彩娴
许多人对大象被残忍盗猎的印象,可能源于2018年腾讯制作的国内首部明星纪录片《奇遇人生》。在这部纪录片的第一集中,知名演员小S与阿雅前往非洲赞比亚探访一家大象孤儿院。这里的大象都有一个共同点:它们的母亲因为象牙被盗猎者杀害而失去了生命。其中一只名叫Chamilando的大象因为目睹母亲被杀害,每天早晨都会尖叫、做噩梦。“很难想象,有些人为了获取一点首饰,竟然夺走了大象的生命。”
在短短几天的拍摄中,节目组亲眼目睹了国家公园边界发生的大象被猎杀事件:由于三分之一的象牙位于头部,盗猎者会割断大象的鼻子,取出残缺的象牙,然后将大象的尸体遗弃在烈日下,任由秃鹫啃食。
据大象孤儿院管理员Rachael介绍,在非洲,每天大约有100只大象因象牙盗猎而死亡。除了大象,老虎、雪豹、羚羊、犀牛、穿山甲等野生动物也面临着同样的威胁。例如,根据世界自然基金会(WWF)的数据,100年前,全球大约有6万只老虎,而如今只剩下3200只。
面对如此严峻的盗猎问题,我们能做些什么?或许很多人会感到无力,但实际上,人工智能技术可以为保护野生动物提供有效的辅助手段。
卡内基梅隆大学计算机科学系的助理教授方飞,是一位坚定的“AI向善”践行者。自2015年起,她结合博弈论与机器学习,开发了PAWS(Protection Assistant for Wildlife Security,野生动物安全保护助手)系统,帮助动物保护区制定随机巡查路线,提高搜捕盗猎者的能力,从而显著减少了盗猎行为。
除了反盗猎,方飞还将博弈论与机器学习结合,应用于保护渡轮线路、保护森林、减少食品浪费、降低高利贷危害、帮助流浪青少年等多个领域。近年来,她还基于“博弈论+机器学习”的方法,研究多智能体互动,以优化共享乘车平台的运营效率。
方飞深信:“AI可以解决我们当前面临的许多社会问题。”
方飞在上海周边长大,从初一开始学习Pascal语言,并对计算机产生了浓厚的兴趣。2007年,她考入清华大学电子工程系。在清华期间,她逐渐转向计算机视觉的研究。在申请博士时,她向多个计算机视觉方向的博士项目递交了申请。
一次偶然的机会,她通过清华电子系的学姐杨蓉和学长王言治了解到南加州大学Milind Tambe教授团队的安全博弈研究。Tambe教授团队的工作将博弈论直接应用于洛杉矶国际机场的安全保障、防范飞机上的暴力行为等方面,这让她意识到博弈论的应用潜力,于是主动联系Tambe教授并成功拿到了博士录取通知。
2011年,方飞赴南加州大学攻读博士,师从Tambe教授。在Tambe教授的指导下,她开始运用博弈论解决安全、可持续性和流动性三个方面的社会挑战。
2012年,方飞在AAAI会议上发表了第一篇文章,将博弈论应用于防止森林滥伐。2013年,她的研究成果被美国海关用于保护纽约市的斯塔滕岛渡轮线路。
2017年8月,方飞加入卡内基梅隆大学计算机科学系软件研究所担任助理教授。截至目前,卡内基梅隆大学计算机科学系共有29位华人教职员工(含兼职),其中ISR有两名核心教职人员,方飞是其中之一。
在担任教职的几年里,方飞带领团队在多个AI顶会上获奖,包括AAMAS 2019最佳应用系统演示奖、IJCAI-ECAI-18杰出论文奖。
方飞的主要研究方向是将博弈论与机器学习相结合。博弈论最初用于探讨如何在游戏中制定最佳策略,而现在则广泛应用于实际问题,如政策经济学。方飞认为,只要一个场景包含多个理性智能体,并且这些智能体之间存在策略互动,就可以用博弈论进行建模。
入职CMU后,方飞继续将“博弈论+机器学习”的方法应用于解决社会问题。她参与撰写的论文《Computational Sustainability: Computing for a Better World and a Sustainable Future》登上了CACM 2019年9月的封面,她还参与撰写了一本名为《Artificial Intelligence and Conservation》的书籍,被列入“AI向善”丛书系列。
许多野生动物保护区面临保护大象、老虎、犀牛等珍稀动物的任务,但由于资源有限,只能雇用少量执法人员进行巡查。如果偷猎者发现执法人员的巡查路线固定,那么他们很容易避开。因此,必须帮助执法人员随机化巡查路线。
PAWS项目中,方飞与团队对执法人员与偷猎者的行为进行了建模,并利用博弈论帮助制定最优巡查路线。然而,这些模型并不能有效帮助巡查人员执行任务。
方飞解释,博弈论模型通常假设人类是理性的,并会选择预期收益最高的行动。然而,现实中的人类行为并不总是理性的。因此,需要从实际数据中对人类行为进行实践学习。这时,机器学习发挥了重要作用。
方飞的团队利用合作伙伴从多个野生动物保护机构收集的巡查与偷猎活动数据,建立有助于预测未来情况的行为模型。然后,他们利用这些数据中的博弈论创建最佳巡查策略。随着巡查人员遵循随机路线,并向研究人员提供有关偷猎证据的反馈,越来越多的数据进入模型,该模型将开始学习偷猎者的行为,并开发出最佳的随机巡查路线来阻止偷猎。
方飞希望通过结合机器学习技术和博弈论,能够改变野生动物保护的现状。除了反盗猎,她的研究还用于制定美国海关的随机巡查路线、保护渡轮线路、从卫星图像中检测非法采矿地点、保护渔业等。
除了研究,方飞还在卡内基梅隆大学开设了一门面向本科生和研究生的课程《Artificial Intelligence Methods for Social Good》,向学生传授机器学习、博弈论和机制设计、顺序决策、规划与优化等基础知识。此外,该课程还介绍了医疗体系、社会福利、安全和隐私以及环境可持续性等领域面临的挑战,以及AI技术如何解决这些问题。
方飞希望通过这门课程,让学生掌握可以广泛应用于为社会造福的AI方法。因此,她入选了2020年IEEE System评选的“AI十大潜力人物”,并在2019年Iridescent评选的“AI领域值得关注的5位女性”中唯一当选的华人学者。
在读博期间,方飞所在团队研究如何保护机场、码头等建筑物的安全。与动物保护组织、世界银行等机构的工作人员交流后,他们认识到这些研究可以用于设计巡查路线,保护动物,防止盗猎;或设计护林人员的巡查路线,防止过度砍伐。
在与动物保护组织合作后,方飞团队发现,这些保护区记录了大量的巡查数据,有的保护区甚至提供了十几年的数据。这些数据让方飞团队意识到,单纯用博弈论模型是不够的,因为博弈论模型假设人是理性的,而盗猎者的行为往往是非理性的。因此,需要先通过数据学习盗猎者的行为模型,再为巡查人员设计巡查路线,使其效率最大化。
方飞团队主要使用斯塔克伯格安全博弈(Stackelberg Security Game, SSG)模型。这种模型适用于有保护者和攻击者的情况。在反盗猎问题中,盗猎者的行为并不是完全理性的,因此需要对盗猎者的行为进行建模,然后将其与SSG模型相结合。
机器学习与博弈论的结合主要有两种方式: 1. 当人类行为不是完全理性的时,需要用机器学习去学习其行为模型,然后将其嵌入博弈论模型中。 2. 在许多问题中,玩家之间的互动非常复杂,如反盗猎问题。在这种情况下,可以用强化学习中的多智能体方法来找到接近平衡的策略。
方飞认为,这些研究本质上都是算法的应用,涉及多个智能体的策略行为。例如,保护野生动物不被偷猎与保护渡轮线路不受攻击有相似之处:都有一个保护者和一个攻击者,他们需要找到在博弈中最好的策略。除了保护者和攻击者的安全博弈,方飞现在对平台和用户的多智能体问题感兴趣,如共享汽车平台。平台是制定策略的一方,司机和用户则是跟随者。
方飞团队首先需要保护区提供的历史巡查数据,否则很难进行预测。此外,还需要大量的地理数据,如保护区周围的海拔变化、河流位置、山脊线位置等。他们通过与保护区合作,获取这些地理信息。此外,还会从公开的数据集中获取相关信息。
实地调查对于验证模型的有效性非常重要。方飞曾在2015年前往马来西亚热带雨林保护区,2017年前往中国东北的黄泥河保护区进行实地考察。这些实地调查让方飞团队更好地理解实际地形和环境,从而优化巡查路线。
PAWS项目自方飞读博开始至今一直在持续。目前,他们已经整合了一些算法到更大的平台中,如Microsoft Azure团队基于PAWS开发了一个API,供各个动物保护区使用。此外,SMART软件也在整合PAWS的相关算法,以便更多的保护区可以直接使用这些功能。
方飞团队经常与其他领域的学者合作,如心理学家、社会学家、法律专家等。这些合作有助于更好地理解和解决复杂的社会问题。
方飞希望更多的人能够参与进来。她建议,首先要与相关机构合作,积极寻找机会。此外,她还积极参与其他组织举办的会议,如即将参加的谷歌“AI for Social Good”研讨会,希望通过这些平台接触更多非政府组织。
对于本科生,方飞建议他们与感兴趣的机构接触,亲自参与一些工作,例如在412 Food Rescue平台上做志愿者。对于博士生,她建议从一年级开始就主动联系这些机构,建立合作关系,提出好的研究问题,并通过实际数据进行分析。
方飞今年至少会招收一名学生,主要招募熟悉多智能体系统和强化学习的学生,同时也熟悉博弈论。她希望这些学生能够参与平台和用户之间多智能体系统的研究,寻找有效的沟通和协作策略。