在9月27日举行的云栖大会“金融智能”专场上,人工智能专家宋乐教授分享了他在蚂蚁金服关于金融特征机器学习的应用与发展。宋乐教授不仅是蚂蚁金服人工智能部门的研究员,同时也是美国乔治亚理工大学的终身副教授及机器学习中心的副主任。他还担任国际机器学习协会的董事,并在多个国际顶级会议上担任领域主席。
在蚂蚁金服,机器学习已经渗透到了各个业务场景,推动了各类业务的发展。宋乐教授详细介绍了金融特征的机器学习,特别是三个方面:面向海量图数据的深度学习系统、自动机器学习系统、多智能体对抗强化学习系统。
金融场景的数据不同于互联网其他场景,它涉及到庞大的金融网络,资金在不同个体间流动。这个网络中的节点包括用户、商家、公司等角色节点,也有账户等虚拟节点,以及设备节点和物理节点。节点间的连接和信息交互也多种多样,形成了复杂的图结构。如何对这样的图进行机器学习建模,提取有效信息,是一项复杂的任务。
为了实现这一点,需要将图数据转换为向量表示,以便进行机器学习。蚂蚁金服面临的挑战是如何处理庞大的图数据,包括上百亿节点和上千亿边。他们构建了专门的系统来处理这些数据,包括图存储系统GraphFlat和PHStore,用于快速查询和推理。此外,还需要设计算法来处理图数据的采样、随机游走和信息传递。
为了应对不同类型网络的建模需求,蚂蚁金服开发了一系列算法,包括适用于无属性网络的xGrep、适用于属性网络的GeniePath、适用于异质网络的HeGNN和IGNN,以及适用于知识图谱的KGNN。这些算法提供了强大的图神经网络功能,支持多种类型的网络建模,并且具有良好的可解释性。
在蚂蚁金服内部,每天都有大量的机器学习模型在训练,但人工调参和模型优化的过程耗时费力。为了提高效率,蚂蚁金服开发了自动机器学习平台AutoML,该平台可以自动完成特征选择、超参数搜索、网络结构搜索以及元学习,从而降低新模型开发的成本。
一个具体的例子是Autonet,这是一种针对推荐系统场景的深度神经网络算法。通过自动化地组装小的深度神经网络子模块,形成新的网络结构,并优化建模效果。在相同的资源条件下,Autonet产生的模型性能与人工设计的模型相当,但在用户拉新的场景中表现更为出色,提高了14%的动销率。
在金融场景中,节点通常是动态变化的,如用户和商家在交互过程中存在博弈、合作和对抗。因此,需要结合对抗学习和多智能体强化学习来建模这些场景。蚂蚁金服开发了多智能体强化学习平台,利用模仿学习方法学习用户的行为特征和奖励函数,进而进行各种机器学习任务。
在推荐系统中,多智能体强化学习被用来优化用户的长期奖励和兴趣,而不是短期的推荐。这样可以提高用户对推荐内容的兴趣和满意度,从而创造更大的价值。
这些技术不仅在营销、信贷等领域得到了广泛应用,还为支付、贷款、保险等场景提供了有效的解决方案。在互联网金融领域,图神经网络和其他高级机器学习技术正发挥着越来越重要的作用。