改进机器学习预防欺诈的9个实践举动
作者头像
  • Coco智能
  • 2019-11-26 10:58:12 3

Ekata公司的战略与运营副总裁Arjun Kakkar在接受特邀专访时,为企业的产品经理和业务负责人提供了九条实用准则,帮助他们将机器学习应用于欺诈检测。Arjun致力于推动电子商务、支付、市场和在线借贷等领域的发展,以提升客户价值。

他指出,全球在线欺诈造成的经济损失已达到250亿美元,但实际上这个数字可能更高,因为很多交易者和金融机构可能会因误判而拒绝合法客户的请求。这种错误导致的在线商业损失至少为5000亿美元,这还不包括客户信任的流失。

在线欺诈检测具有独特的特点,如可以获得大量多样化数据集、存在重复模式及需要快速决策等,使其成为机器学习研究的理想领域。事实上,在机器学习有望解决的众多问题中,在线欺诈检测已经取得了显著成效。

通过一流的机器学习团队与全球贸易商和支付服务商的合作,Arjun为企业的产品经理和业务负责人提供了以下九条实用准则。获得正确的欺诈信号和标签数据是企业面临的最大挑战之一,但如果处理得当,将为企业带来显著优势。

准则1:模型的效果取决于测试和验证集中的标签质量

企业需要明确欺诈的定义,并为其数据贴上标签,确保每个标签都能准确反映既定定义。虽然机器学习方法通常可以容忍训练集中的一些随机标签错误,但系统性错误会对模型性能产生严重影响。例如,“友好欺诈”通常是随机的,但人工标注可能系统性地出错。团队需要努力修正测试和验证集中的随机标签,确保模型评估的准确性。

准则2:获取独特特征能增加欺诈者的破解难度

欺诈团队不断改进他们的手段,因此捕捉这些欺诈者的方法之一是从多个供应商和合作伙伴那里收集独特数据,并识别数字身份背后的真正身份。利用所有有助于风险信号传递的数据,包括设备、身份、个人和网络行为模式。

准则3:通过建立集中式数据仓库并确保其安全性,将数据转化为真正的资产

集中式数据仓库确保数据科学团队了解可用资源并能加以利用。同时,团队还需致力于保障客户数据的安全。遵循与GDPR一致的原则,如仅收集满足客户需求的数据,确保数据存储时间不超过防止欺诈所需的时间,并赋予客户对其数据的完全控制权。赢得客户信任的关键在于企业真正遵守这些原则。

准则4:人工审核仍然是黄金标准,有助于调整模型

经验丰富的审核团队在人员层面的表现是对最佳可实现模型性能的合理估计。因此,模型训练误差与人工审核误差之间的巨大差距表明团队需要减少模型偏差。

准则5:有效的机器学习系统应与人类良好协作

优秀的机器学习系统了解机器和人类各自的优势,从而有效利用这些差异。人类擅长处理缺乏历史数据或需要高度判断力的情况。例如,一家企业在新地理位置接收到订单或遇到独特行为模式时,让人类参与这些案例是值得的。

准则6:发现并纠正模型中的人类偏见是团队的责任

机器学习系统的一个主要风险在于,它们依赖历史数据进行推断。数据往往带有人们的偏见,因此团队有责任纠正这些偏见。第一步是找出潜在的偏见来源,并在数据中寻找这些迹象。验证和测试数据集是否能代表真实情况?团队是否在测试集中包含记录,以检查模型是否存在系统性偏见?从更简单、透明、可解释且无偏见的模型开始,逐步过渡到更复杂的模型。机器学习是预防欺诈的强大工具,但操作不当可能导致适得其反的结果。开发组织的机器学习技术至关重要。

准则7:机器学习模型应符合企业的目标和整体策略

选择一种结合措施和抵消措施的度量标准,以避免在某个方向上的过度反应。例如,团队可以决定最大化模型正确捕获欺诈部分的比例(即“召回率”),同时设定模型错误将合法客户标记为欺诈部分的下限(即“误报率”)。最后,根据拒绝优质客户和未知欺诈的成本来估算业务的实际成本。

准则8:开发多种模型并定期重新训练以保持与现实世界的同步

机器学习模型试图模拟现实世界。首先,欺诈特征在不同地区和类型之间可能存在显著差异。如果条件允许,应构建特定于地理和应用场景的模型。其次,现实世界是动态变化的,欺诈者也在不断进化其策略。因此,企业需要保持数据流的更新,以定期重新训练模型,确保模型输入的质量不随时间下降。

准则9:借鉴其他具有相似欺诈特征的机器学习应用案例

团队在欺诈检测中面临的几乎所有机器学习建模问题在其他领域也有类似的解决方案。例如,欺诈中类别分布不平衡的问题类似于产品缺陷检测。考虑欺诈模型输入产生的偏差会影响持续学习的能力,这一问题也是在线广告行业所面临的挑战。团队需要找到一些想法进行试验。

为了从机器学习中获得真正价值,企业必须将其视为一种组织能力,要求产品、工程、数据科学和隐私团队协同工作。企业的成功将取决于实施能够解决实际业务问题的工作模型。企业应从小处着手,逐步增强自身能力,随着时间推移,业务将稳步发展。

    本文来源:图灵汇
责任编辑: : Coco智能
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
欺诈举动改进预防机器实践学习
    下一篇