为了提升聊天机器人的互动效果,伊利诺伊大学的研究团队致力于打造一款具备积极倾听能力的高效访谈聊天机器人。他们选用Juji平台,因为它不仅开源且基于规则,还可以在没有训练数据的情况下引导聊天机器人。通过Juji平台,研究人员开发出了一款带有自动倾听技能的聊天机器人,显著提高了用户互动的质量和吸引力。
研究人员还创建了两个聊天机器人,其中一个拥有自动倾听技能,另一个没有。他们邀请了206位Amazon Mechanical Turk的参与者对这两个机器人进行实时评价,并从用户回复质量及用户体验等多个维度进行了对比分析。结果显示,拥有自动倾听技能的机器人在吸引高质量用户输入方面表现更佳。
这项研究的贡献在于: - 提供了搭建访谈机器人的实用思路和方法; - 开发了一个渐进式聊天机器人平台的混合框架; - 展示了构建共情聊天机器人的设计意义。
通过结合基于规则的聊天机器人构建器和数据驱动的模型,聊天机器人可以更好地应对复杂多样的用户对话,提供更丰富的用户体验,并激发更高质量的用户反馈。此外,这种方法也可以扩展到其他聊天机器人平台上。
原文链接:https://arxiv.org/abs/2002.01862v1
这篇论文介绍了CASIASURF,一个大规模多模型的数据库,用于人脸防伪。该数据库包含1000个主题,21000个视频样本,每份样本都有三种模型(RGB、深度和红外)。研究团队提供了评估标准、协议、训练/验证/测试子集以及测量工具,为开发新的基准提供了依据。
研究团队还提出了一种新的多模型、多尺度融合方法,作为高效的基础模型。这种方法可以对特征进行加权,确保在不同模型下信息量的最大化。实验表明,CASIASURF数据库对推动前沿的人脸防伪技术至关重要。未来,研究团队计划通过增加更多测试样本,如3D面具,来提升数据库的多样性,并继续探索异类面部防伪技术。
数据库链接:https://sites.google.com/qq.com/face-anti-spoofing/welcome/challengecvpr2019?authuser=0
原文链接:https://arxiv.org/abs/1908.10654v2
Facebook AI研究团队发布了一个名为CoVoST的多语言语音到文本翻译数据库,它涵盖了11种语言的演讲,包括法语、德语、荷兰语、俄语、西班牙语、意大利语、土耳其语、波斯语、瑞典语、蒙古语和中文。CoVoST还包括英语翻译,并基于CC0许可发布为开源库。
CoVoST构建在Common Voice(2019-06-12版本)之上,提供了超过27小时的俄语演讲、37小时的意大利语演讲和67小时的波斯语演讲,是迄今为止最大的演讲数据集。CoVoST数据库中的大多数句子都由具有不同口音的多个发言人覆盖,这有助于模型在训练和评估中考虑语音变化。
数据集链接:https://github.com/facebookresearch/covost
原文链接:https://arxiv.org/abs/2002.01320v1
预测销售机会和结果的能力是企业成功的关键因素。本文介绍了一种适用于基于云的计算平台(Azure ML)的机器学习(ML)工作流程,用于B2B销售结果预测。
该工作流程按顺序提取、清洗和估算销售机会的数据,然后在数据上训练各种类型的ML模型。第二条管道则利用ML模型来估计赢得销售机会的可能性。通过在真实的销售数据集上进行测试,该方法的分类精度达到了0.85,远高于手动用户输入的预测准确率(0.67)。
这种基于云的工作流程不仅提供了更高的可扩展性,还可以轻松集成到企业的现有CRM软件应用中。
原文链接:https://arxiv.org/abs/2002.01441v1
Google发布了一个名为ML-fairness-gym的工具,它是一组组件,用于构建简单的模拟,探究在社交网络环境中部署基于机器学习的决策系统的长期影响。
ML-fairness-gym使用Open AI的Gym框架进行顺序决策模拟。代理可以在模拟环境中与环境交互,通过观察结果来调整其后续操作。环境对系统和成绩的动态进行建模,代理的数据被编码为机器学习系统。ML-fairness-gym可用于解决各种机器学习中的公平问题,具有足够的灵活性,可以模拟和探究“公平性”不足的问题。
Google研究人员表示,ML-fairness-gym将帮助其他研究人员和开发人员更好地了解ML算法对社会的影响,并为开发更负责任和更公平的机器学习系统提供指导。
代码链接:https://github.com/google/ml-fairness-gym/
原文链接:https://github.com/google/ml-fairness-gym/blob/master/papers/acmfat2020fairnessisnotstatic.pdf