AWS 推出五项机器学习新服务
作者头像
  • 阿狸桃子兔
  • 2019-12-04 18:38:39 0

重塑企业搜索:Amazon Kendra

尽管多年来企业尝试了多种搜索解决方案,但内部搜索依然是个难题。大多数员工依然难以找到他们需要的信息。企业拥有很多非结构化的文本数据,如果能够整合多种格式并跨越不同的数据源(如SharePoint、内网、Amazon S3和本地文件存储系统),这些数据将非常有用。然而,即使普遍存在的基于Web的搜索工具存在,企业仍然难以实现高效的搜索,因为没有工具能够很好地跨越现有数据孤岛,提供自然语言查询和准确的结果。当员工有疑问时,他们通常需要使用包含关键字的链接列表,这些链接往往分散在多个文档中,员工必须逐一筛选才能找到所需信息。

Amazon Kendra通过机器学习技术重塑了企业搜索。它允许员工通过真实的问题而非仅仅关键字,在多个数据孤岛中进行搜索。后台的AI技术确保员工能够获得准确的答案,而不是随机的链接列表。员工可以通过自然语言进行搜索,而不仅仅是关键字。例如,员工可以询问“IT服务台什么时候开放?”Amazon Kendra会给出具体的回答,如“IT服务台在早上9:30开放”,并附上指向IT门户网站和其他相关网站的链接。客户可以在应用程序、门户和维基中使用Amazon Kendra。只需在AWS管理控制台中点击几次,客户就能将Amazon Kendra指向他们的各种文档存储库,服务会聚合PB级的数据以构建集中索引。Amazon Kendra还会扫描文档的权限,确保搜索结果符合现有的文档访问策略,搜索结果仅包含用户有权访问的文档。此外,Amazon Kendra会根据用户的特定情况,主动重新训练机器学习模型,利用点击率数据、用户位置和反馈提高准确性,随着时间的推移提供越来越好的答案。

自动代码审查:Amazon CodeGuru

AWS客户也像亚马逊一样编写了大量的代码。软件开发过程中,开发者编写代码、查看代码、编译代码和部署应用程序、衡量应用程序性能并据此改进代码。然而,如果代码一开始就存在问题,所有这些过程都没有太大意义。因此,团队通常会在新代码添加到现有应用程序代码库之前进行代码审查,以检查逻辑、语法和样式问题。即使对于像亚马逊这样的大型机构,考虑到每天编写的代码量,也很难有足够的有经验的开发者来进行全面的代码审查。即便是有经验的审查者也可能错过一些问题,导致错误和性能问题。

Amazon CodeGuru是一种新的机器学习服务,可以自动进行代码审查,找出应用程序中消耗最多资源的代码行。Amazon CodeGuru包含两个组件:代码审查和应用程序分析。对于代码审查,开发者像往常一样提交他们的代码(目前支持GitHub和CodeCommit,未来会支持更多存储库),将Amazon CodeGuru添加为代码审查者之一,无需对正常过程或需要安装的软件进行其他更改。Amazon CodeGuru收到拉取请求后,会自动使用预先训练的模型来评估代码。这些模型已经在亚马逊和GitHub的前10000个项目中进行了数十年的代码审查训练。Amazon CodeGuru会检查代码更改的质量,如果发现问题,它会向拉取请求添加易于阅读的注释,标注出代码行、具体问题和建议的修复措施,包括示例代码和指向相关文档的链接。

Amazon CodeGuru还包括一个机器学习驱动的应用程序分析器,可以帮助客户找到消耗最多资源的代码行。客户只需在其应用程序中安装一个小代理,Amazon CodeGuru就会每五分钟分析一次应用程序代码。代码配置文件包括关于延迟和CPU利用率的详细信息,直接链接到特定的代码行。Amazon CodeGuru可以帮助操作者在应用程序中找到消耗最多资源的代码行,生成火焰图,帮助直观地识别造成性能瓶颈的其他代码行。多年来,亚马逊内部团队使用Amazon CodeGuru对80000多个应用程序进行了代码分析。2017年至2018年间,Amazon CodeGuru的广泛应用帮助亚马逊消费者业务的Amazon Prime Day团队提高了其应用程序效率,CPU利用率提高了325%,减少了管理Prime Day所需的实例数量,整体成本降低了39%。

自动欺诈检测:Amazon Fraud Detector

全球各地的企业每年因欺诈而损失数百亿美元。许多AWS客户都在投资大型、昂贵的欺诈管理系统。这些系统通常基于手工编码的规则,耗时、成本高,难以随着欺诈形式的变化而保持最新,导致系统的准确性低于预期。这使得企业会将优秀客户误判为欺诈者,进行更昂贵的欺诈审核,错失降低欺诈率的机会。亚马逊多年来一直在使用包括机器学习在内的尖端技术来检测欺诈行为,并深知这是一个与欺诈者不断进行的猫捉老鼠游戏,需要大量资源来构建防御和保持最新状态。AWS的客户希望AWS能够分享其在这方面的专业知识和经验。

Amazon Fraud Detector提供了一种完全托管的服务,基于亚马逊消费者业务使用的相同技术,可以实时检测潜在的线下身份欺诈和支付欺诈,而无需机器学习经验。Amazon Fraud Detector使用欺诈和合法交易的历史数据来构建、训练和部署机器学习模型,提供实时、低延迟的欺诈风险预测。首先,客户将交易数据上传到Amazon S3,进行定制模型训练。客户只需提供与交易相关的电子邮件地址和IP地址,可以选择添加其他数据(如账单地址或电话号码)。根据客户想要预测的欺诈类型(新账户或在线支付欺诈),Amazon Fraud Detector将预处理数据、选择一个算法、训练一个模型——利用亚马逊几十年来大规模运行欺诈检测风险分析的经验。Amazon Fraud Detector还使用基于机器学习的数据检测器,这些检测器基于亚马逊数据训练,可以识别与亚马逊上发生的欺诈活动(如异常的电子邮件命名规律)相似的模式,即使客户提供的欺诈示例数量很少,也可以提高模型训练的准确性。

Amazon Fraud Detector将模型训练和部署到完全托管的公共API端点。客户可以将新活动(如注册或新购买)发送到API,接收包括风险评分的欺诈报告。根据此报告,应用程序可以确定正确的行动(如接受购买或将交易传递给人类审核)。借助Amazon Fraud Detector,客户可以更快、更轻松、更准确地检测欺诈。要了解有关Amazon Fraud Detector的更多信息,请访问。

医疗语音转录:Amazon Transcribe Medical

医生的日常工作之一是将详细的数据输入电子健康记录(EHR)系统。然而,帮助他们准确记录和归档病情的方案并不理想。在许多医院,医生必须将医疗笔记口述到录音机中,然后将这些语音文件提交给第三方手动转录,这既昂贵又耗时,可能需要三天时间。另一种选择是使用现有的前端听写软件,但现有的工具限制了医生的效率,他们仍然需要花费数小时在临床记录上。第三种选择是雇佣人工抄写员来帮助记录,但人工抄写员可能会让患者感到不安,医生经常提到他们的记录不够准确,医疗机构也很难大规模地安排和协调抄写员。总之,现有的方案在提高临床记录效率和改善患者护理方面都有不足。

Amazon Transcribe Medical通过使用机器学习技术自动转录自然医学语音来解决这些问题。基于Amazon Transcribe Medical语音到文本功能的病历应用,可以准确、经济地生成记录。Amazon Transcribe Medical由多个机器学习模型组成,这些模型经过数万小时的医学语音训练,提供准确、机器学习驱动的医学转录。实时生成记录,消除了多日的流转时间。

Amazon Transcribe Medical可以帮助医生在与患者交流时自动转录对话,无需分心做手写记录。医疗保健提供商可以专注于患者护理。医生可以自然地讲话,Amazon Transcribe Medical使用内置的自动标点符号,克服了现有转录软件的局限性。对于医疗保健提供商,基于Amazon Transcribe Medical的语音解决方案可以扩展到数千个潜在的医疗中心,消除了管理和协调临时抄写员的操作难题。Amazon Transcribe Medical符合HIPAA认证,提供易于使用的API,可以与支持语音的应用程序和带有麦克风的任何设备集成。Amazon Transcribe Medical的输入文本也可以用于其他AWS服务,如自然语言处理服务Amazon Comprehend Medical,在最终进入病历系统前进行进一步的数据分析。要开始使用Amazon Transcribe Medical,请访问。

人工审核机器学习预测:Amazon Augmented Artificial Intelligence (A2I)

机器学习可以为各种应用场景提供高度准确的预测,包括识别图像中的对象、从扫描的文档中提取文本或转录和理解口语。在每种情况下,机器学习模型都会提供预测,并提供置信度分数以表示模型预测的确定性。置信度分数越高,结果的可信度就越高。对于许多应用场景,当开发者收到高置信度结果时,他们可以信任其结果可能是准确的,可以自动处理它们(例如,自动调整社交网络上用户生成的内容,或给视频加字幕)。然而,在置信度低于预期的情况下,预测结果可能模糊不清,可能需要人工审核才能处理这种模糊性。机器学习和人工审核之间的这种互动对于机器学习系统的成功至关重要,但大规模构建和运营人工审核流程具有挑战性,成本高昂,通常涉及多个流程步骤,需要定制软件管理人工审核任务和结果,需要招聘和管理大量审核人员。结果,开发者时常花费大量时间来管理人工审核流程,而不是构建其预期的应用程序,或者不得不放弃人工审核,导致许多预测的准确性和效率都很低。

Amazon Augmented Artificial Intelligence (A2I)是一项新服务,可以轻松构建和管理机器学习应用的人工审核。Amazon A2I为常见的机器学习任务——如图像中的对象检测、语音转录和内容审核——提供了预构建的人工审核工作流,方便对来自Amazon Rekognition和Amazon Textract的机器学习预测进行人工审核。开发者可以选择特定的应用程序置信度阈值,所有置信度分数低于阈值的预测都将自动发送给人类审核员进行验证。开发者可以选择Amazon Mechanical Turk的50万全球人工、预授权的人工审核第三方机构如Startek、iVision、CapeStart、Cogito和iMerit,或其自己的审核员来执行审核。审核结果存储在Amazon S3中,开发者在审核完成后会收到通知,以便他们根据审核员的可信结果采取下一步行动。Amazon A2I为所有开发者带来了人工审核,消除了构建和管理定制审核流程或招募大量审核员的繁重工作。要开始使用Amazon A2I,请访问aws.amazon.com/augmented-ai。

亚马逊机器学习副总裁Swami Sivasubramanian表示:“各行各业的公司都告诉我们,他们希望应用亚马逊丰富的机器学习经验来应对企业面临的共同挑战。这些挑战包括外部搜索、帮助软件开发者编写更好的代码、识别欺诈行为以及提高所有机器学习系统的整体质量。亚马逊凭借数十年构建机器学习系统的经验,打造了可以成功应对这些挑战的外部系统。今天的发布是我们客户至上文化的又一次迭代,是它激励我们开发这些系统。通过这些发布,我们很高兴能让企业用户使用这些机器学习功能,而无需任何机器学习专业知识。”

3M是一家跨国公司,是研磨产品、化学品与先进材料、薄膜、过滤、粘合剂等产品的领先制造商之一。3M以合作的方式运用科技改善生活。3M企业研究系统实验室技术总监David Frazee表示:“研发是3M的心跳,扎根科学使我们强大。我们的材料科学家在开展新的研究时,需要了解过去的、可能相关的研究。这些信息往往埋藏在我们的专利和广泛的知识库中。寻找合适的信息往往让人疲惫不堪,耗时,有时信息不完整。借助Amazon Kendra,我们的科学家可以使用自然语言查询,快速准确地找到所需的信息。借助Amazon Kendra,我们的工程师和研究人员热情高涨,快速查找信息,加速创新,更有效地合作,源源不断为客户提供独特的产品。”

Workgrid软件公司是Liberty Mutual(利宝保险)的全资子公司,为员工体验平台提供软件解决方案,让工作更加互联、高效和生产力更高。“我们的核心产品之一是Workgrid Chatbot,它让员工可以快速获得频繁查询的答案,通过友好的自然语言界面自动执行任务。企业聊天机器人的关键部分是回答员工提出的无数问题,因此Workgrid提供了自助问答构建器,内容作者无需掌握编程语言即可训练聊天机器人响应员工的问题。除了这些精心策划的内容外,我们希望为Workgrid Chatbot提供一种方法,以便从整个企业的大量文档(如PDF文档)中轻松提取知识,”Workgrid云工程和AI主管Gillian McCann说,“借助Amazon Kendra,我们很高兴我们的客户可以快速高效地获得所需的答案。Amazon Kendra可以从多个存储库的非结构化数据中提取答案,并且有潜力快速学习,让我们向客户交付准确、不断优化的答案。我们很高兴探索Amazon Kendra联系上下文的智能搜索和任务自动化的结合,这将使我们能够提供强大的员工体验。”

BBC是全球领先的广播公司之一,他们把BBC的影像和声音带到了世界各地。“作为一家全球性媒体机构,我们管理着数PB的视频,每天24小时进行直播,”BBC首席技术和产品官Matthew Postgate说,“Amazon CodeGuru以及我们团队使用的其他开发工具,有助于确保我们不断为受众提供强大、可靠的服务,在问题出现之前发现并解决问题。它还将帮助我们深入了解我们的服务如何与AWS平台交互,使团队能够重构和优化其代码,为人们提供他们期望从BBC获得的服务。”

Apptio SaaS解决方案可帮助企业做出明智的决策,在分析、规划和优化投资时转变IT运营模式。Apptio首席产品官Scott Chancellor表示:“为客户提供高度可用、无Bug的服务对我们来说至关重要。我们一直在寻找工具来改变我们的组织,更自动地检测开发周期各阶段的问题,提高开发速度,减少处理并发、资源泄漏和性能瓶颈等常见问题的时间。我们尝试了Amazon CodeGuru,发现它可以在开发的早期阶段自动解决这些问题。此外,它还可以指出降低服务速度的代码区域,我们可以减少处理性能相关缺陷的时间。这些改进将帮助我们为所有客户提供更好的体验。”

SmugMug+Flickr是世界上最具影响力的以摄影师为中心的平台之一。“Smugmug & Flickr专为专业摄影师和摄影爱好者打造,展示他们的作品,也供他们欣赏别人的作品。从第一天起,Smugmug的激情就是,不断想办法让摄影师讲述他们想讲述的故事,以他们想要的方式讲述故事。当我们大规模运营时,图像处理、分类和搜索的功能成为重中之重,”SmugMug & Flickr首席执行官兼首席极客Don MacAskill说,“Amazon CodeGuru的实时分析有助于消除缺陷,识别我们服务的低效部分,特别是应用程序中有价值的代码行会减慢它们的速度。它提出建议、帮助我们更改和优化。根据CodeGuru的建议,我们可以重构代码,使其高度可维护,提高我们的服务性能。”

Charles Schwab是一家先进的投资服务公司。“线上检测欺诈活动是一项永无止境的挑战,不良分子不断制造新的攻击媒介。我们的使命是走在坏人的后面,保护我们的客户,”Charles Schwab欺诈监控与调查副总裁Kara H. Suro说:“我们对Amazon Fraud Detector的发布感到兴奋。这让我们可以更快、更轻松地构建机器学习工具,发现欺诈活动;我们预计欺诈预防率会显著提高。部署Amazon Fraud Detector,将有助于从我们的历史数据中识别欺诈模式,也可以应用亚马逊检测欺诈的经验。”

Vacasa是北美最大的全方位服务度假租赁管理公司之一,在17个国家和地区拥有超过23000家度假屋,每年为超过200万房东提供服务。Vacasa创始人兼首席执行官Eric Breon表示:“自公司成立以来,我们利用技术使当地团队专注于照顾家庭和房东,同时为度假屋房东实现收益最大化。我们对Amazon Fraud Detector的发布感到兴奋,这意味着我们可以更轻松地利用先进的机器学习技术,准确检测欺诈性预订。保护我们的‘门户’免受潜在损害,使我们可以专注于提供无缝、无忧的度假租赁体验。”

Cerner是卫生信息技术解决方案、服务和设备的领先提供商之一。Cerner解决方案策略师Jacob Geers说:“临床文档的准确性对于工作流程和整体护理人员满意度至关重要。通过应用Amazon Transcribe Medical的转录API,Cerner正在初步开发数字语音抄写器,自动听取医生与患者的互动,以文本形式不显眼地捕捉对话。然后,我们的解决方案可以智能地翻译概念,进入Cerner病历系统中的编纂组件。”

Suki是一款AI驱动的、支持语音的数字助理,旨在减轻医生的行政负担。Suki AI公司首席执行官Punit Soni说:“临床文档涉及医疗数据工作流程,帮助临床医生更有效地采集笔记是关键。我们可以轻松地将我们的临床数字助理与Amazon Transcribe Medical集成,允许医生口述医疗笔记,将临床文档的平均精神消耗降低76%。他们的时间应该花在照顾病人上,而不是做数据输入工作。”

作为美国的Un-carrier(去运营商化的运营商),T-Mobile美国公司通过领先的产品和服务创新,重新定义了消费者和企业购买无线服务的方式。“在T-Mobile,我们以客户的幸福来衡量成功。作为Un-carrier,我们知道,当客户觉得我们了解并预测到他们的需求、直接处理他们的痛点时,他们会感到最幸福,”T-Mobile执行副总裁、首席信息官Cody Sanford说,“我们的专家团队客户服务模式致力于建立个人联系,并运用A2I等尖端工具为我们的团队取得成功做好准备。是的,机器学习带来了更深入、更投入的关系!访问实时的上下文信息,例如客户详细信息和可用折扣,使我们的团队可以在与客户进行真实、实时的对话时,代表客户做出现场决策……完全双赢!”

    本文来源:图灵汇
责任编辑: : 阿狸桃子兔
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
机器推出学习服务AWS
    下一篇