亚马逊是一家伟大的公司,有很多值得学习的地方。本文作者在亚马逊工作了五年,从中得到了三个重要的启示,这些启示帮助他从游戏开发顺利过渡到机器学习领域。
尽管有许多关于在亚马逊工作的故事,但作者认为,亚马逊的企业文化比任何教程都更有助于他的职业转型。虽然亚马逊的文化很独特,但作者认为,以下三点是他从亚马逊学到的最重要的经验:数据驱动、6页纸写作和资源管理。亚马逊有一套被称为“领导力准则”的原则,这些原则为公司的独特文化做出了贡献。自2014年加入亚马逊以来,这种文化推动了公司的快速发展。
亚马逊的企业文化中,数据驱动的理念可能是最重要的部分。虽然许多公司声称自己是数据驱动的,但亚马逊在这方面做得尤为出色。每次计划或策略会议都会在历史数据、实时数据和未来数据预测之间找到巧妙的平衡。亚马逊将此视为一门科学。
从每周业务报告(WBR)到每个团队都有专门的数据分析师,分析师的主要任务是帮助构建每周报告,连接不同业务单元的报告系统,并尽可能多地自动收集数据。这样,我们就可以随时获取业务单元的状态快照。
机器学习的核心在于数据本身。没有高质量的数据,就无法准确地训练、测试和验证模型。在构建模型的过程中,虽然投入了大量的时间和精力,但理解数据本身是一项关键技能。
亚马逊以其写作文化闻名。虽然任何人都可以提出一个新想法,但从零开始创建一个新的业务,例如AWS的诞生,需要通过6页纸来实现。这些文档不仅解释了战略或计划,还必须以叙述的方式编写。在亚马逊的会议上,没有PPT演示,而是通过阅读文件和讨论来进行。
要想在亚马逊获得成功,你需要用数据来支持你的观点,并以易于理解的方式向他人解释你的观点。同时,你需要创建一份任何人都能理解的文档,无论他们是否参加了你的会议。
在机器学习领域工作的数据科学家或工程师,应该具备的关键技能之一是能够清晰地传达自己的工作内容、如何复制它以及它的价值。数据科学社区的一部分工作就是撰写和阅读研究论文。因此,虽然6页纸的重要性可以类比到亚马逊的工作中,但实际上,数据科学家应该记录他们的研究,因为这有助于团队协作和知识共享。
从外部看,亚马逊似乎是一个拥有无限资源的大型组织,但实际上,每个部门的团队通常都很小,甚至有时会面临人手不足的情况。团队被期望精益运作,有效管理有限的资源。大多数时候,你可能需要身兼数职。
虽然一个团队可以获得更多的资源,但亚马逊的核心宗旨是节约。要想在亚马逊获得成功,你必须充分利用现有资源,并富有创造性地实现目标。亚马逊有一条称为“行动偏见”的原则,允许你不受限制地采取行动,只要是为了最终目标的利益。
随着对机器学习的研究深入,作者意识到资源管理在每次实验中的作用至关重要。作者无法预测每次训练所需的时间,也无法预知GPU资源的需求。因此,作者需要找到创造性的方法来平衡云计算的可扩展性和本地资源的应用。
在大多数情况下,作者会尽量多地进行本地测试,然后在云上同时运行实验,在多台计算机上进行不同的修改,以便更好地选择最佳解决方案。由于数据科学家很难招聘,因此很有可能你最终会在较小的团队中工作,需要弄清楚如何在每个人之间共享资源,并在降低成本的同时加快训练模型的速度。这是一个微妙的平衡。