周五下午,在位于德克萨斯州奥斯汀的亚马逊芯片实验室内,六名工程师对一个严格保密的新型服务器设计进行了测试。
亚马逊高管拉米·辛诺周五参观实验室时表示,该服务器装有亚马逊的人工智能芯片,可与市场领导者 Nvidia 的芯片竞争。
亚马逊正在开发自己的处理器,以限制对昂贵的 Nvidia 芯片的依赖(即所谓的 Nvidia 税),该芯片为其亚马逊网络服务的部分人工智能云业务提供动力,而这正是主要的增长动力。
亚马逊希望能够通过自主研发的芯片帮助客户以更低的成本进行复杂的计算并处理大量数据。其竞争对手微软和 Alphabet 也在做同样的事情。
亚马逊云业务 AWS 旗下安纳普尔纳实验室 (Annapurna Labs) 的工程总监辛诺 (Sinno) 表示,亚马逊的客户越来越要求 Nvidia 的更便宜的替代品。
虽然亚马逊的 AI 芯片研发才刚刚起步,但其执行非 AI 计算的主力芯片 Graviton 已经开发了近十年,目前已是第四代。AI 芯片 Trainium 和 Inferentia 是较新的设计。
AWS 计算和网络副总裁戴维·布朗 (David Brown) 周二表示:“因此,在某些情况下,价格和性能可提高 40% 到 50%,所以成本应该是使用 Nvidia 运行相同型号的一半。”
AWS 的销售额占亚马逊整体收入的近五分之一,与去年同期相比,今年第一季度其销售额飙升 17%,达到 250 亿美元。AWS 控制着云计算市场约三分之一的份额,而微软的 Azure 则占据约 25% 的份额。
亚马逊表示,在最近的 Prime Day 期间,该公司部署了 25 万个 Graviton 芯片和 8 万个定制 AI 芯片,以应对其平台上活动的激增。
亚马逊一直在开发自己的 AI 芯片以减少相关成本,这也有助于提高亚马逊网络服务 (AWS) 的盈利能力。然而,这家电子商务巨头正在努力开发能够与 Nvidia 标准芯片相媲美的 AI 芯片。
项目迁移问题、兼容性差距和低使用率是阻碍亚马逊 AI 芯片普及的一些问题。这种情况还使亚马逊从其云业务中获得的巨额收入面临风险。据《商业内幕》报道,亚马逊面临的挑战是通过和熟悉此事的消息人士确定的。
Trainium 和 Inferentia 是亚马逊设计的顶级芯片,于去年年底首次亮相。该出版物报道称,去年,Trainium 在 AWS 客户中的采用率仅为 Nvidia 图形处理单元的 0.5%。
报告称,亚马逊在 2024 年 4 月通过其 AWS 服务对不同 AI 芯片的使用百分比进行了评估。与此同时,Inferentia 的采用率略高,为 2.7%。Inferentia 是一款专为推理而设计的芯片,推理是一项 AI 任务,通常指最终消费者使用 AI 模型的计算过程。报告提到一份内部文件称;
上述表述指的是大型云客户在向亚马逊定制芯片转型时面临的挑战。Nvidia 的 CUDA 平台被认为对客户更着迷,报告说明这是关键原因。
全球最大的云服务提供商 AWS 目前正在开发其自主研发的计算机芯片,以促进运营。亚马逊有时会炫耀其在 AI 芯片方面的努力。然而,文件中展示的画面与该公司的预期有所不同。
内部文件称,该公司正努力应对采用率缓慢的问题,但亚马逊首席执行官却有不同的看法。在第一季度财务报表电话会议上,亚马逊首席执行官安迪·贾西 (Andy Jassy) 表示,对 AWS 芯片的需求很高。
“我们拥有最广泛的 NVIDIA 计算实例选择,但考虑到它与现有替代方案相比拥有非常良好的性价比优势,对我们的定制硅片、训练和推理的需求相当高。”
Andy Jassy还在致投资者的信中提到了 AWS 硅片的早期采用者,称“我们已有多个客户在使用我们的 AI 芯片,包括 Anthropic、Airbnb、Hugging Face、Qualtrics、Ricoh 和 Snap。”与此同时,Anthropic 的情况则完全不同,因为亚马逊是这家初创公司最大的支持者。这家云计算巨头已向 Anthropic 投资了 40 亿美元,这笔投资协议要求该公司一定要使用 AWS 设计的硅片。
亚马逊网络服务提供多种处理器,从 Nvidia 的 Grass Hopper 芯片到 AMD 和英特尔。其大部分盈利来自设计自己的数据中心芯片,这有助于避免从 Nvidia 购买 GPU,从而节省成本。
亚马逊于 2018 年推出了其首款 AI 芯片 Inferntia,但 Nvidia 在提供更广泛被不一样的行业采用的解决方案方面仍然处于领头羊。AWS、微软和谷歌是 Nvidia 最大的客户。所有这些巨头都通过他们的云服务租用 GPU。
今年 3 月,AWS 首席执行官 Adam Selipsku 出席了 Nvidia GTC 2023。两家公司发表了联合声明,着重关注双方在推进生成式人工智能方面的战略合作。
“我们两家公司之间的深度合作可以追溯到 13 年前,当时我们共同在 AWS 上推出了世界上第一个 GPU 云实例,今天我们为客户提供最广泛的 NVIDIA GPU 解决方案。”
Nvidia 的平台 Cuda 通常受到开发者的青睐。因为 Nvidia 花费了多年的时间和精力来创建它,而且业界已经采用了它,这让他们处理事情变得更容易。另一方面,亚马逊仍然一定要通过反复试验来解决这一个难题。