英伟达会面临“大模型训练”市场份额逐渐被蚕食的压力吗?
摩根士丹利在上周发布的报告中指出,预计在接下来的一段时间内,英伟达在以性能为核心的市场上将不会面临太大的竞争压力。大摩认为:
“AI和机器学习中的模型训练市场不仅日新月异而且竞争激烈,其中“性能”是最关键的因素,能够提供高性能解决方案的公司会更有竞争力。我们预计英伟达会继续保持产品性能的领先地位,并且高性能产品将继续维持其高溢价的定价权。”
英伟达营收增长或许会成为2024财年最大惊喜:
英伟达预计在2024财年的第四季度(该季度到1月截止)的营收将达到200亿美元。这个数字不仅超出了市场预期,甚至还超过了业界半导体巨头台积电对自己第四季度的营收预测。英伟达预测的营收不仅高,而且出人意料地高。
此外,英伟达预期的毛利率也比市场预期高出20个百分点。在半导体行业中,如此短时间内创造如此庞大的利润实属罕见,也引起了投资者对市场竞争格局的高度关注,投资者非常关注其他公司是否/何时/如何能够竞争分走这部分超额利润。
英伟达推出的B100产品性能领先,相较于亚马逊和微软的定制ASIC芯片要明年2月后才量产,在更看重技术能力而非成本的模型训练市场领域,落后就要挨打:
我们预计在接下来的一段时间内,英伟达在以性能为核心的市场(如AI模型训练市场)上将不会面临太大的竞争压力。英伟达新推出的B100产品在性能上相对于其已经领先的H100产品将有显著提升,这将浇灭其他公司的竞争热情。
而亚马逊和微软最近宣布的定制ASIC芯片要到2024年2月之后才会量产,到那时,他们的产品将远远落后于最新技术水平,无法与英伟达的技术相抗衡。而在更看重技术能力而非成本的模型训练市场领域,落后这么多是没有价值的。
英伟达的基因与其他公司有本质区别,每当英伟达推出新产品直接压制了其他产品的吸引力:
历史是未来的序章,英伟达不断的努力已经多次提高了竞争对手的标准。在20世纪90年代和2000年初,GPU供应商有几十家。随着行业的合并,英伟达许多早期竞争对手要么停止运营,要么被AMD、英特尔等公司收购。
在2010年到2014年期间,尽管英伟达的年收入达到了大约40亿美元的规模,规模可观,但相比于英特尔当时的市值(大约是英伟达的十倍,超过1000亿美元),这个市场规模对英特尔来说不足以促使他们投入大量资源进行竞争。在AI成为主流趋势之前,其他大型半导体公司(如英特尔)对GPU市场的投入较少。
到了2014和2015年,当AI开始成为科技领域的热门话题时(从2012年到2015年,AI在风投资金中的份额翻倍),英伟达已经建立了以GPU为核心的垄断性业务。自2006年英伟达通过推出CUDA技术,实际上创造了GPU计算市场,这使得公司的基因与其他公司有着根本的不同。
大约从2015年开始,人们普遍认识到,图形处理的应用场景将迅速扩展到游戏之外的其他领域。我们目睹了创业公司的再次兴起,以及英特尔、AMD以及云服务提供商开始关注数据中心GPU市场,但除了谷歌的TPU,其他竞争产品在训练领域难以与英伟达相抗衡。长期以来,我们对与英伟达类似的解决方案进行了充分的调研,发现其他公司很难追赶上英伟达,他们与英伟达的差距难以弥合。而且我们经常看到,每当英伟达推出更新更强大的产品,提升了行业标准之后,直接压制了竞争对手的产品吸引力。
在推理侧,英伟达的性能自不必说,但成本可能也是应对竞争的关键因素:
在推理市场,虽然性能重要,但控制成本也同样关键:在推理市场上,竞争相当激烈,主要是因为客户非常关注成本。虽然预计英伟达在这方面会表现良好,但客户的主要关注点是如何在保持适当的处理速度(延迟)的情况下,尽可能降低成本。对于大量的推理工作负载,主要客户能够预见未来的工作负载情况,这使他们有足够的时间和动机去进行深入的软件优化,从而使服务成本更低。
推断市场成功的关键因素:对工作负载的深入了解和针对性的硬件/软件优化。在这个竞争激烈的市场中,成功的例子主要是谷歌。谷歌之所以成功,是因为他们比其他任何人都更好地理解自己的工作负载。谷歌在十多年前发明了“Transformer”模型,并且他们的第五代TPU(张量处理单元)硅片针对这种模型进行了优化。由于Transformer模型现在非常重要,谷歌的TPU在市场上非常成功,且这种成功难以被其他公司复制。
此外,大摩还提到了两大潜在有利因素:
1)2024年上半年,英伟达、计划举办B100 GPU的发布会。这个新产品的推出预计会展示英伟达的竞争力,并且可能会导致其产品的平均售价上升。
2)2024年第二季度,英伟达将开始销售配备了141GB HBM3e内存的H200 GPU。这款新GPU预计将再次确立英伟达在大型语言模型推理领域的领先地位。