英伟达AI之路遇打击 微软实时AI云平台为啥选择了英特尔的FPGA?

EEFOCUS 中字

长远来看,英特尔豪赌167亿美元收购FPGA制造商Altera的举动是一笔好买卖。现在,FPGA已经成为深层神经网络中GPU的强力竞争对手;英伟达应该也已经发现了,微软新的实时云AI/深度学习平台“BrainWave”项目正在采用英特尔的Stratix 10 FPGA;在微软早期进行的测试中,其基于Stratix 10的“BrainWave”项目中的FPGA系统在FP8持续计算上达到39.5万亿次每秒的运算速度;微软计划向需要实时人工智能服务的Azure客户推介搭载英特尔计算平台的“Brain Brain”项目。

预计英特尔的FPGA将减缓英伟达数据中心/汽车业务板块的增长速度。

英特尔收购Altera时豪掷的167亿美金终于见到回报了。现在,Altera的FPGA(现场可编程门阵列)产品成为英特尔对抗英伟达基于GPU的深度学习神经网络平台的利器。与CPU(中央处理单元)相比,GPU(图形处理单元)在并行计算方面存在优势,GPU专家英伟达借此跻身为深度学习计算领域的公认领导者。

然而,英伟达的投资者们应该注意到,微软新的实时人工智能云平台“BrainWave项目”搭载了英特尔的Stratix 10 FPGA。微软在选择深度神经网络[DNN]处理单元或DPU时,没有选择英伟达的Tesla或者Volta GPU,反而选择了Stratix 10。 英特尔将从微软在全球各个数据中心大规模部署“BrainWave”项目中获得显著的经济效益。英特尔没有任何独立的GPU产品,但它拥有的FPGA足以加强其未来在超大型深度神经网络中的作用。

为什么这很重要

现在,以人工智能为中心的数据中心和汽车业务板块为英伟达贡献的季度收入已经超过5亿美金。微软在向Azure客户提供的Brainwave项目中使用FPGA后,也可以为英特尔贡献同等规模的季度收入。我估计,除了微软之外,其它涉足人工智能的公司也会在其GPU加速的深度学习平台中使用英特尔的FPGA。

英伟达股价上升到目前的高度,部分原因来自于它在深度学习计算方面的先发优势。微软采用英特尔的FPGA加速其深度神经网络也可以帮助提升其股价表现。专注AI的投资者们现在应该正视英特尔,它的Stratix 10产品让英特尔一跃成为深层神经网络的硬件供应商巨头。

过去三年中,英伟达的股票大幅跑赢了英特尔。未来,应用在微软Azure服务业务中的Stratix FPGA将成为英特尔进入企业AI市场的迟到的船票。

通过GPU加速的Azure产品,微软与英伟达公司建立了合作伙伴关系。另一方面,BrainWave项目是微软使用FPGA加速器推进其实时人工智能商业服务的举措。

训练深度学习计算机是一个需要高吞吐量的计算密集型过程,GPU优异的并行计算性能使其成为理想选择。然而,GPU能够并行处理复杂的训练输入,FPGA则对加速推理很有效。

加速推理的主要目的是改善服务器与最终用户之间的延迟。 微软对“BrainWave”项目的推广定位是实时(零延迟)AI平台。因此,英特尔的FPGA比英伟达的GPU更加适合做微软BrainWave项目的DPU。

BrainWave项目最终可能用在微软为百度自主驾驶汽车定制的云框架/解决方案上。微软是百度自主驾驶汽车业务上的合作伙伴。和微软一样,百度也在其数据中心上使用FPGA。基于FPGA的BrainWave项目被标榜为针对计算机视觉、机器学习和深度学习,它可以满足未来自动驾驶汽车的云基础设施需求。

GPU和FPGA是目前虽小但正在快速增长的人工智能服务行业的关键元件。 根据Tractica的报告,到2025年,与AI相关的产品和服务市场规模将增长到368亿美元。FPGA可以帮助英特尔在这个利基市场上更好地竞争。

未来,英特尔真的需要更多FPGA产品客户。它需要这块收入来帮助支付它在以167亿美元收购Altera时发行的70亿美元债券。每个新收入来源都可以帮助英特尔恢复因大举投资Altera而拉下的饥荒。

为什么英特尔的FPGA对微软至关重要

Stratix 10的F32峰值性能仍然明显低于英伟达的Pascal GPU。 然而,市场正日趋采用紧凑型低精度数据类型(低于32位或FP32)。 TensorFlow和Caffe等DNN软件框架支持低精度FP16(16位)和FP8(8位)数据类型。在这些不需要FP32级性能的深入学习/机器学习任务中,FPGA可以大行其道。

对于非常低精度的2位和1位DNN的持续改进和FPGA在FP8和FP9 DNN框架上的出色表现相辅相成。人工智能/深度学习并不完全依赖于英伟达GPU所擅长的传统密集FP32和FP64运算。微软的Brainwave项目并没有使用GPU,是因为它还希望能够通过低精度FPGA实现更节能的DNN。不像可以深度定制的FPGA,当涉及到低精度、稀疏、不规则的DNN时,GPU的表现很差。

在早期测试中,基于Stratix 10的Brainwave项目中的FPGA硬件持续计算性能达到39.5万亿次每秒,这个测试是微软在定制的低精度8位浮点格式下完成的。随着继续优化完善Brainwave项目,预计性能还可以进一步提高。

结论

微软长期以来对FPGA的兴趣是英特尔大举押注Altera的原因之一。BrainWave项目是微软2011年推出的 Catapult项目的延续。六年前,微软就已经在其数据中心中配备了Altera FPGA加速板。现在,微软正在使用英特尔最新的Stratix 10 FPGA来加速基于云的深度学习任务,而不仅仅是传统的企业计算工作负载。

微软早在2011年就知道,传统的Xeon CPU无法胜任AI计算任务。英特尔迅速收购Altera的举措表明,它已准备好适应微软转向FPGA加速超大型数据中心的巨大转变。我认为,英特尔从来都没有考虑过购买英伟达这样的GPU厂商,它看中的是微软大力推动FPGA加速云计算背后的趋势,投资的是Altera的潜力和FPGA的未来。

在数据中心硬件产品上,英特尔不需要拿出自己的GPU来与英伟达竞争,它手中的利器是基于14nm工艺、面向数据中心加速应用的Stratix 10。英特尔将继续向数据中心运营商兜售Xeon处理器,同时也会努力争取为其FPGA获得新的订单。

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存