前言:
随着数字化进程的推进,算力需求将越来越大,数据中心将逐步演变为计算中心,算力将成为新的生产力。
而在智能革命风起云涌之际,让异构计算不断显露锋芒,并迅速站上了行业“C位”。
作者 | 方文
新型异构计算随技术提升
所谓异构,就是将CPU、DSP、GPU、ASIC、FPGA等不同制程架构、不同指令集、不同功能的计算单元,组合起来形成一个混合的计算系统。
在过去,随着半导体技术的进步和频率的提升,绝大多数计算机应用不需要结构性的变化,或者特定的硬件加速,即可不断提升性能。
但是现代应用经常会碰到内存、功耗方面的限制。
此时,引入特定单元、让计算系统变成混合结构就成了必然,每一种不同类型的计算单元都可以去执行自己最擅长的任务。
异构计算的本质,是为了解决一套系统中CPU、GPU、或其他什么计算组件性能“拖后腿”,或是负载过于不均匀的问题。
比如曾经APU本来是打算拿GPU弥补CPU算力的不足,比如高通最早搞异构计算,是想让手机发挥出更高的常规能效比,而现在则主要用于增强对于不同AI模型的兼容性和提高处理效率。
万物互联让传统计算架构与挑战
万物互联下,数据量已呈爆炸式增长。摄像头的出现让数据获取来源变得多样,加上日常使用的手机中有各式各样的传感器,让数据量变得更加庞大。
目前流行的AI中的深度学习,便是需要各式各样的数据进行机器学习,才能够让AI变得更聪明。
同样,人工智能模型里的数据被称为源数据,其需要的种类和数量基本来自第一边缘靠近数据产品的设备,例如无人驾驶数据,这类数据需要在边缘端上快速处理。
异构计算带来的好处之一便是它能够针对未来多种不同的应用快速给出高性价比的方案。
在万物互联的时代下,IoT设备像雨后春笋般大量被催生出来,多种设备的通用性要求不一,对性能、数据等方面都有独特的需求。
在这一情况下,需要异构计算,通过采用不同的芯片组合甚至不同的工艺来实现。
日常生活便有很多应用要求我们能够快速给出一些解决方案,而不是还要去重新定义一些芯片架构,重新做。
如果要又快又好去解决这一问题,异构计算是必需的,它能够将方案小型化,能把成本和效能达到一个不错的平衡。
传统的嵌入式系统已经无法满足需求,能够进行不同类型计算的异构计算便成为一个替代选择。
异构计算中心的需求加大
数据中心各业务间交换信息频繁,异构计算需求也相当旺盛,普遍存在的分布式系统以及分布式计算等特性导致了容错性、算力和扩展等性能问题,并且占比普遍较高。
在普遍存在的异构高性能计算机之间的软件互操作性、主存单边带宽和共享分区情况下,每秒处理200t数据和每秒处理8tb数据已成为当前最强劲的计算能力需求。
相对较长的计算驱动存储扩展需求,异构异构计算中心的需求又进一步加大。
FPGA加入“豪华套餐”
AI芯片主要分为CPU 、GPU、FPGA以及ASIC。其中以CPU、GPU、FPGA、ASIC的顺序,通用性逐渐减低,但运算效率逐步提高。
FPGA,即现场可编程门阵列,它是在PAL、GAL、CPLD等可编程器件癿基础上迕一步収展的产物。
未来人工智能应用场景对终端设备推断能力的要求高,FPGA是低功耗异构芯片,开发周期快,编程灵活,人工智能领域的解决方案目前正从软件演进到软件+芯片。
基亍CPU的传统计算架构无法充分满足人工智能高性能并行计算需求,需要FPGA等人工智能架构的专属芯片。
异构计算时代的黄金搭档
在摩尔定律放缓,登纳德缩放比例定律和阿姆达尔定律接近瓶颈之下,摩尔甚至也曾给出“解药”,即“异构计算”,现在正是异构CPU与加速器的“黄金时代”。
数据中心已成为新型计算单元。在现代化、安全的加速数据中心中,DPU已成为其重要的组成部分。
CPU、GPU和DPU的结合,可构成完全可编程的单一AI计算单元,提供前所未有的安全性和算力。
在目前的技术条件下,英特尔的oneAPI的确可能是当今技术最先进,使用最方便,最有可能实现应用程序“异构计算”优化,从而带来执行效能飞跃的编程方案。