AMD近日发布了旗下新一代GPU架构CDNA,面向数据中心等高性能计算业务。英伟达则有望在3月22日线上举行的GTC 2020大会中发布新一代GPU架构Ampere。此外,更有消息称英特尔将继1998年之后,发布22年来首款用于独立显卡的GPU架构Xe。2020年,随着人工智能深度学习对高性能计算的需求越来越迫切,GPU正在成为芯片大厂的角力焦点。

三方角力GPU市场

在近日举行的“金融分析师日”活动上,AMD发布了针对数据中心工作负载优化的新一代GPU架构。据了解,CDNA架构包含了第二代Infinity技术,可增强GPU和CPU之间的连接,并针对机器学习和高性能计算应用而优化,可专注于计算/张量操作,从而加速机器学习计算,而且可以通过Infinity Fabric互连的灵活设计,支持增强的企业级RAS特性与虚拟化技术。此外,它还将提供更高的能效比。AMD首席执行官Lisa Su表示,路线图的发布意味着AMD可获得收入上的加速增长,为股东带来可观的回报。

英伟达也于近日发布消息,由于担心新冠病毒疫情,将原定于3月22日—26日举行的GTC 2020大会改为网上举办。考虑到英伟达一直以来的惯例,在GTC大会上多会发布新一代计算型GPU。因此,业界预期还未露面的7nm Ampere有望面世。元大证券投资咨询公司的一份报告指出,Ampere有望较英伟达当前采用的“图灵”(Turing)架构性能增加50%,同时功耗减半。Ampere GPU将面向数据中心业务。

GPU一向是英特尔的弱项,虽然不乏产品推出,却一直被集成于系统芯片当中。然而,英特尔CFO首席财务官George Davis日前确认,2020年将会推出一款面向独立显卡的Xe架构GPU。这是英特尔自1998年推出i740显卡后,再次进军独显市场。根据之前透露出来的信息,英特尔将要推出的独立显卡DG1,采用Xe架构,拥有96组EU执行单元,基础频率1GHz,加速频率1.5GHz,1MB二级缓存以及3GB显存,TDP为25W。在DG1之后,英特尔还会发布针对高端市场的DG2独立显卡。

争抢人工智能大市场

英伟达、AMD与英特尔三大芯片之所以如此积极地推进GPU的发展,与数据中心对高性能计算的需求密不可分。有专家分析指出,数据中心是人工智能深度学习最重要工作平台,快速完成对海量数据的多层次、多迭代模型分析处理是其一项关键性的工作。从2011年人工智能研究人员首次使用英伟达GPU为深度学习加速之后,GPU就在人工智能领域发挥着巨大作用。虽然许多厂商也在开发基于FPGA或者ASIC的人工智能芯片,但目前采用GPU加速的服务器仍是数据中心的主流。

这也就使得芯片大厂不得不重视GPU的开发。2017年,英伟达推出面向数据中心业务的GPU TeslaV100 GPU,受到业界的广泛采用。此后英伟达继续在人工智能数据中心云端发力,研发面向不同平台的GPU加速解决方案,今年更将推出新一代GPU架构Ampere。研观天下报告指出,目前人工智能应用领域的发展速度快于底层芯片的发展速度,GPU是目前发展最为完善的一类人工智能芯片,是现阶段人工智能应用开发的首选。英伟达凭借其GPU的先发优势在人工智能的前端推理应用领域抢占了先机。

此前,AMD虽然也有很多GPU和显卡产品,但采用的Vega核心本质上还是一款游戏型GPU。此次,AMD发布CDNA架构,专门针对数据中心计算进行了优化。可以看出,AMD在GPU的策略上,也正在走专业化,将面向数据中心的GPU架构与面向游戏优化的RDNA架构分开。

技术分析师Patrick Moorhead表示,数据中心GPU并不需要消费类显卡的许多功能,比如显示和像素引擎、光线追踪等。计算型GPU通过删除这些元素可以节省成本,同时又可添加更多有助数据中心性能提升的逻辑组件,比如张量计算单元等。不过在高性能数据中心部署CDNA 架构GPU之前,AMD仍需在软件上加大投入。

竞争从工艺到架构

从技术趋势上看,随着数据中心深度学习对芯片处理能力以及低功耗需求的提高,GPU对制造工艺的选择也越来越严苛。三大GPU公司目前基本上都选择采用最先进的制造工艺。此前,英特尔财务官George Davis曾经表示,针对14纳米制程的产能不足问题,2020年将增加更多产能填补空缺。

面对2020年陆续推出的新品,英特尔势必要想办法解决先进工艺产能的问题。近日有消息传出,英特尔计划将旗下独立显示GPU交由台积电6纳米工艺代工。更有消息称2022年英特尔还将采用台积电的3纳米工艺来生产。有业内人士分析,假如英特真的打算扩大外包代工份额,除了已经部分外包的芯片组之外,首先可能就是GPU,因为GPU相对CPU来说制造工艺上更为简单,而且以往台积电与英伟达在GPU制造上有着大量的合作,因而更有经验。

至于AMD方面,CDNA架构GPU预计会在今年年底到明年年初面世,继续采用7nm工艺。AMD没有透露第二代CDNA 2的具体工艺,只说是更先进的节点,因而有可能采用5nm工艺。GPU也是先进工艺的追逐者。

此外,GPU在计算架构上的革新也十分关键。GPU+CPU异构架构成为面向人工智能服务器的主流架构。研观天下指出,随着数据处理复杂度的逐步提升,服务器采用的处理系统并非只有采用GPU,或者只采用CPU。而是由CPU和GPU组合而成的异构系统,两种处理器各取所长,密集的处理任务交给GPU,复杂的逻辑运算交给CPU,两种处理器协同工作,提升系统的运算速率。

AMD是目前唯一一家同时拥有x86处理器和独立显卡的供应商,这使其在CPU-GPU互连技术上具有优势。AMD在CPU和GPU之间采用Infinity Fabric技术进行连接,实现内存的一致性,可以减轻许多编码负担。此次发布的CDNA架构便采用了第二代Infinity技术,增强了GPU和CPU之间的连接。AMD还透露第三代Infinity Fabric将具有更高的性能,包括更高带宽、更低延迟的CPU-GPU互连,增强内存一体性能,以简化编程。