英伟达则有望在3月22日线上举行的gtc 2020大会中发布新一代gpu架构ampere
此外,更有消息称英特尔将继1998年之后,发布22年来首款用于独立显卡的gpu架构xe
2020年,随着人工智能深度学习对高性能计算的需求越来越迫切,gpu正在成为芯片大厂的角力焦点
三方角力gpu市场在近日举行的“金融分析师日”活动上,amd发布了针对数据中心工作负载优化的新一代gpu架构
据了解,cdna架构包含了第二代infinity技术,可增强gpu和cpu之间的连接,并针对机器学习和高性能计算应用而优化,可专注于计算/张量操作,从而加速机器学习计算,而且可以通过infinity fabric互连的灵活设计,支持增强的企业级ras特性与虚拟化技术
此外,它还将提供更高的能效比
amd首席执行官lisa su表示,路线图的发布意味着amd可获得收入上的加速增长,为股东带来可观的回报
英伟达也于近日发布消息,由于担心新冠病毒疫情,将原定于3月22日—26日举行的gtc 2020大会改为网上举办
考虑到英伟达一直以来的惯例,在gtc大会上多会发布新一代计算型gpu
因此,业界预期还未露面的7nm ampere有望面世
元大证券投资咨询公司的一份报告指出,ampere有望较英伟达当前采用的“图灵”(turing)架构性能增加50%,同时功耗减半
ampere gpu将面向数据中心业务
gpu一向是英特尔的弱项,虽然不乏产品推出,却一直被集成于系统芯片当中
然而,英特尔cfo首席财务官george davis日前确认,2020年将会推出一款面向独立显卡的xe架构gpu
这是英特尔自1998年推出i740显卡后,再次进军独显市场
根据之前透露出来的信息,英特尔将要推出的独立显卡dg1,采用xe架构,拥有96组eu执行单元,基础频率1ghz,加速频率1.5ghz,1mb二级缓存以及3gb显存,tdp为25w
在dg1之后,英特尔还会发布针对高端市场的dg2独立显卡
争抢人工智能大市场英伟达、amd与英特尔三大芯片之所以如此积极地推进gpu的发展,与数据中心对高性能计算的需求密不可分
有专家分析指出,数据中心是人工智能深度学习最重要工作平台,快速完成对海量数据的多层次、多迭代模型分析处理是其一项关键性的工作
从2011年人工智能研究人员首次使用英伟达gpu为深度学习加速之后,gpu就在人工智能领域发挥着巨大作用
虽然许多厂商也在开发基于fpga或者asic的人工智能芯片,但目前采用gpu加速的服务器仍是数据中心的主流
这也就使得芯片大厂不得不重视gpu的开发
2017年,英伟达推出面向数据中心业务的gpu teslav100 gpu,受到业界的广泛采用
此后英伟达继续在人工智能数据中心云端发力,研发面向不同平台的gpu加速解决方案,今年更将推出新一代gpu架构ampere
研观天下报告指出,目前人工智能应用领域的发展速度快于底层芯片的发展速度,gpu是目前发展最为完善的一类人工智能芯片,是现阶段人工智能应用开发的首选
英伟达凭借其gpu的先发优势在人工智能的前端推理应用领域抢占了先机
此前,amd虽然也有很多gpu和显卡产品,但采用的vega核心本质上还是一款游戏型gpu
此次,amd发布cdna架构,专门针对数据中心计算进行了优化
可以看出,amd在gpu的策略上,也正在走专业化,将面向数据中心的gpu架构与面向游戏优化的rdna架构分开
技术分析师patrick moorhead表示,数据中心gpu并不需要消费类显卡的许多功能,比如显示和像素引擎、光线追踪等
计算型gpu通过删除这些元素可以节省成本,同时又可添加更多有助数据中心性能提升的逻辑组件,比如张量计算单元等
不过在高性能数据中心部署cdna 架构gpu之前,amd仍需在软件上加大投入
竞争从工艺到架构从技术趋势上看,随着数据中心深度学习对芯片处理能力以及低功耗需求的提高,gpu对制造工艺的选择也越来越严苛
三大gpu公司目前基本上都选择采用最先进的制造工艺
此前,英特尔财务官george davis曾经表示,针对14纳米制程的产能不足问题,2020年将增加更多产能填补空缺
面对2020年陆续推出的新品,英特尔势必要想办法解决先进工艺产能的问题
近日有消息传出,英特尔计划将旗下独立显示gpu交由台积电6纳米工艺代工
更有消息称2022年英特尔还将采用台积电的3纳米工艺来生产
有业内人士分析,假如英特真的打算扩大外包代工份额,除了已经部分外包的芯片组之外,首先可能就是gpu,因为gpu相对cpu来说制造工艺上更为简单,而且以往台积电与英伟达在gpu制造上有着大量的合作,因而更有经验
至于amd方面,cdna架构gpu预计会在今年年底到明年年初面世,继续采用7nm工艺
amd没有透露第二代cdna 2的具体工艺,只说是更先进的节点,因而有可能采用5nm工艺
gpu也是先进工艺的追逐者
此外,gpu在计算架构上的革新也十分关键
gpu+cpu异构架构成为面向人工智能服务器的主流架构
研观天下指出,随着数据处理复杂度的逐步提升,服务器采用的处理系统并非只有采用gpu,或者只采用cpu
而是由cpu和gpu组合而成的异构系统,两种处理器各取所长,密集的处理任务交给gpu,复杂的逻辑运算交给cpu,两种处理器协同工作,提升系统的运算速率
amd是目前唯一一家同时拥有x86处理器和独立显卡的供应商,这使其在cpu-gpu互连技术上具有优势
amd在cpu和gpu之间采用infinity fabric技术进行连接,实现内存的一致性,可以减轻许多编码负担
此次发布的cdna架构便采用了第二代infinity技术,增强了gpu和cpu之间的连接
amd还透露第三代infinity fabric将具有更高的性能,包括更高带宽、更低延迟的cpu-gpu互连,增强内存一体性能,以简化编程