现如今,无论是汽车、零售商店,还是医院、家庭、工厂,所有物和设备变得越来越像一台台“计算机”。智能变得无处不在,数据不仅呈现指数级增长,其形态也变得日益多样化。
然而,在英特尔中国研究院院长宋继强看来,未经处理的数据毫无价值,只有将数据转化为业务价值,才能创造新的服务和体验。
自2017年初开始,英特尔确立从“以PC为中心”向“以数据为中心”的转型目标,致力于释放数据指数级增长带来的无限潜能。宋继强认为,人工智能、5G、边缘智能是当今三大转折性技术领域,这三项技术的交汇与叠加,是构建下一波应用创新的关键驱动力。
为此,英特尔提出六大技术支柱,不断扩展英特尔产品领先性。在当前CPU的基础上,进一步构建GPU、FPGA、AI芯片、视觉处理芯片等不同类型的计算架构,以满足多样化工作负载的需求。同时,英特尔还推出了oneAPI软件以及异构整合能力,为塑造未来异构计算格局,满足多元化计算需求奠定了坚实基础。
超异构计算时代来临
宋继强表示,在过去的20年中,“数据”发生了翻天覆地的变化,这也推动了超异构计算时代的来临。
如果从数据产生的源头来看,从最初的以PC为中心,到后来的云端数据中心,再到蓬勃发展的移动互联网时代。伴随着万物互联时代的来临,智能终端的连接数量已经达到百亿级,手机、汽车、摄像头、工业互联网各种场景不一而足。而且,来自终端和边缘所产生的数据量还在快速上升,这就对数据的实时性处理提出了很高的要求,边缘智能成为必然选择。
如果从数据的种类来看,刚开始都是诸如图表之类的结构化数据,在进入图形界面之后,各种各样的应用催生了海量的非结构化数据。来自端、边、云,对延时、成本、算法有着不同需求的数据,正在驱动计算架构的演进和扩展,异构计算渐成趋势。
其中,CPU适合标量运算,GPU可用于矩阵运算或者加速器,ASIC等定制的可编程硬件可作为AI专用的加速器,FPGA则是空间运算的最佳载体,这也是异构计算的常用组件。宋继强表示,在CPU和嵌入式GPU的基础上,通过对Altera、Nervana、eASIC等厂商的收购,英特尔已经掌握了CPU、GPU、ASIC、FPGA四种不同架构。
软硬协同加速转型进程
但在面对多种工作负载的情况下,只有异构计算是不够的,英特尔提出了“超异构计算”,即采用多功能、多架构的芯片处理和加速不同的运算负载,采用封装集成技术将计算单元封装在一个SoC,并具备统一异构计算软件的计算架构。
英特尔的异构整合方案主要有2.5D封装EMIB和3D封装Foveros。EMIB实现芯片的横向连通,支持CPU、图形卡、IO及多芯片间的通信。Foveros将不同制程、不同性价比、不同稳定性的芯片,根据功耗等要求放在不同层级,在三维空间提高晶体管密度和多功能集成。
毋庸置疑,英特尔在硬件层面的创新是有目共睹的。但是进入到超异构计算时代,计算力指数级上升的实现一定是基于硬件与软件的结合。所以英特尔借助“软件先行”的战略,推进硬件和软件的共同创新,来引领异构计算的整合和创新,实现计算力指数级增长,满足未来多元化的计算需求。
英特尔推出了“统一架构编程”,也就是one API,帮助开发者屏蔽了硬件复杂性,可以根据系统和硬件自动适配功耗最低、性能最佳的加速方式,简化并优化编程过程。“one API已经有一套基于开放规范的行业计划,不仅英特尔将产品加入其中,也支持第三方硬件,只要提供了相应产品的描述,也可以加进来,加入one API的优化篮子。”宋继强说。
在此基础上,英特尔还推出了Aurora超级计算机架构。Aurora包含one API,采用Foveros 3D封装,配置了2个英特尔至强可扩展处理器、6个基于CXL标准的GPU,采用7nm制程。宋继强表示,Aurora是一个典型的超异构计算,面向百亿亿次级的计算需求。
如何实现超过1000倍的计算效能提升。从标准计算到深度神经网络,再到神经拟态,千倍计算效能的提升需要“另辟蹊径”。英特尔的探索方向是神经拟态计算和量子计算。
仰望星空:探索神经拟态与量子计算
作为计算领域内的领导者,英特尔不但要脚踏实地,更要仰望星空。比如,如何超越经典计算领域,实现超过1000倍的计算效能提升,英特尔的探索方向是神经拟态计算和量子计算。
在神经拟态计算方面,英特尔在2017年年底发布了Loihi芯片,这是一个基于14纳米制程工艺的单芯片,在架构设计中整合了计算和存储;该芯片具备128个核心,每个核心中有1000个神经元计算模型,单芯片可以模拟13个万个神经元,支持多种学习模式,支持类似于人脑的工作方式。
“人脑有860亿个神经元,这看似有很大差距;但摩尔定律还在继续生效,封装技术也在进步,达到人脑神经元的数量只是时间和工程问题。”宋继强表示。在神经拟态计算方面,英特尔建立了一个全球性的神经拟态研究社区INRC,目前已经有75家组织加入其中。
量子计算同样是英特尔重点投入的领域。在他看来,量子计算主要就是用于解决经典计算机搞不定的大规模计算问题,诸如密码破译、生物医疗、化学等组合爆炸的问题。
英特尔研究院发布了代号为“Horse Ridge”的首款低温控制芯片,这将加快全栈量子计算系统的开发步伐。随着研究不断取得进展,英特尔的目标是让低温控制和硅自旋量子位在相同的温度下工作。英特尔能够充分利用在先进封装和互连技术方面的专长,创建一个将量子位和控制器件集成到精简封装中的解决方案。