慧聪物联网 | 慧聪智能硬件网 | 慧聪新能源网 | 慧聪LED网 | 慧聪电气网 | 慧聪安防网 | 慧聪IT网 | 慧聪变频器网
特惠新品微信
投稿
热门推荐:传感器专栏 | 半导体专栏 | 晶振专栏 | 电容器专栏 | 2019-2020电子行业大全 | 中国电子展 | 2019品牌盛会TOP10榜单

慧聪电子网首页 > 行业资讯 > 国际资讯 > 正文

分享到

英特尔GPU的第三次冲刺

http://www.ec.hc360.com2020年04月30日10:39 来源:半导体行业观察T|T

    去年,英特尔宣布了XeGraphics,同时英特尔表示将重新进入独立GPU市场,这是自1998年i740以来吗,我们首  次看到专用的英特尔GPU。现在,最  好的显卡之间的竞争非常激烈,但英特尔当前的集成显卡解决方案其实在GPU市场排不上号(它们甚至是NvidiaGT1030等低端卡的性能的约1/3)。低性能集成GPU的供应商英特尔(“世界上最  受欢迎的GPU”)是否可以成为这个市场的有力竞争者?

    

我们必须看到,今年在PCGraphics卡市场,将进行大规模的改革。AMD正在开发BigNavi/RDNA2,Nvidia的RTX3080/AmpereGPU即将面世,与英特尔的XeGraphics同期,有传闻将有第四家公司可能进入PCGPU市场,那就是华为。据报道,华为正在进入数据中心GPU市场,因此,可以想象在某个时候制造消费类产品并不是一个巨大的飞跃。

    

但是在本文中,我们重点介绍英特尔。

    

英特尔的XeGraphics计划在2018年成为热点话题,当时他们从AMD聘请了RajaKoduri,此外还有芯片架构师JimKeller和Graphics市场营销商ChrisHook。其中Raja是AMD在2015年11月成立的AMDRadeonTechnologiesGroup以及Vega和Navi架构的重要推动者。英特尔招聘他是希望通他能领导Intel的GPU部门进入新的领域。并不是说英特尔以前没有尝试过。其实除了i740之外,英特尔在2009年推出Larrabee和XeonPhi也是他们的一次尝试,尽管GPU方面从未真正实现过。但他们现在来到了第三次。

    

当然,构建一个好的GPU不仅是说说而已,当中有很多东西需要解决,同时英特尔还有很多要证明的事情。在本文中中,我们将介绍IntelXeGraphics的所有信息,包括发布日期,规格,性能预期和价格。

    

英特尔的Gen11Graphics在高层似乎与XeGraphics非常相似。(图片来源:英特尔)

    

    英特尔XeGraphics架构

    

尽管英特尔可能是专用显卡市场的新来者,但制造GPU对他们来说绝不是新事物。例如当前的IntelIceLakeCPU使用了Gen11Graphics架构,顾名思义,它是第  11代IntelGPU。顺便说一句,第一代英特尔GPU出现在其最  后一个独立显卡i740中(大约在1998-2000年间,以及用于370奔腾III和赛扬CPU的英特尔810/815芯片组)。

    

XeGraphics在IntelGPU架构上已进入第  12代,换句话说,在过去十年中,Gen5至Gen11已集成到IntelCPU中。请注意,Gen10Graphics从来没有看到过“光明”,因为它是CannonLakeCPU系列中止的一部分。

    

尽管每代GPU都基于以前的架构是很普遍的现象,但在升级过程中,也增加了各种改进和增强功能,但据报道,英特尔现在正在使用XeGraphics进行重大更改。其中一些更改着重于实现GPU内核的扩展,另一些更改着眼于专用VRAM的需求,还有一些更改着重于提高每核性能和IPC。

    

最  近的英特尔GPU已分为多个“切片”(slices)和“子切片”(sub-slices),这些子切片在某种程度上类似于AMD的CU和Nvidia的SM。Gen9Graphics的子切片大小为8个EU,每个EU具有两个128位浮点单元(FPU)。对于FP32计算,每个EU每个时钟最  多可以执行8条指令,而FMA(fusedmultiplyadd:融合乘法加法)指令计为两个FP操作,从而使每个时钟的最  大吞吐量达到16个FP操作。因此:EUs*8*2*时钟速度=GFLOPS。从这个意义上讲,与AMD和NvidiaGPU相比,EU算作8个GPU内核,而8个EU等于AMDCU或NvidiaSM。

    

跨出一个级别,以前的IntelGraphics中的切片已分类为GT1,GT2,GT3和GT4(IceLake/Gen11添加了GT1.5选项)。对于Gen9,GT2模型具有三个子切片,每个子切片具有八个EU,GT1模型具有两个子切片,每个子切片都具有六个EU,而GT3模型具有六个子切片和每个八个EU。Gen11更改为每个切片具有八个EU的四个子切片,因此IceLakeGT2具有64个EU和512个GPU内核。对于XeGraphics,英特尔将寻求更高的EU数量和更大的GPU尺寸。

    

第  11代与第9代相比有了很大的进步,XeGraphics可以扩展到八个或更多片。(图片来源:英特尔)

    

当前的迹象表明,XeGraphics的基本“切片”大小将启用多达64个EU,而不同的配置具有不同数量的切片和子切片,可以根据需要部分禁用这些切片和子切片。XeGraphics的基本构建块最  终与Gen11Graphics基本相同,至少在第一次迭代中是如此。重大变化将涉及为专用VRAM添加所有逻辑,并扩展到更大的内核数量和多芯片支持,以及尚未揭示的任何其他体系结构变化。XeGraphics将完全支持DX12和Vulkan,但除此之外一无所知。

    

英特尔已经讨论了XeGraphics的三大分类:用于低功耗/低性能设备的XeLP,用于高性能解决方案的XeHP和用于数据中心应用程序的XeHPC。据我们所知,XeLP主要用于集成Graphics解决方案,可能只有一个切片,在某些情况下可能是两个。我们知道XeLP将在即将面世的TigerLakeCPU中使用,并且已在XeGraphicsDG1开发人员卡中使用过。换句话说,它将是英特尔处理器Graphics的下一个版本。

    

另一方面,XeHPC和IntelExascale是英特尔对超级计算机的雄心壮志的图像和详细信息,正如您可能想像的那样,这意味着功能强大且昂贵的芯片。我们认为XeHPCGPU很长一段时间都不会在消费卡中出现。从我们的角度来看,最  有趣的芯片将落在XeHP的,这些芯片应会出现在各种消费类Graphics卡中。

    

但我们尚不清楚的是第一批XeGraphics解决方案是否将支持硬件光线跟踪。英特尔曾表示将支持光线追踪,但并未具体说明它是否将在最  初版本的XeGraphics架构中实现。光线追踪似乎更可能出现在第二代XeGraphics——7nmPonteVecchio和相关芯片中。也许  光纤追踪支持将仅出现在第一代产品的有限子集中,例如高端XeHP或HPC,但不包括XeLP。但具体情况我们还不知道,不给如果英特尔在AMD的光线跟踪解决方案推出之前,就实现完整的光线跟踪,这将是非常令人惊讶的。

    

这些架构更新至关重要,因为就游戏性能而言,当前的IntelGPU充其量是能用。以UHDGraphics630为例:在Corei9-9900K中,在1.2GHz下的24个EU(192个内核)在理论上可以提供460.8GFLOPS或在时钟频率稍低的(1.1GHz)Corei3-9100中提供422.4GFLOPS。相比之下,AMDRyzen53400G具有11个CU,704个GPU内核和1.4GHz时钟速度,理论性能为1971.2GFLOPS。那就意味着AMD的Vega11Graphics速度大约是IntelUHDGraphics630的三倍,甚至可以更高,但是两种集成显卡解决方案至少在一定程度上受到系统内存带宽的限制。

    

特尔的IceLake处理器具有64EUGPU,可提供有关XeGraphics如何扩展的线索。(图片来源:英特尔)

    

    英特尔XeGraphics的Die和分析

    

除了大部分未公开的体系结构更改之外,XeGraphics上还有一些其他有趣的花絮值得讨论。例如,我们可以很好地了解有关尺寸和晶体管数量的期望。首先,看一下英特尔的IceLake先,看看64EUGPU在英特尔的10纳米节点上有多大。分析dieshot,看起来有64个带有Gen11的EU占据了大约40-45平方毫米的die空间。这实际上很小,这意味着英特尔可以扩展到更大的GPU。

    

即使我们采用该估计值的上限(4平方5毫米),然后假设XeGraphics架构将使尺寸增加近50%(对于它应该带来的所有增强和IPC更改),我们仍然只有每64EU切片需要65平方毫米的空间。与显示输出,视频编解  码器相关的逻辑很多,在大型GPU上不需要复制的逻辑更多,但我们的目标是更高的。

    

将其加倍到130芳芳毫米将为Intel提供128EU芯片,260平方毫米将是256EUs,而520平方毫米将产生512EUs。同样,实际的芯片尺寸可能要小得多,因为最  初的大50%的估计可能会过高。如果英特尔对消费卡采用multi-chiplet方法,则可以只使用一个基本芯片,然后将多个芯片链接在一起。另外,如果英特尔采用定制的硅片路线,则128EUGPU可能约为150平方毫米,而256EU可以容纳约250平方毫米,而大型512EU芯片可能只需要450平方毫米。这样的尺寸绝  对是GPU可以达到的,而我们已经看到AMD和Nvidia通常会变得更大。

    

单个芯片中有512个EU将意味着相当于4096个GPU内核,这将是非常令人印象深刻的。相比之下,AMD的RX5700XT具有2560个GPU内核,而英伟达的RTX2080Ti具有4352个GPU内核。我们不是说AMD,英特尔和Nvidia的GPU都等效,但这至少是衡量潜在性能的基准。512EU芯片的理论计算量实际上可能会超过当前台式机Graphics卡领域的王  者。这听起来像是幻想吗?让我们查看2020年2月在Twitter上发布的XeGraphicsdieshotRajaKoduri。

    

    

我们分析了这张照片,大概是第一代10nm+XeHPCGPU。坦白说,die似乎是巨大的!我们还看到了其他分析结果,但是我们自己的估计是该芯片上的GPU裸片正接近最  大标线片尺寸——大约800平方毫米。这也与英特尔公开声明的有关其第二代PonteVecchio架构的说法相吻合,该架构将移至7nm节点。

    

PonteVecchio将包括英特尔的芯片堆叠技术Foveros,英特尔在2019年的投资者会议上提到,采用当前以PC为中心的方法,产品尺寸“受到标线的限制”。换句话说,芯片的最  大尺寸是基于制造机械的硬限制。这适用于所有微处理器,并且限制大约在850平方毫米左右。英特尔未来的计划将转向以数据为中心的模型,该模型将允许通过裸片堆叠进行进一步扩展,但不适用于10nm+XeHPCGPU。

    

因此XeHPC也许将使用上述的GPUdie,这看起来接近最  大标线片尺寸。同样,这将不会在消费产品中使用,但是鉴于我们对英特尔Gen11Graphics的了解,这样的GPU可能等效于具有1024个EU和8192个GPU核心。英特尔还谈到了未来的GPU将迁移到“数千个EU”,这意味着多个PonteVecchio芯片将加入HMB2e内存,添加INT8和FP64支持,数据中心应该开始运行。

    

现在将其缩小到更易于管理的尺寸,您就会得到以消费者为中心的XeHP。一个在2019年6月意外从英特尔Graphics驱动程序发布中看到的。除了XeLP型号(最  有可能限于64个EU)之外,英特尔还计划生产128EU,256EU和512EUXeHPGraphics卡。这也与英特尔关于XeLP从5W扩展到20W设计的陈述相吻。-不需要带有20WTDPGPU的专用Graphics卡。这使我们了解了实际的XeGraphics规范。

    

英特尔的XeGraphicsDG1开发板,在2020年国际消费电子展上展示。(图片来源:英特尔)

    

    潜在的IntelXeGraphics规格

    

关于IntelXeGraphics的泄漏和谣  言各有各的,每一个都变得更加可信。英特尔还在2020年国际消费电子展上展示了XeGraphicsDG1开发板。尽管英特尔坚持认为该板不是面向消费者的最  终设计,但将来看到类似的产品交付给我们也不会感到惊讶。

    

但是,XeGraphicsDG1还使用XeLP芯片,这意味着它是仅用于测试目的的低功耗专用GPU。英特尔还透露,XeGraphics有三个品牌,从超级移动设备到游戏台式机,再到工作站和数据中心应用程序,均可扩展。鉴于以上所述,英特尔计划发布一套XeGraphics卡,大概使用XeHP芯片,以下是我们期望看到的配置:

    

     英特尔XeGraphics潜在规格

    

根据芯片截图和其他信息,我们期望XeHPGPU将成为消费XeGraphics卡的基本构建块。英特尔的EMIB(嵌入式多管芯互连桥)可以亮相,支持多芯片GPU配置,但没有AMDCrossFire或NvidiaSLI复杂。就像AMD在RyzenCPU上使用小芯片方法一样,只是应用于Graphics。这就是上表假设的。

    

EMIB可以有效地使两个或四个芯片或多或少地充当一个芯片,共同承担渲染任务和内存。具有讽刺意味的是,当英特尔最  初与Ryzen一起取笑AMD的“粘合”芯片时,我们可以看到结果:在AMD与IntelCPU的对比中,Ryzen已迅速扩展到英特尔提供更高的内核数量和性能目前无法匹配。但是英特尔足够聪明,可以认识到这种方法的优势,并且将其应用于GPU很有道理。

    

或者,可能仅针对XeHPC数据中心模型计划EMIB。然后,英特尔将采用与AMD和Nvidia相似的方法,并制造多个GPU变体,其规格仍应与上表中列出的规格相近。EMIB和多芯片方法的优势在于,它可以使英特尔专注于两个主要GPU:XeHP和XeHPC(将XeLP集成到TigerLake和其他CPU中)。

    

考虑到英特尔将不得不与其CPU系列共享XeGraphics的10nm以上制造工艺,因此简化设计数量会有所帮助。由于英特尔尚未使用其10nm工艺发布具有四个以上CPU内核的CPU,因此还存在关于Intel在10nm以上的良率和缺陷数量的疑问。采用较小的裸片和EMIB可以显着提高XeHP的良率。这就是为什么我们的主要猜测是第一代XeGraphics将使用EMIB工艺的原因。

    

每个XeHPGPU128个EU将意味着相当于1024个GPU内核,并且如上所述,应以各种尚未公开的方式改进内核的基础架构。根据英特尔所做的事情,最  终可能会获得与AMD和NvidiaGPU内核更接近平价的GPU内核,这是最  理想的情况,而我们希望发生这种情况。有关于2芯片和4芯片XeGraphics配置的可信谣  言,这将使基本XeHP设计的理论性能提高两倍和四倍。

    

添加更多的GPU内核,切片,EU或任何您想称呼它们的东西都会对英特尔有很大帮助。考虑到Nvidia已经提供了多达4608核(TitanRTX)的GPU,AMD提供了多达4096核(RXVega64)的GPU,而AMD和Nvidia都提供了支持,那么128个EUs/1024核并不能完全吸引我们。而推出的BigNavi和Ampere架构可能会变得更高。到今年年底,我们可以看到AMD和NvidiaGPU具有5120至8192个GPU内核。

    

英特尔在消费领域的表现似乎并不高,但是我们希望看到XeGraphics的型号可以容纳96个EU,最  高可达512个EU,介于两者之间。结合1.5-2.0GHz的时钟速度,考虑到先前的设计以及向10nm+的迁移,这似乎是合理的,英特尔可能会在512EU四芯片配置上将12-16TFLOPS的计算能力推向高潮。再加上8GB的GDDR6内存(或者可能是16GB的两倍),英特尔最  高性能的XeGraphics卡可能是AMD和NvidiaGPU的有力竞争者。至少这是理论,尽管我们仍然不知道是否会出现光线追踪支持。

    

下降到较小的GPU或双芯片配置,我们将获得中等的中端性能。一半的EU和GPU内核,一半的原始计算,但降至6GBVRAM并保留六个内存通道—2020年没有至少6GBVRAM的中档GPU根本无法实现。6-8TFLOPS的理论性能将使该中级XeGraphics解决方案与Nvidia的RTX2060和AMD的RX5600XT处于同一水平,尽管当然驱动程序和其他因素仍需要测试。

    

最  后,我们预测了XeHP配置。这将具有单个GPU小芯片(或最  小的XeGraphics专用GPU),4GB的VRAM和大约中端型号的一半性能。具有128个EU,即1024个内核和潜在的3-4TFLOPS计算能力,这具体取决于时钟速度。可能会有更高和更低的型号,一个型号具有96个EU,而无需PCIe电源连接,另一个型号是具有128个EU和6针电源连接器的高性能预算卡。

    

值得注意的是,英特尔确实在CES演讲中曾说过XeGraphics的速度是Gen9Graphics的四倍。以上配置肯定会达到甚至超过该标准。但是,我们不知道英特尔是否只是简单地从架构上说了四次,即何时使时钟速度和EU计数相等,或者说总体速度是四倍。与集成的GT2UHDGraphics630配置相比,XeLP集成解决方案似乎已经将目标提高了4倍。一块128EU专用的XeGraphics卡应该不会超过英特尔以前提供的所有功能。

    

英特尔XeGraphics的这种概念渲染可能是对较大卡的外观的合理猜测。(图片来源:英特尔)

    

毫无疑问现在,AMD和Nvidia已经走在最  前面了,英特尔是否会成为第三者杀入这个市场,这尚未可知,但我们可以看到半导体巨头的雄心。

责任编辑:黄伟雅

声明:本网站中,来源标明为“ 慧聪电子网”的文章,转载请标明出处。

欢迎投稿,邮箱:yusy@hc360.com

活动推荐

更多

2019中国物联网产业大会

2019年11月27日

杭州·和达希尔顿逸林酒店

大会详情

友情链接

申请友情链接

赛迪网 RFID世界网电子信息产业网畅享网与非网电子产品世界威腾网慧聪家电网慧聪物联网

广州地址

广州市越秀区东风东路745号紫园商务大厦19楼

深圳地址

深圳市福田区深南中路2070号电子科技大厦A座2106

北京地址

北京市朝阳区小关东里10号院润宇大厦2层

关于我们 | 加入我们 | 我要投稿
| 寻求报道 | 申请合作

Copyright?2000-2014 hc360.com. All Rights Reserved
京ICP证010051号 海淀公安局网络备案编号:11010802015485