【硬件资讯】来点新技巧是谁先用上了显卡3D堆叠技巧?NVIDIA联袂海力士发力显存3D堆叠

 常见问题     |      2023-11-26 13:54:57    |      小编

  英伟达联手 SK 海力士,考试将 HBM 内存 3D 堆叠到 GPU 焦点上

  据kr 报道,SK 海力士依然开头聘请逻辑半导体(如 CPU 和 GPU)打算职员,指望将 HBM4 通过 3D 堆叠的体例直接集成正在芯片上。

  据报道,SK 海力士正正在与几家半导体公司研究其 HBM4 集成打算方式,席卷 Nvidia。

  表媒以为,Nvidia 和 SK 海力士很恐怕会协同打算这种集成芯片,并借帮台积电举办代工,然后通过台积电的晶圆键合本事将 SK 海力士的 HBM4 芯片堆叠到逻辑芯片上。而为了杀青内存芯片和逻辑芯片的一体协同,合伙打算是不行避免的。

  假使 SK 海力士可能凯旋,这恐怕会正在很大水准上蜕变行业的运作体例,由于这不光会蜕变逻辑和存储新芯片的互连体例,还会蜕变它们的创设体例。

  现阶段,HBM 堆叠要紧是安置正在 CPU 或 GPU 旁边的中介层上,并操纵 1024bit 接口毗连到逻辑芯片。SK 海力士的对象是将 HBM4 直接堆叠正在逻辑芯片上,统统清除中介层。

  正在某种水准上来讲,这种方式有些似乎于 AMD 的 3D V-Cache 堆叠,它便是直接将 L3 SRAM 缓存封装正在 CPU 芯片上,而假使是 HBM 的话则可能杀青更高的容量且更低廉(IT之家注:HBM 彰彰也会比缓存速率更慢)。

  目前困扰业界的要紧要素之一正在于 HBM4 须要采用 2048bit 接口,因而 HBM4 的中介层至极繁复且本钱昂扬。因而,假使可能将内存和逻辑芯片堆叠到一块,这看待经济效益来说是可行的,但这同时又提出了另一个题目:散热。

  新颖逻辑芯片,如 Nvidia H100,因为装备了远大的 HBM3 内存,正在带来远大 VRAM 带宽的同时也发作了数百瓦的热能。因而,要念为逻辑和内存封装会集体举办散热恐怕须要至极繁复的方式,乃至要斟酌液冷和 / 或浸没式散热。

  韩国科学本事院电气与电子工程系的教育 Kim Jung-ho 显露,“假使散热题目正在两到三代之后办理,那么 HBM 和 GPU 将可能像一体雷同运作,而无需中介层” 。

  一位业内人士告诉 Joongang,“正在另日 10 年内,半导体的 游戏规矩 恐怕会产生转折,存储器和逻辑半导体之间的区别恐怕变得微亏损道”。

  不懂得专家记不记得,正在AMD的RX7000系列显卡发表之后,有民间大佬正在X光透视下创造RDNA3焦点类似有与Ryzen似乎的,用于堆叠3D V-Cache缓存的布局,偶然之间3D堆叠缓存的显卡成为了热议的话题。时隔一年多,这项正在显卡上杀青3D堆叠的本事即将正在NVIDIA和海力士的合营中成为实际,AMD你真的是XX都赶不上热乎的啊……

  这种片上堆砌显存的好处原本和咱们之前说的——Intel的Foveros 3D内存、AMD的3D V-Cache缓存、苹果的团结内存是雷同的,取缔了中介层之后可能有更高的带宽、更疾的速度和更低的延迟,这正在GPU越发是专业GPU上尤为主要。但专家也看到了,操纵片上内存或者片上缓存的多半是CPU或者SOC装备,他们的芯局部积幼,散热题目相对来说不那么主要,况且叠加的片上存储基础都对照幼。

  目前尚欠亨晓NVIDIA念要杀青的是将片上HBM行为显存仍旧更大的缓存操纵,从文中的描摹来看该当是显存,那散热的压力就越发远大了啊……

  指日PCI-SIG正在美国丹佛科罗拉多集会中央实行了SC23集会,向成员出现了PCIe本事演示和新的PCI急迅线缆定名计划,夸大了PCIe本事是高职能计较互连的首选。PCI-SIG显露,PCIe内部和表部线缆新定名计划为“CopprLink”,目前正正在造订PCIe 5.0和PCIe 6.0的内部和表部线缆典型,对象是本年内发表。

  PCI-SIG的演示要点是高职能计较(HPC),因而CopprLink恐怕会将对象放正在了接口的数据传输上,以便为下一代平台上的各式装备供给最佳的传输带宽,供电题目也许不是斟酌的要点。假使CopprLink与供电亲昵合系,那么该当会起劲办理现时12VHPWR准绳遭遇的极少题目。固然“12V-2×6 PCIe 6.0”毗连器新打算依然发表了,然而类似另有矫正的余地。

  PCI-SIG早正在客岁1月就发表了PCIe 6.0典型,要紧面向数据辘集型墟市,例如高职能计较、数据中央、角落计较、人为智能和机械研习(AI/ML)、汽车、物联网(IoT)以及航空航天等,并进一步增强了PCI Express行为高速互联的接口。PCIe 6.0典型将数据传输速度降低到64 GT/s,比拟PCIe 5.0典型降低了一倍,16通道可能供给高达256 GB/s的最大双向带宽。

  另表,PCIe 6.0典型诈骗基于固定巨细流局限单位(Flit)的编码,同意操纵低延迟前向纠错(FEC)和四级脉冲幅度调造(PAM4)信令和强轮回冗余校验(CRC)。当然,PCIe 6.0典型连结了与以往PCIe本事的兼容性,接济与数以万计现有产物的毗连。

  此表,谁人会烧起来的接头又双叒叕改了。之前依然有一版12V-2×6的矫正计划发表,基础可能褂讪操纵,不少电源、显卡厂商也跟进了,这个时刻再发新版总感应有点……我片面是以为像电源接口这种准绳硬件,没有需要太频仍的改动,一个是要保障历久的装备通用性,另一个则是为了褂讪,历程墟市检验的才是好用安静的,指望电源接口不要像Intel的CPU接口雷同吧……

  正在这两款 GPU 中,GFX1200 ID 之前被用于 Navi 41 SKU,纵然有报道称 AMD 依然取缔了其高端 Navi 4X 产物线,但这些产物原来很有恐怕是谋略用于 Navi 4C 芯片的打算。

  据称,该公司现正在正潜心于高端和主流墟市。看待 AMD 来说,其旗舰产物和高端产物之间的区别正在于,AMD 爱好将价钱正在 500 美元(IT之家备注:现时约 3580 元群多币)以上的产物视为发热级产物,而这些产物往往会操纵顶级 Navi x1 芯片,但这一次恐怕不会。

  依据 AMD 安置,基于 RDNA 4 架构的下一代 Radeon GPU 系列估计将于 2024 年推出 ,并将采用全新的进步工艺节点,敬请希望。

  下一代AMD显卡也有了更多眉目,依据之前AMD的说法,下一代RDNA4并没有高端产物,这两个新显现的代号很恐怕是对应Navi 44和Navi 48。依据之前的说法,RDNA4这一代是大范围焦点的高端产物BUG太多,于是才被放置,放弃下一代的比赛转而备战下下代。要懂得正在GCN时期,是向来到末期才显现放弃高端产物只应对中端墟市的环境,而RDNA确实第一代和下一代都要显现云云的现象了,不懂得这个RDNA家族的潜力终于何如样了。【硬件资讯】来点新技巧是谁先用上了显卡3D堆叠技巧?NVIDIA联袂海力士发力显存3D堆叠