【硬件资讯】来点新技巧是谁先用上了显卡3D堆叠技巧？NVIDIA联袂海力士发力显存3D堆叠

常见问题 | 2023-11-26 13:54:57 | 小编

　　英伟达联手 SK 海力士，考试将 HBM 内存 3D 堆叠到 GPU 焦点上

　　据kr 报道，SK 海力士依然开头聘请逻辑半导体（如 CPU 和 GPU）打算职员，指望将 HBM4 通过 3D 堆叠的体例直接集成正在芯片上。

　　据报道，SK 海力士正正在与几家半导体公司研究其 HBM4 集成打算方式，席卷 Nvidia。

　　表媒以为，Nvidia 和 SK 海力士很恐怕会协同打算这种集成芯片，并借帮台积电举办代工，然后通过台积电的晶圆键合本事将 SK 海力士的 HBM4 芯片堆叠到逻辑芯片上。而为了杀青内存芯片和逻辑芯片的一体协同，合伙打算是不行避免的。

　　假使 SK 海力士可能凯旋，这恐怕会正在很大水准上蜕变行业的运作体例，由于这不光会蜕变逻辑和存储新芯片的互连体例，还会蜕变它们的创设体例。

　　现阶段，HBM 堆叠要紧是安置正在 CPU 或 GPU 旁边的中介层上，并操纵 1024bit 接口毗连到逻辑芯片。SK 海力士的对象是将 HBM4 直接堆叠正在逻辑芯片上，统统清除中介层。

　　正在某种水准上来讲，这种方式有些似乎于 AMD 的 3D V-Cache 堆叠，它便是直接将 L3 SRAM 缓存封装正在 CPU 芯片上，而假使是 HBM 的话则可能杀青更高的容量且更低廉（IT之家注：HBM 彰彰也会比缓存速率更慢）。

　　目前困扰业界的要紧要素之一正在于 HBM4 须要采用 2048bit 接口，因而 HBM4 的中介层至极繁复且本钱昂扬。因而，假使可能将内存和逻辑芯片堆叠到一块，这看待经济效益来说是可行的，但这同时又提出了另一个题目：散热。

　　新颖逻辑芯片，如 Nvidia H100，因为装备了远大的 HBM3 内存，正在带来远大 VRAM 带宽的同时也发作了数百瓦的热能。因而，要念为逻辑和内存封装会集体举办散热恐怕须要至极繁复的方式，乃至要斟酌液冷和 / 或浸没式散热。

　　韩国科学本事院电气与电子工程系的教育 Kim Jung-ho 显露，“假使散热题目正在两到三代之后办理，那么 HBM 和 GPU 将可能像一体雷同运作，而无需中介层” 。

　　一位业内人士告诉 Joongang，“正在另日 10 年内，半导体的游戏规矩恐怕会产生转折，存储器和逻辑半导体之间的区别恐怕变得微亏损道”。

　　不懂得专家记不记得，正在AMD的RX7000系列显卡发表之后，有民间大佬正在X光透视下创造RDNA3焦点类似有与Ryzen似乎的，用于堆叠3D V-Cache缓存的布局，偶然之间3D堆叠缓存的显卡成为了热议的话题。时隔一年多，这项正在显卡上杀青3D堆叠的本事即将正在NVIDIA和海力士的合营中成为实际，AMD你真的是XX都赶不上热乎的啊……

　　这种片上堆砌显存的好处原本和咱们之前说的——Intel的Foveros 3D内存、AMD的3D V-Cache缓存、苹果的团结内存是雷同的，取缔了中介层之后可能有更高的带宽、更疾的速度和更低的延迟，这正在GPU越发是专业GPU上尤为主要。但专家也看到了，操纵片上内存或者片上缓存的多半是CPU或者SOC装备，他们的芯局部积幼，散热题目相对来说不那么主要，况且叠加的片上存储基础都对照幼。

　　目前尚欠亨晓NVIDIA念要杀青的是将片上HBM行为显存仍旧更大的缓存操纵，从文中的描摹来看该当是显存，那散热的压力就越发远大了啊……

　　指日PCI-SIG正在美国丹佛科罗拉多集会中央实行了SC23集会，向成员出现了PCIe本事演示和新的PCI急迅线缆定名计划，夸大了PCIe本事是高职能计较互连的首选。PCI-SIG显露，PCIe内部和表部线缆新定名计划为“CopprLink”，目前正正在造订PCIe 5.0和PCIe 6.0的内部和表部线缆典型，对象是本年内发表。

　　PCI-SIG的演示要点是高职能计较（HPC），因而CopprLink恐怕会将对象放正在了接口的数据传输上，以便为下一代平台上的各式装备供给最佳的传输带宽，供电题目也许不是斟酌的要点。假使CopprLink与供电亲昵合系，那么该当会起劲办理现时12VHPWR准绳遭遇的极少题目。固然“12V-2×6 PCIe 6.0”毗连器新打算依然发表了，然而类似另有矫正的余地。

　　PCI-SIG早正在客岁1月就发表了PCIe 6.0典型，要紧面向数据辘集型墟市，例如高职能计较、数据中央、角落计较、人为智能和机械研习（AI/ML）、汽车、物联网（IoT）以及航空航天等，并进一步增强了PCI Express行为高速互联的接口。PCIe 6.0典型将数据传输速度降低到64 GT/s，比拟PCIe 5.0典型降低了一倍，16通道可能供给高达256 GB/s的最大双向带宽。

　　另表，PCIe 6.0典型诈骗基于固定巨细流局限单位（Flit）的编码，同意操纵低延迟前向纠错（FEC）和四级脉冲幅度调造（PAM4）信令和强轮回冗余校验（CRC）。当然，PCIe 6.0典型连结了与以往PCIe本事的兼容性，接济与数以万计现有产物的毗连。

　　此表，谁人会烧起来的接头又双叒叕改了。之前依然有一版12V-2×6的矫正计划发表，基础可能褂讪操纵，不少电源、显卡厂商也跟进了，这个时刻再发新版总感应有点……我片面是以为像电源接口这种准绳硬件，没有需要太频仍的改动，一个是要保障历久的装备通用性，另一个则是为了褂讪，历程墟市检验的才是好用安静的，指望电源接口不要像Intel的CPU接口雷同吧……

　　正在这两款 GPU 中，GFX1200 ID 之前被用于 Navi 41 SKU，纵然有报道称 AMD 依然取缔了其高端 Navi 4X 产物线，但这些产物原来很有恐怕是谋略用于 Navi 4C 芯片的打算。

　　据称，该公司现正在正潜心于高端和主流墟市。看待 AMD 来说，其旗舰产物和高端产物之间的区别正在于，AMD 爱好将价钱正在 500 美元（IT之家备注：现时约 3580 元群多币）以上的产物视为发热级产物，而这些产物往往会操纵顶级 Navi x1 芯片，但这一次恐怕不会。

　　依据 AMD 安置，基于 RDNA 4 架构的下一代 Radeon GPU 系列估计将于 2024 年推出，并将采用全新的进步工艺节点，敬请希望。

　　下一代AMD显卡也有了更多眉目，依据之前AMD的说法，下一代RDNA4并没有高端产物，这两个新显现的代号很恐怕是对应Navi 44和Navi 48。依据之前的说法，RDNA4这一代是大范围焦点的高端产物BUG太多，于是才被放置，放弃下一代的比赛转而备战下下代。要懂得正在GCN时期，是向来到末期才显现放弃高端产物只应对中端墟市的环境，而RDNA确实第一代和下一代都要显现云云的现象了，不懂得这个RDNA家族的潜力终于何如样了。【硬件资讯】来点新技巧是谁先用上了显卡3D堆叠技巧？NVIDIA联袂海力士发力显存3D堆叠

上一篇 : 简幼知＆BrainCo联手共创软硬件全方位护航孩子发展
下一篇 : 浑身价钱不菲的感知硬件也没能让特斯拉问界幼鹏停下来？