电子发烧友网报道(文/周凯扬)在今年的亚马研芯迎更AWS re:Invent上,云服务巨头亚马逊公开了两款全新的逊再新自研芯片,一是发两基于Arm架构的新一代Gravition CPU,Gravition4,款自另一款则是片训片时隔数年终于更新的Trainium2。
第四代自研Arm服务器CPU
从2018年11月,练芯到今年的隔年11月,Gravition这一亚马逊自研的亚马研芯迎更服务器CPU已经迭代了数个版本,Gravition4作为该系列最新的逊再新产品,自然也拥有最强大的发两性能表现。Gravition4集成了96个Arm Neoverse V2内核,款自每个内核配置了2MB的片训片L2缓存,加上12个DDR5-5600通道。练芯相比上一代,隔年Gravition4的亚马研芯迎更核心数多出了50%,计算性能提高了30%,L2缓存变为两倍,内存带宽也提高了75%,可以毫无疑问地说,Gravition4将成为AWS自研硬件服务器矩阵的新王牌。
不过AWS计算与网络服务副总裁David Brown表示,跑分与现实应用负载相去甚远,往往不能代表芯片的真实性能表现,所以亚马逊更愿意用实际应用的成绩来展示Gravition4的性能提升。在MySQL这样的数据库应用中,Gravition4展现出了高出Gravition3 40%的性能。在网页应用上,Gravition4比上一代快30%,在大型Java应用中快45%。
而且毫不夸张地说,Gravition4也是目前对 ML硬件支持最为完善的CPU了。除了自研的Inferentia和Trainium系列芯片以外,亚马逊也为Gravition4组合打造了支持英伟达A100、H100、英特尔Habana Gaudi、高通AI100的容器。
训练芯片终于迎来第二代
在去年的AWS re:Invent上,亚马逊公开了全新的Inferentia2芯片,这也是其自研AI芯片矩阵中的推理芯片,但其训练芯片Trainium却没有同步更新,直到今年的AWS re:Invent上Trainium2的发布,才终于为这个3年前开辟的产品线带来了新品。
如今爆发式的生成式AI应用需要利用庞大的数据集进行训练,比如最近兴起的静态图片生成视频应用。这些基础模型或大语言模型的参数从千亿到万亿不等,需要更高的算力才能支撑起来。
更高的性能也是Trainium2本次升级的重点,根据亚马逊提供的数据,相较于第一代Trainium芯片,Trainium2提供了4倍的训练性能和3倍的内存容量,与此同时还将能效比提高至上一代的两倍。在扩展性上,亚马逊最高可提供 10万颗Trainium2芯片互联,从而实现高达65 exaflops的算力,提供超算级的性能。在这样的规模下,训练一个3000亿参数的LLM只要数周时间。
不过,与已经进入预先使用阶段且未来几个月就将开放使用的Gravition4不同,Trainium2应该仍在量产过程中,亚马逊表示明年某个时间才会投入使用。
写在最后
从亚马逊雷打不动的发布频率来看,他们在自研服务器芯片的设计上相当积极,多次首发Arm Neoverse的最新核心。而且从服务器部署情况来看,他们也没有在量产上遇到太多的问题,几乎可以推测除了英伟达以外,亚马逊应该就是台积电先进封装的最大使用者了。此外,亚马逊对待第三方硬件的策略也相当聪明,亚马逊并没有选择去追求极致的性能,而是借助自研芯片打造更具性价比的方案。
2025-03-10 06:091397人浏览
2025-03-10 05:4562人浏览
2025-03-10 05:08626人浏览
2025-03-10 04:541687人浏览
2025-03-10 03:44972人浏览
2025-03-10 03:37163人浏览
如今的潮流时尚引导着当代消费状况,把握消费者的心理和行为导向。因此,著名灶具品牌在发展时需要借助潮流的力量,保持不与潮流脱节,才能适应未来发展趋势。明星效应推广力量强随着明星名声的增大,很多的品牌产品
电子发烧友网报道文/吴子鹏)随着摩尔定律速度放缓,近几年先进封装技术成为大算力芯片发展的主要推动力。得益于人工智能应用的算力需求爆发,芯片封装技术的重要性更是提升到了前所未有的高度。在第十六届集成电路
亮点速览DT50 5G亮点速览:- 依托于UNISOC P7885,支持5G SA/NSA/4G/3G/2G,拥有更快的信息传输速度与畅快网速体验;- 拥有强大AI算力和高性能CPU,能并行处理多个复