热搜:微信 游戏 亮相 内存仅 抢不到 风林火山 电脑公司 王者荣耀 王者荣耀 万能装机 系统 xp 电脑公司 浏览器 一键重装 蜘蛛侠 快手 win7 fix realtek 微信 游戏 office mumu模拟器 微软电脑管家 22H2 secoclient 11 11 11 开始菜单 WingetUI 腾讯电脑管家 打印机 应用商店 谷歌浏览 批量下载 中国建设银行 win1032位 龙信 系统 Outlook AutoCAD 2023 Fix 迅雷 系统大师 装机大师 win7系统 WIFI sscom wps 采集 启动 植物大战僵尸 驱动人生 腾讯QQ V9.7.20 优酷 输入法 抖音 三只羊 短视频 qq 快手 系统 迅雷 注册表 学习通 红警 the vmware win11 必应 原神 小米 乙 和 UC浏览器网页版 TT
编辑:电脑系统网 2024-06-27 来源于:电脑系统网
电脑系统网 6 月 27 日新闻,科技博客 Chips and Cheese 于 6 月 25 每天发布博文,详细测试 AMD MI300X GPU,经过高速缓存、延迟、推理等方面的比较,发现其性能远远超过英伟达 H100。
MI300X 简介AMD Instinct MI300X 基于人工智能加速器 CDNA 3 结构构造,采用混合 5nm 和 6nm 工艺,最多有 1530 亿晶体管。
MI300X在存储方面也有了很大的提高 的 HBM3 与上一代相比,容量 MI250X (128 GB) 高出 50%。
与英伟达 H100 MI300X相比 有以下优点:
内存容量高于 2.4 倍
内存带宽高于 1.6 倍
FP8 性能 (TFLOPS) 高出 1.3 倍
FP16 性能 (TFLOPS) 高出 1.3 倍
在 1v1 在比较测试中,性能可以领先 H100 (Llama 2 70B) 最多 20%
在 1v1 在比较测试中,性能可以领先 H100 (FlashAttention 2) 最多 20%
在 8v8 在服务器比较测试中,性能可以领先 H100 (Llama 2 70B) 最多 40%
在 8v8 在服务器比较测试中,性能可以领先 H100 (Bloom 176B) 最多 60%
高速缓存AMD MI300X 配备了 32KB L1 缓存、16KB 标量缓存,4MB L2 缓存和巨大 256MB Infinity Cache(作为 L3 缓存)。
hips and Cheese 缓存基准测试表明,MI300X在所有相关缓存级别中 缓存带宽大大优于缓存带宽 Nvidia 的 H100。
一级缓存性能显示 MI300X 的带宽是 H100 的 1.6 倍,二次缓存的带宽是 H100 的 3.49 倍,MI300X 最后一级缓存(即无限缓存)的带宽是 H100 的 3.12 倍。
显存带宽AMD GPU 的本地 HBM3 内存是 H100 PCIe 的 2.72 倍,VRAM 带宽是 H100 PCIe 的 2.66 倍。
在内存测试中,AMD GPU 唯一的失败是内存延迟,H100 比 AMD GPU 快 57%。
请注意,这是最低规格 H100 PCIe 显卡,拥有 80GB HBM2E。后续版本(如 H200)含高达 141GB 的 HBM3E,最高带宽可达 4.8 TB / s。
Raw 吞吐量Chips and Cheese 考虑到指令吞吐量的结果 INT32、FP32、FP16 和 INT8 计算。
AMD 芯片的指令吞吐量高得离谱。有时,MI300X 比 H100 快 5 倍,最差时也快 40%。
人工智能推理测试计算机系统网络附上原始地址,感兴趣的用户可以深入阅读。
广告声明:文本中包含的外部跳转链接(包括不限于超链接、二维码、密码等形式)用于传递更多信息,节省选择时间。结果仅供参考。计算机系统网络上的所有文章都包含了本声明。
2024/12/01 00:29
消息称京东调整职级序列体系,原 M、P、T、S 合并为新的专业主序列 P2024/12/01 00:29
龙芯中科:下一代桌面芯片 3B6600 研制中,GPU 芯片 9A1000 争取明年上半年流片2024/12/01 00:29
广东省将从 12 月 1 日起实施深圳赴香港“一签多行”旅游政策消息人士表示该项目仍处于早期阶段,因为其“物理资产尚未到位”,预计 Meta 将在 2025 年初公开讨论此事,届时将确认详细计划,包括预期路线、容量和建设理由。...
2024/12/01 00:29:12
“科技昨夜今晨”时间,大家好,现在是 2024 年 11 月 30 日星期六,今天的重要科技资讯有:
2024/12/01 00:29:10