当前位置: 智能网 > 智能硬件 > Tesla A100发布: 英伟达GPU架构如何演进？

Tesla A100发布: 英伟达GPU架构如何演进？

发布日期：2020-05-19 16:00:52 浏览次数：261

关于NVlink，它于2016年首次与PascalP100 GPU一起推出，是NVIDIA专有的高带宽互连，旨在允许多达16个GPU相互连接以作为单个集群运行，应对更大的工作负载。对于Volta，NVIDIA对NVlink进行了较小的修订，将数据传输率提高了25％。同时，对于A100和NVlink3，这次是NVIDIA在进行更大的升级，使通过NVlink可用的总带宽增加了一倍。

总而言之，与NVlink 2相比，NVlink 3有两个重大变化，既可以提供更大的带宽，又可以提供更多的拓扑。

首先，NVIDIA有效地将NVlink的信号速率提高了一倍，从NVlink 2的25．78Gbps提高到NVlink 3的50Gbps。这使NVlink与其他互连技术保持同步，其中许多技术都类似地升级为更快的信号。另一个重大变化是，鉴于信号速率提高了一倍，NVIDIA还将单个NVlink中的信号对／通道数量减少了一半，一个NVlink内可用的带宽数量保持不变，速度分别为上行每秒25GB和下行每秒25GB（或通常每秒50GB／秒），但可以使用一半的通道来完成。

NVIDIA A100在软件也做了些优化，包括50 多个加速、仿真和AI CUDA－X库，CUDA 11，AI服务器框架 NVIDIA Jarvis，应用框架NVIDIA Merlin和NVIDIA HPC SDK。

NVIDIA A100基于7nm Ampere GA100 GPU，具有6912 CUDA内核和432 Tensor Core，540亿个晶体管数，108个流式多处理器。采用第三代NVlink，GPU和服务器双向带宽为4．8 TB／s，GPU间的互连速度为600 GB／s。另外，Tesla A100在5120条内存总线上的HBM2内存可达40GB。

从单一的Mezz Modular卡到全长PCIe 4．0图形卡，NVIDIA Ampere GA100 GPU提供尺寸不等的各种方案。GPU还具有多种配置，但NVIDIA今天重点介绍的是Tesla A100，它用于DGX A100和HGX A100系统。

关于NVIDIA Ampere GA100 GPU架构和规格，NVIDIA的Ampere GA100 GPU绝对是一个庞然大物。尺寸为826mm2，比Volta GV100 GPU的815mm2还要大。鉴于管芯尺寸和晶体管数量，Ampere GA100 GPU是单手构建的最密集的GPU。

Tesla A100 SMX模块具有带有6个HBM2堆栈的GA100 GPU。相比Tesla V100（Volta），SMX模块发生了变化，孔与上一代不对齐。推测，这可能是我们正在寻找的SMX Gen 4模块。该模具似乎比GV100稍大，估计为820－840 mm 2。GA100 Ampere有望作为数据中心GPU推出，专注于面向计算的Tesla系列。

NVIDIA也发布了 DGX A100系统，该系统由8个GPU A100通过NVlink互连。NVIDIA深度学习工作站，即DGX系统，经历了几次迭代。最早的系统采用Pascal GP100 GPU，随后推出了4款基于Volta架构的系统，规格包含4到16个Tesla V100处理器。

3

关键词： 宝马提供系统

下一篇：中保研死磕C-NCAP：“军备竞赛”为权威还是为分食百亿蛋糕？
上一篇：资本往行业头部涌入，智能洗车赛道或以一超局面终结

[ 智能网搜索 ] [ 打印本文 ] [ 违规举报 ]

• 多位高管接连离职、市场遭华为蚕食，海康大华收	• 马云将从软银董事会辞职，时间是6月25日
• 4月国内轿车销量榜：轩逸力压朗逸夺冠大众是最	• 百度大脑全新发布人机协同审核管理平台，开放合
• 连信科技与杭师大共同组建“治未病”与健康管理	• 中保研：“全球车”在中美市场安全性有差距，但
• 华为再次立功！国产自动驾驶操作系统首获国际认	• 机器学习基础 \| 监督学习与无监督学习的快速入
• 裁员、卖身、倒闭：美国自动驾驶融资200亿美元	• 刚刚！4月70城房价延续微涨态势，疫情为何致房
• 强化学习机器人平台公司Covariant获得4000万美	• 裁员、卖身、倒闭：美国自动驾驶融资200亿美元
• 覆盖超2000种疾病，清睿智能用AI的力量提高基层	• 浪潮发布5款安培架构GPU服务器，加码人工智能新

单点液位开关在冷却系	2019年会议平板市场数
基于Raspberry Pi（树	中国芯片产业已取得了