av 国产 英伟达公布Blackwell架构更多细节:引颈AI与超等狡计的新纪元

发布日期:2024-08-27 18:32    点击次数:190

av 国产 英伟达公布Blackwell架构更多细节:引颈AI与超等狡计的新纪元

  在本日的Hot Chips 2024大会上av 国产,英伟达公布了下一代GPU架构Blackwell的更多细节信息,以及当年的居品路子图。

  会议时期,英伟达架构总监Ajay Tirumala和Raymond Wong对Blackwell平台进行了初步先容,并讲明了这些技艺怎样协同责任,在提高动力成果的同期为AI和加速狡计性能提供新的圭臬。

  为Blackwell作念好准备

  英伟达Blackwell是通用狡计全栈矩阵的终极惩处有策动,由多个英伟达芯片构成,包括Blackwell GPU、Grace CPU、BlueField数据处理单位、ConnectX网罗接口卡、NVLink交换机、Spectrum以太网交换机和Quantum InfiniBand交换机。

  它涵盖了从CPU和GPU狡计,到用于互连的不同类型的网罗。这是芯片到机架和互连,而不单是是GPU。它是有史以来单个GPU所领有的最强AI狡计、内存带宽和互连带宽。通过使用高带宽接口(NV-HBI),可在两个GPU芯片之间提供10TB/s的带宽。

  此外,英伟达还引入了新的FP4和FP6精度。缩短狡计精度是提高性能的一种人所共知的设施。通过英伟达的Quasar量化系统,不错找出哪些方面不错使用较低的精度,从而减少狡计和存储。英伟达默示,用于推理的FP4在某些情况下不错接近BF16性能。

  NVLink交换机芯片和NVLink交换机托盘(tray)旨在以更低的功耗推送无数数据。英伟达演示了GB200 NVL72和NVL36。其中,NVL72包含36个Grace GPU和72个Blackwell GPU,专为万亿参数AI而联想。GB200 NVL 72行为一个谐和系统,对大言语模子(LLM)推感性能擢升高达30倍,开释了及时运行数万亿个参数模子的才智。

  英伟达默示,跟着AI模子尺寸的加多,在多个GPU上拆单干作负载大势所趋。而Blackwell满盈雄伟,不错在一个GPU中处理各人模子。

  终末,英伟达还展示了2024年至2028年的居品路子图。2026年的1.6T ConnectX-9似乎标明了英伟达对PCIe Gen7的需求,因为PCIe Gen6 x16无法处理1.6T的网罗聚集。

  Blackwell的技艺打破

  本年3月,英伟达在GTC 2024开导者大会上发布了新的GPU架构Blackwell。Blackwell得名于好意思国数学家David Blackwell,是英伟达最新一代的AI芯片与超等狡计平台。与Grace数据中心CPU、新一代网罗芯片等居品一谈,面向生成式AI共同构成好意思满惩处有策动。

  英伟达称,Blackwell领有6项鼎新性技艺,可维持多达10万亿参数的模子进行AI历练和及时大言语模子(LLM)推理。

  1.宇宙最雄伟的芯片:Blackwell架构GPU领有2080亿个晶体管,确保了芯片具有极高的狡计才智和复杂性;剿袭台积电4纳米工艺制造,提高了芯片的集成度,缩短了功耗和发烧量;配备192GB的HBM3E显存,极大擢升了芯片的数据处理才智和成果。

  2.第二代Transformer引擎:勾通Blackwell Tensor Core技艺和TensorRT-LLM和NeMo Megatron框架中的英伟达先进动态范围料理算法av 国产,Blackwell将通过新的4位浮点AI维持双倍的狡计和模子大小推理才智。

  3.第五代NVLink:为提高数万亿参数和搀杂各人AI模子的性能,最新一代英伟达NVLink为每个GPU提供了打破性的1.8TB/s的双向蒙胧量,确保最复杂LLM之间多达576个GPU之间的无缝高速通讯。

  4.RAS引擎:Blackwell维持的GPU包含一个专用引擎,完了可靠性、可用性和事业性。此外,Blackwell架构还加多了芯片级功能,运用基于AI的防护性爱戴进行会诊和预测可靠性问题。这不错最大放荡地延长系统日常运行时刻,并提魁岸范围部署AI的弹性。

  5.安全东谈主工智能:先进的深广狡计功能可在不影响性能的情况下保护AI模子和客户数据,并维持新的本机接口加密契约,进一步增强了芯片的安全性。

  6.解压缩引擎:专用解压缩引擎维持最新方式,加速数据库查询,提供数据分析和数据科学的最高性能。

  英伟达CEO黄仁勋称,Blackwell不单是芯片,而是一个全新的平台。它将是英伟达历史上、乃至所有狡计机历史上最告捷的居品。

  Blackwell的阛阓影响

  Blackwell架构的推出受到了宇宙各大云提供商、事业器制造商以及头部AI企业的爱重,如亚马逊、谷歌和微软等。英伟达默示,Blackwell正在被宇宙各大云事业提供商剿袭。同期,AI公司、电信提供商和一系列其他技艺企业也有着苍劲的需求。

  Blackwell的发布预示着AI的又一个打破时刻的到来,如故发布便取得了微软CEO萨蒂亚·纳德拉(Satya Nadella)、Alphabet CEO桑达尔·皮查伊(Sundar Pichai)、亚马逊CEO安迪·贾西(Andy Jassy)、OpenAI CEO萨姆·奥特曼(Sam Altman),以过甚他闻名科技首脑和名东谈主的维持。

  至关艰巨的是,Blackwell是一个更大的生态系统政策的一部分。黄仁勋称:“Blackwell不仅是系统的中枢芯片,它推行上照旧一个平台。它基本上即是一个狡计机系统。”

  Nvidia还将使用Blackwell来擢升其在软件鸿沟的地位和宏愿。朝上的AI开导商已经依赖Nvidia的CUDA软件来创建由该公司处理器驱动的应用法子,而高性能Blackwell处理器的眩惑力应有助于确保客户不时使用其软件。

  该政策致使蔓延得更远。黄仁勋在GTC的一次会议上称:“你不错制造芯片让软件运行得更好,但莫得软件你就无法创造一个新的阛阓。咱们的独到之处在于,我驯服咱们是独逐个家概况创造我方阛阓的芯片公司。”

  跟着基于Blackwell架构的GPU GB200的发布,英伟达似乎正在为创建新类别的AI软件应用法子掀开大门。反过来,此类软件的推出、彭胀和捏续发展可能会对其超高端GPU产生更大的需求。

  Blackwell的延迟

  本月初有报谈称,英伟达的下一代Blackwell系列AI芯片因联想残障问题被动推迟发布,这一决定可能对包括Meta、谷歌和微软在内的大客户酿成影响。

  据悉,Blackwell芯片的大范围坐蓐原运筹帷幄于本年第三季度启动,并于第四季度启动录用。但谈,在准备大范围坐蓐时,台积电的工程师发现了联想问题,导致坐蓐受阻。

  报谈称,由于台积电封装技艺CoWoS的复杂性,英伟达将推迟Blackwell GPU的出货时刻至2025年第一季度。

  瑞银(UBS)分析师觉得,英伟达首批Blackwell芯片最多延迟4~6周出货,即推迟到2025年1月底。为此,许多客户会改而采购交货时刻短的H200芯片。

  而摩根士丹利的分析师相对乐不雅,觉得Blackwell芯片的坐蓐仅会暂停约两周,并可在2024年第四季度通过台积电的辛苦赶上程度。

  举座而言,分析师觉得相关Blackwell芯片推迟上市的担忧可能被夸大了,预测这不会对英伟达的营收或需求产生紧要影响。

  英伟达CEO黄仁勋默示,Blackwell GPU的研发预算约为100 亿好意思元,上市后单价会在3~4万好意思元。鉴于刻下历练和部署AI的苍劲需求,该价钱也并未超出阛阓预期。

四房色播

  “反英伟达”定约

  包括Alphabet、高通和英特尔在内的公司正在联手创建一个组织“UXL基金会”,旨在回绝英伟达在AI鸿沟建筑无可争议的主导地位。

  UXL基金会旨在创建一个软件套件,匡助在更粗造的处理器上运行AI应用法子,并减少对英伟达平台的依赖。

  据报谈,UXL基金会当今正在招募微软、亚马逊和其他有影响力的科技公司。因此,尽管许多科技界的闻名东谈主士对Blackwell的才智感到痛快,但不错领悟的是,东谈主们对更粗造的AI鸿沟过度依赖英伟达的生态系统捏支配格调。

  在某种程度上,UXL基金会的树立阐发了英伟达当今的竞争地位有多强。该公司在用于AI和其他加速狡计应用的GPU阛阓上占据了约莫90%的份额,而Blackwell的推出可能有助于它不时保捏致使扩大其主导地位。

  与不休扩大的专用软件器具相勾通,英伟达正在重塑AI鸿沟,而其竞争敌手和潜在竞争敌手还有许多责任要作念。

海量资讯、精确解读,尽在新浪财经APP

包袱裁剪:刘亮堂 av 国产