NVIDIA为大型语言模型提供高达30%的AI性能提升
NVIDIA宣布对NeMoMegatron框架进行更新,该框架可将大型语言模型的AI训练速度提高30%。新闻稿:随着大型语言模型(LLM)的规模和复杂性不断增长,NVIDIA今天宣布对NeMoMegatron框架进行更新,该框架可提供高达30%的训练速度提升。
这些更新包括两项开创性技术和一个超参数工具,可在任意数量的GPU上优化和扩展LLM的训练,提供使用NVIDIAAI平台训练和部署模型的新功能。
BLOOM是世界上最大的开放科学、开放获取的多语言语言模型,拥有1760亿个参数,最近在NVIDIAAI平台上进行了训练,支持46种语言和13种编程语言的文本生成。NVIDIAAI平台还支持拥有5300亿个参数的最强大的Transformer语言模型之一,即Megatron-TuringNLG模型(MT-NLG)。
LLM是当今最重要的先进技术之一,涉及从文本中学习的多达数万亿个参数。然而,开发它们是一个昂贵且耗时的过程,需要深厚的技术专长、分布式基础设施和全栈方法。
适用于TeslaV100SXM3GPU的NVIDIAHGX2GPU(图形处理单元)托盘环。该公司的HGX基板与其A100TensorCoreGPU配对,一些人担心如果NVIDIA收购设计公司,Arm产品可能会面临类似的命运。图片:浪潮集团
然而,它们在推进实时内容生成、文本摘要、客户服务聊天机器人和对话式AI界面问答方面的好处是巨大的。
为了推进LLM,AI社区正在继续对MicrosoftDeepSpeed、Colossal-AI和HuggingFaceBigScience等工具进行创新,这些工具均由NVIDIAAI平台提供支持,包括Megatron-LM、Apex和其他GPU加速库。
这些对NVIDIAAI平台的新优化有助于解决整个堆栈中的许多现有痛点。NVIDIA期待与AI社区合作,继续让所有人都能获得LLM的力量。
NeMoMegatron的最新更新为GPT-3模型的训练提供了30%的加速,其参数范围从220亿到1万亿不等。现在可以在24天内使用1,024个NVIDIAA100GPU在1750亿个参数模型上完成训练——在这些新版本发布之前,将获得结果的时间缩短10天,或大约250,000小时的GPU计算。
NeMoMegatron是一个快速、高效且易于使用的端到端容器化框架,用于收集数据、训练大型模型、根据行业标准基准评估模型以及以最先进的延迟进行推理和吞吐量性能。
它使LLM训练和推理在各种GPU集群配置上变得容易且可重现。目前,这些功能可供早期访问客户在NVIDIADGXSuperPOD和NVIDIADGXFoundry以及MicrosoftAzure云中运行。对其他云平台的支持即将推出。
您可以在NVIDIALaunchPad上试用这些功能,这是一个免费程序,提供对NVIDIA加速基础设施动手实验室目录的短期访问。
两种加速LLM培训的新技术
更新中包含的两项用于优化和扩展LLM训练的新技术是序列并行性(SP)和选择性激活重新计算(SAR)。
序列并行性扩展了张量级模型并行性,它注意到以前没有被并行化的转换器层的区域在序列维度上是独立的。
沿着序列维度拆分这些层可以实现计算的分布,最重要的是,这些区域的激活内存可以跨张量并行设备。由于激活是分布式的,因此可以为反向传递保存更多的激活,而不是重新计算它们。
选择性激活重新计算通过注意到不同的激活需要不同数量的操作来重新计算,从而改善了内存限制强制重新计算一些但不是全部激活的情况。
除了检查点和重新计算整个转换器层之外,还可以检查点和重新计算每个转换器层的一部分,这些部分占用大量内存,但重新计算的计算成本并不高。
获得LLM的强大功能还需要高度优化的推理策略。用户可以轻松地使用经过训练的模型进行推理,并使用p-tuning和提示调整功能针对不同的用例进行优化。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
2025年以来,联通支付严格贯彻落实国家战略部署,以数字和科技为驱动,做好金融五篇大文章,履行支付为民社会...浏览全文>>
-
随着新能源汽车市场的不断发展,大众汽车推出的ID 4 X系列车型受到了广泛关注。2025款滁州地区的ID 4 X以...浏览全文>>
-
在安徽滁州购买长安猎手K50时,了解其落地价格以及如何节省购车成本是非常重要的。长安猎手K50作为一款实用性...浏览全文>>
-
2025款途锐作为大众旗下的一款豪华SUV,凭借其卓越的性能和高端配置,吸引了众多消费者的关注。对于计划购买这...浏览全文>>
-
在新能源汽车市场蓬勃发展的背景下,大众ID 4 X以其出色的产品力和亲民的价格赢得了众多消费者的青睐。作为...浏览全文>>
-
大众ID 系列自推出以来,凭借其出色的电动性能和时尚的外观设计,受到了广泛的关注。作为一款备受期待的新车...浏览全文>>
-
2025款济南高尔夫GTI作为一款备受关注的性能钢炮车型,其市场定位和产品力都十分突出。这款车型在动力系统、操...浏览全文>>
-
岚图汽车作为东风旗下的高端新能源品牌,近年来凭借其创新的设计理念和卓越的性能表现,在市场上赢得了广泛的...浏览全文>>
-
2024款的安庆ID 7 VIZZION作为一款备受关注的新能源车型,凭借其出色的续航能力与智能科技配置吸引了众多消...浏览全文>>
-
池州途昂作为大众汽车旗下的旗舰级SUV车型,凭借其宽敞的空间、强劲的动力以及豪华的配置,在国内中大型SUV市...浏览全文>>
- 联想日前公布了一款具有可以向上扩展的显示屏的笔记本电脑
- 联想 YOGA 智能眼镜 T1 将在 10 月 24 日开启预售
- 三星在国内正式发了三星W23系列
- 三星正式发布了折叠屏手机三星W23
- 三星举办了三星W23系列新机发布会
- 2022第十八届深南电路杯航空模型大赛将于10月29日在深圳举行
- 飞利浦公布了新的游戏外设品牌Evnia的首轮产品线
- AMD Ryzen 7 7700:65 W Zen 4 台式机 CPU 首次亮相 Geekbench
- MelGeek 现在通过 Kickstarter 众筹活动发布 Pixel
- 三星 Galaxy 智能手机获得新的便捷相机定制选项
- Realme 10 有望推出浅色和深色渐变配色
- 三星确认到 2023 年 2 月将 Android 13 分发到 49 款智能手机和平板电脑
- 三星为 Galaxy Z Fold 4 增加了一家屏下摄像头供应商
- YouTube 获得了新设计与双指缩放
- TecnoPovaNeo5G32兆像素相机和6000mAh智能手机便宜
- 三星GalaxyBuds2Pro现已上市售价200美元
- 百思买在11月7日为Totaltech会员提供购买PS5的机会
- 级别锁一直都有一个秘密的线程无线电
- 这款飞利浦设备将通过语音命令在几分钟内烹饪食物知道价格
- 这是三星在德国的 One UI 5.0 更新发布时间表