【Hello AI】AIACC-AGSpeed性能数据

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 本文展示了AIACC-AGSpeed(简称AGSpeed)的部分性能数据,相比较通过PyTorch原生Eager模式训练模型后的性能数据,使用AGSpeed训练多个模型时,性能具有明显提升。

本文展示了AIACC-AGSpeed(简称AGSpeed)的部分性能数据,相比较通过PyTorch原生Eager模式训练模型后的性能数据,使用AGSpeed训练多个模型时,性能具有明显提升。

背景信息

本文通过测试不同场景下的模型,展示AGSpeed的不同性能提升效果。如果您想了解更多模型的性能测试效果,请联系我们

性能数据

本示例数据以hf_GPT2、hf_Bert、resnet50,timm_efficientnet等50多个模型为例,通过FP32精度和AMP混合精度两种场景进行训练,不同场景下各模型训练后的性能数据如下所示:

  • FP32精度训练场景
  • AMP混合精度场景

上述性能数据图中,横坐标和纵坐标的含义如下所示:

  • 横坐标:代表所有参加训练的模型。
  • 纵坐标:代表相比PyTorch原生Eager模式,模型使用AGSpeed训练后的加速比。加速比大于1.0表示性能提升有所提升。

性能效果

相比PyTorch原生的Eager模式,通过AGSpeed训练模型后,性能提升率如下所示。以吞吐量作为性能指标来展示AGSpeed的性能效果,性能提升率=(吞吐量(AGSpeed)-吞吐量(Eager))/吞吐量(Eager)。

说明下图中的数据仅展示部分典型模型,如果您想了解更多模型的性能提升效果,请联系我们

模型

精度

吞吐量(Eager)

吞吐量(AGSpeed)

性能提升率

resnet50 v1.5

TF32

8195 images/s

9222 images/s

提升12.5%

AMP

17160 images/s

17592 images/s

提升2.5%

SSD

TF32

2282 images/s

2427 images/s

提升9.9%

AMP

3312 images/s

3679 images/s

提升11.1%

BERT

TF32

2464 sequences/s

2589 sequences/s

提升5.1%

AMP

4689 sequences/s

5031 sequences/s

提升7.3%

nnUnet3D

TF32

89.21 images/s

98.42 images/s

提升6.8%

AMP

151.27 images/s

161.52 images/s

提升6.8%

好啦!小弹的分享到此为止。我们更欢迎您分享您对阿里云产品的设想、对功能的建议或者各种吐槽,请扫描提交问卷并获得社区积分或精美礼品一份。https://survey.aliyun.com/apps/zhiliao/P4y44bm_8

【扫码填写上方调研问卷】

欢迎每位来到弹性计算的开发者们来反馈问题哦~

相关文章
|
1天前
|
人工智能 NoSQL atlas
生成式AI入门必读:基本概念、数据挑战与解决方案
许多企业正在选择MongoDB Atlas。其原生向量搜索功能,加上统一的 API 和灵活的文档模型,对于寻求通过 RAG 方法提取专有数据来增强 LLM 的企业来说,是一个有吸引力的选择。
|
1天前
|
人工智能 NoSQL atlas
Atlas Vector Search:借助语义搜索和 AI 针对任何类型的数据构建智能应用
一切才刚刚开始,MongoDB 致力于提供优秀的开发者数据平台,助力开发者打造新一代 AI 赋能的应用
|
1天前
|
人工智能 NoSQL atlas
Fireworks AI和MongoDB:依托您的数据,借助优质模型,助力您开发高速AI应用
我们欣然宣布MongoDB与 Fireworks AI 正携手合作让客户能够利用生成式人工智能 (AI)更快速、更高效、更安全地开展创新活动
|
1天前
|
存储 机器学习/深度学习 人工智能
新一代数据库技术:融合AI的智能数据管理系统
传统数据库管理系统在数据存储和查询方面已经取得了巨大的成就,但随着数据量的不断增长和应用场景的多样化,传统数据库已经难以满足日益增长的需求。本文将介绍一种新一代数据库技术,即融合了人工智能技术的智能数据管理系统。通过结合AI的强大能力,这种系统能够实现更高效的数据管理、更智能的数据分析和更精准的数据预测,为用户带来全新的数据管理体验。
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
【AI 生成式】如何利用生成式人工智能进行机器学习的数据增强?
【5月更文挑战第4天】【AI 生成式】如何利用生成式人工智能进行机器学习的数据增强?
|
1天前
|
人工智能 NoSQL atlas
生成式AI入门必读:基本概念、数据挑战与解决方案
为了实现这一目标,许多企业正在选择MongoDB Atlas
|
1天前
|
数据采集 存储 人工智能
【AI大模型应用开发】【LangChain系列】实战案例4:再战RAG问答,提取在线网页数据,并返回生成答案的来源
【AI大模型应用开发】【LangChain系列】实战案例4:再战RAG问答,提取在线网页数据,并返回生成答案的来源
64 0
|
1天前
|
Cloud Native 关系型数据库 分布式数据库
数据之势丨云原生数据库,走向Serverless与AI驱动的一站式数据平台
在大模型席卷之下,历史的齿轮仍在转动,很多人开始思考,大模型能为数据库带来哪些改变。阿里云数据库产品事业部负责人李飞飞表示,数据库和智能化的结合是未来非常重要的发展方向,数据库的使用门槛将大幅降低。
|
数据采集 存储 人工智能
壳牌是如何成为一家数据和AI驱动的公司的?
作为一家全球性的能源和石化企业,壳牌(Shell)正在努力地以数据为驱动,推动业务发展,让数据科学变得和石油物理学一样重要。
|
机器学习/深度学习 人工智能 自然语言处理
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
第五届世界互联网大会正在如火如荼的举行。
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
http://www.vxiaotou.com