备案控制台

开发者社区 > ModelScope模型即服务 > 正文

部署ModelScope默认直接填满第一个GPU，导致内存溢出，这个有解决办法吗？

qwen/Qwen-72B-Chat部署ModelScope默认直接填满第一个GPU，导致内存溢出，这个有解决办法吗？

展开

收起

Lucidly 2024-04-24 08:20:41 11 0

1 条回答

写回答

取消提交回答

为了利利

2000元阿里云代金券免费领取，2核4G云服务器仅799元/3年，新老用户都有优惠，立即抢购>>>
vllm 部署的话，有个参数可以设置，--tensor_parallel_size 此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-04-24 12:19:27

赞同展开评论打赏

相关问答

modelscope-funasr中，我是用的部署包，是看GreedySearch这块吗？

13

1

0

ModelScope现在什么笔记本电脑是支持GPU计算的开发环境的？

28

1

0

ModelScope不选本地部署的1.8B那个模型为什么也能用？

10

1

0

ModelScope平台提示 EAI-DSW 资源紧张，切换至 EAIS GPU环境如何理解？

9

0

0

ModelScope魔搭的gpu资源最近几天一直用不了怎么办？

8

0

0

modelscope-funasr这个是说明已经支持GPU了吗？

35

0

0

modelscope-funasr 如果不销毁model，一直复用来识别语音，内存会不会持续被消耗？

13

0

0

ModelScope有创空间部署到本地的文档说明吗?

12

1

0

按照ModelScope官网VLLM推理加速与部署的问题,依然报错,怎么解决?

20

1

0

使用modelscope-inference在倚天上部署大模型，这个现在支持吗 ?

11

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

如何训练属于自己的“通义千问”呢？

ModelScope的Qwen1.5-14B-Chat需要多少大显存？

我希望通过damo-YOLO训练1500*1500的图片

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

ModelScope从魔塔社区创建的阿里服务没有使用抵扣资源包而是付费实例。怎么处理？

服务器上onnxruntime-gpu 调用结束，如何释放显存

请问ModelScope中，怎么修改本地运行，模型自动下载到 c 盘下？

streamlit 生成链接无法访问，gradio只生成内网，无法生成公网

展开全部

阿里云通义千问向全社会开放！

Llama 3开源！魔搭社区手把手带你推理，部署，微调和评估

千亿大模型来了！通义千问110B模型开源，魔搭社区推理、微调最佳实践

Qwen1.5开源！魔搭最佳实践来啦！

vanna+qwen实现私有模型的SQL转换

LLM 大模型学习必知必会系列(一)：大模型基础知识篇

ChatGPT中文版杀疯了,已登录AI模型市场

ModelScope--人像卡通化、人像美肤

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

Llama3 中文通用Agent微调模型来啦！（附手把手微调实战教程）

展开全部

相关课程

更多

个性化语音合成模型微调

40

1

去学习

ModelScope社区Library技术架构介绍

174

1

去学习

相关电子书

更多

DeepStream: GPU加速海量视频数据智能处理 立即下载

阿里巴巴高性能GPU架构与应用 立即下载

GPU在超大规模深度学习中的发展和应用 立即下载

相关实验场景

更多