ModelScope模型即服务-推荐-阿里云开发者社区

阿里云

|

8月前

|

人工智能 API 开发者

|

博文

阿里云通义千问向全社会开放！

17378 37 43

ModelScope运营小助手

|

21天前

|

安全测试技术 Swift

|

博文

Llama 3开源！魔搭社区手把手带你推理，部署，微调和评估

Meta发布了 Meta Llama 3系列，是LLama系列开源大型语言模型的下一代。在接下来的几个月，Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能，并会分享 Llama 3 研究论文。

2560 2 8

11593

|

4月前

|

问答

com/action/joingroup?code=v1是什么意思

2867 3 17

来自：计算机视觉版块

ModelScope运营小助手

|

15天前

|

自然语言处理 Swift

|

博文

千亿大模型来了！通义千问110B模型开源，魔搭社区推理、微调最佳实践

近期开源社区陆续出现了千亿参数规模以上的大模型，这些模型都在各项评测中取得杰出的成绩。今天，通义千问团队开源1100亿参数的Qwen1.5系列首个千亿参数模型Qwen1.5-110B，该模型在基础能力评估中与Meta-Llama3-70B相媲美，在Chat评估中表现出色，包括MT-Bench和AlpacaEval 2.0。

536 0 0

d4bhkgz3uzfz6

|

2月前

|

SQL 存储开发工具

|

博文

本文档介绍了如何在本地部署Vanna服务以使用Qwen模型进行text2sql转换。首先，通过`snapshot_download`下载Qwen-7B-Chat模型，并安装相关依赖。接着，修改`openai_api.py`设置本地LLM服务接口。然后，安装并配置Vanna Flask服务，包括自定义LLM服务、连接数据库以及修改端口。为了解决内网访问问题，使用ngrok或natapp进行内网穿透，提供公网访问。最后，处理了chromadb包中自动下载资源的问题，以防网络不佳导致的失败。通过这些步骤，实现了使用本地Qwen模型的Vanna服务。

796 0 0

ModelScope运营小助手

|

3月前

|

自然语言处理 API Swift

|

博文

Qwen1.5开源！魔搭最佳实践来啦！

近几个月来，通义千问团队一直在努力探索如何构建一个“好”的模型，同时优化开发者体验。就在刚刚，中国新年前夕，通义千问团队分享了Qwen开源系列的下一个版本，Qwen1.5。

2499 3 4

ModelScope运营小助手

|

5天前

|

数据可视化物联网关系型数据库

|

博文

幻方开源第二代MoE模型 DeepSeek-V2，魔搭社区推理、微调最佳实践教程

5月6日，幻方继1月份推出首个国产MoE模型，历时4个月，带来第二代MoE模型DeepSeek-V2，并开源了技术报告和模型权重，魔搭社区可下载体验。

136 9 9

多麻辣哦

|

6月前

|

问答

ModelScope中，模型下载默认路径在哪个路径？

2155 4 2

来自：计算机视觉版块

青城山下庄文杰

|

10月前

|

问答

ModelScope从魔塔社区创建的阿里服务没有使用抵扣资源包而是付费实例。怎么处理？

358 3 0

来自：计算机视觉版块

汀丶人工智能

|

4天前

|

机器学习/深度学习人工智能自然语言处理

|

博文

LLM 大模型学习必知必会系列(一)：大模型基础知识篇

117 2 2

来自：自然语言处理版块

ModelScope运营小助手

|

1月前

|

自然语言处理数据可视化物联网

|

博文

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

1368 4 5

提个问题

|

9月前

|

开发者

|

问答

如何训练属于自己的“通义千问”呢？

4708 63 22

汀丶人工智能

|

6天前

|

自然语言处理物联网 API

|

博文

检索增强生成(RAG)实践：基于LlamaIndex和Qwen1.5搭建智能问答系统

139 6 6

来自：自然语言处理版块

ModelScope运营小助手

|

5月前

|

人工智能 PyTorch 算法框架/工具

|

博文

通义千问72B、1.8B、Audio模型开源！魔搭社区最佳实践来啦！

通义千问再次重磅开源！

3471 0 1

陈幕白

|

3月前

|

问答

ModelScope的Qwen1.5-14B-Chat需要多少大显存？

1384 2 17

ModelScope运营小助手

|

18天前

|

自然语言处理前端开发 Swift

|

博文

Llama3 中文通用Agent微调模型来啦！（附手把手微调实战教程）

Llama3模型在4月18日公布后，国内开发者对Llama3模型进行了很多训练和适配，除了中文纯文本模型外，多模态版本也陆续在发布中。

479 3 4

ModelScope运营小助手

|

4月前

|

缓存自然语言处理物联网

|

博文

LLama Factory+ModelScope实战——使用 Web UI 进行监督微调

LLaMA Factory 是一个高效的大语言模型训练和推理框架，它通过提供一站式的 Web UI 界面和集成多种训练方法，简化了大模型的微调过程，并能够适配多种开源模型。

1516 2 5

ModelScope运营小助手

|

1月前

|

机器学习/深度学习自然语言处理机器人

|

博文

【RAG实践】Rerank，让RAG更近一步

本文主要关注在Rerank，本文中，Rerank可以在不牺牲准确性的情况下加速LLM的查询（实际上可能提高准确率），Rerank通过从上下文中删除不相关的节点，重新排序相关节点来实现这一点。

366 0 0

ModelScope运营小助手

|

14天前

|

自然语言处理前端开发 Swift

|

博文

社区供稿 | 中文llama3模型哪家强？llama3汉化版微调模型大比拼

随着llama3的发布，业界越来越多的针对其中文能力的微调版本也不断涌现出来，我们在ModelScope魔搭社区上，搜集到几款比较受欢迎的llama3中文版本模型，来从多个维度评测一下，其对齐后的中文能力到底如何？微调后是否产生了灾难性遗忘问题。

200 2 2

mustang2247

|

9月前

|

问答

我希望通过damo-YOLO训练1500*1500的图片

6713 4 44

来自：计算机视觉版块

已解决

Lucidly

|

2月前

|

物联网

|

问答

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

554 1 3

汀丶人工智能

|

7天前

|

自然语言处理 API 开发工具

|

博文

基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手（检索增强生成(RAG)大模型）

138 0 0

来自：自然语言处理版块

ModelScope运营小助手

|

8月前

|

机器学习/深度学习人工智能物联网

|

博文

大模型时代，还缺一只雨燕｜ SWIFT：魔搭社区轻量级微调推理框架

伴随着大数据的发展和强大的分布式并行计算能力，以预训练+微调的模型开发范式渐渐成为深度学习领域的主流。 2023年各家推出的大模型浩如烟海，如GPT4、Llama、ChatGLM、Baichuan、RWKV、Stable-Diffusion等。这些模型在达到越来越好的效果的同时也需要越来越多的算力资源：全量finetune它们动辄需要几十至上百G显存训练部署，一般的实验室和个人开发者无力承担。

1439 8 8

游客pzlxprtoigjes

|

7月前

|

问答

streamlit 生成链接无法访问，gradio只生成内网，无法生成公网

1504 3 0

来自：计算机视觉版块

圣者ay

|

12月前

|

问答

服务器上onnxruntime-gpu 调用结束，如何释放显存

3032 16 0

来自：计算机视觉版块

ModelScope运营小助手

|

17天前

|

人工智能测试技术 API

|

博文

Phi-3：小模型，大未来！（附魔搭社区推理、微调实战教程）

近期， Microsoft 推出 Phi-3，这是 Microsoft 开发的一系列开放式 AI 模型。Phi-3 模型是一个功能强大、成本效益高的小语言模型?(SLM)，在各种语言、推理、编码和数学基准测试中，在同级别参数模型中性能表现优秀。为开发者构建生成式人工智能应用程序时提供了更多实用的选择。

434 1 1

ModelScope运营小助手

|

2月前

|

存储人工智能达摩院

|

博文

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

108594 93 105

青城山下庄文杰

|

10月前

|

问答

Modelscope魔塔的创空间的文件怎么下载到本地呀？

3004 4 5

来自：计算机视觉版块

ModelScope运营小助手

|

2月前

|

编解码 JSON 数据可视化

|

博文

DeepSeek VL系列开源，魔搭社区模型微调最佳实践教程来啦！

3月11日，DeepSeek-AI开源了全新多模态大模型DeepSeek-VL系列，包含1.3b、7b两种不同规模的4个版本的模型。

323 3 3

游客du2xsfqkguune

|

4月前

|

语音技术 Python

|

问答

KeyError: 'asr-inference is not in the pipelines r

962 2 1

来自：语音版块

ModelScope运营小助手

|

7天前

|

自然语言处理前端开发物联网

|

博文

社区供稿 |【中文Llama-3】Chinese-LLaMA-Alpaca-3开源大模型项目正式发布

Chinese-LLaMA-Alpaca-3开源大模型项目正式发布，开源Llama-3-Chinese-8B（基座模型）和Llama-3-Chinese-8B-Instruct（指令/chat模型）

144 7 7

十一0204

|

10月前

|

问答

请问modelscope中怎么对funasr进行本地部署？

1310 4 0

zeroonetwothree

|

4月前

|

异构计算

|

问答

从魔塔领取gpu免费资源无法连接huggingface.co

882 2 0

ModelScope运营小助手

|

4月前

|

开发框架数据可视化 Windows

|

博文

如何提升大模型Agent的能力 ——LLM Agent框架 Modelscope-Agent 实战

本文介绍Agent到底是什么，如何进行优化，以及如何使用Agen框架。

1232 0 1

cuicuicuic

|

6月前

|

问答

ModelScope 使用14B模型推理时报这个错误？

681 2 0

来自：计算机视觉版块

十一0204

|

10月前

|

问答

请问ModelScope中，怎么修改本地运行，模型自动下载到 c 盘下？

2771 3 0

ModelScope运营小助手

|

7月前

|

存储 JSON 前端开发

|

博文

multi-agent：多角色Agent协同合作，高效完成复杂任务

随着LLM的涌现，以LLM为中枢构建的Agent系统在近期受到了广泛的关注。Agent系统旨在利用LLM的归纳推理能力，通过为不同的Agent分配角色与任务信息，并配备相应的工具插件，从而完成复杂的任务。

26568 4 5

ModelScope运营小助手

|

21天前

|

自然语言处理开发者异构计算

|

博文

社区供稿 | Llama3-8B中文版！OpenBuddy发布新一代开源中文跨语言模型

此次发布的是在3天时间内，我们对Llama3-8B模型进行首次中文跨语言训练尝试的结果：OpenBuddy-Llama3-8B-v21.1-8k。

577 1 1

ModelScope运营小助手

|

3月前

|

机器学习/深度学习自然语言处理机器人

|

博文

【RAG实践】基于LlamaIndex和Qwen1.5搭建基于本地知识库的问答机器人

LLM会产生误导性的 “幻觉”，依赖的信息可能过时，处理特定知识时效率不高，缺乏专业领域的深度洞察，同时在推理能力上也有所欠缺。

1558 2 2

ModelScope运营小助手

|

2月前

|

存储前端开发物联网

|

博文

在魔搭使用ComfyUI，玩转AIGC

ComfyUI是一个功能强大、模块化程度高的AIGC图形和视频生成的用户界面和后台。

561 6 6

多麻辣哦

|

6月前

|

问答

ModelScope中，请问Qwen-14B-Chat-Int4运行最少需要多少内存？

1105 2 0

来自：计算机视觉版块

niedapeng

|

9月前

|

监控 Serverless API

|

博文

ModelScope一键部署模型：新手村实操FAQ篇

魔搭社区支持开源模型一键部署至阿里云函数计算，本文以小白视角进行操作实操与FAQ讲解。

2845 1 2

点点DD的小书屋

|

9月前

|

问答

通义千问 RuntimeError: "addmm_impl_cpu_" not implement

1844 1 0

taro_秋刀鱼

|

2月前

|

Java 开发工具

|

博文

阿里云灵积平台Java SDK调用教程

开通阿里云灵积服务并创建API-KEY，添加Java依赖`dashscope-sdk-java`版本2.11.0。示例代码展示如何使用SDK进行多模态对话，调用`MultiModalConversation`进行交互，并打印结果。测试结果显示输出对一张图片的描述。参考链接提供通义千问VL快速入门指南。

203 0 0

J.X

|

2月前

|

开发工具 git

|

问答

在modelscope下载模型，直接在网页下载，或者用git下载，都只下载一个几B的文件

199 4 0

已解决

magichen

|

12月前

|

SQL 前端开发关系型数据库

|

博文

LLM大模型实战 —— DB-GPT阿里云部署指南

DB-GPT 是一个实验性的开源应用，它基于FastChat，并使用vicuna-13b作为基础模型, 模型与数据全部本地化部署, 绝对保障数据的隐私安全。同时此GPT项目可以直接本地部署连接到私有数据库, 进行私有数据处理，目前已支持SQL生成、SQL诊断、数据库知识问答、数据处理等一系列的工作。

6981 2 3

ModelScope运营小助手

|

5月前

|

缓存 API 开发者

|

博文

魔搭社区牵手FastChat&vLLM，打造极致LLM模型部署体验

FastChat是一个开放平台，用于训练、服务和评估基于LLM的ChatBot。

884 0 2

ModelScope运营小助手

|

26天前

|

SQL 自然语言处理 JavaScript

|

博文

快来与 CodeQwen1.5 结对编程

今天，来自 Qwen1.5 开源家族的新成员，代码专家模型 CodeQwen1.5开源！CodeQwen1.5 基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

253 0 1

多麻辣哦

|

6月前

|

物联网并行计算异构计算

|

问答

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

820 4 0

来自：计算机视觉版块

ModelScope运营小助手

|

8月前

|

数据可视化安全物联网

|

博文

通义千问14B开源！内附魔搭最佳实践

9月25日，阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat，免费可商用。Qwen-14B在多个权威评测中超越同等规模模型，部分指标甚至接近Llama2-70B。阿里云此前开源的70亿参数模型Qwen-7B等，一个多月下载量破100万，成为开源社区的口碑之作。

2029 0 1

最新

文章

视频

问答

推荐

阿里云通义千问向全社会开放！

Llama 3开源！魔搭社区手把手带你推理，部署，微调和评估

com/action/joingroup?code=v1是什么意思

千亿大模型来了！通义千问110B模型开源，魔搭社区推理、微调最佳实践

vanna+qwen实现私有模型的SQL转换

Qwen1.5开源！魔搭最佳实践来啦！

幻方开源第二代MoE模型 DeepSeek-V2，魔搭社区推理、微调最佳实践教程

ModelScope中，模型下载默认路径在哪个路径？

ModelScope从魔塔社区创建的阿里服务 没有使用抵扣资源包 而是付费实例。怎么处理？

LLM 大模型学习必知必会系列(一)：大模型基础知识篇

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

如何训练属于自己的“通义千问”呢？

检索增强生成(RAG)实践：基于LlamaIndex和Qwen1.5搭建智能问答系统

通义千问72B、1.8B、Audio模型开源！魔搭社区最佳实践来啦！

ModelScope的Qwen1.5-14B-Chat需要多少大显存？

Llama3 中文通用Agent微调模型来啦！（附手把手微调实战教程）

LLama Factory+ModelScope实战——使用 Web UI 进行监督微调

【RAG实践】Rerank，让RAG更近一步

社区供稿 | 中文llama3模型哪家强？llama3汉化版微调模型大比拼

我希望通过damo-YOLO训练1500*1500的图片

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手（检索增强生成(RAG)大模型）

大模型时代，还缺一只雨燕 ｜ SWIFT：魔搭社区轻量级微调推理框架

streamlit 生成链接无法访问，gradio只生成内网，无法生成公网

服务器上onnxruntime-gpu 调用结束，如何释放显存

Phi-3：小模型，大未来！（附魔搭社区推理、微调实战教程）

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Modelscope魔塔的创空间的文件怎么下载到本地呀？

DeepSeek VL系列开源，魔搭社区模型微调最佳实践教程来啦！

KeyError: 'asr-inference is not in the pipelines r

社区供稿 |【中文Llama-3】Chinese-LLaMA-Alpaca-3开源大模型项目正式发布

请问modelscope中怎么对funasr进行本地部署？

从魔塔领取gpu免费资源 无法连接huggingface.co

如何提升大模型Agent的能力 ——LLM Agent框架 Modelscope-Agent 实战

ModelScope 使用14B模型推理时报这个错误？

请问ModelScope中，怎么修改本地运行，模型自动下载到 c 盘下？

multi-agent：多角色Agent协同合作，高效完成复杂任务

社区供稿 | Llama3-8B中文版！OpenBuddy发布新一代开源中文跨语言模型

【RAG实践】基于LlamaIndex和Qwen1.5搭建基于本地知识库的问答机器人

在魔搭使用ComfyUI，玩转AIGC

ModelScope中，请问Qwen-14B-Chat-Int4运行最少需要多少内存？

ModelScope一键部署模型：新手村实操FAQ篇

通义千问 RuntimeError: "addmm_impl_cpu_" not implement

阿里云灵积平台Java SDK调用教程

在modelscope下载模型，直接在网页下载，或者用git下载，都只下载一个几B的文件

LLM大模型实战 —— DB-GPT阿里云部署指南

魔搭社区牵手FastChat&vLLM，打造极致LLM模型部署体验

快来与 CodeQwen1.5 结对编程

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

通义千问14B开源！内附魔搭最佳实践

ModelScope模型即服务

活跃用户

相关产品

ModelScope从魔塔社区创建的阿里服务没有使用抵扣资源包而是付费实例。怎么处理？

大模型时代，还缺一只雨燕｜ SWIFT：魔搭社区轻量级微调推理框架

从魔塔领取gpu免费资源无法连接huggingface.co