阿里云向量检索 Milvus 版开启公测,助力企业打造高质量 AI 服务

简介: 阿里云向量检索 Milvus 版正式开启公测,诚邀广大开发者及企业用户参与公测,赋能智能检索,解锁 AI 潜能。

在这个数据驱动的时代,如何快速、准确地从海量数据中检索到所需的信息,是所有企业面临的共同挑战。Milvus 作为一款云原生开源向量检索引擎,基于 Faiss、Annoy、HNSW 等知名库构建,并进行了优化,实现了高可用、高性能、易扩展的特性,适用于处理海量向量数据的实时召回。

阿里云向量检索 Milvus 版是阿里云提供的 Serverless Milvus 全托管服务,100% 兼容开源 Milvus,提供高性能、可扩展、大规模 AI 向量数据库相似性检索服务,具备开箱即用、弹性可扩展、全链路监控告警的能力,同时提供开源 Attu 的可视化工具。适用于各种 AI 应用场景,如:多模态搜索、RAG、广告推荐、内容风险识别等。

近日,阿里云向量检索 Milvus 版正式开启公测,诚邀广大开发者及企业用户参与公测,赋能智能检索,解锁 AI 潜能


立即开通


产品优势

  • 云原生极速向量检索服务

阿里云向量检索 Milvus 版集成了 Vector 检索库,凭借其高性能、高可用性的特点,支持混合查询,为用户提供高效且稳定的向量数据检索能力。


  • 企业级运维及易用性

云上全托管的向量数据库服务,不仅极大地缩减了集群维护成本,而且开箱即用,内置配置管理、安全管理等功能,并通过云原生架构实现高性能、可扩展性,支持按需节点化伸缩能力;同时,还提供了全面可视化的监控告警链路,以确保系统稳定运行及高效运维。


  • 兼容开源 Milvus 生态

阿里云向量检索 Milvus 版全面兼容开源 Milvus 系统,提供了 Attu 等丰富的开源管理工具,更拥有丰富且活跃的生态社区资源。


应用场景

多模态检索

结合 AI 推理、训练等工程平台和 Embedding 模型的能力,Milvus 可高效索引和检索不同类型的数据,如:图片、视频、声纹、办公文档和一些半结构化文档,支持快速精准地跨媒体类型进行信息检索,并提供强大的扩展性和灵活的接口。

智能问答&大模型

Milvus 结合大型语言模型实现智能问答系统,通过向量化处理用户查询,利用其高效检索功能快速匹配“私有知识库”中的信息,并结合大模型,生成准确回应。此方案提供即时、精确、交互式的生成式搜索服务。

公测说明

阿里云向量检索 Milvus 版已开启免费公测。您可以在E-MapReduce控制台,选择 EMR Serverless > Milvus,进入 Milvus 页面创建入门版的实例。公测期间您可以免费试用 Milvus 服务,免费试用结束后,您可以续费或及时释放实例,避免产生费用。

*注意 向量检索 Milvus 版实例创建时,需要依赖阿里云OSS产品进行数据存储,相关费用请参见计费概述

公测限制

  • 公测期间,您仅可以创建实例系列入门版的实例,且限创建3个。

当您的向量数据规模超过500万,或者当前入门版的规格无法满足您的业务需求时,您可以填写阿里云向量检索Milvus标准版测试申请表申请试用。相较于入门版本,Milvus 标准版提供了更大范围的实例规格选项和更加多样化的配置,您可以根据实际使用情况灵活选择最适合的实例规格。

  • 公测期间不保障服务等级协议 SLA,但服务不降级。
  • 公测期间支持以下地域和可用区。

地域名称

地域ID

可用区

华东1(杭州)

cn-hangzhou

可用区H

可用区J

华东2(上海)

cn-shanghai

可用区G

华北2(北京)

cn-beijing

可用区G


操作步骤

  1. 进入 EMR Serverless Milvus 页面。
  1. 登录E-MapReduce控制台
  2. 在左侧导航栏,选择EMR Serverless > Milvus
  3. 在顶部菜单栏处,根据实际情况选择地域。

  1. Milvus页面,单击创建实例



  1. 在Milvus向量搜索页面,完成相关配置。

配置项

示例

描述

付费类型

包年包月

仅支持包年包月类型。

付费时长

1个月

默认购买时长为1个月,支持的购买时长以实际界面为准。

地域和可用区

华东1(杭州)

可用区H

实例所在的物理位置和可用区。

*注意 实例创建后,无法更改地域和可用区,请谨慎选择。

VPC ID

vpc_Hangzhou/vpc-bp1f4epmkvncimpgs****

专有网络是您在阿里云自己定义的一个隔离网络环境,您可以完全掌控自己的专有网络。

选择已有的专有网络,或者如需创建新的专有网络,可以单击前往控制台创建,详情请参见创建和管理专有网络

vSwitch ID

vsw_i/vsw-bp1e2f5fhaplp0g6p****

交换机(vSwitch)是组成专有网络VPC的基础网络模块,用来连接不同的云资源。

选择已有的交换机,或者如需创建新的交换机,可以单击控制台创建,详情请参见创建和管理交换机

服务关联角色

AliyunServiceRoleForMilvus

已授予您的阿里云账号的AliyunServiceRoleForMilvus角色,以及与其关联的AliyunServiceRolePolicyForMilvus策略。

Milvus使用此角色来访问您在其他云产品中的资源。

引擎版本

2.3

Milvus的社区版本号。

OSS存储

serverless-milvus-oss

用于存储向量数据。

*注意 需为Bucket创建指定标签,key为Product,value为ServerlessMilvus,详情请参见管理存储空间标签

如果没有Bucket,在OSS存储下拉列表中选择去创建,跳转至对象存储OSS控制台上创建,具体操作请参见控制台创建存储空间

规格

入门版

Milvus实例的规格。

  • 入门版:适用于测试环境,且资源规格固定。

选择该规格时,还需配置Standalone规格参数,该参数是入门版节点配置,可以使用默认的1 vCPU 4 GiB。

  • 标准版:适用于生产环境,资源规格可以按需定制。

root用户密码

请您自定义

设置Milvus实例用于登录数据库的root账号密码。

重要

请牢记您设定的密码,目前不支持修改密码。

  1. 单击立即购买

当实例状态为运行中时,表示实例创建成功。

联系我们

如果您在使用向量检索 Milvus 版的过程中遇到任何疑问,可加入钉钉群59530004993咨询。

快速跳转

  1. 向量检索 Milvus 版官网:https://www.aliyun.com/product/bigdata/emapreduce/milvus
  2. 产品控制台:https://emr-next.console.aliyun.com/
  3. 产品文档:https://help.aliyun.com/zh/emr/serverless-milvus/
  4. 标准版申请:https://survey.aliyun.com/apps/zhiliao/JqRjGNFoS
相关实践学习
数据湖构建DLF快速入门
本教程通过使?数据湖构建DLF产品对于淘宝用户行为样例数据的分析,介绍数据湖构建DLF产品的数据发现和数据探索功能。
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
相关文章
|
1天前
|
弹性计算 自然语言处理 开发工具
基于阿里云向量检索 Milvus 版和 LangChain 快速构建 LLM 问答系统
本文介绍如何通过整合阿里云Milvus、阿里云DashScope Embedding模型与阿里云PAI(EAS)模型服务,构建一个由LLM(大型语言模型)驱动的问题解答应用,并着重演示了如何搭建基于这些技术的RAG对话系统。
|
1天前
|
运维 JavaScript Java
Serverless 应用引擎产品使用之在阿里云函数计算中想为两个不同的服务分别开通自定义域名如何解决
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
26 1
|
1天前
|
人工智能 弹性计算 算法
一文解读:阿里云AI基础设施的演进与挑战
一文解读:阿里云AI基础设施的演进与挑战
|
1天前
|
人工智能 自然语言处理 JavaScript
阿里云发布 AI 编程助手 “通义灵码”——VSCode更强了 !!
阿里云发布 AI 编程助手 “通义灵码”——VSCode更强了 !!
21 3
|
1天前
|
Cloud Native 关系型数据库 OLAP
高效易用的数据同步:阿里云瑶池 Zero-ETL服务来啦!
在大数据时代,企业有着大量分散在不同系统和平台上的业务数据。OLTP数据库不擅长复杂数据查询,不具备全局分析视角等能力,而OLAP数据仓库擅长多表join,可实现多源汇集,因此需要将TP数据库的数据同步到AP数据仓库进行分析处理。传统的ETL流程面临资源成本高、系统复杂度增加、数据实时性降低等挑战。为了解决这些问题,阿里云瑶池数据库提供了Zero-ETL服务,可以快速构建业务系统(OLTP)和数据仓库(OLAP)之间的数据同步链路,将业务系统的数据自动进行提取并加载到数据仓库,从而一站式完成数据同步和管理,实现事务处理和数据分析一体化,帮助客户专注于数据分析业务。
82 0
|
1天前
|
消息中间件 人工智能 监控
|
1天前
|
存储 机器学习/深度学习 人工智能
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
|
1天前
|
JSON 文字识别 算法
C# 通过阿里云 API 实现企业营业执照OCR识别
C# 通过阿里云 API 实现企业营业执照OCR识别
|
1天前
|
JSON API C#
C# 通过阿里云 API 实现企业工商数据查询
C# 通过阿里云 API 实现企业工商数据查询
|
1天前
|
人工智能 运维 Serverless
【云故事探索】NO1:看森马服饰,在阿里云上如何用AI实现创新?
在数字化转型中,云计算成为企业创新的关键驱动力。森马服饰借助阿里云函数计算,应对新零售挑战,实现业务模式重塑和效率提升。面对AI技术落地的困难,如高成本、长决策周期和复杂运维,森马通过阿里云的Serverless解决方案,快速将AI融入核心业务,优化了从设计到营销的全链条流程。通过函数计算,森马降低了AI项目初期的硬件投入和运维难题,提升了设计师的工作效率,将设计时间从3天缩短到30秒,实现了服装设计和营销的智能化升级。
http://www.vxiaotou.com