PolarDB +AnalyticDB Zero-ETL ：免费同步数据到ADB，享受数据流通新体验

2024-03-24 101551

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

云原生数据库 PolarDB MySQL 版，Serverless 5000PCU 100GB

云原生数据库 PolarDB 分布式版，标准版 2核8GB

简介： Zero-ETL是阿里云瑶池数据库提供的服务，旨在简化传统ETL流程的复杂性和成本，提高数据实时性。降低数据同步成本，允许用户快速在AnalyticDB中对PolarDB数据进行分析，降低了30%的数据接入成本，提升了60%的建仓效率。Zero-ETL特性包括免费的PolarDB MySQL联邦分析和PolarDB-X元数据自动同步，提供一体化的事务处理和数据分析，并能整合多个数据源。用户只需简单配置即可实现数据同步和实时分析。

什么是Zero-ETL

ETL 是将上层业务系统的数据经过提取(Extract)、转换清洗(Transform)、加载(Load)到数据仓库的处理过程，目的是将上游分散的数据整合到目标端数仓，通过在数仓中做进一步的计算分析，来为业务做有效的商业决策。

开发传统的ETL流程，具备以下挑战：

资源成本增加：不同的数据源可能需要不同的ETL工具，搭建ETL链路会产生额外的资源成本
系统复杂度增加：用户需要自行维护ETL工具，增加了运维难度，无法专注于业务应用的开发
数据实时性降低：部分ETL流程涉及周期性的批量更新，在近实时的应用场景中，无法做到快速产出分析结果。

Zero-ETL是旨在为用户减少不同数据源间人工迁移或同步的工作量，降低ETL的成本和复杂度，让用户不需要开发和关注ETL流程，专注于上层的应用开发和数据分析。

阿里云瑶池数据库提供的Zero-ETL服务

Zero-ETL优势

阿里云瑶池数据库Zero-ETL旨在实现事务处理和数据分析一体化，实现建仓成本的降低，建仓效率的提升。

目前使用Zero-ETL方案，数据接入成本可下降30%，构建数据仓库的效率可提升60%。

总结来看，Zero-ETL的优势如下：

零成本：提供低成本的数据接入链路，用户可免费或极低成本实现在AnalyticDB中对上游PolarDB数据进行分析

易用性好：无需创建和维护执行ETL（提取、转换、加载操作）的复杂数据管道，仅需选择源端数据和目标端实例，自动创建实时数据同步链路，减少构建和管理数据管道所带来的挑战，专注上层应用开发

多源汇集：Zero-ETL的目标端可以提供全局视角，将多个数据源实例汇集到目标端进行复杂分析、关联查询等

阿里云云原生数据仓库AnalyticDB MySQL基于湖仓一体架构打造，高度兼容MySQL，毫秒级更新，亚秒级查询，可以同时提供高吞吐离线处理和高性能在线分析。

针对在AnalyticDB MySQL中分析PolarDB的数据，我们提供以下两种Zero-ETL功能。

联邦分析：通过该功能可以免费将PolarDB MySQL的数据实时同步到AnalyticDB MySQL中，只需要简单配置源端和目标端，便可完成同步任务的构建，用户无需额外再维护其他的数据同步链路；数据进入AnalyticDB MySQL后可以直接用ADB Spark或XIHE计算引擎进行查询和分析