MPP云数仓

基于云计算、支持大规模并行处理的数据仓库,高可用、可弹性扩缩容的PB级数据仓库服务

  产品信息

  MPP云数仓简介

  MPP云数仓是为云而生的数据仓库服务,具有存储、计算、元数据分离的先进架构,可并行扩缩容,能有效解决数据孤岛和数据规模问题,助力客户快速构建金融企业级数据仓库。  

  产品特性

  简单易用

  通过使用云数仓,企业用户可以在几分中内启动一个包含几十个甚至上百个节点的数据仓库集群,数据加载后马上可以开始数据分析任务。同时由于是完全托管的云服务,数据仓库承担了所有的集群资源配置、数据备份、监控审计、错误恢复、高可用和升级等纷繁复杂、极易出错的运维工作,让用户专注于业务分析上面。

  多维度弹性

  基于云平台,计算和存储物理上分离、逻辑上集成的架构使得云数仓实现了多维度弹性:横向伸缩和纵向伸缩。企业用户可以根据业务和数据量的变化,动态调整数据仓库集群中计算节点的数量。

  超高性能

  云数仓的架构专门为数据仓库应用优化,从而能够提供超高性能。这些优化包括无共享大规模并行处理(MPP)、流水式执行引擎、列式存储和大表分区等技术。配合我们提供的多维度弹性,用户可以取得非常高的性价比。

  兼容开源

  作为云原生的数据仓库服务,云数仓在PostgreSQL和Greenplum Database的基础上对系统架构和运行实现上面进行了大量深度的优化。但在查询接口(包括使用习惯)以及底层数据文件存储格式和访问协议方面,我们保持与开源系统一致。

  应用场景

  企业级云数仓

  业务类型

  企业级云数仓

  上云建议

  通过云数仓用户可以快速的构建出来一个高可用,弹性伸缩的企业级数据仓库,并且支持3NF 、星型、雪花等数据模型。支持历史拉链表、缓慢变化维度处理。帮助企业构建安全稳定的数据仓库

  BI报表分析

  业务类型

  BI报表分析

  上云建议

  商业数据通过数据采集、数据集成同步到云数仓后,利用数据开发或者标准SQL客户端连接数仓服务,使用BI工具轻松分析海量数据,生成BI报表,并通过可视化进行集中展示,为金融、教育、政府、移动互联网等行业提供强大的商业决策支持。

  在线ETL开发

  业务类型

  在线ETL开发

  上云建议

  用户可通过数据开发组件,进行ETL作业编辑和任务开发,并在MPP云数仓中进行在线调试。MPP云数仓支持海量数据的关联及聚合运算,可针对ETL作业的负载进行计算集群的在线扩缩容,多种级别的数据压缩及行列存储模式,支持各类ETL聚合运算的需求。

  产品功能

  云原生数据仓库

  元数据、存储、计算分离的架构,支持弹性的扩缩容服务

  跨平台数据访问

  云数仓支持跨中心,跨平台的数据访问

  智能敏捷的服务

  支持快速的创建、扩缩容等

  • 云数仓以元数据、计算和存储三者分离的架构,多个集群共享统一数据存储的架构,支持独立元数据服务在线升级和弹性伸缩,支持一致性hash数据分布策略实现秒级扩容。

  多数据类型支持

  除了结构化数据类型,支持丰富的数据类型