数据加速器 GooseFS 应用场景

开源生态数据湖
客户基于开源 Hadoop 生态构建大数据处理与分析，会面临计算资源与存储资源扩容速度不匹配、存储系统需对接多数据源的问题。
推荐产品
推荐数据加速器 GooseFS。
主要能力
计算存储分离
通过计算与存储分离，实现计算资源弹性伸缩，满足客户对计算资源的灵活调度。
多数据源支持
可对接多种数据源，允许存储任意规模的结构化、半结构化、非结构化数据。
高性能业务架构
通过数据加速器（Data Accelerator Goose FileSystem，GooseFS）、元数据加速器、AZ 加速器等多级加速服务，提升计算业务访问性能。
交互式查询数据湖
客户在对象存储（Cloud Object Storage，COS）中存储了多种数据源数据，包括实时计算数据，需要对其中的数据进行 OLAP 分析并进行数据可视化展示。
主要能力
多数据源支持
可对接多种数据源，允许存储任意规模的结构化、半结构化、非结构化数据。
性能加速
通过数据加速器、元数据加速器、AZ 加速器等多级加速服务，实现超越本地 HDFS 的性能。
机器学习数据湖
在经典机器学习场景中，训练数据量大，同时要求很大的内网带宽。
主要能力
超大带宽
可以提供超大的内网带宽，满足机器学习场景大带宽需求。
多数据源支持
可对接多种数据源，允许存储任意规模的结构化、半结构化、非结构化数据。
性能加速
通过数据加速器、元数据加速器、AZ 加速器等多级加速服务，实现超越本地 HDFS 的性能。
云原生数据湖
通过容器服务，结合 Flink、TensorFlow 等开源应用，搭建云原生数据 ETL 集群和分析集群，实现计算资源的弹性化；通过数据加速器、元数据加速器、AZ 加速器等多级加速服务，提升计算业务访问性能；通过对象存储服务作为数据湖存储底座，实现海量异构数据的低成本存储。
主要能力
计算存储分离
通过计算与存储分离，实现计算资源弹性伸缩，满足客户对计算资源的灵活调度。
高性能业务架构
通过数据加速器、元数据加速器、AZ 加速器等多级加速服务，提升计算业务访问性能。
丰富生态支持
可存储 Parquet、ORC 多种格式数据源，支持 Spark、Presto、Flink 等多种大数据插件。
应用场景

本页目录：

开源生态数据湖

推荐产品

主要能力

交互式查询数据湖

主要能力

机器学习数据湖

主要能力

云原生数据湖

主要能力