我们在Hadoop文件系统中创建了一个新的数据湖。数据以ORC的形式存储。目前分析系统直接连接到数据湖来读取这些ORC文件。
有没有办法在数据湖和分析系统之间创建一个中间层来服务数据?
发布于 2018-10-05 02:13:17
哪些是您的分析软件?是否可以使用API或RESTful web服务来访问数据湖?请再说清楚一点。
发布于 2018-10-05 02:23:18
这个问题非常普遍,但构建数据湖的一种常见且简单的方法是使用Presto (https://prestodb.io)。
Presto可以读取几种格式,但也可以连接到不同的数据源,如mysql数据库和其他,以表格的形式呈现数据。
客户端可以使用SQL,也可以通过jdbc/odbc访问数据湖,甚至可以从excel等工具或其他分析工具(微策略、tableau等)访问数据湖。
https://stackoverflow.com/questions/52637833
复制相似问题