首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Apache Drill基本介绍

Apache Drill主要特征 低延迟 SQL 查询 对文件(例如 JSON、Parquet、文本)和 HBase 自描述数据进行动态查询,而无需在 Hive 元存储中定义元数据。...就地查询复杂半结构化数据 使用 Drill 无模式 JSON 模型,您可以就地查询复杂、半结构化数据。 无需在查询执行之前或期间展平或转换数据。...您可以使用现有的工具,例如 Tableau、MicroStrategy、QlikView 和 Excel。 Hive 交互式查询 Apache Drill 让您可以利用您在 Hive 上投资。...您可以使用 Drill 在 Hive 上运行交互式查询并访问所有 Hive 输入/输出格式(包括自定义 SerDes)。...您可以连接与不同 Hive 元存储关联,也可以连接 Hive HBase 或日志文件目录。

1.8K30

Apache Drill 专为Hadoop、NoSQL和云存储设计Schema-free类型SQL引擎

在此基础上,Drill不仅支持行业标准 ANSI SQL,做到开箱即用和快速上手,还支持大数据生态集成,如 Apache Hive 和 Apache Hbase 等存储系统,即插即用部署方式。...Apache Drill 关键特性 低延迟SQL查询。 直接对自描述数据进行动态查询而无需提前定义Schema,如 JSON、Parquet、TEXT 和 Hbase等。...Drill虚拟数据集可以将复杂NoSQL数据结构对应到兼容BI结构,帮助用户挖掘和可视化数据。 交互式查询Hive Drill可以充分利用Hive中存在资源。...您可以使用Drill在Hive上运行交互式查询和分析,并且能够访问Hive所有输入和输出格式(包含自定义 SerDes)。...不仅可以连接不同Hive元存储所包含,还可以将异构数据源进行连接(联邦查询特性),比如将Hive关联(Join)Hbase或文件系统中日志目录等。

1.6K30
您找到你想要的搜索结果了吗?
是的
没有找到

HBase 命名空间 Namespace

简介 命名空间是逻辑分组,类似于关系数据库系统中数据库。这种抽象为多租户相关功能奠定了基础: 配额管理(HBASE-8410):限制一个命名空间可以使用资源(Region或者Table等)。...删除命名空间属性: alter_namespace 'ns1', {METHOD => 'unset', NAME=>'PROPERTY_NAME'} 2.5 在命名间中创建 创建命名空间后,我们可以在该命名空间上创建...0.9023 seconds => Hbase::Table - ns1:test 2.6 查看给定命名空间所有可用 可以使用 list_namespace_tables 命令列出给定命名空间下所有可用...2.7 删除命名空间 可以使用 drop_namespace 命令删除中存在命名空间。...我们只能删除命名空间。如果删除包含命名空间,必须先把该命名空间下创建删除。

5.4K21

hbase查看表结构_HBase语法「建议收藏」

③namespace :命名空间,理解为Java中hbase看成是Java中类 换句话说,namespace就是保存一个逻辑上路径 2....查看命名空间结构 drop_namespace 删除命名空间 list_namespace 查看HBase中所有的命名空间 list_namespace_tables 查看指定命名间中所有.../所有失效 enable/enable_all 使生效 drop/drop_all 删除 exists 判断是否存在 is_disabled/is_enabled 是否失效/生效 list 查询...,也可以修改添加删除属性# 1.修改指定指定列簇属性hbase(main):005:0> alter 'ns1:t1',NAME =>'f1',VERSIONS =>10Updating all...scan命令:多行查询数据 # 查询指定命名间中指定所有数据hbase(main):025:0> scan 'ns1:t1'ROW COLUMN+CELL

6.2K30

2015 Bossie评选:最佳10款开源大数据工具

从MongoDB,HBase,Cassandra和ApacheSpark,SlamData同大多数业界标准外部数据源可以方便进行整合,并进行数据转换和分析数据。...Drill专为嵌套数据低延迟分析设计,它有一个明确设计目标,灵活扩展到10000台服务器来处理查询记录数据,并支持兆级别的数据记录。...Drill使用ANSI 2003 SQL查询语言为基础,所以数据工程师是没有学习压力,它允许你连接查询数据并跨多个数据源(例如,连接HBase和在HDFS中日志)。...最后,Drill提供了基于ODBC和JDBC接口以和你所喜欢BI工具对接。 10. HBASE ? HBase在今年里程碑达到1.X版本并持续改善。...在他特性更新方面包括扫描器更新,保证提高性能,使用HBase作为流媒体应用像Storm和Spark持久存储能力。HBase可以通过Phoenix项目来支持SQL查询,其SQL兼容性在稳步提高。

1.3K100

运营数据库系列之应用支持

可以使用Java客户端API对Apache HBase执行操作。您可以开发可用于创建,插入数据Java应用程序。本机Java客户端API提供了编程访问。...Apache Phoenix对Apache HBase进行了超级优化,而不是针对各种体系结构(认为Drill)进行了优化,并且支持SQL ANSI-92标准。...您可以通过其标准JDBC API以典型DDL / DML语句形式创建Apache HBase并与之交互。...您必须在创建时定义列系列,但是以后可以动态添加列。Apache HBase此功能允许您在列族中添加新列,并更改应用程序以开始使用该新列。...您可以使用REST服务器创建,删除,以及执行其他具有REST端点操作,这些端点在此处中有所描述:http : //hbase.apache.org/book.html#_using_rest_endpoints

1.7K00

基于大数据分析系统Hadoop13个开源工具

与Hive相同元数据、SQL语法、ODBC驱动程序和用户接口(Hue Beeswax),可以直接在HDFS或HBase上提供快速、交互式SQL查询。...Engine三部分组成),可以直接从HDFS或者HBase中用SELECT、JOIN和统计函数查询数据,从而大大降低了延迟。...直接使用HBase API、协同处理器与自定义过滤器,对于简单查询来说,其性能量级是毫秒,对于百万级别的行数来说,其性能量级是秒。Phoenix完全托管在GitHub之上。...Apache Drill 代码托管地址: GitHub 本质上,Apache Drill是Google Dremel开源实现,本质是一个分布式mpp查询层,支持SQL及一些用于NoSQL和...Drill目的在于支持更广泛数据源、数据格式及查询语言,可以通过对PB字节数据快速扫描(大约几秒内)完成相关分析,将是一个专为互动分析大型数据集分布式系统。 10.

1.7K60

后Hadoop时代大数据架构

Hive:用于Hadoop一个数据仓库系统,它提供了类似于SQL查询语言,通过使用该语言,可以方便地进行数据汇总,特定查询以及分析。...领导着Apache Drill项目,是GoogleDremel开源实现,目的是执行类似SQL查询以提供实时处理。 原理篇 数据存储 我们目标是做一个可靠,支持大规模扩展和容易维护系统。...使用了一种类似于SQL数据库查询优化方法,这也是它与当前版本Apache Spark主要区别。它可以将全局优化方案应用于某个查询之上以获得更佳性能。...Impala Cloudera公司主导开发新型查询系统,它提供SQL语义,能够查询存储在HadoopHDFS和HBasePB级大数据,号称比Hive快5-10倍,但最近被Spark风头给罩住了...Drill Apache社区类似于Dremel开源版本—Drill。一个专为互动分析大型数据集分布式系统。 Druid 在大数据集之上做实时统计分析而设计开源数据存储。

1.7K80

2015 Bossie评选:最佳开源大数据工具

Drill专为嵌套数据低延迟分析设计,它有一个明确设计目标,灵活扩展到10000台服务器来处理查询记录数据,并支持兆级别的数据记录。...Drill使用ANSI 2003 SQL查询语言为基础,所以数据工程师是没有学习压力,它允许你连接查询数据并跨多个数据源(例如,连接HBase和在HDFS中日志)。...最后,Drill提供了基于ODBC和JDBC接口以和你所喜欢BI工具对接。 10. HBASE HBase在今年里程碑达到1.X版本并持续改善。...在他特性更新方面包括扫描器更新,保证提高性能,使用HBase作为流媒体应用像Storm和Spark持久存储能力。HBase可以通过Phoenix项目来支持SQL查询,其SQL兼容性在稳步提高。...Kylin使用Hive和MR来构建立方体,Hive用作预链接,MR用作预聚合,HDFS用来储存构建立方体时中间文件,HBase用来存储立方体,HBasecoprocessor(协处理器)用来响应查询

1.5K90

Hadoop上时实类SQL查询系统对比

以前只用过Hive与impala两个类SQL查询系统,最近又将Hortonworks开源Stinger与ApacheDrill做了些调研。累死累活搞了一天资料,头都大了。...这样也造就了impala开发比较快速,虽然到现在才一年左右时间,但是impala已经可以很稳定运行。 impala主要是为hdfs与hbase数据提供实时SQL查询。...不过因为impala使用是C开发,所以impala还是鼓励大家写一个c下面的udf来提高性能。 drill 开源时间跟impala差不多,只不过属于Apache,。...它数据接口都是插件化,理论上支持各种查询语言,SQL自然也不例外,不过目前这个系统还是Apache一个孵化项目,很多功能尚未完成与稳定。但是可以预见,这个系统如果完成是很有影响力。...SQL查询系统,也是声称可以提升较hive 100倍速度(悲崔hive,都拿它来当反面教材)。

57520

后Hadoop时代大数据架构

Hive:用于Hadoop一个数据仓库系统,它提供了类似于SQL查询语言,通过使用该语言,可以方便地进行数据汇总,特定查询以及分析。...领导着Apache Drill项目,是GoogleDremel开源实现,目的是执行类似SQL查询以提供实时处理。 原理篇 数据存储 我们目标是做一个可靠,支持大规模扩展和容易维护系统。...使用了一种类似于SQL数据库查询优化方法,这也是它与当前版本Apache Spark主要区别。它可以将全局优化方案应用于某个查询之上以获得更佳性能。 Kafka ?...Impala Cloudera公司主导开发新型查询系统,它提供SQL语义,能够查询存储在HadoopHDFS和HBasePB级大数据,号称比Hive快5-10倍,但最近被Spark风头给罩住了...Drill Apache社区类似于Dremel开源版本—Drill。一个专为互动分析大型数据集分布式系统。 Druid 在大数据集之上做实时统计分析而设计开源数据存储。

87050

【聚焦】后Hadoop时代大数据架构

Hive:用于Hadoop一个数据仓库系统,它提供了类似于SQL查询语言,通过使用该语言,可以方便地进行数据汇总,特定查询以及分析存放在Hadoop兼容文件系统中大数据。...领导着Apache Drill项目,是GoogleDremel开源实现,目的是在Hadoop数据上执行类似SQL查询以提供实时处理。...Impala Cloudera公司主导开发新型查询系统,它提供SQL语义,能够查询存储在HadoopHDFS和HBasePB级大数据,号称比Hive快5-10倍,但最近被Spark风头给罩住了...Drill Apache社区类似于Dremel开源版本—Drill。一个专为互动分析大型数据集分布式系统。 Druid 在大数据集之上做实时统计分析而设计开源数据存储。...,它还支持不同硬件平台,如果想速度更快,可以使用SSD。

89840

都是 HBase SQL 引擎,Kylin 和 Phoenix 有什么不同?

与此同时,出现了越来越多大数据技术帮助企业进行大数据分析,例如 Apache Hadoop,Hive,Spark,Presto,Drill,以及今天我们即将介绍 Apache Kylin 和 Apache...了解 Apache Kylin 和 Apache Phoenix 同学都知道,它们都是使用 Apache HBase 做数据存储和查询,那么,同为 HBase SQL 引擎,它们之间有什么不同呢...Phoenix 直接使用 HBase API,以及协处理器和自定义过滤器,从而使得查询效率更好。对于查询,Phoenix 可以根据 region 边界进行分块并在客户端并行运行以减少延迟。...为了使得查询效率更高,Phoenix 可以上加索引,不同索引有不同适用场景:全局索引适用于大量读取场景,且要求查询中引用所有列都包含在索引中;本地索引适用于大量写入,空间有限场景。...图5 单对比图 图 5 是一个单查询场景分析,从上我们可以看出, 针对于一张查询,Phoenix 查询耗时是 Kylin 几十甚至是几百倍,加入索引后,Phoenix 查询速度有了较为显著提升

1.7K30

HBase 简介

笔记整理自 1 HBase 定义 Apache HBase 是以 hdfs 为数据存储,一种分布式、可扩展 NoSQL 数据库。...最终 HBase 关于数据模型和 BigTable 对应关系如下: HBase 使用与 Bigtable 非常相似的数据模型。用户将数据行存储在带标签中。...HBase 物理存储结构 2.3 数据模型 1)Name Space 命名空间,类似于关系型数据库 database 概念,每个命名空间下有多个。...HBase 两 个自带命名空间,分别是 hbase 和 default,hbase 中存放HBase 内置,default是用户默认使用命名空间。...2)Table 类似于关系型数据库概念。不同是,HBase 定义时只需要声明列族即可,不需 要声明具体列。因为数据存储时稀疏,所有往 HBase 写入数据时,字段可以 动态、按需指定。

53720

大数据之Phonenix与Hbase集成

Phoenix完全使用Java编写,作为HBase内嵌JDBC驱动。Phoenix查询引擎会将SQL查询转换为一个或多个HBase扫描,并编排执行以生成标准JDBC结果集。...address" varchar); 删除视图 drop view "test"; 4)映射 使用Apache Phoenix创建对HBase映射,有两种方法: HBase中不存在时,可以直接使用...当HBase中已经存在时,可以以类似创建视图方式创建关联,只需要将create table改为create view即可。...1.创建单个字段全局索引 CREATE INDEX my_index ON my_table (my_col); 如果想查询字段不是索引字段的话索引不会被使用,也就是说不会带来查询速度提升。...CATALOG"; 查看表 TABLE_SCHEM 发现有些这个属性为。 那么如果你没有指定自动映射命名空间,就会报错。

1.5K40

2015.5 技术雷达 | 平台篇

开源数据库引擎 Cloudera Impala,Apache Drill 和 Facebook Presto 都在2014年应运而生。...你可以使用 Kylin 所提供立方体设计器来定义立方体,并启动一个离线进程来构建它们。离线进程会进行一个预连接步骤,将事实和维度连接到一个扁平化结构中。...查询引擎(基于 Apache Calcite)会决定目标数据集是否HBase 中存在。如果存在,该引擎会直接访问 HBase目标数据,以次秒级延迟返回结果。...如果目标数据集不存在,该引擎会将这些查询转向 Hive(或者是集群中任何其它可以用 SQL 查询 Hadoop 方案)。...另外还值得一提是,其中一些数据库产品还使用了类似 Cassandra 和 HBase 分布式数据库作为他们底层存储引擎。

1.2K50

大数据学习系列之五 ----- Hive整合HBase图文详解

Hive整合HBase使用场景: (一)通过Hive把数据加载到HBase中,数据源可以是文件也可以是Hive中。 (二)通过整合,让HBase支持JOIN、GROUP等SQL查询语法。...(三)通过整合,不仅可完成HBase数据实时查询,也可以使用Hive查询HBase数据完成复杂数据分析。...然后查看hive和hbase是否删除了 输入: drop table t_student; 通过这些可以看到hive和hbase之间数据成功同步!...输入: select * from t_student t join t_student ti where t.id=ti.id ; 说明:通过关联查询可以得出之间是可以关联查询。...在查询一张时候,hive没有使用引擎,因此相对比较快,如果是进行了关联查询之类,就会使用引擎,由于hive默认引擎是mr,所以会很慢,也和配置有一定关系,hive2.x以后官方就不建议使用mr了

1.2K00

Hbase 入门详解

稀疏性是 HBase一个突出特点,在其他数据库中,对于处理一般都会填充 null,对于成百上千万列来说,通常会存在大量值,如果使用填充 null 策略,势必会造成大量空间浪费。...而对于 HBase 值不需要任何填充,因此稀疏性是 HBase 可以无限扩展一个重要条件。...行式存储在获取一行数据时是很高效,但是如果某个查询只需要读取中指定列对应数据,那么行式存储会先取出一行行数据,再在每一行数据中截取待查找目标列。...和其他 RDBMS 不同,HBase通常都是分布式存储,ZooKeeper 可以通过特定机制实现分布式锁。...随着时间推移,同一个 Store 下 HFile 会越来越多,文件太多会影响 HBase 查询性能,主要体现在查询数据 IO 次数增加。

98820
领券