我已经阅读了文档和博客,但没有在哪里解释查询是如何工作的。由于sql和sql-mr获取数据的方式是分布式的,那么它们是否会在内部生成map reduce作业?例如,customer表有10条记录,这些记录通过散列(客户id)分布,并假设它们是3个工作进程(除了asterdata中的节点),数据在它们之间拆分为3个记录,每个记录在两个节点上,4个记录在一个节点上在SQL中,简单的select * from customers;在这种情况下可以工作吗?它如何从3个节点获取记录?如果普通的sql查询可
我试过这个查询其中,'table1‘是hive中的表名,它的工作原理很好,并给出了结果。hadoop-yarn/staging/anonymous/.staging/job_1453359797695_0017/job.splitmetainfo
at org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl$InitTransition.createSplits(JobImpl.java:1