在我的应用程序中,我有两个MySQL表,“单位”和“印象”是一对一的关系。我需要从单元表中获取所有广告单元的列表,但也获取每个广告单元的印象计数。
我有两个SELECT查询来完成这项任务(在本例中简化了),首先使用子select:
SELECT
(SELECT COUNT(*) FROM impressions WHERE impression_unit_id = unit_id) AS impressions_count,
unit_id
FROM units;
然后使用GROUP BY:
SELECT
COUNT(impression_id) AS impress
我想基于部分匹配来连接配置单元中的两个表。到目前为止,我尝试使用以下SQL查询:
select * from tableA a join tableB b on a.id like '%'+b.id+'%';
and instr but nothing working, is there a way?
尝试使用如下所示的子查询在配置单元中运行此查询:
select y,m,d,h from A
where d not in (select d from B)
我收到一个错误,即"only subquery expressions that are top level conjuncts are allowed"
有谁知道这意味着什么,以及如何绕过它?
提前感谢!
如何在配置单元中使用In子句我想在配置单元select x from y where y.z in (select distinct Z from y) order by x中编写类似这样的代码;但我找不到任何方法。我尝试了Hive 0.7中的In子句,它抛出了错误,我也尝试了Find_in_Set。使用find_in_set(y.z,子查询)..但作业正在失败。
我想在蜂巢上做这个。如果有人知道如何在蜂巢中做到这一点,请帮助我。
谢谢和问候,Atul
我一直在关注这篇关于如何使用Hive分析推特数据的文章:
我已经设置了flume来收集twitter数据并写入HDFS。我已经设置了一个指向相同HDFS位置的配置单元表。
当我在配置单元中运行类似这样的命令时:从推文中选择entities.user_mentions.screen_name;
我得到的响应如下: OK Time Time: 0.16秒。
无论我运行什么查询,我都得不到任何结果。
由于我不熟悉配置单元,我是希望在配置单元命令行中看到结果,还是必须从mySQL中挖掘结果。mySQL是metastore。
我想知道是否有可能根据另一列对stuff函数中的连接单元格进行重新排序。
到目前为止,我使用的是以下查询
SELECT
Id,
KPI = STUFF((SELECT DISTINCT ', ' + Name
FROM #TempTable1 b
WHERE b.Id = a.Id
FOR XML PATH('')), 1, 2, '')
但这会使输出按字母顺序排列。我想根据ID列来订购。
下面是我的查询结果
我
我有下面的查询,它有一个内部查询,它有一个依赖于外部查询的不等式条件。看起来HIVE不支持通过不等式条件从内部查询引用外部查询。如何在配置单元中编写此查询?
SELECT
*
FROM
A
WHERE NOT EXISTS
(
SELECT *
FROM
B
WHERE
B.cust_id = A.cust_id
AND datediff(A.year_month, B.year_month) < 365 * 3
)
我正在使用一个hdinsight集群(配置单元版本.13)来运行一些配置单元查询。其中一个在map join期间启动本地任务的查询(来自TPCH套件的查询7)由于内存不足而失败(hive会中止它,因为哈希表已达到配置的限制)。
Hive似乎将1 1GB分配给本地任务,这个大小是从哪里获得的,我如何增加它?
2015-05-03 05:38:19 Starting to launch local task to process map join; maximum memory = 932184064
我假设本地任务应该使用与映射器相同的堆大小,但事实似乎
我想在我的连接上附加一个应用程序名,就像PgAdmin在这里所做的那样:
📷
(文本形式查询:select pid,query,wait_event,state,* from pg_stat_activity;)
我的连接是以这种方式创建的(在VBA中):
Dim cnDB As New ADODB.Connection
cnDB.Open "PostgreSQLDsnHere"
其中,DSN是通过以下方式创建的:
32位:转到这里:%WINDIR%\SysWOW64\odbcad32.exe
64位:转到这里:%windir%\system32\odbcad32.exe
转到
我需要在配置单元查询的where子句中执行嵌套select。示例代码片段如下所示;
选择*
来自TableA
where时间> (select TA_timestamp from TableB where id="hourDim")
这是可能的,还是我在这里做错了什么,因为我在运行上面的脚本时遇到了错误?!
为了进一步详细说明我正在尝试做的事情,有一个cassandra键空间,我用时间戳发布统计数据。定期(例如每小时)此统计数据将使用配置单元进行汇总,一旦汇总,数据将与相应的小时分开存储。因此,当查询第二次运行(以及连续运行)时,查询应该只在新数据上运行(即- times
我在取消合并报表上的单元格时遇到问题。 3 Suppliers for the query 我有一个SQL查询,它显示了一个供应商的3个实例(左连接到联系人),如下所示。但是,在为查询运行报告时,供应商的3个实例被合并为一个实例。这在我的情况下是不可取的,因为在将报告导出到excel时,我希望能够基于其他属性对列进行排序,但是,由于行的合并,这是不可能的。如何获得单独显示的结果?Cells are Merged on the report ?