在查询中
SELECT explode(context_ngrams(sentences(lower(val)), array("he", null), 10)) AS x
FROM kafka;
在这个例子中,array("he", null)
做了什么?
发布于 2016-07-13 13:25:53
从基本的Hive函数中,代码array("he", null)
只创建一个两个元素数组,其中第一个值是字符串"he“,第二个值为null。
如果您的意思是“它对context_ngrams函数做了什么”,那么蜂巢统计页面上的文档具有以下(稍微重新格式化的)描述:
从推特中选择context_ngrams(句子(下(Tweet)),数组(“i”,“爱”,空),100,1000 ); 上面的命令将返回推特推特假设数据库中“我爱”这一短语之后的前100个单词的列表。每个null指定要估计的n克组件的位置;因此,每个查询必须在上下文数组中至少包含一个null。
因此,在您的示例中,查询将返回单词"he“后面的前10个单词。
https://stackoverflow.com/questions/38341755
复制相似问题