按分区过滤system.parts (ClickHouse)异常_如何按数组列内容过滤clickhouse表？_Clickhouse如何按控制字符过滤字符串 - 腾讯云开发者社区

olap、opentsdb、clickhouse

关于clickhouse中的自定义分区，我有几个问题。背景:我正试图在点击屋的顶部建立一个TSDB。我们需要支持非常大的批量写入和复杂的OLAP读取。假设我们按月使用标准分区，并且在clickhouse集群中有20个节点。我想知道来自同一个月的数据都会流向同一个节点，还是clickhouse会做一些内部平衡，并将数据从同一个月转移到多个节点？如果同一个月的所有数据都写入同一个节点，那么这将对我们的场景非常不利。我可能会考虑使用标记定义数据源的不同标记(时间戳，标记)。我们的监控系统将每30秒向TSDB写入数据。我们的读取模式通常是单表范围扫描或一个列上的几个表连接。对于如何自定义分

浏览 1提问于2019-03-07得票数 1

1回答

有没有办法做点击房屋索引和分区分析？

clickhouse

在我有限的使用clickhouse的经验中，我需要分析表的索引和分区，有没有办法获得clickhouse的查询，使用什么索引和什么分区？提前谢谢。

浏览 14提问于2021-03-30得票数 0

回答已采纳

2回答

Clickhouse:在select上拆分输出

apache-kafka、clickhouse

在通过物化视图从MergeTree表加载的KafkaEngine表上，在Clickhouse上执行select，一个简单的select显示clickhouse-client中按组分割的输出： :) select * from customersVisitors; SELECT * FROM customersVisitors ┌────────day─┬─────────createdAt───┬──────────────────_id─┬───────────mSId─┬───────xId──┬─yId─┐ │ 2018-08-17 │ 2018-08-17 11:42:04 │

浏览 1提问于2018-08-17得票数 2

回答已采纳

2回答

Clickhouse:有没有办法在一个` `alter drop partition *`查询中删除多分区？

clickhouse

在clickhouse中，表是按天分区的。现在，为了方便起见，我想在一个alter查询中删除多分区。我已经通过shell使用while循环做到了这一点： while [[ $startDate < $endDate ]] do clickhouse-client --query="alter table db.table drop partition toYYYYMMDD(toDate($startDate))" startDate=`date -d "+1 day $startDate" +%Y-%m-%d` done 我只是想找到一

浏览 435提问于2019-03-25得票数 5

回答已采纳

1回答

ClickHouse - CollapsingMergeTree表引擎-记录即使具有相同的列值和不同的符号(+1/-1)也不会合并

clickhouse

我们有一个带有ClickHouse引擎的CollapsingMergeTree表。我们希望在从源导入数据时更新记录(可能是频繁的)。最初，所有记录都用+1符号列插入。我们要更新记录的是，我们用-1符号插入要更新的记录，然后用+1符号插入更新的记录，期望当数据部分在后台合并时，具有相反符号的相同记录将被ClickHouse折叠。问题是‘它永远不会发生’ 我知道，ClickHouse将异步合并数据，但经过几个月的时间，ClickHouse没有执行任何合并。我询问SELECT * FROM system.merges是否正在进行任何合并。查询结果为0。还将ClickHouse更新为其最新版本。但

浏览 8提问于2020-02-27得票数 1

2回答

物化索引抛出DB::Exception:缺失列

clickhouse

我遇到了一个materialize index的21.3版本的问题。我创建了一个3库仑的表-- u64、i32和s。 CREATE TABLE test_idx (`u64` UInt64, `i32` Int32, `s` String) ENGINE = MergeTree() ORDER BY u64; 然后我在其中插入300万个数据并运行OPTIMIZE TABLE test_idx FINAL(制作Wide的一部分)。 select name, part_type from system.parts where table='test_idx' and active

浏览 18提问于2022-07-18得票数 0

2回答

Clickhouse从csv DB：：NetException导入数据:当写入套接字时，连接被对等设备重置

clickhouse

我正在尝试通过以下方式将查询文件加载到点击屋: clickhouse-client --max_memory_usage=15323460608 -- FORMAT _csv_delimiter="|“-- *.gz =”INSERT INTO tmp1.my_test)表格式CSV“ 在写入套接字(127.0.0.1:9000)时，我收到错误:代码: 210。DB::NetException:连接被对等项重置。在clickhouse-server.log、clickhouse-server.err.log或zookeeper.log中没有错误当我运行insert命令时，我发现内存

浏览 0提问于2019-05-16得票数 3

1回答

clickhouse表ttl在21.8.4.51版本中不工作

clickhouse、ttl

我使用火花流来使用kafka的记录并将它们写到带有ttl的clickhouse表中，clickhouse版本为21.8.4.51，我的表ddl如下所示： CREATE TABLE dataplugin.ods_stb_boot_up_delay_all_local ON CLUSTER '{cluster}'( `evtTime` Int64, `evtCode` String, `pVer` String, `stbID` String, `bootUpDelay` Int64, `provinceCode` String, `writeTime` DateTime, IND

浏览 25提问于2022-11-30得票数 0

1回答

无法使用ClickHouse驱动程序连接DBeaver

jdbc、dbeaver、clickhouse

我想使用连接clickhouse和jdbc驱动程序。我的驱动程序设置如下：司机名称: clickhouse 类名: ru.yandex.clickhouse.ClickHouseDriver URL模板: jdbc:clickhouse://{host}:{port} 当我测试连接时，它会抛出这样的异常： ru.yandex.clickhouse.except.ClickHouseUnknownException: ClickHouse异常，代码: 1002，主机: xxx，端口: 8123；错误而读取响应魔术不正确: 112 我哪里错了？

浏览 13提问于2017-10-13得票数 0

回答已采纳

1回答

Clickhouse -“单个插入块的分区太多”

insert、clickhouse

在将复制的MySQL数据库重新加载到Clickhouse的过程中，使用"clickhouse-mysql“，我遇到了”单个插入块的分区太多“，我似乎无法前进。到目前为止，我尝试过的一些事情：将"max_partitions_per_insert_block“设置为零，以查看它是否能够通过.，使用 Clickhouse表的创建方式与自动创建(--create)非常相似，但它确实遗漏了几个NULLABLE类型： CREATE TABLE DB.DB__main ( `id` Int64, `user_id` Int64, `screenname` String, `cre

浏览 0提问于2020-04-08得票数 3

回答已采纳

1回答

Clickhouse合并会导致选定标记的增加吗？

clickhouse

如果clickhouse正在执行背景合并操作(假设10部分合并为1部分)，这会导致选定的标记上升吗？或仅受由于SELECT查询而执行的读操作所控制的选定标记。

浏览 6提问于2022-04-08得票数 0

回答已采纳

1回答

如何在使用ClickhouseIO时确保每秒插入1次

google-cloud-dataflow、apache-beam、clickhouse、apache-beam-io

我正在使用Apache Beam Java SDK来处理事件并将它们写入Clickhouse数据库。幸运的是，现在已经可以使用了。 ClickhouseIO累积元素并批量插入它们，但是由于管道的并行特性，在我的例子中，它仍然导致每秒大量的插入。我经常在Clickhouse中收到"DB::Exception: Too much“或"DB::Exception: Too much queries”。 Clickhouse文档每秒执行1次插入。有没有一种方法可以用ClickhouseIO确保这一点？也许在ClickhouseIO.Write之前做一些KV分组或者别的什么？

浏览 3提问于2020-03-10得票数 0

2回答

ClickHouse -每个查询插入一百多个条目

clickhouse

我不知道如何增加每个查询的最大条目数。我想在每个查询中插入一千个条目，默认值是100。根据the doc的说法，参数max_partitions_per_insert_block定义了同时输入的限制。我尝试从ClickHouse客户端修改它，但是我的插入仍然失败： $ clickhouse-client my-virtual-machine :) set max_partitions_per_insert_block=1000 *SET* max_partitions_per_insert_block = 1000 Ok. 0 rows in set. Elapsed: 0.001

浏览 213提问于2019-05-17得票数 1

回答已采纳

2回答

插入从一个表到另一个结构相同的表的所有行。

insert、clickhouse

我试图将表的所有内容移动到另一个具有相同结构的表中。有很多行，所以当我尝试像这样执行它时 insert into target_table select * from source_table; 我会犯这样的错误： ClickHouse exception, code: 159; Read timed out 我假设它尝试将整个SELECT数据加载到RAM中，然后将其插入表中，在这种情况下是不可能的。是否有一些专门的方法来这样做？我也不想按小部分选择和插入循环数据。编辑:我正在搜索一个SQL解决方案。

浏览 4提问于2019-03-13得票数 6

1回答

logstash-输出-clickhouse在安装插件时抛出错误

java、logstash、elastic-stack、elk

Validating logstash-output-clickhouse-0.1.0.gem Installing logstash-output-clickhouse Plugin version conflict, aborting ERROR: Installation Aborted, message: Bundler could not find compatible versions for gem "logstash-mixin-http_client": In snapshot (Gemfile.lock): logstash-mixin-http

浏览 14提问于2021-06-01得票数 0

回答已采纳

1回答

在mac os上运行clickhouse坞映像时出错

macos、docker、installation、yandex、clickhouse

当我从码头图像安装yandex点击室时，我有异常情况。 docker run -it --rm --link some-clickhouse-server:clickhouse-server yandex/clickhouse-client --host clickhouse-server docker logs 54aa87e92a2c Include not found: clickhouse_remote_servers Include not found: clickhouse_compression POCO ERROR: Exception: Could not dete

浏览 1提问于2017-05-16得票数 1

回答已采纳

2回答

来自服务器本地主机的意外数据包:9000，::1

clickhouse

我已经按照这里的说明安装了。我还启用了:：in /etc/clickhouse-server/config.xml。一开始很好，具体如下： sudo /etc/init.d/clickhouse-server重新启动clickhouse-server服务: /etc/clickhouse-server/config.xml: /var/lib/clickhouse/ to中的数据目录路径但是，当我启动客户机时，它会失败，如下所示：客户端ClickHouse客户端版本1.1.54383。连接到本地主机:9000。编号: 102。DB::NetException:来自服务器本地主机的意外数

浏览 0提问于2018-05-23得票数 4

回答已采纳

3回答

clickhouse-client :内存使用率非常高

clickhouse

我已经在wsl2上运行的clickhouse-server上加载了on数据集。服务器端一切正常，但是clickhouse-client突然开始占用大量内存，这在给定的htop输出中很明显。 ? 当仅执行简单的group by查询时， select year,count(1) from datasets.ontime group by year 我不得不关闭wsl才能从中恢复。如果我做错了什么，请让我知道！注意:我已经将ontime数据集的分区指令更改为年和ORIGINSTATE，即：PARTITION BY (Year,OriginState) Clickhouse版本: 21.

浏览 443提问于2021-04-26得票数 1

1回答

将数据插入到ClickHouse时的高iops

clickhouse

我在向clickhouse插入数据时遇到了性能问题。我们每批插入100,000行，间隔时间是30s，但是由于分区键字段的基数很大，所以会插入100,000行到2000+分区中，这时就达到了iops的上限150，即使我们把ebs的iops上限提高到2000，也仍然达到了上限。如果无法减少分区数，如何降低iops？clickhouse的版本是20.5，提前谢谢！

浏览 35提问于2020-08-05得票数 0

回答已采纳

1回答

无法以只读模式插入到表中

node.js、clickhouse

当我尝试在clickhouse数据库中插入记录时，出现以下异常：异常： Code: 164, e.displayText() = DB::Exception: Cannot insert into table in readonly mode, e.what() = DB::Exception 节点包：连接代码： const clickhouse = new ClickHouse({ url: 'http://localhost', port: 8123, debug: true, database: 'mydb', basicAuth: 'def

浏览 331提问于2019-03-09得票数 2

回答已采纳

1回答

clickhouse一次合并一个分区

clickhouse

当我运行optimize table * final时，如何强制ClickHouse一次只合并一个分区(不指定分区201304，然后指定201305，然后依次运行它)？我正在使用CollapsingMergeTree。它使用了大量的RAM来为许多分区一起进行多个合并，并杀死了服务/机器。

浏览 57提问于2020-02-10得票数 0

回答已采纳

5回答

多个小插口在点击室

clickhouse

我在clickhouse中有一个事件表(MergeTree)，并且希望同时运行许多小的插入。但是，服务器会变得过载，没有响应。此外，一些插入件丢失了。在clickhouse错误日志中有很多记录： 01:43:01.668 [ 16 ] <Error> events (Merger): Part 201 61109_20161109_240760_266738_51 intersects previous part 是否有优化此类查询的方法？我知道我可以对某些类型的事件使用bulk insert。基本上，运行一个包含多个记录的insert，这个clickhouse处理得相当好。但是，

浏览 8提问于2016-11-14得票数 15

回答已采纳

1回答

无法读取未定义的属性“omitFormat”

sails.js、clickhouse

我在clickhouse中创建了一个表，如下所示： let clickhouse = new ClickHouse (sails.config.clickhouse); let query = `CREATE TABLE table1(category String,subcategory String,title String,id Int64) Engine=Log` 我试图按如下方式运行上面的查询： return new Promise((resolve, reject) => { clickhouse.query (query, function (err

浏览 3提问于2019-11-19得票数 0

回答已采纳

3回答

Clickhouse客户-代码: 62。DB::Exception:空查询

docker-compose、clickhouse

我试图使用clickhouse-server和clickhouse-client服务来运行Docker和Docker Compose。基于和，我在文件中创建了服务，如下所示： docker-compose.yml: ch_server: container_name: myapp_ch_server image: yandex/clickhouse-server ports: - "8181:8123" - "9000:9000" - "9009:9009"

浏览 5提问于2021-02-14得票数 2

回答已采纳

2回答

在预准备语句中将负java long转换为clickhouse Uint64

java、jdbc、clickhouse

在插入之前，是否有任何方法将负long转换为Uint64 (clickhouse数据类型)。现在 preparedStatement.setObject(columnNumber, -3108819769473315784); preparedStatement.execute(); 抛出以下异常 ru.yandex.clickhouse.except.ClickHouseException: ClickHouse exception, code: 321, host: localhost, port: 33493; Code: 321, e.displayText() = DB::Excep

浏览 7提问于2019-10-04得票数 0

回答已采纳

1回答

Clickhouse GraphiteMergeTree表从不推荐的format_version迁移

clickhouse

我尝试了两种方法，在这里描述编辑元数据文件创建表graphite.data_test ( Path String，Value Float64，Time UInt32，Date Date，Timestamp UInt32 )引擎=GraphiteMergeTree(日期，(路径，时间)，8192，'graphite_rollup') alter graphite.data_test从graphite.data附加分区202208；分离表graphite.data_test； vi /var/lib/clickhouse/metadata/graphite/data_test

浏览 4提问于2022-08-01得票数 0

1回答

当一个碎片服务器关闭时，是否有什么方法可以使分布式表仍然用于查询？

clickhouse

有一种常见的情况是，我们将更新clickhouse的配置，它必须重新启动clickhouse才能生效。在重新启动过程中，查询服务依赖于clickhouse的分布式表，由于与重新启动服务器断开连接，因此将返回异常。因此，正如标题所述，我想要的是，当一个碎片服务器停机时，使分布式表仍然适用于查询的方法。谢谢。

浏览 1提问于2019-03-13得票数 0

回答已采纳

1回答

Clickhouse如何按控制字符过滤字符串

clickhouse

在Clickhouse中，如何按控制字符过滤字符串，例如制表符\t、换行符\n SQL Server具有表示控制字符的。另外，配置单元具有用于匹配控制字符的正则表达式的。在CH中如何做类似的事情？我不知道如何在以下命令中正确转义制表符。无论反斜杠1、2或4的数量是多少： $ clickhouse-client --query="SELECT 'Hello\tworld'" Hello\tworld $ clickhouse-client --query="SELECT 'Hello\\tworld'" Hello\tworld

浏览 138提问于2021-05-19得票数 0

回答已采纳

1回答

无法安装新的clickhouse-server。安装失败，并显示Poco::Exception。代码: 1000

clickhouse

我正在Ubuntu 20.04.1 LTS上本地安装clickhouse-server和clickhouse-client。我之前的一个安装很好，但是在某些时候它坏了。从这里运行官方推荐的脚本后：https://clickhouse.tech/docs/en/getting-started/install/ sudo apt-get install apt-transport-https ca-certificates dirmngr sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv E0C56BD4 ech

浏览 572提问于2021-01-29得票数 0

回答已采纳

1回答

如何在windows azure表的同一个表中存储具有相同分区键的不同类型？

azure、azure-table-storage、azure-storage

我有两个相关的实体。 Fruits.Apple Cars.Bmw 这些实体属于同一个用户，我想使用userId作为这两个实体的partitionKey。我将它们存储在相同的分区中，但是当我使用CreateQuery传递partitionKey时，查询将返回具有该分区的所有实体，而不仅仅是苹果。这是抛出一个异常： “当前值'Fruits.Apple‘类型与预期的'Cars.Bmw’类型不兼容。” 有没有按类型过滤的乳清来避免这种错误？谢谢, 穆里洛

浏览 0提问于2012-10-24得票数 0

回答已采纳

3回答

是否可以从clickhouse表中删除旧记录？

sql、clickhouse

据我所知，clickhouse只允许插入新数据。但是有没有可能删除某个时间段之前的数据块，以避免硬盘溢出？

浏览 3提问于2018-09-16得票数 18

回答已采纳

2回答

了解clickhouse分区

clickhouse

我看到clickhouse为每个分区键(在每个节点中)创建了多个目录。文档中说目录名称的格式是: partition ID_minimum block number_maximum block number_level。你知道这里是什么级别吗?一个节点(一个表)上的347个不同的分区键创建了1358个目录。(自定义分区) 文档建议分区数量不要超过1000个。我们应该牢记分区键的数量还是目录的数量？另外，有没有关于如何控制这个目录数量的配置？

浏览 2提问于2018-08-09得票数 6

1回答

获取异常表间歇性地处于只读模式

java、clickhouse

在我的应用程序中，当我间歇性地执行clickhouse insert查询时，我得到了以下异常代码: 242，e.displayText() = DB::Exception: Table处于只读模式(版本19.14.6.12) 在clickhouse服务器错误日志中，观察到以下异常的相同时间戳。 0. 0x3353de0 StackTrace::StackTrace() /usr/bin/clickhouse 1. 0x66f25e8 ? /usr/bin/clickhouse 2. 0x66f2d0b Coordination::Exception::Exception(std::stri

浏览 95提问于2020-10-21得票数 0

1回答

使用MergeTree引擎创建分区键时出错

python-3.x、docker-compose、sqlalchemy、clickhouse

我一直试图使用infi.clickhouse_orm创建模型，但是分区键出现了问题我的模特： from infi.clickhouse_orm import Model, UInt16Field, Float32Field, StringField, MergeTree,DateField class OHLC(Model): __tablename__ = 'ohlc' id = UInt16Field() min = Float32Field() max = Float32Field() start_date = DateField() interval =

浏览 6提问于2020-07-20得票数 1

回答已采纳

2回答

Clickhouse内存问题

clickhouse、clickhouse-client

我有一个大约20亿行的表，我试图从这个表中查询max(id)。Id不是表的排序键，该表使用的是表引擎mergeTree。不管我怎么尝试，我都会有记忆错误。这并不仅限于这一个查询。当我试图完全(垂直)查询任何表以查找数据时，我的12 gb内存是不够的。现在我知道我可以补充更多，但这不是重点。当没有足够的内存时，clickhouse就会抛出一个错误吗？是否有通知clickhouse使用磁盘的设置？ SQL 241: ClickHouse异常，代码: 241，主机: XXXXXX，端口: 8123；代码: 241，e.displayText() =DB:异常:内存限制(用于查询)：将使用9.32

浏览 3提问于2021-07-30得票数 1

回答已采纳

3回答

Clickhouse:如何对Clickhouse数据库进行增量备份，包括分区表和未分区表？

database、clickhouse

需要对Clickhouse DB进行备份，有些表已分区，有些表没有分区。如果可能，请提供一些脚本或代码，以便更好地理解。

浏览 22提问于2019-07-12得票数 4

1回答

ClickHouse数据库中的截断和插入

sql、database、clickhouse、yandex、column-oriented

我有一个特殊的场景，每隔30分钟就需要截断和批处理插入到ClickHouse数据库管理系统中的表。我在中找不到截断选项的引用。但是，我可以找到一些建议，我们可以通过删除旧表、创建同名的新表并将数据插入到其中间接地实现这一点。关于这一点，我有几个问题。这是如何实现的？这个过程中的步骤顺序是什么？在删除和重新创建表时，其他查询(如Select )会发生什么呢？在ClickHouse中删除和重新创建一个表通常需要多长时间？是否有一种更好、更干净的方法可以实现这一点？

浏览 1提问于2018-08-25得票数 2

回答已采纳

2回答

为什么Clickhouse比PostgreSQL慢？

postgresql、olap、clickhouse

我想使用Clickhouse作为OLAP，使用PostgreSQL作为OLTP数据库。问题是，对Clickhouse的查询比在Postgres上运行得慢。查询如下： select count(id) from {table_name} 这是我的桌子结构： CREATE TABLE IF NOT EXISTS {table_name} ( `id` UInt64, `label` Nullable(FixedString(50)), `query` Nullable(text),

浏览 6提问于2022-02-20得票数 2

回答已采纳

1回答

ClickHouse当发生错误时，内存不是自动释放的

memory、clickhouse

当我移动数据时发生了一个错误，但是在内存从未自动释放之后。 SELECT在data_center.local_table中选择*来自data_center.base_table，其中create_time >= 1667664000和create_time < 1667750400 和错误消息从服务器接收到异常(21.8.2版)：代码: 241。DB::Exception:从casd2412asdas.clickhouse.myid.com:9000收到。DB：：异常:内存限制(总计)超过:将使用55.47 GiB (尝试分配4718592字节的块)，最大值: 55.47 GiB:

浏览 18提问于2022-11-29得票数 0

1回答

如何在clickhouse主键中使用“`toYYYYMMDD(时间戳)”

primary-key、partition、clickhouse

我使用clickhouse作为我的项目基础数据库和它的MergeTree表工程。我尝试使用Custom Partitioning Key特性，并创建了如下表： CREATE TABLE MyTable ( UserID UUID, ResourceID UUID, TimeStamp DateTime, Usage Int64, Version UInt32 ) ENGINE = ReplacingMergeTree(Version) PARTITION BY t

浏览 0提问于2019-08-28得票数 1

1回答

无法在ClickHouse中消费来自主题分区的消息

apache-kafka、clickhouse

我正在介绍kafka，我想知道如何像这样使用从topic中的分区到ClickHouse表的消息：当我有3个主题时，很容易将每个主题的表连接起来 ENGINE = Kafka SETTINGS kafka_broker_list = 'broker:9092', kafka_topic_list = 'topic1', kafka_group_name = 'kafka_group', kafka_format = 'JSONEachRow' 但是我不知道如何将消息从一个主题的分区消费到表中。请帮帮忙

浏览 1提问于2019-01-15得票数 0

2回答

Clickhouse Kafka主题加入：

apache-kafka、clickhouse

我有两个(以及更多) Kafka主题，我需要加入他们。我的问题来自我在博客/StackOverflow上读到的内容...有两个选项： 1)将它们都流式传输，Clickhouse Kafka引擎/spark流，然后运行join，这在Clickhouse中是不推荐的？ 2)构建一个包含所有列的表，并使用Clickhouse引擎/spark streaming更新相同的入口？任何建议

浏览 22提问于2019-03-06得票数 1

1回答

在clickhouse中，当转换失败时，如何返回null而不是抛出异常？

clickhouse

如果不能将字符串值强制转换为int，则clickhouse将抛出异常，如何在转换失败时返回null而不是抛出异常？谢谢。 SELECT CAST('a' AS Int32)

浏览 1提问于2021-09-09得票数 0

回答已采纳

2回答

无法从Kafka获取数据到分布式表

java、apache-kafka、clickhouse

我需要从Kafka队列(用我的脚本填充它)获取数据到ClickHouse (CH)集群中的每个副本。我创造了：每个副本上的“队列”表(卡夫卡引擎)；每个副本上的“使用者”物化视图(从“队列”获取数据到分布式表)； “数据”分布表；当我将数据放入Kafka时，我非常肯定表接受数据(简单的select count(*) from data)，但是我总是这样： “进度:1.55000行，1.24MB (297.46行/秒，237.18 KB/s)从服务器接收异常(版本18.14.17)：代码:159.DB：：exception :接收自主机:port.db：：Excep

浏览 0提问于2019-02-23得票数 0

回答已采纳

2回答

Clickhouse十字加入解决方案？

sql、join、alias、clickhouse

我试图计算每个IP地址在Clickhouse中错误事务状态的百分比。 SELECT c.source_ip, COUNT(c.source_ip) AS total, (COUNT(c.source_ip) / t.total_calls) * 100 AS percent_faulty FROM sip_transaction_call AS c CROSS JOIN ( SELECT count(*) AS total_calls FROM sip_transaction_call ) AS t WHERE (status = 8 OR status

浏览 14提问于2022-01-03得票数 0

1回答

ClickHouse聚合-按日/月/年(时间戳)分组？

mysql、group-by、aggregate、aggregate-functions、clickhouse

在ClickHouse中有没有办法使用时间戳值按日/月/年()进行分组？在将MySQL查询重写为ClickHouse时，很难弄清楚。我的MySQL查询看起来像这样... SELECT COUNT(this), COUNT(that) FROM table WHERE something = x AND stamp BETWEEN startdate AND enddate SELECT COUNT(this), COUNT(that) FROM table WHERE something = x AND stamp BETWEEN startdate AND enddate GROUP BY

浏览 1提问于2021-01-25得票数 0

2回答

无法从clickhouse连接到zookeeper

apache-zookeeper、clickhouse

我正在使用Bitnami Zookeeper AMI for AWS，并且已经配置了一个3节点集群。我在我的clickhouse配置文件中指定了它们，如下所示。 <zookeeper> <node index="1"> <host>X.X.X.X</host> <port>2181</port> </node> <node index="2">

浏览 403提问于2019-01-29得票数 1

回答已采纳

2回答

火花SQL -读写顺序或流水线？

apache-spark、apache-spark-sql

我正在为Spark编写一个成本函数。在建立表格扫描行为模型时，我无法理解读和写是在管道中还是按顺序进行的。让我们考虑以下SQL查询：从table1选择*，其中columnA =‘xyz’；每项任务：读取数据块(本地或远程节点) 筛选出不满足谓词的元组。将剩余的元组写入磁盘 (1)、(2)和(3)是按顺序进行还是在管道中进行？换句话说，数据块首先被完全读取(组成它的所有磁盘页)，然后被过滤，然后被重写到磁盘，或者这些活动是在管道中执行的？(即在读取(n+1)-tuple时，可以处理和写入n元组)。提前谢谢。

浏览 2提问于2016-04-13得票数 0

回答已采纳

1回答

如何避免在分布式表上合并高基数的子选择聚合

clickhouse

在Clickhouse中，我有一个很大的表A，其中包含以下各列： date, user_id, operator, active 在表A中，事件已经在date、user_id和operator上预先聚合，而列“active”表示在给定日期存在用户的特定类型的活动。表A分布在2个分片/服务器上:首先，我在每个服务器上创建了表A_local (PK是date，user_id)。然后，我创建了分布式表A来合并本地表A_local，使用hash(userid，operator)作为分片键。User_id是高基数字段(数千万到数亿)，而列“operator”具有低基数(大约1000个不同的值)。每个

浏览 10提问于2019-09-07得票数 2

回答已采纳

2回答

Clickhouse Kafka引擎抛出异常

clickhouse

我正在尝试使用Clickhouse Kafka引擎来摄取数据。数据采用CSV格式。在数据摄入过程中，有时我会遇到异常。 2018.01.08 08:41:47.016826 [ 3499 ] <Debug> StorageKafka (consumer_queue): Started streaming to 1 attached views 2018.01.08 08:41:47.016906 [ 3499 ] <Trace> StorageKafka (consumer_queue): Creating formatted reader 2018.01.08 08:

浏览 6提问于2018-01-08得票数 1

回答已采纳