Cassandra中的宽分区模式_获取cassandra中的所有分区键_Cassandra中的自定义分区程序 - 腾讯云开发者社区

cassandra

在Cassandra中“宽分区模式”是什么？在“Defiinitive Cassandra”这本书中，它似乎是一个推荐的东西，但在一些在线文章中，我看到了它应该避免的东西。那么它到底是什么，是不是更可取呢？

浏览 21提问于2021-07-03得票数 0

回答已采纳

1回答

拥有分区大小超过100 is的Cassandra表的副作用是什么？

cassandra

我正在运行3.11.1，在失败状态下有6个表大小。 Max partition is larger than 100MB. 对于这6个表，分区大小平均在200 5GB到5GB以上。这6个表被分割成3个键空间，并且特定于Akka持久性 eventsByTag (即eventsByTag1、eventsByTag2)。这些表中的许多数据没有被使用，它仍然需要可用。然而，我正在考虑改变数据模型，但同时，我试图更好地理解大分区大小的影响。除了内存不足或访问卡桑德拉限制之外，如果大多数数据没有被访问，还有其他一些大分区大小的负面影响吗？一个可能相关(未证实)的具体案例是，我目前正在运行带有物化视

浏览 0提问于2018-01-10得票数 1

回答已采纳

2回答

Scale cassandra流错误(空指针异常)

java、nullpointerexception、cassandra

我们有一个包含单个节点的集群，其中包含大约40 We的数据。我们正在尝试扩展并向集群中添加第二个节点，但无法实现。种子节点开始流式传输数据，但在一段时间后抛出错误。错误是： ERROR [STREAM-OUT-/10.0.0.166] 2016-06-21 12:18:40,300 StreamSession.java:520 - [Stream #862ed0e0-37a7-11e6-b0b9-3fa2170fe9a5] Streaming error occurred java.lang.NullPointerException: null at org.apache.cassan

浏览 1提问于2016-06-22得票数 1

1回答

在单节点中使用cassandra，我还需要担心选择一个“好的”分区键吗？

cassandra

我们在单个节点上使用cassandra。据我所知，在集群中，智能分区密钥将允许数据跨集群分布，并将避免所有密钥存储在同一主机上。然而，在我们的例子中，只有一个主机，我可以使用一个常量(虚拟)分区键，但我想检查如果我这样做是否会错过一些东西。例如，cassandra的每个分区最多有20亿个单元。cassandra是否也遵守单个主机的限制？我可以在单个节点cassandra上拥有超过20亿个单元格的表吗？

浏览 0提问于2017-07-01得票数 0

1回答

10 of分区大小的概念从何而来？

cassandra、cql

我正在为Cassandra中的时间序列数据做一些数据建模，我已经决定实现存储桶来调整分区大小，并在集群中保持合理的分布。我决定将分区设置为不超过10 my的大小，因为我已经看到许多源将此声明为理想的分区大小，但我找不到任何关于为什么选择10 my的信息。最重要的是，我在DataStax或Apache中找不到任何提到这个软10 or限制的东西。我们的数据可以被请求很长一段时间，这意味着如果分区大小保持在10 of，那么需要大量分区来处理1请求。我更希望增加分区的大小，并且需要更少的分区来服务这些请求。 10 of分区大小的概念从何而来？这还相关吗？如果我的分区大小是20 my，那会有什么不好

浏览 0提问于2019-11-27得票数 2

回答已采纳

1回答

你如何称呼DynamoDB和Cassandra的数据模型？

cassandra、amazon-dynamodb、scylla

说DynamoDB是一个"“数据库。但是，将其称为“键值”数据库完全忽略了DynamoDB的一个极其基本的特性，即排序键的特性:键有两个部分(分区键和排序键)，具有相同分区键的项可以按照排序键一起高效地检索。 Cassandra还具有完全相同的排序项内部分区特性(它称之为“聚类键”)，使用术语来描述它。然而，虽然这个术语“宽列”比“键值”要好，但它还是有点不合适，因为它描述了一个项目可以有大量不相关列的更一般的情况--不一定是一个单独项目的排序列表。因此，我的问题是，是否有一个更合适的术语可以描述像DynamoDB和Cassandra这样的数据库的数据模型，这些数据库就像键值存储一样

浏览 3提问于2020-03-22得票数 12

回答已采纳

2回答

如何在cassandra中找到除system.log之外的大分区？

cassandra、cassandra-2.0、cassandra-2.1

在进入system.log之前，我们如何在cassandra集群上找到较大的分区？由于这个原因，我们正面临一些性能问题。有人能帮我吗。我们有cassandra版本2.0.11和2.1.16。

浏览 7提问于2018-12-28得票数 3

2回答

使用宽列存储构建复合主键是正确的模式吗？

cassandra、hbase、bigtable、happybase、wide-column-store

HBase和Cassandra是作为宽列存储构建的，使用行和列的概念。行由与RDBMS中的主键概念类似的键和由多列组成的值组成。表示可以如下所示： *******| Key | Value -------+------------+-------------+------------------------------------------ Colunms| | name | value -------+------------+-------------+-------

浏览 4提问于2015-09-11得票数 1

回答已采纳

1回答

如何使用和查询Phantom中的动态列族为Cassandra？

scala、cassandra、phantom-dsl

最近，我开始处理大量的数据，这些数据也需要经过正常的事务处理。选择Cassandra，我的数据模型使用动态列。我理解使用CQL可以修改表，插入或查询列以获得所需的数据。但是，我在为Cassandra使用带有Scala的Phantom客户端，并阅读了我无法找到一种方法来编写或查询动态列家族的文档。假设我们使用case类，那么如何使用Scala中的Cassandra动态列呢？

浏览 4提问于2015-10-05得票数 6

回答已采纳

1回答

在Cassandra中按时间排序结果

cql、cassandra-3.0

我在试着从Cassandra那里得到一些时间序列数据我的表显示在图片上，当我查询时，我得到的数据如下所示:首先，当我在Cassandra中插入数据时，我看到的是所有的假数据，接下来，我看到的是所有的真数据。我的问题是:我如何根据插入时的时间对数据进行排序或排列，以便能够在插入时按顺序排列数据。当我尝试"select c1 from table1 order by c2“时，我得到以下错误："ORDER BY只有当分区键被EQ或IN限制时才受支持。” 谢谢你，

浏览 0提问于2017-06-15得票数 0

1回答

具有CQL 3的动态列

cassandra、cql

我阅读了有关存储时间序列数据的Datastax文章，根据文章，它应该创建宽行来存储一些时间序列。如下(文章中的图片)：我创建了表： CREATE TABLE test.times ( id text, time timestamp, temperature text, PRIMARY KEY (id, time)); 并插入一些值： cqlsh> insert into test.times (id, time , temperature ) VALUES ( '1', '2013-04-03 07:03:00', '72F'); c

浏览 0提问于2016-05-16得票数 0

回答已采纳

3回答

Cassandra是面向列的数据库还是列数据库？

cassandra、nosql、column-oriented、wide-column-store

柱状数据库应该将一组列存储在一起。但卡桑德拉按行存储数据。SS表将保存映射到相应分区键的多行数据。因此，我觉得Cassandra是一个像MySQL那样的逐行数据存储，但是它还有其他的好处，比如“宽行”，并且每个列都不一定存在于所有行中，当然，它在内存中。如果我错了，请纠正我。

浏览 11提问于2014-08-22得票数 22

回答已采纳

2回答

火花卡桑德拉连接器直接连接不适用于IN查询

cassandra、datastax-java-driver、spark-cassandra-connector

我在cassandra中有一个表，其中A(String)和B (int)是分区键，我正在用spark编写sql查询 select ("SELECT * from table where A IN ("221",...) and B IN(32,323...)); 在解释计划中，它似乎是在进行批处理扫描，而不是直接连接分区键。 == Physical Plan == Project [A,B ... other columns] +- BatchScan[A,B ... other columns] Cassandra Scan: dev.table Cassandra滤

浏览 8提问于2020-08-04得票数 1

1回答

当从cassandra源读取数据时，spark中的重新分区会改变spark分区的数量吗？

apache-spark、cassandra、spark-cassandra-connector

我正在从spark的cassandra表中读取一张表。我在cassandra中有很大的分区，当cassandra的分区大小超过64MB时，在这种情况下，cassandra分区将等于spark分区。由于分区太大，我在spark中遇到了内存问题。我的问题是，如果我在从cassandra读取数据后开始重新分区，spark分区的数量会发生变化吗？它不会导致火花记忆问题吗？我的假设是，spark首先会从cassandra读取数据，因此在这个阶段，cassandra的大分区不会因为重新分区而拆分。重新分区将处理从cassandra加载的底层数据。我只是想知道，当从spark读取数据时，重新分区是否会

浏览 48提问于2021-06-07得票数 1

1回答

我不能repository.save(我的数据)，我正在寻找一个很好的选择加入Spring + Cassandra

java、spring、spring-boot、cassandra、spring-data

我开始接触卡桑德拉，但我有麻烦了，因为我不能加入。由于不能用CQL来完成JOIN，所以我考虑寻找替代方法，并在Java应用程序端加入它。具体来说，我使用@OneToMany并尝试加入实体，但出现了以下错误。有什么好办法吗？项目结构 SpringBoot + Apache的Spring数据版本：弹簧启动：(v1.3.5.RELEASE) spring-data-cassandra-1.3.5.RELEASE 卡桑德拉2.1.16 错误日志 com.datastax.driver.core.exceptions.InvalidQueryException: Unkno

浏览 2提问于2016-12-14得票数 0

回答已采纳

1回答

分配量对Cassandra簇修复时间的影响

cassandra、repair、merkle-tree

分区数量对Cassandra集群的修复时间有何影响？分块越少，梅克尔树算法和修复过程的速度越快是正确的吗？会修得更快- CREATE TABLE ks.t1 ( id2 bigint, id1 bigint, name text, PRIMARY KEY (id2, id1, name) ); 比为 CREATE TABLE ks.t1 ( id2 bigint, id1 bigint, name text, PRIMARY KEY ((id2, id1), name) ); 如果计数(id2，id1) >计

浏览 1提问于2016-02-19得票数 1

回答已采纳

1回答

在Cassandra中保存邮件内容

cassandra

我正在创建电子邮件发送功能。此功能分为两个服务。服务-1:准备电子邮件内容并将内容保存到Cassandra表。服务2:从Cassandra中选择电子邮件内容，并将电子邮件发送给用户。我的问题是: Cassandra是存储电子邮件内容的好数据库，还是我需要使用diff数据库？

浏览 2提问于2021-09-28得票数 0

1回答

如何在Cassandra中创建十亿列的模式？

java、cassandra、scalability

我在Cassandra中看到，对于每一个行键，我们可以节省数十亿的列名/列值对。此外，在能够在Cassandra中持久化数据之前，我们需要创建模式。因此，我想知道我们应该如何创建一个包含数十亿列的模式？这没有道理吗？我正在专门研究一个用例，在这个用例中，我希望保存每分钟生成的事件，并且每分钟都可以有数百万(如果不是数十亿)事件。因此，我想知道如何正确地建模。 2022-05-22-05-55 --> <event id as column name, event value as column value> 请帮帮忙。

浏览 10提问于2022-05-23得票数 2

1回答

cassandra中的查询路径

nosql、cassandra、bigdata

卡桑德拉中以下查询的执行路径是什么：-5行来自一个带有令牌1(Node1)的Cassandra节点-5行来自一个带有令牌2(Node2)的Cassandra节点-5行来自一个带有令牌3的Cassandra节点(Node3) 客户端向Node1发送查询。-在3个节点中执行该查询的顺序是什么？- Node1如何将该查询传播到node2和node3？- Node1将node2和node3中的行合并以服务于完整的查询结果？

浏览 3提问于2013-09-05得票数 1

回答已采纳

2回答

Cassandra中的分区键

cassandra

如果在我的cassandra中，RowKey是(a，b，c)，并且我的数据与存在的基数高度倾斜，那么假设只有一个。如果复制因子为1，整个数据会驻留在cassandra集群的单个节点上吗？此外，如果该节点关闭，我将得到什么异常？

浏览 1提问于2014-12-02得票数 1

回答已采纳

1回答

为什么Cassandra驱动程序不返回所有行的COUNT()？

python、pandas、dataframe、cassandra、datastax-python-driver

我正在数据Stax的cassandra数据库中插入一个大约14k行的df。我使用的免费版本的Data，在那里，您有25 MB的存储限制。我的数据集大约是1.5MB大小。我的代码在插入和获取后没有出现错误。但是，在我计算了提取后的行数之后，我只得到了大约1.5k行。我似乎不知道问题出在哪里。是插入码还是取码？在绞尽脑汁并多次搜索谷歌之后，我无法弄清楚。以下是我的代码-： cassandraDBLoad.py def progressbar(it, prefix="", size=60, out=sys.stdout): # Python3.3+ count = len(i

浏览 19提问于2022-07-17得票数 0

1回答

在cassandra的cql查询中，“每分区限制”是什么意思？

cassandra、cqlsh、scylla

我有一个scylla表，如下所示： cqlsh:sampleks> describe table test; CREATE TABLE test ( client_id int, when timestamp, process_ids list<int>, md text, PRIMARY KEY (client_id, when) ) WITH CLUSTERING ORDER BY (when DESC) AND bloom_filter_fp_chance = 0.01 AND caching = {'k

浏览 12提问于2020-05-07得票数 4

回答已采纳

1回答

用于存储倒排索引的Cassandra分区和集群键

cassandra、inverted-index

我需要使用Cassandra来存储倒排索引，其中存储的单词及其在文章中的频率如下所示： word, article_title, frequency 唯一单词的数量约为40M，Cassandra节点的数量= 2。使用单词的第一个字符作为分区键和单词本身哪个更好？主键呢？

浏览 10提问于2017-03-09得票数 0

1回答

Cassandra Hector :给定行键和二级索引的IndexedSliceQuery

cassandra、hector

Hector: hector-core-1.0-5 Cassandra-1.1.2 我需要在Hector中对查询进行建模，如下所示： select * from table1 where rowkey='x' and secondary_indexed_column='y' 如果我使用一个setStartKey设置为rowKey 'x‘的列，我仍然会得到包含IndexedSliceQuery _indexed_column=’y‘的所有行。如果我在addEqualsExpression(" row_key "，'x')中添

浏览 1提问于2012-09-13得票数 1

2回答

宽行、分区、集群列/键和分区键的概念是否存在于Cassandra的查询语言级别？

cassandra、cql

在Cassandra中，宽行、分区、集群列/键和分区键的概念是否存在于查询语言级别？或者是查询语言的用户不知道的内部实现问题？下面是来自的一个例子。在查询语言中的命令中，上述概念似乎不存在，但在钩子下却存在。考虑以a作为分区键，b作为集群列创建的表：创建表测试(a文本，b int，c文本，主键(a，b，b))插入test(a，b，c)值(‘test’，2，'test2')插入test(a，b，c)值(‘test’，1，'test1')插入test(a，b，c)值(‘test-new’，1，'test1') 如果您按照以下顺序运行上述查询，

浏览 0提问于2019-11-29得票数 1

1回答

Cassandra:按查询排序

cassandra

我有一点特别的要求。 Constelation:我使用Redis DB来存储地理数据，并使用georedius来获取它们，按距离排序。使用这个键，我在cassandra中搜索数据。但是cassandra的结果是在key或其他东西中排序的。我想要的是，按照我要求的顺序重新获得信息。分区键由id (我从redis返回)和一个status构建而成。我可以告诉cassandra按id数组排序吗？

浏览 7提问于2016-08-15得票数 0

2回答

Cassandra数据从1.2迁移到3.0.2

cassandra、migration、etl、data-migration、cassandra-3.0

我知道以前也有人问过类似的问题，但我认为我的用例非常具体，我找不到任何答案。在生产中，我们使用卡桑德拉1.2与ByteOrderPartitioner在一个6节点集群与Priam作为种子管理工具。最近，我们升级了所有的依赖项，并试图用Murmur分区器迁移到Cassandra3.0.2，并且为了向后兼容性，我们需要在新集群.Also上实现节约，我们也想从Priam迁移。我能够设置新的集群，但在数据迁移过程中遇到了许多问题。我试了三件事： 1)使用复制命令:当行数很大时失败 2) SSTable2Json :Cassandra3.0.2已停止支持SSTable2Json 3) SSTablel

浏览 1提问于2016-02-11得票数 0

3回答

根据Where子句更新Cassandra中的列

cassandra、cql、cql3

我有一张很简单的桌子 cqlsh:hell> describe columnfamily info ; CREATE TABLE info ( nos int, value map<text, text>, PRIMARY KEY (nos) ) 下面是我试图更新值的查询。 update info set value = {'count' : '0' , 'onget' : 'function onget(value,count) { count++ ; return {"value":

浏览 1提问于2014-04-18得票数 4

回答已采纳

1回答

设计Instagram问题的最佳数据库设计

database-design、cassandra、instagram

我正在阅读链接：中的帖子。我在理解节数据库模式方面遇到了很多困难：现在，本节介绍在像cassandra这样的nosql存储中存储照片的元数据。问题如下：，如下所示，将列表存储在不同的列中究竟意味着什么？对于‘’表，‘UserPhoto’键将是‘UserID’，‘value’将是用户拥有的‘PhotoID’列表，存储在不同的列中。虽然建议使用nosql存储，但它对关系数据库管理系统究竟有什么用处呢？

浏览 1提问于2021-07-16得票数 1

回答已采纳

2回答

Cassandra模式

java、service、cassandra、cql3

我目前已经在Cassandra中设计了一个模式，但我想知道是否有更好的方法来做事情。基本上，问题是大多数读取(如果不是全部读取)都是动态的。我构建了一个分割系统作为应用程序服务，它读取动态自定义查询(完全与Cassandra无关，但查询是严格的，并且仅限于应用程序)，它继续查询cassandra并合并结果。我已经使大多数列族尽可能地宽，并且因为数据是非常写密集型的，所以使用组合键来对负载进行分区。这基本上是在Cassandra之上实现一个查询层，该查询层特定于应用程序，包括某种连接或合并操作。此布局或流程是否有任何限制？

浏览 0提问于2013-07-03得票数 0

1回答

为什么DSE搜索唯一的键是Cassandra中的分区键？

solr、datastax-enterprise

我有一个列族，我通过DataStax Enterprise的SolR HTTP向某些应用程序公开。在某些用例中，我认为直接访问cql层可能更好。但是，当仔细查看底层数据模型时，我发现SolR中的唯一方法是，而不是使用带有集群列的复合键。这不会产生每个分区一个宽行吗？对于大型数据集来说，这不是一个“差”的数据模型吗？

浏览 0提问于2014-08-04得票数 0

回答已采纳

2回答

当查询选择了集合时，不能在关系中限制对列的聚类

cassandra

我正在阅读这篇文章，它展示了如何在cassandra中使用IN子句编写查询我创建了下面的表 create table foo2(id bigint, bid bigint, data set<bigint>, primary key (id, bid)); insert into foo2 (id, bid, data) values (1, 1, {1, 2}); insert into foo2 (id, bid, data) values (1, 2, {3, 4}); insert into foo2 (id, bid, data) values (1, 3, {5,

浏览 0提问于2017-04-24得票数 6

1回答

可以直接从Cassandra读取来自web应用程序的表面信息吗？

web、web-applications、cassandra、nosql

我使用Cassandra作为时间序列日志应用程序的主数据存储。我收到大量写入此数据库的数据，因此Cassandra是一个自然而然的选择。但是，当我尝试显示有关web应用程序上的数据的统计数据时，我对此数据库进行了代价高昂的读取，结果速度开始变慢。我最初的想法是运行定期的cron作业，每小时预先计算这些统计数据。这将确保不会有缓慢的读取。我想知道是否有其他方法可以从Cassandra数据库中读取数据，最好的解决方案是什么？

浏览 0提问于2017-03-28得票数 0

1回答

使用多个键查询Cassandra驱动程序

c++、cassandra、cassandra-2.0

我试图从c++应用程序中查询cassandra，并返回一组键的值。我正在使用这里描述的datastax驱动程序： cassandra查询字符串如下所示： SELECT value from my_table WHERE key IN (?); 如果我为每个参数数准备了一个单独的查询字符串，我可以使用cass_statement_bind_string_n，但是是否有一种方法可以使用一个字符串，而不管我希望查询的键数是多少？

浏览 0提问于2019-05-17得票数 2

回答已采纳

2回答

cassandra 2.0.9:编写量大的列的最佳实践

database-schema、cassandra-2.0

我对卡桑德拉的聚类感到有点困惑。我有一个非常重写和更新的应用程序。对于传统的关系数据库，我将数据划分为两个表:一个表用于不频繁更改的数据；一个表(行较短)用于频繁更改的列：例如： create table user_def ( id int primary key, email list< varchar > ); # stable create table user_var ( id int primary key, state int ); # changes all the time 但是Cassandra似乎是为访问人烟稀少的列而优化的，所以我不确定在Cassandra模

浏览 8提问于2014-07-22得票数 0

回答已采纳

1回答

Cassandra系统提示大分区

cassandra、cassandra-2.1

我们用的是卡桑德拉2.1.14。当前，大型分区警告出现在system.hints表上。如何确保system.hints表没有宽分区？请注意，我们现在不想升级到cassandra 3。有定期清除system.hints的方法吗？这会导致卡桑德拉星系团的I/O激增吗？日志： Compacting large partition system/hints: 10ad72eb-0240-4b94-b73e-eb4dc2aa759a (481568345 bytes)

浏览 3提问于2017-10-03得票数 2

回答已采纳

1回答

查询包含集合的大行时，Cassandra中内存不足的错误(set)

java、cassandra、out-of-memory、datastax、cql3

我使用的是Cassandra2.0.8，我已经定义了一个cql3表，如下所示： CREATE TABLE search_scf_tdr ( fieldname text, fieldvalue text, scalability int, timestamptdr bigint, tdrkeys set<blob>, PRIMARY KEY ((fieldname, fieldvalue, scalability), timestamptdr) ) 对于这个密钥空间，我使用的复制因子为每个DC 2。在这个表中，通过使用如下的更新，将项逐一添加到tdrkey集

浏览 2提问于2015-05-21得票数 4

回答已采纳

1回答

如何在python脚本中使用cqlshrc？

python-3.x、cassandra

我在GCP上有一个(Apache) Cassandra节点集群，在一个VM上有一个Python3节点。使用"cqlsh --cqlsh“可以运行我需要的查询，而不会出现任何错误。在cqlshrc里面有服装时间戳和增加的连接超时。复制DATETIMEFORMAT = %m/%d/%Y %H:%M:%S 连接request_timeout = 6000 我还在“~/..cassandra/”文件夹中有"cqlshrc“文件，这样我就可以使用它而不必将它作为参数传递。现在，使用“Cassandra驱动程序”的Python脚本希望与Cassandra对话并运行一些查询，但我得

浏览 8提问于2019-12-05得票数 0

1回答

如何重新设计这个经典的表格，使之在Cassandra / Scylla中从3列扩展到300 k列？

database、optimization、cassandra、nosql、scylla

本底.作为我们新的在线功能商店的一部分，我们正试图在Cassandra或Scylla中存储成千上万的字典(带有公用键的值列)。每一列(数值数组)共享相同的键，但键有数以百万计的值中的10。作为概念的证明，创建了一个典型的关系结构，只有3列： cassandra@cqlsh> use dicts; cassandra@cqlsh:dicts> create table dict7 (my_id bigint primary key, claims_count1 int, claims_count2 int, claims_count3 int); cassandra@cqlsh

浏览 5提问于2022-07-17得票数 0

1回答

如何分析和解决Cassandra中的“编写大分区”警告？

cassandra、cassandra-3.0

App服务器不断为几个表获取以下警告日志： org.apache.cassandra.io.sstable.format.big.BigTableWriter。maybeLogLargePartitionWarning编写大分区这是什么意思？如何分析和解决这一问题？

浏览 7提问于2022-10-11得票数 1

1回答

卡桑德拉在中间终止连接？

java、cassandra、datastax

我从datastax为java使用Cassandra驱动程序。我知道我在一张桌子上有2000万行。当我用 Select * from table 在获取了大约800000行之后，进程将停止。在我的Java代码中 futureResults = session.executeAsync(statement); ResultSet results = futureResults.getUninterruptibly(); for (Row row : results) { } 也许我做错了什么？

浏览 7提问于2016-04-15得票数 0

回答已采纳

1回答

卡桑德拉分区与NoSql分区

cassandra、nosql、cassandra-3.0

我理解了不同的b/w Cassandra分区键，复合键，聚类键。但是没有找到足够的信息来理解如何在cassandra中处理分区。在cassandra中，分区键的范围存储在一个节点上，比如分区/碎片。我的理解对不对..？在DB.中，每个分区键是否有不同的文件(在系统级别)？如果是这样的话，读起来会不会慢一点？如果每个分区键在DB中没有不同的文件。怎么处理的..？

浏览 2提问于2018-04-10得票数 1

回答已采纳

1回答

卡桑德拉写作(也是？)大分区

cassandra

我有一个Cassandra集群运行了相当一段时间(几个月)，正如预期的那样，它每天都在消耗大量的数据。在过去的几天里，集群出现了问题，因为其中一个节点不断崩溃，而我在日志中看不到多少。值得注意的是以下警告，但我现在确定它是否相关： insufficient space to compact all requested files. 846201.56MB required 比现有的要多得多。尽管如此，即使有足够的磁盘来支持这种压缩，它似乎是过度的，不是吗？有人知道我的问题是什么吗？谢谢你的关注。

浏览 0提问于2018-04-16得票数 3

回答已采纳

1回答

Cassandra在阻止同步请求的多进程中的同步执行

python、database、cassandra、multiprocessing、cql

我有一个应用程序，它读取一系列XML文件，其中包含道路车辆通道的日志。然后，应用程序处理每条记录，转换几个信息以匹配数据库列，并将其插入cassandra数据库(在远程服务器中运行单个节点，它位于内部网络中，因此连接实际上不是问题)。在数据库中插入数据之后，每个文件的过程将继续读取这些数据并为汇总表生成信息，从而为在应用程序的一个不相关部分中进行钻取分析做好准备。我正在使用多处理并行处理许多XML文件，而我遇到的麻烦是与cassandra服务器通信。从原理上看，这一过程如下：从XML文件读取记录过程记录数据将处理过的数据插入数据库(使用.execute_async(quer

浏览 3提问于2015-08-20得票数 1

回答已采纳

1回答

Apache 3.10 IllegalArgumentException - Murmur3Partitioner的无效令牌

java、cassandra、yaml、virtualbox、cluster-computing

我使用的令牌值： initial_token: 85070591730234615865843651857942052864 当我试图启动Cassandra时，将导致以下Java异常： Exception (java.lang.IllegalArgumentException) encountered during startup: Invalid token for Murmur3Partitioner. Got 85070591730234615865843651857942052864 but expected a long value (unsigned 8 bytes integer

浏览 3提问于2017-03-01得票数 0

回答已采纳

1回答

为什么SELECT *关闭Cassandra节点？

cassandra、relational-database、datastax-enterprise

在关系数据库中，SELECT *所做的最糟糕的事情是导致连接超时，但它不会关闭数据库。Cassandra在内部做了什么不同的事情？

浏览 0提问于2018-04-20得票数 1

1回答

使用cassandra-cli或CQL更改cassandra列族主键

cassandra、cql、cql3、cassandra-cli、cqlsh

我使用的是Cassandra 1.2.5。使用cassandra-cli在Cassandra中创建列族后，是否可以使用cassandra-cli或CQL修改列族上的主键？具体地说，我目前有以下表格(来自CQL)： CREATE TABLE "table1" ( key blob, column1 blob, value blob, PRIMARY KEY (key, column1) ); 我希望该表如下所示，而不必删除并重新创建该表： CREATE TABLE "table1" ( key blob, column1 blob,

浏览 1提问于2013-08-25得票数 11

回答已采纳

1回答

在一次读取数百万张记录时表现如何？

cassandra、nosql

关于Cassandra的冗余是如何为来自不同位置的数千个传入请求提供良好性能的，已经写了很多文章，但是我还没有发现任何关于单个大请求吞吐量的信息。这就是这个问题的意义所在。我正在评估Apache Cassandra作为解决以下问题的数据库解决方案的潜力：客户端将是一个单独的服务器应用程序，具有对Cassandra数据库的独占访问权，该数据库位于同一数据中心。Cassandra实例可能是几个节点，但可能不超过5个。当应用程序上运行某一功能(偶尔由人触发)时，它将向Cassandra填充多达500万条表示浮点数据的短数组的记录，并删除此类记录。记录不会被更新，我们永远不需要访问数组的各个元素

浏览 6提问于2022-02-12得票数 1

1回答

Cassandra压缩失败，“无法计算直方图溢出时的最大值上限”。

cassandra

我有一个3节点ApacheCassandra3.11.3生产集群，从2019年开始运行，现在它突然开始在system.log中抛出错误，如下所示。快速的帮助和解决将不胜感激。 ERROR [CompactionExecutor:455628] 2022-10-14 05:50:14,602 CassandraDaemon.java:228 - Exception in thread Thread[CompactionExecutor:455628,1,main] java.lang.IllegalStateException: Unable to compute ceiling for ma

浏览 0提问于2022-10-14得票数 0

2回答

Datastax Cassandra中的动态列族

cassandra、datastax-enterprise、cql3、datastax-java-driver

因为有一种方法可以通过CQL 3在Cassandra中创建动态列族，即使用具有紧凑存储的复合主键。对于在动态列系列(宽行)中插入数据，这将是一种有效的方法，datastax驱动程序或Thrift的。由于我正在使用Datastax，Datastax强烈建议在新的开发中使用非紧凑表，尽管非紧凑型表在内部不太“紧凑”，那么我应该如何创建动态列族，使用紧凑存储还是没有紧凑存储。请建议一下。

浏览 3提问于2014-08-28得票数 1

回答已采纳