腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如
何为
分区
列
的
不同
值
选择
RDBMS
数据
sql
、
oracle
、
select
、
database-partitioning
TABLE_DATE" DATE, ) PARTITION BY RANGE ("TABLE_DATE") 我猜这个表有按TABLE_DATE
列
分区
的
数据
如何在WHERE子句中使用此
分区
列
更快地从该表中提取
数据
,
如
...
浏览 18
提问于2019-05-07
得票数 0
3
回答
如何轻松地将
RDBMS
数据
导入配置单元
分区
表
hive
、
sqoop
我
的
RDBMS
中有表。现在,我
选择
了该表
的
第3
列
作为我
的
HIVE表
的
分区
列
。 现在,我如何轻松地将我
的
RDBMS
表
的
数据
导入HIVE表(考虑
分区
列
)?
浏览 0
提问于2015-03-13
得票数 0
1
回答
如果
列
的
数据
类型是:partitionColumn,有没有办法在Spark-JDBC
的
“option(”partitionColumn“,”colname“)”中定义“partitionColumn”?
apache-spark
、
apache-spark-sql
、
rdbms
、
spark-jdbc
我正在尝试将
数据
从
RDBMS
加载到HDFS上
的
hive表。现在可以
选择
提供
分区
列
、下界和上界,如下所示: .format("jdbc") .optionnumeric
数据
类型
的
情况下才有效。在我正在读取
的
表中,它是基于
列
location进行
分区
<e
浏览 1
提问于2018-09-27
得票数 0
1
回答
大型
数据
库如何处理新用户?
performance
、
database-design
我
的
问题是
数据
库设计。如
何为
具有大量行数
的
DBs设计模式?例如,访问日志:您可以创建一个表访问(日期、用户、端点),但是对于拥有大量用户
的
系统,这会导致一个表
的
行数很快就无法使用。作为解决方案,我
的
想法是为每个新用户创建一组表:在我们
的
模型中,只有access_user_1001(.)。这将随着用户数量
的
增加而横向扩展。 这种方法到底是被使用
的
,还是只处理巨大
的
表更好呢?
浏览 0
提问于2020-06-13
得票数 -2
回答已采纳
1
回答
Cassandra与
RDBMS
:聚类
列
cassandra
、
cql
Cassandra主键由
分区
键和聚集
列
组成。
分区
键指示
数据
所在
的
节点,而聚集键决定磁盘上
的
顺序。如果我们没有按正确
的
顺序提供聚类
列
,许多read查询或order BY子句就不能工作。
分区
键
的
作用是明确
的
。如果没有它,所有节点都将被检查,从而影响性能。但是,一旦我们使用
分区
键确定了节点,问题就会减少到像在传统
RDBMS
中那样查找记录,不是吗?那么,为什么Cassan
浏览 18
提问于2021-07-28
得票数 1
回答已采纳
1
回答
按日期分割跟踪表是否有缺点?
mysql
、
database-design
、
sharding
我们有一个mysql跟踪
数据
库,它有大约1亿行。我们通常每天为特定
的
操作、唯一
的
访问等运行查询组。问题是,由于索引之间
的
相互作用,查询生成月度报告
的
速度越来越慢(我们对日期进行范围扫描,然后基于多个其他字段进行查询)。 快速插入--每天桌子都是新
的
浏览 2
提问于2014-09-07
得票数 7
回答已采纳
1
回答
Spark:仅
选择
特定
分区
apache-spark
、
apache-spark-sql
、
spark-dataframe
、
apache-spark-dataset
我在我
的
RDBMS
数据
库中有一个巨大
的
表,其中包含
不同
帐户类型
的
记录。我将此
数据
加载到spark中一次,并将根据帐户类型对该表进行多次循环,以生成一些报告。我已经在这个表上创建了一个临时
的
全局视图。df.createOrReplaceGlobalTempView("account_tbl") 现在,我想根据account_type
列
将此视图划分为多个
分区
,其中
数据
被划分为多个块,
浏览 0
提问于2018-03-24
得票数 2
1
回答
从1000+ DB集中数百万条记录
.net
、
database
、
postgresql
、
synchronization
、
bigdata
我们有1500+本地服务器,在这里我们使用PostgreSQL DB存储一些销售事务
数据
。每台本地服务器每天都会添加关于200+记录
的
内容,因此大约有300.000条每日记录(从上午8点到晚上10点)。 我们需要存储每笔交易至少18个月,这意味着
数据
可以达到167.000.000条记录。在每个本地服务器中,我都会创建一个新表,它只保存对新创建
的
事务ID
的
引用。我将使用这个额外
的
表来查找每次都需要同步
的
最新事务。完成同步后,我将删除引用,等待新引用
的
出现
浏览 1
提问于2022-09-01
得票数 0
1
回答
Impala如何支持
分区
?
hive
、
impala
Impala如何支持
分区
的
概念,如果它支持它,Hive
分区
和Impala
分区
之间有什么区别?
浏览 2
提问于2014-10-21
得票数 1
2
回答
如何在
RDBMS
中存储表格
数据
?
database-design
、
database-agnostic
如果我想在
数据
库中存储任意大
的
表,应该如何设置
数据
库表?表有任意数量
的
列
和行(
列
约为1-10 k,行约为0-10 m)。表有一个名称
列
总是具有相同
的
数据
类型。我想存储
的
"Bob the Table" | "Name&q
浏览 0
提问于2013-05-28
得票数 0
2
回答
RDBMS
缓存与磁盘I/O --供应商间
的
比较
sql
、
database
、
relational-database
、
rdbms
我对领先
的
RDBMS
如何检索
数据
知之甚少。因此,这些问题似乎有些不成熟: 当
不同
进程对某些缓存
数
浏览 1
提问于2012-11-21
得票数 1
回答已采纳
1
回答
我想使用sqoop导入作业将
数据
sqoop到配置单元
列
分区
表中。我们该怎么做呢?
hadoop
、
hive
、
hdfs
、
sqoop
、
partitioning
我有一个按country
列
分区
的
hive表。我
的
RDBMS
列
如下:fields terminated by ','在hdfs文
浏览 5
提问于2017-08-26
得票数 0
1
回答
高图表中非分组
列
的
排序
highcharts
是否有一种方式来排序列显示,以强制使用最小
值
的
列
向前(较高
的
z-索引)?我已经搜索过,但找不到多少信息。
浏览 2
提问于2016-06-22
得票数 1
1
回答
从spark中
的
sql server并行读取
sql-server
、
apache-spark
、
jdbc
我正在使用com.microsoft.sqlserver.jdbc.SQLServerDriver在spark作业中从sql server读取
数据
。为了提高性能,需要并行读取
数据
。spark job建立
的
连接数是否等于spark-submit命令中
的
核心数?
浏览 0
提问于2019-06-28
得票数 1
1
回答
如何通过python匹配DynamoDB表中
的
文本(寻找类似regex
的
内容)?
python
、
amazon-dynamodb
、
dynamodb-queries
response = ddb.get_item(Key={}据我所知,上述代码将从
列
中包含'a‘
的
表中返回项但是,我希望以这样
的
方式进行查询,即如果
列
包含"I‘m good“,而我
的
搜索字符串是" am ",则应该能够匹配表中包含
的
文本中
的
" am”,并检索包含
浏览 11
提问于2022-10-07
得票数 -1
2
回答
有效地让partitionBy写入与原始表相同
的
总
分区
数。
apache-spark
、
pyspark
我被要求把它作为一个单独
的
问题发出来,所以这里是: 据我所知,df.partitionBy(COL)将把带有COL
值
的
所有行写入自己
的
文件夹,并且每个文件夹(假设行以前通过其他键分布在所有
分区
中)
的
文件数量与整个表中
的
大致相同如果我有一个包含500个
分区
的
大表,并且对一些属性
列
使用partitionBy(COL),那么我现在有100个文件夹,每个文件夹都包含500个文件(现在非常小)。作为演示,前面的问题共享一个玩具
浏览 0
提问于2018-06-09
得票数 38
回答已采纳
2
回答
为什么Cassandra不被认为是关系
数据
库?
relational-theory
、
nosql
、
rdbms
、
cassandra
读这个回答卡桑德拉有桌子。movies ( title TEXT, release_yea
浏览 0
提问于2020-12-04
得票数 5
回答已采纳
3
回答
Cassandra
数据
库设计
nosql
、
schema
、
cassandra
我来自
RDBMS
背景,设计了一个以Cassandra为后端
的
应用程序,我不确定我
的
设计
的
有效性和可扩展性。由于Cassandra具有灵活
列
族(稀疏结构)
的
概念,因此我考虑使用以下模式:如果我这样做,我最终将拥有数百万
列
(在
RDBMS
中可能是行),尽管本质上与行键没有关联,例如: u
浏览 1
提问于2012-09-13
得票数 3
回答已采纳
1
回答
如何在documentDb中找到
分区
密钥
的
有效性?
azure
、
azure-cosmosdb
、
nosql
为了在documentDb中获得最佳性能,我们必须为
分区
密钥
选择
正确
的
密钥。假设我们确实
选择
了一个键作为
分区
键(在我们有任何
数据
之前,并有了一些未来
的
想法)。与
数据
一样,一旦
数据
在documentDb中积累,尽管我们
的
最佳意图,我们
的
分区
键可能是最优
的
,也可能不是最优
的
。在documentDb中是否有任何逻辑可以让我们清楚地看到当前
的</
浏览 3
提问于2017-02-28
得票数 0
3
回答
sql中
的
表分布和表
分区
有什么区别?
sql
、
database
、
azure-sql-database
、
partitioning
、
azure-sqldw
我仍然在努力识别azure sql
数据
仓库中
的
表分布概念与Sql server中
的
表
分区
概念有何
不同
? 对两者
的
定义似乎都取得了相同
的
结果。
浏览 1
提问于2018-08-04
得票数 5
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Sqoop使用实例讲解
MySQL 分区和分表总结
超级实用的 MySQL 常用优化指南!
mysql分区
MySQL 学习笔记(一)
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券