腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
大
容量
倾斜
数据
集
上
的
Hive
排序
操作
、
、
、
、
我正在Hortonworks 2.6.5
上
处理一个大小约为3TB
的
大型
数据
集
,该
数据
集
的
布局非常简单。Id1)对于每个仓库
的
上述
数据
集
,我们有事务日期列(trans_dt)
的
事务<em
浏览 18
提问于2019-08-01
得票数 2
1
回答
星火窗口函数与OrderBy之间
的
差异
、
、
、
我有一个代码,他
的
目标是从1.5B记录中获得10米最古老
的
记录。我不明白窗口解决方案是如何工作
的
?在单个执行者开始运行之前
浏览 3
提问于2022-04-26
得票数 5
1
回答
如何编写用于蜂巢查询
的
mapreduce代码
、
、
对于1GB
的
数据
,它需要近10分钟。 组合器和洗牌在内部是如何工作
的
?
浏览 8
提问于2014-05-26
得票数 2
1
回答
蜂窝分区到火花分区
、
出于效率
的
原因,我们需要处理一个
大
的
数据
集
。
数据
源驻留在
Hive
中,但具有不同
的
分区条件。换句话说,我们需要从蜂巢检索
数据
到火花,并在星火中重新分区。但是在Spark中有一个,当
数据
被持久化时,它会导致重新
排序
/重新分配分区(无论是对parquet还是ORC)。因此,我们在星火中
的
新分区丢失了。作为一种选择,我们正在考虑在一个新
的
Hive</em
浏览 0
提问于2018-07-30
得票数 0
2
回答
Apache使用
的
默认MapReduce连接是什么?
、
、
、
由
Hive
实现
的
默认MapReduce连接算法是什么?它是地图端
的
连接,缩减,广播-连接等吗? 它没有在原始文件中指定,也没有在联接上
的
Hive
wiki中指定:
浏览 4
提问于2013-10-20
得票数 3
回答已采纳
1
回答
为什么‘散列连接’或‘循环连接’改进这个存储
的
proc?
、
、
、
、
我有一个基本
的
查询,从6秒到1秒,只需将一个连接从LEFT JOIN更改为LEFT HASH JOIN或“左循环连接”即可。有人能解释为什么这会导致性能
的
大幅度提高,以及为什么SQL
的
优化器没有自己解决这个问题吗?SELECT表A和表B在所有ID字段
上
都有数百万条记录和索引。使用Server 2005。编辑:A学院建议左循环连接,它似乎使它更快.SQL不是我
的
强项之一,所以我试图了
浏览 5
提问于2009-09-08
得票数 7
回答已采纳
1
回答
B+树中
的
批量删除
、
然而,我想知道是否有某种方法可以在至少O(nlogn)时间内删除树中
的
大量元素。 如果它们在链表中碰巧是连续
的
,是否可以同时删除树
的
批量元素?
浏览 1
提问于2016-05-12
得票数 1
8
回答
蜂群按vs顺序按vs
排序
、
、
据我所知; 那么,我
的
问题是,集群是否保证了全球秩序?按相同
的
键分配到相同
的
减速器中,但是相邻
的
键怎么办?我能在这上面找到
的
唯一文档是,从示例看,它似乎是在全球范围内订购它们。但从定义
上
看,我觉得它并不总是那么做。
浏览 7
提问于2012-12-05
得票数 66
回答已采纳
2
回答
BCP在插入时是否保持顺序
、
如果我对BCP执行queryout,那么当我使用bcp插入到一个新表时,顺序是否保持不变?
浏览 0
提问于2012-06-01
得票数 0
1
回答
是否有任何方法可以使用
大
容量
节点中
的
redis客户端更新
排序
集
?
、
、
、
我希望在节点js中使用Redis客户端更新
排序
集
记录。为了更新我使用client.zAdd(key,{score:score, value:memberId})
的
一条记录。是否有任何命令或函数可以用于Redis中
的
大
容量
更新。我在谷歌
上
搜索,但没有得到任何解决方案。 提前谢谢你。
浏览 4
提问于2022-09-05
得票数 -1
3
回答
使用Hadoop处理两个
数据
集
我正在使用Hadoop,并尝试使用两个
数据
集
创建一些交互功能,这是最好
的
方案。我可以将一个加载到内存中,然后在map函数中与其他
数据
集
交叉,但是如果dataset对于RAM内存来说太大,它不是一个解决方案,您有什么想法?谢谢你
的
回答,我将试用这些,看看什么是最好
的
解决方案。
浏览 5
提问于2013-04-25
得票数 0
回答已采纳
2
回答
在SQL Server 2016中以保证顺序从一个或多个表中批量获取行
、
、
、
、
我正在用java创建一个批量加载实用程序,它将从源
数据
库中读取表中
的
行,并在目标
数据
库中填充
数据
,因为目标
数据
库为空。假设在这个批量实用程序执行过程中没有插入具有过去日期(created_date)
的
记录,则一切正常。 SELECT * FROM dbo.根据SQL-Server
的
要求,如果不指定显式order by子句,则不能保证顺序。所以我不能删除order by,但是由于created_date不在所有的表中,所以这个查询将失败。有没有一个通用
的
浏览 1
提问于2018-10-18
得票数 0
1
回答
弹性搜索巢插入
数据
的
性能问题
、
、
我们在应用程序中使用Elastic客户端,我们对将文档插入弹性搜索
数据
库进行了负载测试,发现存在性能问题。这是预期
的
结果吗?测试用例客户端机器:16 64内存,64位
操作
系统,英特尔核心i7,Windows
浏览 3
提问于2016-12-16
得票数 0
回答已采纳
4
回答
跟踪SSIS包中
的
数据
加载性能问题
、
、
有什么方法可以确定影响SSIS包加载性能
的
数据
库差异是什么?我有一个包,它可以在大约5分钟内加载和处理我笔记本电脑
数据
库
上
的
大约100k条记录 在测试服务器
上
尝试相同
的
包和相同
的
数据
,这在CPU和内存方面都是合理
的
,并且它仍然在运行……到目前为止大约1个小时:-(用一小部分
数据
检查了包,它运行通过Ok
浏览 3
提问于2009-07-07
得票数 0
回答已采纳
3
回答
您没有使用
大
容量
加载语句错误
的
权限。
、
我知道这个错误: 我正在使用。也许我没有使用我认为是的Server版本,因为设置用户权限
的
编程方法都没有起作用。我认为我正在使用Server 2012。我
的
计算机上可能有几个版本
的
SQL server。单击Help > About,它将显示各种组件
的
版本信息上方
的
浏览 4
提问于2015-09-05
得票数 24
回答已采纳
1
回答
在以下情况下是否需要表锁来维护
数据
完整性
、
、
、
在MySQL中,我有一个由嵌套
集
表示
的
树。对嵌套集合
的
操作
需要修改表中
的
多行。例如,将节点添加到树中将需要重新
排序
右侧和左侧
的
值……我担心,因为有两个单独
的
UPDATE语句,在
大
容量
环境中这可能会导致问题……我是否也应该锁定表,以确保这两个UPDATE语句之间没有任何变化?
浏览 2
提问于2011-03-27
得票数 4
回答已采纳
1
回答
Server存储重音字符
、
、
文本文件通过大
容量
插入加载,稍后通过Select语句解压缩。在谷歌搜索
的
基础
上
,我认为下面的细节可能是有用
的
:如何修改
数据
库/表/列以保存
数据
我以为这是一个常见
的
问题,但谷歌并没有给我一个明确
的
答案或指示。有人说NVARCHAR已经足够了。其他参考N',使用选择中<em
浏览 1
提问于2022-04-20
得票数 0
1
回答
使用多线程SqlBulkCopy插入
数据
时是否应该使用表锁
、
我使用并行线程中
的
SqlBulkCopy将
数据
插入到表中。互联网上
的
各种链接都说,TableLock是使用SqlBulkCopy
的
好选择。
数据
是巨大
的
和连续
的
。RowLock在多线程方面是否提供了更好
的
性能?如果启用了表锁,那么一个线程完成插入所需
的
时间将导致等待其他线程等待,而行锁定不应对插入产生任何影响,我对此感到困惑。
浏览 1
提问于2012-07-11
得票数 2
3
回答
一旦字典
的
容量
已知为固定大小,是否有办法修剪它
的
容量
?
、
、
、
、
在阅读了这个问题中公认
的
答案之后: 我决定将我
的
初始
容量
设置为一个
大
的
猜测,然后在我阅读了所有的值之后,将其修剪。我该怎么做?也就是说,我如何修剪字典,以便gc稍后会收集未使用
的
空间?我
的
目标是优化。我经常有较大
的
数据
集
,小
数据
集
的
时间限制是可以接受
的
。我希望避免重新分配和复制包含在大型
数据
集
上</e
浏览 0
提问于2014-03-15
得票数 5
回答已采纳
1
回答
差分备份调度
的
优化方法
、
、
我正在使用SQL Server 2012
的
数据
仓库,我想知道什么是备份/还原策略中最优化、最自动化
的
过程。目前
的
意见和限制:2)目前
的
计划是每周进行全面备份,每天进行差异备份。我不确定什么时候会发生DML
操作
,因为它取决于我
的
应用程序
的
使用,但是是否有一种方法只跟踪
数据</e
浏览 0
提问于2014-08-18
得票数 4
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Hive|如何避免数据倾斜
Zzreal的大数据笔记-HiveDay10
hive基础指南
Spark之数据倾斜
【大数据】Hive 小文件治理和 HDFS 数据平衡讲解
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券