腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Spark学习技巧

本公众号主要分享Spark使用及源码，spark 机器学习，图计算，同时会涉及到hadoop家族。

专栏作者

810

文章

1220853

阅读量

247

订阅数

分布式锁用Redis还是Zookeeper？

云数据库 Redis 分布式 node.js

系统 A 是一个电商系统，目前是一台机器部署，系统中有一个用户下订单的接口，但是用户下订单之前一定要去检查一下库存，确保库存足够了才会给用户下单。

Spark学习技巧

2022-04-18

2300

伴鱼事件分析平台设计

大数据存储分布式

在伴鱼，服务器每天收集的用户行为日志达到上亿条，我们希望能够充分利用这些日志，了解用户行为模式，回答以下问题：

Spark学习技巧

2022-03-15

4150

ElasticSearch让人叹为观止的分布式系统架构设计

node.js Elasticsearch Service 系统架构分布式存储

分布式系统类型多，涉及面非常广，不同类型的系统有不同的特点，批量计算和实时计算就差别非常大。

Spark学习技巧

2022-01-13

3100

Kafka Connect | 无缝结合Kafka构建高效ETL方案

kafka 编程算法 api 分布式 node.js

Kafka connect是Confluent公司(当时开发出Apache Kafka的核心团队成员出来创立的新公司)开发的confluent platform的核心功能。可以很简单的快速定义 connectors 将大量数据从 Kafka 移入和移出. Kafka Connect 可以摄取数据库数据或者收集应用程序的 metrics 存储到 Kafka topics，使得数据可以用于低延迟的流处理。一个导出的 job 可以将来自 Kafka topic 的数据传输到二级存储，用于系统查询或者批量进行离线分析。

Spark学习技巧

2021-08-25

1.1K0

飞天茅台超卖事故：Redis分布式锁请慎用！

分布式 lua 云数据库 Redis http

我们项目中的抢购订单采用的是分布式锁来解决的。有一次，运营做了一个飞天茅台的抢购活动，库存 100 瓶，但是却超卖了！

Spark学习技巧

2021-03-05

4010

面试必问的一致性Hash在负载均衡中的应用

缓存负载均衡负载均衡缓存分布式

一致性Hash是一种特殊的Hash算法，由于其均衡性、持久性的映射特点，被广泛的应用于负载均衡领域，如nginx和memcached都采用了一致性Hash来作为集群负载均衡的方案。

Spark学习技巧

2021-03-05

5.6K1

同样是服务注册中心，Eureka为什么比ZooKeeper优秀？

zookeeper 分布式缓存数据分析

服务注册中心，给客户端提供可供调用的服务列表，客户端在进行远程服务调用时，根据服务列表然后选择服务提供方的服务地址进行服务调用。服务注册中心在分布式系统中大量应用，是分布式系统中不可或缺的组件，例如rocketmq的name server，hdfs中的namenode，dubbo中的zk注册中心，spring cloud中的服务注册中心eureka。

Spark学习技巧

2021-03-05

1K0

简单明了！OLTP场景下的数据分布式设计原则

分布式数据库 sql 云数据库 SQL Server 数据迁移

温卫斌，就职于中国民生银行信息科技部，目前负责分布式技术平台设计与研发，主要关注分布式数据相关领域。

Spark学习技巧

2021-03-05

6750

并发减库存，怎么保证不超卖？

数据分析 java spring 云数据库 Redis 分布式

秒杀的场景有很多，比如：抢购、抢票、抢红包等等。总之，就是在极短时间内有大量的请求。

Spark学习技巧

2021-03-05

3.3K0

超卖 100 瓶茅台的事故分析

分布式 lua 云数据库 Redis http

本篇文章主要是基于我们实际项目中因为redis分布式锁造成的事故分析及解决方案。我们项目中的抢购订单采用的是分布式锁来解决的，有一次，运营做了一个飞天茅台的抢购活动，库存100瓶，但是却超卖了100瓶！要知道，这个地球上飞天茅台的稀缺性啊！！！

Spark学习技巧

2021-03-05

3450

大数据平台监控告警系统的实现

api 分布式系统架构 tornado 数据库

本次演讲将会一步步地，向大家展示我们这个系统架构。由于时间有限，我不会深入讲解技术细节（事实上我一开始做好、发给Sting的ppt有多达40页现在精简到20多页）。我希望达到的效果是－－

Spark学习技巧

2021-03-05

2K0

分布式系统浅谈

分布式 tomcat 数据分析微服务

一个tomcat打天下的时代，不能说完全淘汰了，在一个管理系统，小型项目中还经常使用，这并不过分，出于成本的考虑，这反而值得提倡。但如果要延伸到高并发场景下就必然要了解分布式系统：

Spark学习技巧

2021-03-05

6450

交互式分析领域，为何ClickHouse能够杀出重围？

分布式存储数据分析数据库 sql

导语 | 在百花齐放的交互式分析领域，ClickHouse 绝对是后起之秀，它虽然年轻，却有非常大的发展空间。本文将分享 PB 级分析型数据库 ClickHouse 的应用场景、整体架构、众多核心特性等，帮助理解 ClickHouse 如何实现极致性能的存储引擎，希望与大家一起交流。文章作者：姜国强，腾讯实时检索研发工程师。

Spark学习技巧

2020-11-09

1.5K0

利用 Kafka 设置可靠的高性能分布式消息传递基础架构

kafka 数据分析 java 分布式 apache

世界已经迈进“移动”时代，现在应用程序必须能够实时提供数据，这不仅包括数据库表中存储的重要最终结果，还包括用户使用应用程序时执行的所有操作。任何可用信息，例如，用户点击量、日志数据或传感器数据都可用于改善用户体验、生成报告、向机器学习系统提供数据，等等。现如今，开发者必须关注基于实时事件流的系统。

Spark学习技巧

2020-09-16

9850

高并发场景下锁的使用技巧

数据库 sql 分布式压力测试 java

如何确保一个方法，或者一块代码在高并发情况下，同一时间只能被一个线程执行，单体应用可以使用并发处理相关的 API 进行控制，但单体应用架构演变为分布式微服务架构后，跨进程的实例部署，显然就没办法通过应用层锁的机制来控制并发了。

Spark学习技巧

2020-09-08

6420

详解hive的join优化

编程算法缓存分布式 hive

Hive自动识别各种用例并对其进行优化。Hive 0.11改进了这些情况的优化器：

Spark学习技巧

2020-08-07

3.6K0

分库分表需要考虑的问题及方案

数据库 sql 分布式

需要特别说明的是：当同时进行垂直和水平切分时，切分策略会发生一些微妙的变化。比如：在只考虑垂直切分的时候，被划分到一起的表之间可以保持任意的关联关系，因此你可以按“功能模块”划分表格，但是一旦引入水平切分之后，表间关联关系就会受到很大的制约，通常只能允许一个主表（以该表ID进行散列的表）和其多个次表之间保留关联关系，也就是说：当同时进行垂直和水平切分时，在垂直方向上的切分将不再以“功能模块”进行划分，而是需要更加细粒度的垂直切分，而这个粒度与领域驱动设计中的“聚合”概念不谋而合，甚至可以说是完全一致，每个shard的主表正是一个聚合中的聚合根！这样切分下来你会发现数据库分被切分地过于分散了（shard的数量会比较多，但是shard里的表却不多），为了避免管理过多的数据源，充分利用每一个数据库服务器的资源，可以考虑将业务上相近，并且具有相近数据增长速率（主表数据量在同一数量级上）的两个或多个shard放到同一个数据源里，每个shard依然是独立的，它们有各自的主表，并使用各自主表ID进行散列，不同的只是它们的散列取模（即节点数量）必需是一致的.

Spark学习技巧

2019-10-11

1.5K0

终于有人把 Elasticsearch 原理讲透了！

Elasticsearch Service 分布式搜索引擎机器学习 api

搜索是现代软件必备的一项基础功能，而 Elasticsearch 就是一款功能强大的开源分布式搜索与数据分析引擎。

Spark学习技巧

2019-06-28

1.3K0

如何优雅地玩转分库分表

数据库 sql 分布式

在谈论数据库架构和数据库优化的时候，我们经常会听到“分库分表”、“分片”、“Sharding”…这样的关键词。让人感到高兴的是，这些朋友所服务的公司业务量正在（或者即将面临）高速增长，技术方面也面临着一些挑战。让人感到担忧的是，他们系统真的就需要“分库分表”了吗？“分库分表”有那么容易实践吗？为此，笔者整理了分库分表中可能遇到的一些问题，并结合以往经验介绍了对应的解决思路和建议。

Spark学习技巧

2019-05-21

7060

如何高效地玩转多级缓存

缓存 sdk ide 分布式 java

TMC，即“透明多级缓存（Transparent Multilevel Cache）”，是有赞 PaaS 团队给公司内应用提供的整体缓存解决方案。

Spark学习技巧

2019-05-17

6590

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态