前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据和云计算技术周报(第56期)

大数据和云计算技术周报(第56期)

作者头像
大数据和云计算技术
发布2018-07-26 15:51:18
4840
发布2018-07-26 15:51:18
举报
文章被收录于专栏:大数据和云计算技术

写在第56期

“大数据” 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算、存储、网络都涉及,知识点广、学习难度高。

本期会给大家奉献上精彩的:HBase、Zookeeper、模型引擎、云上架构、Spark、Kafka、StreamSets、es+hadoop、Redis、RocketMQ、Tengine、MySQL。全是干货,希望大家喜欢!!!

#大数据和云计算技术社区#希望通过坚持定期分享能帮助同学在大数据学习道路上尽一份微博之力。相信长期坚持认真阅读周报的同学,在技术的道路上一定会日益精进!感谢编辑们的长期坚持!

以下是正文,限于众编辑水平有限,不保证大家都喜欢。

HBase

①随着越来越多的业务选择HBase作为存储引擎,对HBase的可用性要求也越来越高,对于HBase的运维也提出了新的挑战。目前运维集群超过30+,而且接入的业务类型繁多,对于性能要求也不完全一样,这是今年面临的问题。从15年开始,结合京东的业务情况,基于大数据平台,实现用户接入使用全流程自动化。

http://bigdata.51cto.com/art/201701/528383.htm

②本文对Meet Up交流会上滴滴团队分享的专题进行总结,主要围绕HBase特性应用与内核改进,Phoenix改进与实践,GeoMesa应用简介与展望,稳定性&容量规划四个方面进行了详解。滴滴有很多值得学习的地方,推荐一看。

http://click.aliyun.com/m/1000001132

2

MySQL

①最近复习了一下索引,找到了这篇文章,作者把索引的原理讲解的非常透彻,现在研究开源NoSQL产品的比较多,比如HBase,本质上就是在分布式文件系统上建立索引库。所以理解索引对于各种类型的数据库都很重要。

http://blog.codinglabs.org/articles/theory-of-mysql-index.html

②mysql 8.0和pg10对比

https://mp.weixin.qq.com/s/AYDaH8doa-8Y60ILzWKqNg

3

Zookeeper

本文从外围介绍一下Zookeeper是一个什么样子的服务和我们为什么需要这样一种服务

https://www.cnblogs.com/yuyijq/p/3391945.html

4

模型引擎

模型引擎是携程数据服务组对日常开发工作经验的总结和升华,从最贴近实际的场景出发,为模型上线的各环节提供便利。同时,作为一个综合性平台,模型引擎也从特征质量监控、模型调用监控等方面完善了对模型服务质量的把控。

https://mp.weixin.qq.com/s/KrXAKoDh3kohqaMAXfD1bQ

5

云上架构

云上搭建架构不单单需要考虑到性能和可用性,还有安全性、可管理性、弹性等层面都需要注意,实际工作中每一个环节都需要顾及到。

https://mp.weixin.qq.com/s/vJVq1VcoZMkRxLqhcVqjQQ

6

Spark

本文讲解了如何利用Spark框架来实现分布式学习。首先介绍了Spark与深度学习相关的几个核心概念,接着列举了几个开源的深度学习案例,这些开源案例对我们深入学习深度学习大有裨益。

https://towardsdatascience.com/deep-learning-with-apache-spark-part-1-6d397c16abd

7

Kafka

本文主要介绍了Kafka High Level Consumer、Consumer Group、Consumer Rebalance、Low Level Consumer实现的语义和适用场景。以及未来版本中对High Level Consumer的重新设计–使用Consumer Coordinator解决Split Brain和Herd等问题。

https://mp.weixin.qq.com/s/zheqluaR4IY-NVqbE3MXiQ

8

StreamSets

本篇文章Fayson主要介绍如何使用StreamSets实时采集Kafka的数据并将采集的数据写入Hive,StreamSets的流程处理如下:

https://mp.weixin.qq.com/s/xcJYxv_8ncS9lqVFlwlHkQ

9

es+hadoop

es+hadoop最佳实践,实时分析你的数据

https://www.linkedin.com/pulse/elasticsearch-hadoop-best-two-worlds-real-time-analysis-anshul-verma

10

Redis

在介绍 RDB 和 AOF 方案时,不仅介绍它的作用及操作方法,同时介绍持久化实现的一些原理细节及需要注意的问题。最后,介绍在实际使用中,持久化方案的选择,以及经常遇到的问题等。

https://mp.weixin.qq.com/s/ad7DwTPGpACJ34pmP1y_mQ

11

RocketMQ

消息队列之 RocketMQ,从原理到实践,让你对消息队列有不一样的认识

https://mp.weixin.qq.com/s/hSidgPDbIB4hvVq5Pvlvtw

12

Tengine

Tengine是由淘宝网发起的Web服务器项目。它在Nginx的基础上提供了更加强大的支持,相信会有更好的发展

https://mp.weixin.qq.com/s/CaV0RmhEM3aMvo6a_btOYw

致谢:

周蓬勃、王在道、孙亚飞、冯艺帆、陈少军、邓开表、张少华、薛述强、刘彬、刘超、廖程鹏、董言、吕西金、朱洁、蓝随、黄文辉、郭飞、魏宏斌

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-06-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据和云计算技术 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云数据库 HBase
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档