大数据” 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算、存储、网络都涉及,知识点广、学习难度高。
本期会给大家奉献上精彩的:数据分析预测、数据库设计、Elasticsearch、流架构、分布式锁 、Kylin 、flink、Redis、神经网络、数据安全。全是干货,希望大家喜欢!!!
#大数据和云计算技术社区#希望通过坚持定期分享能帮助同学在大数据学习道路上尽一份微博之力。相信长期坚持认真阅读周报的同学,在技术的道路上一定会日益精进!感谢编辑们的长期坚持!
以下是正文,限于众编辑水平有限,不保证大家都喜欢。
1
数据分析预测
一个全世界最大的数据分析预测工具,去做数据分析和数据采集,采集网页并分析词和权重,最后做分析预测,预测它的每一次的排序展示是否符合用户当下的预期。
2
数据库设计
饿了么实战数据库设计,值得一看
3
Elasticsearch
Elasticsearch(ES)作为NOSQL+搜索引擎的有机结合体,不仅有近实时的查询能力,还具有强大的聚合分析能力。那么,我们如何调优呢
4
流架构
评估好哪一种流架构模式最适合你的业务场景,是大数据开发的先决条件。
大数据时代的的信息量都是爆发式的膨胀,对数据和信息的处理速度和时效要求也越来越高。传统的方式都是在后台系统每天作一次全量处理,目前的要求都需要实时作处理。Apache Hadoop 生态系统已成为企业实时地处理和挖掘大数据的首选。Apache的Kafka, Flume, Spark, Storm等技术在不断地推进新的可能。
5
分布式锁
什么是分布式锁?以漫画的方式进行讲解,形象生动,值得大家看一看
6
Kylin
在Apache Kylin的实际部署中,有时SQL查询并不能如预期在很短的时间内完成,这就需要开发人员有针对性地进行分析和优化。本文将分阶段为大家解析应如何分析和优化Apache Kylin的查询性能。
7
flink
本文主要是讲述flink与kafka结合。并对比Spark Streaming与kafka的结合。
8
Redis
本文主要描述的是对“高可用”Redis服务 的总结和思考。
9
神经网络
这篇文章详细的介绍了循环神经网络的概念和原理,rnn和cnn的联合使用,最后还给出了应用实例
10
数据安全
近年来,数据安全形势越发严峻,各种数据安全事件层出不穷。在当前形势下,互联网公司也基本达成了一个共识:虽然无法完全阻止攻击,但底线是敏感数据不能泄漏。也即是说,服务器可以被挂马,但敏感数据不能被拖走。服务器对于互联网公司来说,是可以接受的损失,但敏感数据泄漏,则会对公司产生重大声誉、经济影响。本文讲解如何根据自身特点,来进行数据安全保障
致谢:
周蓬勃、王在道、孙亚飞、冯艺帆、陈少军、邓开表、张少华、薛述强、刘彬、刘超、廖程鹏、董言、吕西金、朱洁、蓝随、黄文辉、郭飞、