前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据和云计算技术周报(第112期)

大数据和云计算技术周报(第112期)

作者头像
大数据和云计算技术
发布2019-07-23 10:45:20
7320
发布2019-07-23 10:45:20
举报
文章被收录于专栏:大数据和云计算技术

导语

“大数据” 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算、存储、网络都涉及,知识点广、学习难度高。 本期会给大家奉献上精彩的:HBase、AI、MongoDB、实时计算、Spark、redis、Kylin、Brooklin、HBase。全是干货,希望大家喜欢!!!

1ClickHouse

ClickHouse 优秀的读写处理性能,丰富强大的函数支持,以及灵活的 SQL 查询,支撑了微博广告监控系统的百亿流量请求和复杂业务需求。

https://mp.weixin.qq.com/s/lx5BaREb0uVXwzTWJdWrcg

2实时计算

“数据智能” (Data Intelligence) 有一个必须且基础的环节,就是数据仓库的建设,同时,数据仓库也是公司数据发展到一定规模后必然会提供的一种基础服务。从智能商业的角度来讲,数据的结果代表了用户的反馈,获取结果的及时性就显得尤为重要,快速的获取数据反馈能够帮助公司更快的做出决策,更好的进行产品迭代,实时数仓在这一过程中起到了不可替代的作用。

本文主要讲述知乎的实时数仓实践以及架构的演进.

https://mp.weixin.qq.com/s/e8lsGyl8oVtfg6HhXyIe4A

3HBase

本文讲解了京东7000+节点HBase集群平台化的演进之路。

https://mp.weixin.qq.com/s/5WaeCXk0BILC7iJ3Q44bmw

本文主要讲解了通过hash或md5对HBase RK进行散列化处理时如何预建分区的方法,并提供了创建split计算器,用于从抽样数据中生成一个比较合适的splitKeys用于创建预分区,可以直接拿来用的。

https://blog.csdn.net/liyonghui123/article/details/84701105?from=timeline

4Spark

本文将探讨我们在计算平台上的选型,为什么选择基于Spark构建计算平台,我们是如何使用Spark的,以及基于此又做了什么更多的工作。

巨人的肩膀,站的更远 https://mp.weixin.qq.com/s/N4iLpQEsXuD0uVtmB6XQlw

5MongoDB

本文讲述了MongoDB的compact命令的作用,对读写操作的影响,以及WiredTiger存储引擎如何执行compact,预估compact回收空间;

http://www.mongoing.com/archives/26907

6Kylin

海量数据下的用户访问行为分析一直是一大难题,满帮集团作为全国最大的车货匹配信息平台,每天会产生近十亿的流量数据,半年即达千亿级数据规模,如何做到快速地响应业务方的多维查询、自定义漏斗分析、留存分析、用户画像等流量分析需求。

https://mp.weixin.qq.com/s/77fveA9q_AQWBYYxpdpgYg

7Brooklin

Brooklin 是一种近实时的大规模数据流分布式服务,LinkedIn 自 2016 年以来一直在使用这项服务,支撑每天数千个数据流和超过 2 万亿条消息。近日,LinkedIn 正式宣布开源 Brooklin!

https://mp.weixin.qq.com/s/JC7BFW7rA1azHOs-zqjrpQ

8AI

本文将介绍腾讯 AI Lab & Robotics X 主任张正友博士在 CCF-GAIR 2019 大会上所做的报告,讲述计算机视觉研究的历史和未来。

https://mp.weixin.qq.com/s/ZKmB27qdjyIsvdT9x7UDOg

9Redis

十二张图详解Redis的数据结构和对象系统

https://mp.weixin.qq.com/s/HgwmTlmV_d2dOmAl-fYzkQ

10开心一刻

我很奇怪客栈这个词,难道后入住的必须先退房吗?

致谢:

周蓬勃、王在道、孙亚飞、冯艺帆、陈少军、邓开表、张少华、薛述强、刘彬、刘超、廖程鹏、董言、吕西金、朱洁、蓝随、黄文辉、郭飞

猜你喜欢

#大数据和云计算机技术社区#博客精选(2017)

NoSQL 还是 SQL ?这一篇讲清楚

阿里的OceanBase解密

#大数据和云计算技术#: "四有"社区介绍

大数据和云计算技术周报(第56期)

新数仓系列:Hbase周边生态梳理(1)

《大数据架构详解》第2次修订说明

简单梳理跨数据中心数据库

云观察系列:漫谈运营商公有云发展史

云观察系列:百度云的一波三折

云观察系列:阿里云战略观察

超融合方案分析系列(7)思科超融合方案分析

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-07-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据和云计算技术 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
TDSQL MySQL 版
TDSQL MySQL 版(TDSQL for MySQL)是腾讯打造的一款分布式数据库产品,具备强一致高可用、全球部署架构、分布式水平扩展、高性能、企业级安全等特性,同时提供智能 DBA、自动化运营、监控告警等配套设施,为客户提供完整的分布式数据库解决方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档