前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据与云计算技术周报(第140期)

大数据与云计算技术周报(第140期)

作者头像
大数据和云计算技术
发布2020-02-19 11:21:23
5410
发布2020-02-19 11:21:23
举报

导语

“大数据” 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算、存储、网络都涉及,知识点广、学习难度高。 本期会给大家奉献上精彩的:Elasticsearch、Kafka、cassandra、MongoDB、spark、Hbase、OLAP。全是干货,希望大家喜欢!!!

1Elasticsearch

本文主结合作者近千万级开发实战经验,和大家一起深入探讨一下Elasticsearch 索引设计,历时两周+的时间完成此文,干货满满,避免大家掉坑。

https://mp.weixin.qq.com/s/KQQJfKCOuqadTujbLNu5aA

2Kafka

Kafka性能和吞吐都很高,通过sendfile和pagecache来实现zero copy机制,顺序读写的特性使得用普通磁盘就可以做到很大的吞吐,相对来说性价比比较高。

https://mp.weixin.qq.com/s/p9w0mA4XgPCF2_ytrdea5g

3cassandra

详解cassandra数据库

https://mp.weixin.qq.com/s/5q-aKUTSZvl3fFCuV1sUAQ

4MongoDB

本文讲述了使用Tapdata的数据同步工具将多个数据源实时抽取到MongoDB后,发现从源端mongo到目标端mongodb的数据迁移后不一致问题,并通过比对数据,检查数据同步日志,检查mongodb日志,发现了recvChunk和moveChunk日志,最后在各个分片节点上执行脚本解决不一致问题。

https://mp.weixin.qq.com/s/VTt3SQt2OvsL4sh_OmwKNA

5Elasticsearch

今天给大家分享"腾讯万亿级 Elasticsearch 技术解密"。

https://mp.weixin.qq.com/s/JOkfa9eQfxkINWqxTHug-Q

6大数据

hbase:meta表相关详细介绍

https://mp.weixin.qq.com/s/5WLiqpoGgv-TibW3xR4Btg

7Hbase

hbase同步elasticsearch

https://esdoc.bbossgroups.com/#/hbase-elasticsearch

8Kafka

本文从实例和源码的角度分析了 Kafka 生产者原理及使用?

https://mp.weixin.qq.com/s/iIEFLlwbrVNp8rD25yUQAQ

9OLAP

OLAP 是大数据分析应用非常重要的组成部分。这篇文章是介绍 OLAP 任务在并发/分布式环境下执行和调度的算法和模型的。我们将从最简单的 Volcano 模型开始讲起,逐步引出分布式环境下执行 OLAP 查询操作的一些挑战和经典的解决方案。

https://mp.weixin.qq.com/s/9OGd5OnVGFUymCC-f-DR-Q

10Pandas

Pandas 是基于 NumPy 的一种数据处理工具,该工具为了解决数据分析任务而创建。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的函数和方法。这些练习着重DataFrame和Series对象的基本操作,包括数据的索引、分组、统计和清洗。

https://mp.weixin.qq.com/s/39yPBJ7DWSMs_aIxtlpXCw

11开心一刻

世界上最遥远的距离不是生与死,而是你亲手制造的BUG就在你眼前,你却怎么都找不到她。

致谢:

周蓬勃、王在道、孙亚飞、冯艺帆、陈少军、邓开表、张少华、薛述强、刘彬、刘超、廖程鹏、董言、吕西金、朱洁、蓝随、黄文辉、郭飞

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-02-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据和云计算技术 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Pandas 是基于 NumPy 的一种数据处理工具,该工具为了解决数据分析任务而创建。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的函数和方法。这些练习着重DataFrame和Series对象的基本操作,包括数据的索引、分组、统计和清洗。
相关产品与服务
Elasticsearch Service
腾讯云 Elasticsearch Service(ES)是云端全托管海量数据检索分析服务,拥有高性能自研内核,集成X-Pack。ES 支持通过自治索引、存算分离、集群巡检等特性轻松管理集群,也支持免运维、自动弹性、按需使用的 Serverless 模式。使用 ES 您可以高效构建信息检索、日志分析、运维监控等服务,它独特的向量检索还可助您构建基于语义、图像的AI深度应用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档