首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据存储学习路径推荐

我自己就是从业务自学转入数据库内核研发岗位的,根据自己的经历,简单总结了一下入门数据库相关的学习路线、学习资料、项目书籍推荐等,大家可以参考。...可以了解到数据库的基本概念,例如存储、BufferPool 管理、索引、优化器、执行器、事务、MVCC 等。...之所以推荐存储类的小项目,主要是因为存储层的 KV 一般比较好实现,同时又能够了解到一些数据库的基本设计理念。...当然如果你对某个部分特别感兴趣的话,比如优化器之类的,也可以多去了解然后自己实践,我这里推荐存储和事务的实现,是因为相对来说比较容易上手。...---- 为了帮助你更高效的学习,我还整理了一份数据库开发的学习资料,数据库的各个方面都涉及到了,例如 SQL、优化器、执行引擎、存储等等,包含一些优质的书籍、论文、视频课程、博客等,还有一些优质的教学类项目

4.2K20

微信后台基于时间的新一代海量数据存储架构的设计实践

时隔3年,微信再次分享了基于时间的新一代海量数据存储架构的设计实践(可以认为是《微信后台基于时间的海量数据冷热分级架构设计实践》一文中所述架构的升级版),希望能带给你启发。...推荐阅读:阿里团队也分享过IM基于时序的数据同步和存储方案,有兴趣可以一并阅读:《现代IM系统中聊天消息的同步和存储方案探讨》。...3、微信的数据访问模式 经过数据分析,我们发现基于时间存储一般有如下三个特点。...特点2——冷热分明: 这类基于时间存储数据的时效性往往也决定了访问频率。比如对用户进行公众号文章的推荐,用户近期的阅读记录会更加具有参考意义。...热数据层+机械盘冷数据层的分层架构方案来解决此类基于时间存储

78530
您找到你想要的搜索结果了吗?
是的
没有找到

微信后台基于时间的新一代海量数据存储架构的设计实践

时隔3年,微信再次分享了基于时间的新一代海量数据存储架构的设计实践(可以认为是《微信后台基于时间的海量数据冷热分级架构设计实践》一文中所述架构的升级版),希望能带给你启发。...推荐阅读:阿里团队也分享过IM基于时序的数据同步和存储方案,有兴趣可以一并阅读:《现代IM系统中聊天消息的同步和存储方案探讨》。...3、微信的数据访问模式 经过数据分析,我们发现基于时间存储一般有如下三个特点。...特点2——冷热分明: 这类基于时间存储数据的时效性往往也决定了访问频率。比如对用户进行公众号文章的推荐,用户近期的阅读记录会更加具有参考意义。...对于某个 container,任一时刻必须只在最多一个 containersvr 上服务。否则就有导致数据错乱的风险。类比多线程中的 data race。

1.1K20

阿里双十一购物节背后的技术问题

因为这是个烂项目,没有考虑各种高并发,海量数据,索引等技术问题。 那么,双十一那天会发生什么事情呢?2017年双十一天猫成交额1682亿,那么1682背后包含多少海量的数据,高并发查询,PV,UV等。...另一个显著的问题就是同一时间海量的数据存储,这也是一大技术难题。阿里在Mysql的基础之上,自行研发了一套SliSql,性能比Mysql提升70%。AliSQL版本在强度和广度上都经历了极大的考验。...AliSQL增加更多监控指标,并针对电商秒杀、物联网大数据压缩、金融数据安全等场景提供个性化的解决方案。 还有一个重大的技术挑战就是双十一的零点秒杀活动,这也是双十一最核心的业务。...毕竟一个不慎,双十一的活动就是一地鸡毛了。在此,小编整理了几个应对策略: 秒杀系统独立部署。为了避免秒杀活动搞垮整个淘宝网站,将秒杀系统单独部署,使用独立的域名独立的服务器,独立的数据库。...比如近几年流行的大数据,云计算,分布式数据库,搜索引擎等这些技术早就在双十一中应用了。所以为了表示对技术人员崇高的敬意,小编决定今年双十一买一千块以上的东西。哈哈,准备剁手买买买了。

8.5K30

阿里双十一购物节背后的技术问题

因为这是个烂项目,没有考虑各种高并发,海量数据,索引等技术问题。 那么,双十一那天会发生什么事情呢?2017年双十一天猫成交额1682亿,那么1682背后包含多少海量的数据,高并发查询,PV,UV等。...另一个显著的问题就是同一时间海量的数据存储,这也是一大技术难题。阿里在Mysql的基础之上,自行研发了一套SliSql,性能比Mysql提升70%。AliSQL版本在强度和广度上都经历了极大的考验。...AliSQL增加更多监控指标,并针对电商秒杀、物联网大数据压缩、金融数据安全等场景提供个性化的解决方案。 还有一个重大的技术挑战就是双十一的零点秒杀活动,这也是双十一最核心的业务。...毕竟一个不慎,双十一的活动就是一地鸡毛了。在此,小编整理了几个应对策略: 秒杀系统独立部署。为了避免秒杀活动搞垮整个淘宝网站,将秒杀系统单独部署,使用独立的域名独立的服务器,独立的数据库。...比如近几年流行的大数据,云计算,分布式数据库,搜索引擎等这些技术早就在双十一中应用了。所以为了表示对技术人员崇高的敬意,小编决定今年双十一买一千块以上的东西。哈哈,准备剁手买买买了。

8.9K30

阿里双十一购物节背后的技术问题

因为这是个烂项目,没有考虑各种高并发,海量数据,索引等技术问题。 那么,双十一那天会发生什么事情呢?2017年双十一天猫成交额1682亿,那么1682背后包含多少海量的数据,高并发查询,PV,UV等。...另一个显著的问题就是同一时间海量的数据存储,这也是一大技术难题。阿里在Mysql的基础之上,自行研发了一套SliSql,性能比Mysql提升70%。AliSQL版本在强度和广度上都经历了极大的考验。...AliSQL增加更多监控指标,并针对电商秒杀、物联网大数据压缩、金融数据安全等场景提供个性化的解决方案。 还有一个重大的技术挑战就是双十一的零点秒杀活动,这也是双十一最核心的业务。...毕竟一个不慎,双十一的活动就是一地鸡毛了。在此,小编整理了几个应对策略: 秒杀系统独立部署。为了避免秒杀活动搞垮整个淘宝网站,将秒杀系统单独部署,使用独立的域名独立的服务器,独立的数据库。...比如近几年流行的大数据,云计算,分布式数据库,搜索引擎等这些技术早就在双十一中应用了。所以为了表示对技术人员崇高的敬意,小编决定今年双十一买一千块以上的东西。哈哈,准备剁手买买买了

9.4K20

NameNode主备宕机引发的思考

大家都知道在双十一这些电商大型营销活动期间,电商网站的访问量等是平时的N倍。每当这个时候到来,无论是开发还是运维人员都严阵以待生怕服务出现问题。...很不幸,笔者的一个朋友在一家电商公司上班,在双十一时,恰恰就出现了NameNode宕机的生产事故。...问题排查的时候发现有大量的full GC日志 问题分析 NameNode的主要职责就是管理元数据,不会频繁创建和销毁对象,官方推荐1/4--1/3给年轻代,剩下的给老年代。...当然这个配比应对平时的数据量是没有问题的,但在这种大型营销活动盛行的时候,网站访问量激增带来的是数据量激增,那么NameNode需要管理的元数据也会激增,对NameNode的内存是一个很大挑战。...Namenode启动时加载元数据到堆内存,元数据一般不会改变,会一直加载到老年代,当日新增数据量特别大时,NameNode加载大量数据到老年代,然后当老年代空间不足发生full GC,日志持续剧增,导致频繁发生

57720

Hadoop调优 | NameNode主备宕机引发的思考

大家都知道在双十一这些电商大型营销活动期间,电商网站的访问量等是平时的N倍。每当这个时候到来,无论是开发还是运维人员都严阵以待生怕服务出现问题。...很不幸,笔者的一个朋友在一家电商公司上班,在双十一时,恰恰就出现了NameNode宕机的生产事故。...问题排查的时候发现有大量的full GC日志 问题分析 NameNode的主要职责就是管理元数据,不会频繁创建和销毁对象,官方推荐1/4--1/3给年轻代,剩下的给老年代。...当然这个配比应对平时的数据量是没有问题的,但在这种大型营销活动盛行的时候,网站访问量激增带来的是数据量激增,那么NameNode需要管理的元数据也会激增,对NameNode的内存是一个很大挑战。...Namenode启动时加载元数据到堆内存,元数据一般不会改变,会一直加载到老年代,当日新增数据量特别大时,NameNode加载大量数据到老年代,然后当老年代空间不足发生full GC,日志持续剧增,导致频繁发生

1.2K00

天猫双11订单峰值58.3万笔秒,消费狂欢背后隐藏了哪些技术?

2010 年前后,企业必备的 IT 基础设施是「IOE」:IBM 的小型机、Oracle 数据库及 EMC 存储设备,虽然性能稳定,但是成本非常高,且部署麻烦。...飞天的核心是 2013 年启动的大数据平台 Maxcompute,平台创新性的采用了 Datalake 技术,把不同的数据源用类似的方式存储,用统一的方法计算,提供一套标准化语言,快速实现不同类型数据的计算...如今 Maxcompute 已经可以承载 EB 级别的数据存储能力和百 PB 级的单日计算能力。 在去 IOE 和飞天的基础上,2015 年阿里对技术进行了一轮总结,提出了「中台」战略。...在 AI 技术的支撑下,购物变得更加智能,个性化推荐、用户购买行为实时分析等成为可能。...平台对用户消费行为的洞察和商品推荐也更加精准,而这背后的技术引擎是智能搜索引擎。阿里的智能搜索推荐日均模型发布 1000+,单模型容量 1TB+,模型可以即时分析,分钟级更新 1 亿参数。

8.1K10

【技术种草】双十一 !一大波建站优惠来袭,这不薅点来建站?

个人建站方案 目前,相对于个人,网站流量没那么大,不管是否是静态网站,我都推荐使用直接上服务器。 买了服务器,没有域名怎么行?所以,这里推荐买服务器的同时,趁着双十一优惠,买个域名和CDN流量包。...另外,综合看了一下: 推荐的服务(面向个人或中小团队),推荐程度: 轻量应用服务器(LH) > 云服务器(CVM) 主要原因:个人项目,流量不大,需要的计算量和资源也不多,用LH这样给定带宽、给定流量包就足够了...尤其是现在个人服务器的带宽普遍在1M-10M左右,为例降低服务器带宽压力,也推荐使用CDN(其实有点像Redis了,哈哈)。...另外,我推荐企业用户可以看看存储: [对象存储] CDN流量,1TB 99元,首单还是60元。这……建议腾讯云可以亏到坐地铁回家了。...,得京东卡: [拉新活动] 我个人推荐,先注册一个CPS推广者(传送门),之后再拉小伙伴购买,奖励叠加。

19.2K40

2020有赞双十一 | 齐心聚力,稳重带冲!

这几天下班打车,司机师傅总会留心的问一句:“双十一来了,你们挺忙的吧。” “忙是肯定的,每天都挺忙的。”不过更多人所好奇的,是作为SaaS服务公司的有赞,在双十一这一天都在“忙”些什么? ?...从设置目标阶段就开始从多个纬度思考,分析过去几年的数据流量和模型数据,推测出今年大促活动的流量,数据要足够精准,在这个基础上做一定的余量,既要能保证系统的稳定性,又不能浪费公司资源,主要围绕: 1、全链路压测...3、预案改造和监控治理:梳理在大促场景下的系统预案,共产生上千条预案,并多次演练这些预案,使得系统出现问题时能够秒级应对和处理,并且构建全方位数据监控和预警的能力,共构建了几十个业务的监控大盘,几千条监控报警规则...,使得系统透明化、可视化、可监控化,能够第一时间感知系统运行情况。...SaaS行业本没有双十一,因为商家需要做双十一,所以每年我们都会提前几个月去演练、扩容,我们的技术和服务团队也全程值班做好商家经营的保障,为商家大促保驾护航。

1.1K20

无例可循,双十一倒逼出中国互联网「三高架构」

高质高效地保障双十一大促工作的进行,涉及基础设施、存储、中间件、业务架构、交互技术与安全等多个技术领域,需要多部门紧密配合,能够集中体现一个团队的资源统筹、技术积累、工程实力和创新能力。...第二阶段:去 IOE,解决存储单点扩展和稳定性问题,流量从百万到千万 随着支付宝从单一支付工具逐渐成为一个互联网金融平台,系统支撑的流量激增,使用大量服务器支撑双十一流量洪峰构成了巨大的成本压力,以及其他很多不确定性因素...2011 年开启去 IOE 战略(不再使用 IBM 小型机、Oracle 数据库、EMC 高端存储,转向自主掌控的技术)。...也是从这一时期开始,双十一的峰值和日常业务峰值差别越来越大,因此基于 LDC 架构灵活的流量调度能力,实现了机房级别弹性扩展能力,在大促前将流量弹回到新的机房,在大促结束后快速回收该机房。...正是因为一次次双十一的倒逼创新,支付宝的实践证明在金融级中间件、数据库和云计算平台的支持下,分布式架构完全能够胜任复杂、高要求的金融级交易。

3.1K20

【一周简报】有米sdk代码窃隐私风波不断,找你妹等256个App被迫下架

有米sdk代码窃隐私风波不断,找你妹等256个App被迫下架 ---- 前段时间,诸多APP因为嵌入有米的广告sdk,涉及窃取用户隐私而被下架,曾经风行一时的找你妹等软件APP也赫然在列。...UCloud电商狂欢保障计划即将启动,为“双十一”保驾护航!...---- 作为最懂互联网的云服务商,UCloud即将在双十一前夕推出“电商狂欢保障计划”,针对电商企业双十一特殊需求,提供三大技术服务支持,并从计算、存储、网络、安全、运维五个方面保障电商IT系统拥有强健...、弹性、稳定的后台,让电商企业可以游刃有余的面对双十一的业务狂欢。...,不用考虑IT支出、系统运维、App性能、数据安全、数据挖掘等基础问题,将全部人力和精力用于产品、服务、备货、物流等核心竞争力的优化上,增强应对双十一等业务高峰的能力,为其保驾护航。

2.4K70

京东商城技术架构部 | 我为11.11保驾护航

全力保障双十一,集群平台来助力。 脚踏实地,再创佳绩。 统一调度,自由计算。 科技引领,正道成功。 ? ▲集群技术部-南京职场日常备战 ?...统筹资源,夯实基础, 全力保障双十一。...在线存储部 在电商场景下大量业务需要提供高负载、高并发能力,数据读写速度往往会成为业务并发能力瓶颈,在线存储部所提供的高速存储能力很好的解决了用户这一痛点,海量存储容量、急速读写速度,对于数据存储系统来说这些近乎苛刻的要求如今已成为在线存储部各种产品的标配...智能存储部参与前台千人千面项目,提供APP首页首焦广告图智能排版、各推荐位透底图输出等服务,保障11.11大促期间千人千面高效落地! ? 智能存储,坚如磐石, 稳如泰山,无懈可击!...知识计算部联合业务团队明确定制化的应急预案,对全链路进行多机房互备和软硬件服务扩容,同时采用全流量压测进行演练,能够确保在11.11流量洪峰下平稳运行,另外,增加了全天候人工值守+短信异常报警等监控,保证在第一时间能够发现问题

12.6K30

硝烟四起的双十一,到底谁能笑傲江湖?

马上又是一年一度的双十一! 数亿网民也许还没准备好集体狂欢,各电商巨头、数百万大中小卖家却已经枕戈待旦,磨刀霍霍,准备华丽登场。...这不2016天猫双11玩法刚刚被曝光,有人就开始对其6大亮点进行全面解读,但响铃看,无论是其明星阵容+矩阵直播,打造超级IP,还是千人千面的个性化推荐,亦或是天猫全球潮流盛典都是寄希望通过找寻新用户唤醒老用户...10月18日,苏宁易购在南京也召开“穿越双十一:城·惠·玩”发布会,宣布双十一将穿越回古代,致敬传统商业文明,穿越时空、穿越价格、穿越服务、穿越体验,这种娱乐化的方式给我们带来的会是一股清流还是泥石流暂且不知...双十一期间,苏宁金融也将顺势出击,大宴天下。极致服务,依旧是本次双十一的重要看点。侯恩龙表示,双十一期间,第五代智慧物流基地云仓一号正式启用,全国超3000家城市门店和苏宁易购直营店,支持免费自提。...二、卖家要真赚钱、持续赚 对于所有从事商业活动的卖家,他们需要的不是一时半会的狂欢,而是真正能赚到钱,并且持久得赚钱。当双11已经变成第一梯队卖家们的游戏时,我们更应该认清形势,定位好自己。

23K20

谁顶住双11的世界级流量洪峰?神龙架构负责人等9位大牛现场拆解阿里秘籍

就是阿里十年前开始做的飞天大数据平台。在双11中,阿里使用了全自研的一整套平台,平台包括超过10万台规模服务器集群,10+数据中心、10EB级别存储、每天千万级别的大数据和AI计算作业。...据统计,去年2018年双十一的时候,这样的实时推荐给商家的智能决策,90%都会被商家采用。...实时计算的系统层面,能够支持TPS、每天有超过万级别的在线实时在跑,每天处理超过10 Trillions of Records,包括实时分析、实时预警、实时搜索、在线机器学习、广告实时推荐,这些都是大数据和...另外,RDMA网络也是一个重点技术,今年像存储计算分离之后的云盘和核心数据库的核心交易量,在去年的基础上发展了3倍,所有的这一切就是阿里在数据中心网络里面做的几个比较突出的工作。...网络、服务器、存储这些基础设施多年来发生了翻天覆地的变化,微服务,容器化,数据库等一系列的底层技术和框架的持续演进,带动了电商技术今天在搜索,个性化推荐,视频互动,消息等各个应用领域支撑和连接着数亿消费者

10.6K10

Redis的雪崩,击穿,穿透详解「建议收藏」

缓存雪崩 举例 双十一期间,所有用户一打开淘宝就是进入首页,首页的压力非常大,为了提高并发,将网站首页数据都缓存到redis里,所有的redis key失效时间都是3小时。...双十一当天大量用户剁手狂欢,这时候3个小时过去了,redis里首页的key缓存全部失效,这时候redis里查询不到数据了,只能去数据库中查询,造成数据库无法响应挂掉。...一句话总结 在高并发下,大量缓存key在同一时间失效,大量请求直接落在数据库上,导致数据库宕机。 解决方案 随机设置key失效时间,避免大量key集体失效。...拉黑该IP地址 对参数进行校验,不合法参数进行拦截 布隆过滤器 将所有可能存在的数据哈希到一个足够大的bitmap(位图)中,一个一定不存在的数据会被 这个bitmap拦截掉,从而避免了对底层存储系统的查询压力...本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

36730

微博千万级规模高性能高并发的网络架构设计

像平台的业务部门,做的就是数据存储和读取,对搜索来说做的是 数据的检索,对大数据来说是做的数据的挖掘。微博其实和淘宝是很类似 华为云中国前二,全球前五,增速第一,凭什么? 微博其实和淘宝是很类似的。...举了一个例子,大家都会用电商,电商在双十一会做全国范围内的活动,他们做设计的时候也会考虑场景的,一个就是购物车,我曾经跟相关开发讨论过,购物车是在双十一之前用户的访问量非常大,就是不停地往里加商品。...随着业务的发展,除了跟时间相关的微博还有非时间的微博,就是会有广告的要求,增加一些广告,还有粉丝头条,就是拿钱买的,热门微博,都会插在其中。...分发控制,就是说和一些推荐相关的,我推荐一些相关的好友的微博,我推荐一些你可能没有读过的微博,我推荐一些其他类型的微博。...二级索引,是我们里面一个比较特殊的场景,就是我要快速找到这个人所要发布的某一时段的微博时,通过二级索引快速定位。

43510

2021年大数据Spark(三十四):Spark Streaming概述

Spark Streaming概述 在传统的数据处理过程中,我们往往先将数据存入数据库中,当需要的时候再去数据库中进行检索查询,将处理的结果返回给请求的用户;另外,MapReduce 这类大数据处理框架...Streaming 应用场景 如下的场景需求, 仅仅通过传统的批处理/离线处理/离线计算/处理历史数据是无法完成的:  1)、电商实时大屏:每年双十一时,淘宝和京东实时订单销售额和产品数量大屏展示,要求...: 数据量大,可能每秒钟上万甚至几十万订单量 快速的处理,统计出不同维度销售订单额,以供前端大屏展示 2)、商品推荐:京东和淘宝的商城在购物车、商品详情等地方都有商品推荐的模块,商品推荐的要求: 快速的处理..., 加入购物车以后就需要迅速的进行推荐 数据量大 需要使用一些推荐算法  3)、工业大数据:现在的工场中, 设备是可以联网的, 汇报自己的运行状态, 在应用层可以针对这些数据来分析运行状况和稳健程度,...模式一:原生流处理(Native) 所有输入记录会一条接一条地被处理,上面提到的 Storm 和 Flink都是采用这种方式; 绝对一次一条的模式  模式二:微批处理(Batch) 将输入的数据以某一时间间隔

93920
领券