1. 因为面向对象语言和关系性数据库存在阻抗不匹配(impedance mismatch),并且随着需要处理的数据量增大,文档型数据以“NoSQL”的名义获得了新生,MongoDB、RethinkDB之类的数据库在互联网行业火起来了。
2. 在大数据量和高并发的情况下,以SSTable和LSM树为核心的数据库逆袭,开始逐渐侵占以B树为核心的关系型数据库的市场,例如CockroachDB和TiDB。
3. 并发隔离等级划分地愈加细致,出现了SSI、SI等一系列等级,让开发者可以能根据应用场景选择最合适的并发隔离等级,这一点在CockroachDB特别明显。最后值得一提的是Spanner的黑科技原子钟+Truetime ,简单粗暴的从工业实践上解决了分布式系统中的时间难题。
4. Hadoop带来的OLAP观念的革新,同时使得列式存储成长起来了,Parquet和orc格式开始成为数仓的主流格式。
5. 分布式系统观念的扩展到OLTP数据库,Paxos和Raft算法解决了一致性和共识问题,使得分布式OLTP数据库生产可用了。CAP理论的成熟,虽然在实践上没啥用,但是开发者可以简单地根据应用场景不同选用不同的数据库存储和搜索数据,例如强调CP的Hbase和强调AP的Cassandra。
6. AWS Aurora为代表的云数据库的兴起,再次强调了:The log is the database。可用性程度达到一个全新的等级,数据库的异地容灾变成云数据库的标配