首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

建议程序员都读一读的31篇论文系列笔记(1~2)

本文介绍了Dynamo数据库技术的演进,从Amazon DynamoDB到Amazon DynamoDB on Demand,再到Amazon DynamoDB Local。主要内容包括:DynamoDB的架构、DynamoDB的存储模型、DynamoDB的查询引擎、DynamoDB的索引引擎、DynamoDB的缓存策略、DynamoDB的运维工具、DynamoDB的监控工具、DynamoDB的自动化运维工具、DynamoDB的定价策略、DynamoDB的实例类型、DynamoDB的访问接口、DynamoDB的客户端API、DynamoDB的Java客户端API、DynamoDB的Python客户端API、DynamoDB的C++客户端API、DynamoDB的JavaScript客户端API、DynamoDB的REST客户端API、DynamoDB的SQL接口、DynamoDB的Table API、DynamoDB的Global Secondary Index API、DynamoDB的Local Secondary Index API、DynamoDB的Stream API、DynamoDB的备份与恢复、DynamoDB的故障转移、DynamoDB的负载均衡、DynamoDB的自动化运维、DynamoDB的文档、DynamoDB的GitHub仓库、DynamoDB的官方文档、DynamoDB的在线学习资源、DynamoDB的知乎专栏、DynamoDB的YouTube频道、DynamoDB的Twitter、DynamoDB的LinkedIn、DynamoDB的Reddit、DynamoDB的Quora、DynamoDB的StackOverflow、DynamoDB的GitHub。

00

Cell | 映射单细胞的转录组向量场

本文介绍由美国马萨诸塞州怀特黑德生物医学研究所的Xiaojie Xu和Jonathan S. Weissman以及匹兹堡大学计算与系统生物学系的Jianhua Xing共同发表在Cell的研究成果:基于单细胞测序(scRNA-seq)RNA速度和代谢标记预测细胞状态。作者提出了一个分析框架dynamo (https://github.com/aristoteleo/dynamo-release),推断绝对RNA速度,重建预测细胞命运的连续向量场,利用微分几何提取潜在的规则,最终预测出最佳的重编程路径和扰动结果。进一步分析了dynamo在克服传统基于剪接的RNA速度分析的基本限制方面的能力,表明其能在代谢标记的人类造血scRNA-seq数据集上精确估计速度。此外,微分几何分析揭示了驱动早期巨核细胞出现的机制,并阐明了PU.1-GATA1电路中的不对称调节。利用最小作用路径方法,dynamo可以准确预测驱动无数造血系统的转变,并最终由计算机干扰预测基因微扰引起细胞命运的转变。综上,Dynamo有助于开展细胞状态转变的定量分析和预测。

02

Riak - 背景篇(1)

典型的现代关系数据库在某些类型的应用程序中表现平平,难以满足如今的互联网应用程序的性能和可扩展性要求。因此,需要采用不同的方法。在过去几年中,一种新的数据存储类型变得非常流行,通常称为 NoSQL,因为它可以直接解决关系数据库的一些缺陷。Riak 就是这类数据存储类型中的一种。 Riak 并不是惟一的一种 NoSQL 数据存储。另外两种较流行的数据存储是 MongoDB 和 Cassandra。尽管在许多方面十分相似,但是它们之间也存在明显的不同。例如,Riak 是一种分布式系统,而 MongoDB 是一种单独的系统数据库,也就是说,Riak 没有主节点的概念,因此在处理故障方面有更好的弹性。尽管 Cassandra 同样是基于 Amazon 的 Dynamo 描述,但是它在组织数据方面摒弃了向量时钟和相容散列等特性。Riak 的数据模型更加灵活。在 Riak 中,在第一次访问 bucket 时会动态创建这些 bucket;Cassandra 的数据模型是在 XML 文件中定义的,因此在修改它们过后需要重启整个集群。 Riak 是用 Erlang 编写的。而 MongoDB 和 Cassandra 是用通用语言(分别为 C++和 Java)编写,因此 Erlang 从一开始就支持分布式、容错应用程序,所以更加适用于开发 NoSQL 数据存储等应用程序,这些应用程序与使用 Erlang 编写的应用程序有一些共同的特征。 Riak支持Map/Reduce 作业,但是Map/Reduce 作业只能使用 Erlang 或 JavaScript 编写。

03

如何基于云计算技术进行数据管理

数据的快速增长导致用户对计算机计算能力的需求越来越高。云计算在提高普通计算机快速处理能力上起到了很大的作用。云计算能够对普通用户使用计算机的模式进行改变,从而给用户提供按需分配的存储能力、计算能力以及应用服务能力等,给用户带来更多的方便,也在很大程度上降低了用户对软件和硬件采购的费用。但是,云计算需要各种技术手段作为支持,其中包括虚拟化技术、分布式的储存方式、计算数据的管理以及数据同步运算等等。 1.云计算技术 云计算是一种基于网络的新的计算方式。云计算的核心思想可以追溯到上世纪60年代。利用云计算和计算机

05

Riak - 背景篇(2)

因为我们用的PC机器性能不一,质量参差不齐,可能每天都会有机器挂掉或者重启。我们需要保证在某个机器挂掉或者损坏时,保证工作的正常运行。 我们可能最先想到的就是,给每个节点机器加一台备用的节点。这样,在主节点宕机时,备节点就可以顶上去。但是仔细想一下,这个方案是让人不放心的。因为当一主一备中的某一台机器坏掉,另外一台就成了一个单点运行的节点。这个时候另外一个节点一旦发生错误,服务就变得不可用,数据也有可能丢失。在一个要求高可靠性的系统上,这是不可忍受的。 那么,这样,我们就再加一个呗,一主两备。或者说,我们做个集群,集群内有多台,动态选主。但是这么做,无疑增加了成本。而且如果架构设计的不好,宕机重启的工作很麻烦,而且故障排查,也很麻烦。 我们可以抛弃主备的思想,运用无主集群。而且,尽量不添加额外的备用机器。那么,我们可以考虑在现有的机器上多备份几份。一般工业界认为比较安全的备份数应该是3份。好,那么我们看看做这个备份的时候需要注意的问题。

01

【赵渝强老师】NoSQL数据库之Cassandra基础

Cassandra是一个混合型的非关系的数据库,类似于Google的BigTable。其主要功能比Dynamo (分布式的Key-Value存储系统)更丰富,但支持度却不如文档存储MongoDB(介于关系数据库和非关系数据库之间的开源产品,是非关系数据库当中功能最丰富,最像关系数据库的。支持的数据结构非常松散,是类似json的bjson格式,因此可以存储比较复杂的数据类型)。Cassandra最初由Facebook开发,后转变成了开源项目。它是一个网络社交云计算方面理想的数据库。以Amazon专有的完全分布式的Dynamo为基础,结合了Google BigTable基于列族(Column Family)的数据模型。P2P去中心化的存储。很多方面都可以称之为Dynamo 2.0。

02
领券