首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    HBase使用HashTable/SyncTable工具同步集群数据

    复制(在上一篇博客文章中介绍)已经发布了一段时间,并且是Apache HBase最常用的功能之一。使集群与不同的对等方复制数据是非常常见的部署,无论是作为DR策略还是简单地作为在生产/临时/开发环境之间复制数据的无缝方式。尽管这是使不同的HBase数据库在亚秒级延迟内保持同步的有效方法,但是复制仅对启用该功能后所摄取的数据进行操作。这意味着复制部署中涉及的所有集群上的所有现有数据仍将需要以其他某种方式在同级之间进行复制。有很多工具可用于同步不同对等集群上的现有数据。Snapshots、BulkLoad、CopyTable是此类工具的知名示例,以前的Cloudera博客文章中都提到了这些示例。HashTable/SyncTable,详细介绍了它的一些内部实现逻辑,使用它的利弊以及如何与上述其他数据复制技术进行比较。

    01

    Nat. Methods | MARS: 跨异构单细胞实验发现新型细胞类型

    今天给大家介绍由美国斯坦福大学计算机科学系Jure Leskoveck课题组在《Nature methods》上发表了一篇名为“MARS: discovering novel cell types across heterogeneous single-cell experiments”的文章。文中提出了用于识别和注释已知的以及新的细胞类型的元学习方法MARS,MARS通过跨多个数据集传输潜在细胞表示,克服了细胞类型的异质性。使用深度学习来学习细胞嵌入功能以及细胞嵌入空间中的一组地标。该方法具有发现以前从未见过的细胞类型并注释尚未注释的实验的独特能力。将MARS应用于大型小鼠细胞图集,并展示了其准确识别以前从未见过的细胞类型的能力。此外,MARS通过概率性地在嵌入空间中定义细胞类型,自动为新的细胞类型生成可解释的名称。

    05
    领券