首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

使用 NoSQL 数据库分析大规模数

本文转自IBM的developerWorks,主题是关于使用NoSQL存储和处理大规模数据,文章列举了一些循序渐进的学习资料,包括了视频音频和文字材料,是一个很不错的了解、学习NoSQL的知识向导。...本学习路线图向 Java 开发人员介绍了 NoSQL 技术,以及 Apache Hadoop MapReduce 技术在处理大规模数据方面的优势。 1....NoSQL 入门 NoSQL 数据库被更多的人所关注是因为它在解决大规模数据的可扩展性上有它独到的解决方案。...阅读: Java 开发 2.0: NoSQL 2. 流行 NoSQL 数据库实用指南 现在,您已经对 NoSQL 有了一些基本的认识,是时候去认识一些目前流行的数据库了。...在这里了解 Apache Hadoop,一个 MapReduce 的开源实现,它在 IBM 的大规模数据解决方案中起到了重要的作用。

99460

教你几招,Pandas 轻松处理超大规模数

Metwalli 译者 | 盖磊 策划 | 陈思 处理大规模数据集时常是棘手的事情,尤其在内存无法完全加载数据的情况下。...本文将介绍其中三种使用 Pandas 处理大规模数据集的技术。 压 缩 第一种技术是数据压缩。压缩并非指将数据打包为 ZIP 文件,而是以压缩格式在内存中存储数据。...第二种技术:数据分块(chunking) 另一个处理大规模数据集的方法是数据分块。将大规模数据切分为多个小分块,进而对各个分块分别处理。在处理完所有分块后,可以比较结果并给出最终结论。...小 结 处理大规模数据集时常是棘手的事情,尤其在内存无法完全加载数据的情况下。一些解决方案或是耗时,或是耗费财力。毕竟增加资源是最简单直接的解决方案。

1K30
领券