The Apache Hadoop software library is a framework that allows for the distributed processing of large data sets across clusters of computers using simple programming models.
Apache基金会的Hadoop是一个用于分布式大数据处理的架构软件库,用简单的计算模型完成集群计算。
字母哥自己的理解:把计算机集群(拥有多台计算机)的计算能力和存储能力联合,使其协同合作,并能够按照一定的计算模型,完成任务目标的计算方式。
hadoop擅长于大数据的分析处理(OLAP),典型的应用场景是数据仓库,大数据分析。
hadoop不擅长做OLTP,联机事务处理。传统web增删改查应用(子项目hbase除外)。
喜欢 (2)or分享 (0)