首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    HBase快速入门系列(1) | Hbase的简单介绍

    HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持结构化的数据存储。   官方网站:http://hbase.apache.org   – 2006年Google发表BigTable白皮书   – 2006年开始开发HBase   – 2008年北京成功开奥运会,程序员默默地将HBase弄成了Hadoop的子项目   – 2010年HBase成为Apache顶级项目   – 现在很多公司二次开发出了很多发行版本,你也开始使用了。   HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群。   HBase的目标是存储并处理大型的数据,更具体来说是仅需使用普通的硬件配置,就能够处理由成千上万的行和列所组成的大型数据。   HBase是Google Bigtable的开源实现,但是也有很多不同之处。比如:Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MAPREDUCE来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用Chubby作为协同服务,HBase利用Zookeeper作为对应。

    01

    快速学习-HBase简介

    HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持结构化的数据存储。 官方网站:http://hbase.apache.org – 2006年Google发表BigTable白皮书 – 2006年开始开发HBase – 2008年北京成功开奥运会,程序员默默地将HBase弄成了Hadoop的子项目 – 2010年HBase成为Apache顶级项目 – 现在很多公司二次开发出了很多发行版本,你也开始使用了。 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase的目标是存储并处理大型的数据,更具体来说是仅需使用普通的硬件配置,就能够处理由成千上万的行和列所组成的大型数据。 HBase是Google Bigtable的开源实现,但是也有很多不同之处。比如:Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MAPREDUCE来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用Chubby作为协同服务,HBase利用Zookeeper作为对应。

    02

    SQL Server数据库和表的基本管理

    我们先来了解SQL Server数据库中的文件类型: 主数据文件:包含数据库的启动信息,指向数据库中的其他文件,每个数据库都有一个主数据文件(有且只有一个),推荐文件扩展名是.mdf; 辅助数据文件:除主数据文件以外的所有数据文件都是次要数据文件,次要数据文件主要是为了扩展数据的硬盘空间(可以有也可以没有),推荐文件扩展名是.ndf; 事务日志文件:包含恢复数据库所有事务的信息,每个数据库中至少有一个事务日志文件(有且必须有一个,可以多个),推荐文件扩展名是.idf; 文件流数据文件:可以使基于SQL的应用程序能在文件系统中存储非结构化的数据,如:文档、图片、音频、视频等。 数据文件由若干个64KB大小的区组成,每个区由8个8KB的连续页组成; 事务日志文件的存储不是以页为单位的,而是由一条条的大小不等的日志记录为单位。 创建数据库之前,需要考虑如下事项: 创建数据库的权限默认授予sysadmin和dbcreator服务器角色成员,服务器角色用于向用户授予服务器范围内的安全特权; 创建数据库的用户将成为该数据库的所有者; 考虑数据文件及日志文件的放置位置; 合理估计数据库的大小合并增长值。 接下来我们简单来一下数据的基本操作:

    02
    领券