首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    hadoop 学习之路

    当前,越来越多的同学进入大数据行业,有的是底层的技术,有的是工程,有的是算法,有的是业务。每个产品、都需要工程化的实现,以前,工程师都是操练着java/python/c等各种语言操纵中各类的软件,比如jquery,spring、mysql,实现产品的业务逻辑。在大数据时代,要想个性化实现业务的需求,还是得操纵各类的大数据软件,如:hadoop、hive、spark、hbase、jstorm等。笔者(阿里封神)混迹Hadoop圈子多年,经历了云梯1、ODPS等项目,目前base在E-Mapreduce。在这,笔者尽可能梳理下,本文是围绕hadoop的。对于算法、机器学习是另一个范畴,本篇不涉及,不过从事机器学习算法的研发,能力最好在中级之上。

    02

    大数据时代的结构化存储-HBase的应用实践

    时间回到2011年,Hadoop作为新生事物,在阿里巴巴已经玩得风生水起,上千台规模的"云梯"是当时国内名声显赫的计算平台。 这一年,Hadoop的好兄弟HBase由毕玄大师带入淘宝,开启了它的阿里之旅。从最初的淘宝历史交易记录,到去年的支付宝消费记录存储在线历史存储统一;从蚂蚁安全风控的多年存储演进,到HBase、TT、Galaxy的大数据激情迭代;HBase在阿里经历过年轻的苦涩,释放过青春的活力,也付出过成长的代价。几代人的不懈努力下,五年陈的HBase开始表现出更成熟、更完善、更丰富的一面,成为公司内部被广泛使用的存储产品之一。 经过阿里集团内部的锤炼,集团将这个技术红利输送给广大阿里云客户。现已推出云数据库HBase产品,支持海量的PB级的大数据存储,适用于高吞吐的随机读写的场景。

    02

    DBA技术栈总结

    随着技术的发展,DBA所做的工作不仅仅是对数据库的维护,所需要的知识可能更多,本文从开发语言、硬件、运维工具、关联软件,网络知识、Linux技能、数据库类型和数据库技能等八个方面对DBA技术栈进行总结,每种分类的简要内容如下: 开发语言: 开发语言可以分为四类,运维开发语言,数据库运维,大数据开发语言,数据库内核开发,牵扯的语言主要是Python,Shell和Go等 硬件方面: RAID卡,SSD固态硬盘,网卡等 运维工具: 包含运维部署工具,监控报警工具,日常运维工具以及一系列压测工具。 关联软件: 包括消息队列,缓存,搜索,服务发现,审计和版本控制等 网络方面: 包含TCP/IP,ethtool,iptables,DNS以及网络硬件 Linux技能: 常用命令,文件系统,系统层命令,IO管理层命令 数据库种类: 关系型(MySQL,SQL server,Oracle),新型数据库(mongodb),大数据(Hbase)。 数据库技能: 数据库开发规范,事务,锁,索引,存储引擎,备份恢复,中间件,优化,高可用,SQL审核 后续随着技术的进步,可能还需要进行一系列的补充。

    01
    领券