首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    关于数据挖掘就业方面的问题?

    1.数据挖掘主要是做算法还是做应用?分别都要求什么? 这个问题太笼统,基本上算法和应用是两个人来做的,可能是数据挖掘职位。做算法的比较少,也比较高级,其实所谓做算法大多数时候都不是设计新的算法(这个可以写论文了),更多的是技术选型,特征工程抽取,最多是实现一些已经有论文但是还没有开源模块的算法等,还是要求扎实的算法和数据结构功底,以及丰富的分布式计算的知识的,以及不错的英文阅读和写作能力。但即使是这样也是百里挑一的,很难找到。绝大读书数据挖掘岗位都是做应用,数据清洗,用现成的库建模,如果你自己不往算法或者

    06

    企业生产环境为什么选择使用Cloudera Manager

    看到About云中很多成员,特别是初级入门Hadoop成员,当然也包括已经工作的成员,经常会遇到Cloudera的问题。About云邀请了鸟叔,一线资深大数据工程师,任职于某知名直播、免费电子书平台、具有5年的大数据开发经验,从事过开发、大数据架构设计等。下面给大家介绍了企业为什么使用Cloudera及在企业的作用。 1.为什么许多企业使用Cloudera Manager Cloudera Manager的设计目的就是针对企业,为了方便企业数据中心的管理简单和直观,在一定程度上降低了公司的成本 ①人员成本:减少了搭建集群的人员和维护人员; ②时间成本:在一定程度上较Apache版本减少搭建时间,小白式安装,维护时间,任务运行时间, ③提高了公司的资源使用,设置了资源池,有利于任务的高效处理,解决了大数据技术栈中各组件间的兼容性。同时Cloudera Manager提供了一系列的报告和诊断工具,有利于集群性能优化,提供了中央控制器对集群配置统一处理修改。 在功能上 Cloudera Manager 宕机也不会影响到其他组件的任务运行,配置存放于sql数据库,避免了运维人员误操作导致的集群运行失败,主要得益于Cloudera Manager的架构设计。 在组件配置中类window操作,不需要写命令,看到即得到,同时他也提供了对应的Api功开发者使用。 对于权限也分完全管理员和一般管理员,提高了集群的安全性,当集群出现警告会第一时间通过邮件通知,有效的降低了集群宕机的风险。 2.Cloudera Manager 在企业的作用 企业需要的就是这种能高效处理,把更多时间投入到开发的工具上,所以许多企业都会选择基于Cloudera Manager 监控的CDH版本的集群, (1)有效的监控集群的健康状态 (2)有效的解决了hadoop生态圈中各组件及版本的兼容性。

    03

    这20年,我“颠簸”在软件工程的列车上

    世界格局在进入 21 世纪之后风云变幻,软件领域同样风起云涌。从硬件到软件,从单机到分布式,从孤岛到互联,程序员的创造力无比强大。但究其本质,软件工程和土木工程其实没有太大的区别,只不过一个是在码字母,一个是在码砖头。至于建筑的主体,设计缺陷,或者地基没打好,一样会垮塌,不管是楼塌了还是软件崩了,都可能成为整个世界都能感知到的大事件。 本文作者刘星先后经历安全行业和大数据领域,2011 年加入淘宝,参与了当时全球最大的 Hadoop 集群的开发和运维,在阿里先后担任数据开发平台研发负责人、研发效能 Aone 研发负责人。本文中,他将从 2003 年淘宝网成立那年开始,回顾总结这些年来软件工程体系的主线技术,探讨变化和趋势,并从自己的视角给出一些观点和思考。

    05
    领券