专栏首页技术翻译数据分析师需要掌握的技能

数据分析师需要掌握的技能

基础

1.第一个是Excel。这看起来很简单,但实际上并非如此。Excel不仅可以执行简单的二维表,复杂的嵌套表,还可以创建折线图,柱形图,条形图,面积图,饼图,雷达图,组合图和散点图。

2.在SQL Server或Oracle上掌握SQL语句。虽然您是业务分析师,但如果您可以依赖IT和IT工具(例如多维BI分析模型),有时您无法获得所需的数据。学习 编写嵌套的SQL语句,包括 join,group by,order by,distinct,sum,count,average和各种统计函数,这非常有帮助。

3.掌握可视化工具,例如BI,例如CognosTableauFineBI等,特别关注企业使用的工具,就像我以前使用FineBI一样。使用这些工具进行可视化非常方便,特别是如果分析报告可以包含这些图像。这些技能肯定会吸引高层领导的注意力,因为它可以使他们一目了然,并深入了解业务的本质。此外,作为专业分析师,使用多维分析模型Cube,您可以轻松高效地自定义报告。

总结:此时,如果您掌握了上述80%的技能,您可以被视为合格的分析师。此阶段的数据分析师需要知道如何使用工具处理数据,了解业务场景,分析和解决基本问题。重要的是要强调数据分析师最重要的事情是熟悉我们的业务。了解业务,分析师的逻辑将是清晰和一般的,它将排除大多数无用的分析。很长一段时间,对于我理解的业务,我在比较数据时就知道了这个问题。

在此之后,如果您想深入研究技术,您可以继续在数据科学家的指导下发展您的职业生涯。

高级技能

1.学习统计系统

  • 纯机器学习强调算法的预测能力和实现,但统计学一直强调“可解释性”。例如,我可以看到两只股票之间的相关性是否相关。假设一个反相关的股票下跌,那么,根据数据,我们可以假设其他股票会上涨。
  • 与数据挖掘相关的统计方法(多变量逻辑回归分析,非线性回归分析,判别分析等)。
  • 定量方法(时间轴分析,概率模型,优化)。
  • 决策分析(多用途决策分析,决策树,影响图,敏感性分析)。
  • 建立竞争优势分析(通过项目和成功案例学习基本分析概念)。
  • 数据库输入(数据模型,数据库设计)。
  • 预测分析(时间轴分析,主成分分析,非参数回归,统计过程控制)。
  • 数据管理(ETL(提取,转换,加载),数据治理,管理责任,元数据)。
  • 优化和启发式(整数规划,非线性规划,局部探索,超灵感(模拟退火,遗传算法))。
  • 大数据分析(学习非结构化数据概念,MapReduce技术,大数据分析方法)。
  • 数据挖掘(聚类(k-means方法,分割方法),关联规则,因子分析,生存时间分析)。
  • 风险分析与运行分析的计算机模拟。
  • 软件级分析(组织级别的分析主题,IT和业务用户,变更管理,数据主题,演示和通信。

2. 掌握AI机器学习算法并使用Python / R等工具对其进行建模

传统的BI分析可以回答过去发生的事情,现在正在发生,未来会发生什么?我们必须依靠算法。虽然像TableauFineBI这样的自助服务BI具有内置的分析模型部分,但分析人员需要更全面,更深入的探索,需要Python和R等数据挖掘工具。此外,大数据集之间的隐藏关系无法实现通过手动分析或使用传统工具。此时,算法已实现,并且不会有任何意外。

其中,用于统计分析的开源编程语言及其操作环境R,引起了很多关注。R的优势不仅在于它包含丰富的统计分析库,而且还具有高质量的图表生成功能,可以显示结果并可以使用简单的命令运行。此外,它还有一个名为CRAN(Comprehensive R Archive Network)的包扩展机制,可以通过导入扩展包来导入标准状态下不支持的功能和数据集。虽然R语言很强大,但学习曲线很陡峭。就个人而言,我建议你从Python开始,它拥有丰富的统计库,如NumPy,SciPy,Python数据分析库和Matplotlib。

数据人才的最终发展围绕着数据战略。例如,数据战略专家可以使用IT知识和经验来制定业务决策。数据科学家可以使用IT技术开发复杂的模型和算法。分析顾问可以结合实际的业务知识和分析经验,专注于您的行业的下一个爆炸点。

因此,您需要具备沟通,组织,管理技能和商业思维。这不限于某个位置。您需要在更高的位置思考并为公司寻求利益。与此同时,我们还必须考虑如何使用“数据分析”卡在公司中发挥作用并使用数据来推动业务运营。这是值得思考的问题。

课程和书籍推荐

首先学习基本概率。一个很好的资源是概率和统计学概论

快速了解统计学习中使用的术语,是做什么的。为此,请阅读: Wasserman, Larry. All of statistics: a concise course in statistical inference. Springer, 2004.

为了学习基本的统计思想,统计学习简介是一本流行的教科书。

使用d3.js可视化库,使用基本HTML和JavaScript学习基本可视化。

学习基本算法和算法分析,并了解如何分析算法复杂性。平均复杂性,最差复杂性。每次编写程序时,都会预计所需的时间(通过算法分析预测)。 我在Coursera.org上推荐普林斯顿的算法类

通常,伟大的数据科学家都有博客供所有人访问。我推荐这些博客,我经常读到:

  • Betaworks首席数据科学家,Gilad Lotan的博客
  • 希拉里·梅森(Hilary Mason)是纽约地区着名和着名数据科学家的首席科学家,他有一个很棒的博客: hilarymason.com

原文标题《The Skills That Data Analysts Need to Master》

作者:Vincent Wong

译者:February

不代表云加社区观点,更多详情请查看原文链接

原文链接:https://dzone.com/articles/what-computer-skills-do-data-analysts-need-to-mast

原文作者:Vincent Wong

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 动态 | 2018 ACM 杰出科学家名单最新公布,12 位华裔学者上榜

    AI 科技评论:日前,ACM(国际计算机学会)公布了 2018 年度 ACM 杰出科学家名单,全球共有 49 名研究人员入选。其中,华裔学者的表现非常出色,上榜...

    AI科技评论
  • 【书单推荐】 数据分析师&数据挖掘工程师

    以上图书,是我经常翻阅的图书,和大家分享。如果有条件的可以,阅读英文原版,更好!

    fishexpert
  • 如何成为一名数据挖掘工程师?

    fishexpert
  • 干货|(书单推荐) 数据科学家&数据挖掘工程师

    以上图书,是我经常翻阅的图书,和大家分享。如果有条件的可以,阅读英文原版,更好!

    fishexpert
  • AI For Fragrance Design ,人工智能与香水设计

    最近MixLab在开展30天AI训练营,研究的是美食相关的AI应用,其中有一种应用方式是为特定的人群生成新的菜谱。思路可以参考IBM的研究:

    mixlab
  • 【SQL刷题系列】:leetcode180 Consecutive Numbers

    【SQL刷题系列】:leetcode183 Customers Who Never Order

    用户2769421
  • 说好的面经来啦!! 数据挖掘/大数据开发

    之前找实习还有秋招的时候看了不少大神的帖子,现在也来回馈一下~ 感觉这方面帖子也不多。

    牛客网
  • 【SQL刷题系列】:leetcode177 Nth Highest Salary

    【SQL刷题系列】:leetcode183 Customers Who Never Order

    用户2769421
  • 全球首个运筹优化挑战赛冠军产生 京东献出顶级挑战引发供应链创新突破

    历时四个月,由京东主办的全球首个聚焦于智能物流、智能供应链两大无界零售基础设施的顶级运筹优化赛事圆满落幕。顶级的挑战吸引了顶级的人才,最终在「城市物流运输车智能...

    京东技术
  • 初步尝试 sklearn

    Scikit-learn是一个用于Python编程语言的免费软件机器学习库。 它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度增强,k均值和DBS...

    小歪

扫码关注云+社区

领取腾讯云代金券