前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >22个对于数据科学家来说容易犯的错误

22个对于数据科学家来说容易犯的错误

作者头像
小莹莹
发布2018-04-20 17:41:55
6300
发布2018-04-20 17:41:55
举报

对于软件工程师或数据科学家来说,下列错误是很容易犯(随意顺序):列表如下:

  1. 在团队没有尽自己的能力出力。
  2. 把自己看成以为天才。
  3. 使用一些上司看不懂的专业术语。
  4. 当一名完美主义者:完美总是和不好的投资回报率所关联,而在商业的战场上:80%的价值产生于20%的时间,然而80%的时间只能产生剩余20%的价值。(这条法则也被称作收益递减法则),
  5. 没有花足够的时间在记录你的数据分析,数据表格怎样以及相关的代码(一般记录这样的一个过程会占用你25%的时间,而且这是在匆匆忙忙之下完成的,而没有完整的完成这样的项目。没有适当的记录,任何人,包括你自己,都不会知道备份,提取其中的价值,以及明白你六个月前的实现过程)。
  6. 没有花足够的时间对代办事务进行优先处理和更新:告诉你的股东(但不要把一把小小的要求强加给他们),每天花30分钟的时间来优先处理这些事物(使用日历和项目管理器)。
  7. 不尊重或知道数据科学项目的周期。
  8. 不创建一个可再次使用的程序或者代码。你反倒花更多的精力在一次性分析中。
  9. 使用一些老方法来处理大数据,尤其是在一个动态标注的那些耗时的聚类算法或指数化算法,这些方法的运行速度比这些新方法在创造分类系统方面可以快上百万倍。
  10. 不要通过过多或过少的电脑科学学习如何展开一个分布式的算法,以及使算法的运行速度和内存使用上达到最有效的利用,而你应该要和你的IT团队在如何深入完成项目以前进行讨论。
  11. 为你的分析创建一个地方的,内部的数据市场:你的系统管理会对你的行为感到厌恶。在你要使用这些IT资源前首先就要和它讨论。
  12. 表现得像刚开始在大公司工作那样,并尝试以另一种方式工作。一些分工较细致的大公司(这对你的职业生涯会有危险),它们像所有行业有主管一样启动这些如千斤顶的所有交易项目那样。
  13. 创建一些比较糟糕的表格。
  14. 关注工具而非商业问题。
  15. 计划把沟通留到最后。
  16. 进行没有问题或计划导向的数据分析。
  17. 没有对其进行简单化。
  18. 没有一个好的销量。
  19. 你的计划没有和你的股东进行产量方面的谈话而让他知道成功的指标,不要对此进行猜测。
  20. 确认在你的组织中找到合适的人进行谈话,甚至不是这里的人。
  21. 避免简仓和数据简仓。主动的寻找数据的资源,并参与数据库设计的谈话中。
  22. 没能对诸如探索性数据分析的任务进行自动化操作

翻译:品言,审核:陆勤

PPV课原创翻译文章,转自请注明出处链接。

1、回复“数据分析师”查看数据分析师系列文章

2、回复“案例”查看大数据案例系列文章

3、回复“征信”查看相关征信的系列文章

4、回复“可视化”查看可视化专题系列文章

5、回复“SPPS”查看SPSS系列文章

6、回复“答案”查看hadoop面试题题目及答案

7、回复“爱情”查看大数据与爱情的故事

8、回复“笑话”查看大数据系列笑话

9、回复“大数据1、大数据2、大数据3、大数据4”查看大数据历史机遇连载

PPV课大数据ID: ppvke123 (长按可复制)

大数据人才的摇篮!专注大数据行业人才的培养。每日一课,大数据(EXCEL、SAS、SPSS、Hadoop、CDA)视频课程。大数据资讯,每日分享!数据咖—PPV课数据爱好者俱乐部!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-09-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PPV课数据科学社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档