前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >成为数据科学家的7件事,必看!

成为数据科学家的7件事,必看!

作者头像
万能数据的小草
发布2024-07-23 15:17:07
390
发布2024-07-23 15:17:07
举报
文章被收录于专栏:万能的小草

一、概括

本文强调了大数据相关专业学生与实际的数据科学家所需的重要技能之间的一些知识差距。在校期间通常不会教授版本控制、云技术、DevOps 等一些技术技能。除了硬技能之外,将讨论成为更具适应性的数据科学家所需的软技能,例如向上管理。

二、目标读者

  • 有抱负的初级数据科学家

大纲

  • part1:硬技能
    • 学习版本控制工具,例如git、docker
    • 学习云计算
  • part2:软技能
    • 职位JD
    • 数据质量
    • 预期管理
    • 向上管理
    • 换工作

在典型的大数据课程中,一般都将学习数学、统计学、数据结构和算法、软件工程、数据库和机器学习。为了通过面试的技术评估,还要练习大量的 Python 和 SQL 编码问题。

通过考试和面试后,一般会比较少使用上述知识(大部分情况下就是“面试造火箭、入职拧螺丝”)。一些未写在职位描述中的软技能可能会成就你的职业生涯。为了读者的职业生涯一帆风顺,以下是我提供的一些建议,或者至少是希望有人能早点告诉我的一些建议。

让我们从技术技能开始,这些技能对我们来说可能更容易学习。小公司的数据科学家需要更广泛的技术堆栈。除有信心留在大公司直到退休,否则强烈建议学习一些DevOps和云计算。

  1. 学习版本控制工具,例如gitdocker

在一个团队中工作。多个团队成员可能会为同一个项目编写代码。为了促进协作,需要学习git。它允许为并发开发创建不同的分支,并跟踪编辑历史记录。

根据工作范围,DevOps 可能不是必需的。但是,如果需要部署 ETL 管道或生产经过训练的模型学习模型等,则无法避免docker。为了让配置更简单,你可以尝试一下docker-compose

2.学习云计算

通常,对数据科学家有需求的公司应该拥有一些来自不同云服务提供商的云基础设施。顶级云平台都提供免费试用。甚至可以在面试前使用云为历史作品创建一个项目。

在开始工作之前不可能了解所有内容。如果招聘岗位描述中没有写,如何找出梦想的公司使用哪个云平台?前往maimai并搜索在那里工作的数据科学家。他们可能会在个人资料或工作经验部分描述技术堆栈。

亚马逊在云市场保持领先地位。

如果想要不太陡峭的学习曲线,请从 AWS 开始。他们拥有最大的用户群,因此有大量免费的在线资源可以帮助入门。一旦掌握了 AWS 中的云基础设施,就可以轻松选择 Google Cloud 和 Azure。

除了技术技能之外,想分享从我个人和同龄人过去的经验中学到的如何与人打交道的经验。每个人都投入最多时间的硬技能很少对数据科学家构成挑战。

3.职位描述不代表实际工作内容

有人说数据科学家是最性感的工作。我想说只有工作描述才是性感的。企业用它来吸引尽可能多的应聘者。大多数优秀的公司都会在面试过程中调整面试者期望。然而,如果由于迫切希望有人上船,可能会发现自己后来被“鲶鱼”了。

数据科学家并不是每天都构建机器学习模型。根据团队规模,必须进行大量的“数据清洗”工作。较小的公司甚至可能希望兼任数据工程师。大公司有严格的数据治理规定,甚至在获取数据进行分析之前就可能让你抓狂。你的工作并不像 Leetcode 问题那样具有智力挑战性。

强烈鼓励联系该团队中的数据科学家,了解他们实际上在做什么。

4. 上游数据的质量不由你掌控

感谢团队内部数据仓库工程师、数据分析师,我们可以从数据平台提取数据并向业务方讲述故事。

然而,如果讲述的故事不能帮助业务方实现他们的目标,即创造收入,他们会认为你做得不好。再次赢得他们的信任更加困难。如果已尽力理解无法从上游修复的损坏数据,那并不重要。

如果花费的时间比预期长,业务方会认为我们不重视对应的项目。没有人关心找到数据源和相应的负责人来授予访问权限是多么乏味。

不要责怪后端工程师和数据工程师。大家都受到难以克服的技术债和数据治理的摆布。

然而,在加入团队之前,当然是无法评估上游数据的质量。可以在面试过程中提出探究性问题,以衡量技术债和官僚主义的程度。此外,在接受工作机会之前,可以在maimai上联系数据团队的前成员。

5.业务预期管理很重要

一般情况下,业务方告诉当前碰到的棘手的问题。我们提出一个解决方案,即仪表板或机器学习模型,来解决问题。

然而,事情并没有那么简单。

首先,永远不要指望业务侧会给你一个需要解决的具体问题。不要太从字面上理解他们的要求。明确他们想要什么,并评估他们的要求是否能得到他们想要的东西。例如,营销主管可能会告诉你,他们想要一个机器学习模型来决定即将到来的营销活动的目标对象。知道他们只是想花更少的钱来保留或获取花更多钱的客户,我们可以帮助计算客户终身价值和客户获取成本,而不是训练模型。

其次,即使是专家,业务人员也可能不信任提供的内容。一开始,必须向通常未受过技术培训的业务运营“推销”你的解决方案。这也不全是关于印象管理。最终,结果是可衡量的。无论投入多少精力来训练模型,如果他们没有从中受益,业务方就会质疑你的能力。

最后,讲业务化的“语言”。与他们谈论收入、用户增长、转化率等。应该将技术术语翻译成他们的“语言”。如果时间允许,可以一起出去玩并与他们建立融洽的关系。

6. 向上管理

向上管理没有单一的方法。最终目标是与TL建立相互信任。使他相信自己有动力为团队做出贡献。另一方面,也相信你的TL正在积极帮助实现职业目标。不要扭曲现实来创造这些看法。也不要对现实有扭曲的看法。

不同的管理者有不同的管理风格。正确评估TL的个性和环境是一项艰巨的任务。

如果你的TL仍在努力证明自己的价值,请不要超越他/她。否则,你做的越多,你的TL可能会感受到更大的威胁。如果他/她认可你的技能并让你全力以赴,这可能不是一件坏事。别抱怨。如果他/她喜欢把你的工作归功于自己,那就利用他/她的弱点,要求更有影响力的项目。如果你能帮助TL加薪,你升职的机会也很大!

报告你的进展并及时获得反馈。确保始终与TL保持一致。

7.什么时候换工作?

通常,招聘人员会在官网或maimai、boss邀请参加工作面试。如果没有收到任何信息,请查看boss个人资料并在那里展示相关技能。

偶尔面试一次工作,了解哪些新获得的技能或项目经验吸引了他们的注意力。

对于初级数据科学家,请查看希望入职的公司的最新技术堆栈,并思考可以在公司中学到什么。有差距吗?可以在空闲时间学习这些技能,也可以加入一家可以学习这些新技能的新公司。例如,如果想去的公司需要在分布式机器学习方面经验丰富的数据科学家,但当前的公司不需要,请寻找一个可以让你接触分布式计算的新职位。否则,自己学习分布式训练是非常困难(而且昂贵)的。

跳槽常常被人不悦。然而,如果可以通过跳槽更快地掌握所需的技术技能,那么就是一个战略跳槽者。与此同时,也将获得经济上的奖励。如果没有晋升,留在同一家公司可能每年加薪 5%。然而,跳槽到另一家公司可以让你的年薪加薪20%~30%。

如果盲目换工作,高级数据科学家可能会损失更多。未来的雇主不再仅仅根据技术技能来评估您,深厚的领域知识使您与那些缺乏在应用技术工具解决问题之前看到真正问题的远见的初级人员区分开来。当你已经成为某个领域的学科专家时,改变行业可能并不明智。根据职业目标,战略性地计划每一步。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-04-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 万能数据的小草 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 二、目标读者
  • 大纲
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档