首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据科学之七个数据实验室最佳实践

也许您正在寻找更好的方法来执行数据实验并促进数据发现和数字化创新。 或者你正在尝试开始使用机器学习来通过数据实验室发现更多的业务创新机会。

当然,数据实验室就是一个很好的开始。 数据实验室使数据科学和新数据的实验更加可行。 机器学习等复杂分析可能会对生产系统的服务水平造成压力。但拥有数据实验室可确保您的数据科学家可以根据需要进行实验和运行分析,而不会对系统造成压力并面临来自其他团队的投诉。

对于许多人来说,建立和实施数据实验室是一个新项目。事实上,您甚至可能在公司建立了第一个数据实验室。

那么如何确保数据实验室获得成功的呢? 在本文中,我们列出了七个数据实验室的最佳实践。 请记住,这些最佳实践旨在让您超越体系结构和实现的细节,以及更广泛的获得支持和采用。

数据实验室最佳实践#1:快速获胜

和三四个月后有三个产出相比,两个月甚至更短时间有一个产出更好。您的数据实验室可能是一个对领导而言高度可见,并且昂贵的项目。 人们希望证明它正在发挥期望的作用,并且立即就想看见。所以不要试图只玩数据沙箱。相反,请牢记需要有一个与关键业务利益相关者的目标一致的业务目标。

您需要从IT和业务角度展示数据实验室的价值,以获得尽可能多的支持。

对于IT,请证明您最大限度地减少了实验室对生产系统的压力。对于企业而言,现在可以通过简单的方式展示公司开始省钱或最大化收入的方式。如果您没有任何想法,请与该部门的业务负责人会面并进行头脑风暴。 这里有一些可以参考的点:

如何设计服务以最大化广告收入?

最佳的数据组合是什么能帮助让客户更有可能接受移动优惠推荐?

我需要哪些数据? 我该如何组合这些数据呢? 我从哪里得到它?

专注于快速获胜,但要记住未来的改进和更复杂的项目。

数据实验室最佳实践#2:考虑从现有数据开始

请记住,即使您一直在收集或清理新数据,现有数据也会有价值。如果您已经有可用的标记数据,请考虑创建一个用例,以便您可以更快地开始使用。有时这可能围绕重组您的项目范围。让我们说理想情况下,您的业务部门希望360度全方位地了解客户,以获得更有效的客户促销。这是一个复杂的项目,需要大量的数据。

例如英国的国民健康服务使用现有数据来帮助加速他们的快速获胜。他们将付款,其他交易和客户投诉视为要调查的欺诈案例的首批数据。停止欺诈或恢复欺诈性索赔通常是一个很好的快速获胜。

一旦你获得了一些快速获胜的应用点,你就可以开始处理需要更多资源或更多种类数据的更复杂的项目。但特别是在早期阶段,重要的是要记住大多数企业不会关心机器学习算法的复杂性或创新性。

他们想要结果。 他们获得这些结果的速度越快越好。

数据实验室最佳实践#3:尝试在候选应用队列中拥有更多实验项目

我们已经说过你应该有一些快速的胜利。我们还说过你应该从现有数据开始。现在我们想说你应该尝试在候选的应用队列中尝试安排更多项目(但也不要太多 - 需要保持平衡)。

您应该记住,并非每个数据探索项目都会产生可行的结果。如果这个想法只能说明渐进式变化,那么它可能无法显示出足够的成本节约和易于实施的想法以获得领导层的吸引力。仅仅展示数据实验室确定价值的多种方式对您来说是不够的。执行团队想知道有多少这些想法得到了实施了。

这就是为什么你应该在管道中有很多候选数据项目,以减少失败的机会。但是也要尝试一些重点。

数据实验室最佳实践#4:保持管理层对你项目的支持

我们假设你有一些行政管理层的支持来实现这一目标。 但是你需要持续保持他们的参与度。 这也与之前的观点有关 - 提供一些快速的胜利。

但不要止步于此。 看看你可以加入哪些业务高管。你能在其他地区快速获胜吗? 你不想让自己和你的资源过于紧张。但与此同时,理想的愿景是一家满是高管要求更多机器学习项目的公司,并为您的数据实验室提供大量支持,因为它被视为公司的重要组成部分。为此,您可以提供有关机器学习可以执行哪些业务操作的管理层对话,以及关于如何帮助其他业务部门扩展的想法。是的,这确实需要额外的工作,但如果您决心让您的数据实验室成为业务的基石,那么它是非常值得和重要的。

数据实验室最佳实践#5:操作数据

你可能会认为你的数据科学工作在寻找到业务见解就结束了。但事实并非如此。 您需要推动您的高管和其他业务负责人将您的发现付诸实施。 看看您正在为之工作的业务部门或业务负责人。他们赞美你的发现但从未实施过吗? 如果是这样的话,是时候应该认真的开展对话了,甚至应该找到一个业务团队进行合作。

考虑您可以创建的可操作报告,或提出现有应用程序和流程的改善建议。 您的发现可能会影响全新的服务,应用或产品的创建。请记住,数据实验室,并不是要发现有多少见解。 您的企业关心的是节省了多少资金以及创造了多少收入。 如果您能指出团队产生的实际收入,那就最好了。

数据实验室最佳实践#6:确保您拥有可扩展的平台

请记住,云是数据实验室这种类型的应用的理想平台。 您可以在那里配置实验室,存储大量数据,并根据需要启动和降低灵活的分析工作负载。 最好的情况下,您只需支付所使用的费用,从而最大限度地降低您的成本和风险。

除了拥有可扩展的平台之外,您还需要资源和人才来执行。 如果不这样做,您可能会从第一天开始积压大量数据项目。这就导致了最佳实践#7。

数据实验室最佳实践#7:支持您的数据科学家

一个优秀的数据科学家是能值得他或她的黄金价值的。确保您的数据科学家获得足够的支持并为他的工作成功提供足够的保障。将他们聚集在才华横溢,多元化的团队中。为他们提供想要的工具。 并确保您的管理层容忍风险。 您的数据科学家可能需要一段时间才能找到每个人都在寻找的深刻的业务胜利。因此,相应地设定期望,同时确保您可以找到快速轻松的胜利,让每个人都开心。

结论

这就是我们实施成功的数据实验室的七个最佳实践。 数据科学可能并不容易,但拥有数据实验室可以让您更轻松对开始这一切 - 我们希望本文能够帮助您更轻松地获得成功。

如果您想再向我们提问,请随时与我们联系。

分享:

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180726G0F0IM00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券