本篇来自于话题讨论:你认为数据开发需要了解机器学习算法吗?
对于这个问题,有些群友认为是需要的,也有些群友认为是不需要的,本文根据大家的观点及作者的一些认知,对这个话题进行一个总结。
下面是大家对于这个问题的一些看法:
讨论一:
需要了解一些。在和下游同事沟通的时候是很需要的。因为做数据开发的一部分目的是为了给算法工程师提供数据支持。
讨论二:
在不同的公司要求程度不一样,大公司分工明确,数据开发如果不考虑后续机器学习算法对数据的要求,会给后续公司数据分析挖掘带来额外的成本,降低效率,可能导致不同部门反复沟通,寻求合适的方案,导致数据开发反复修改,浪费时间和空间,部分公司可能要你从数据开发到模型开发都要做,这个你可就得都会,考虑整个数据流程的一致性,不是割裂开来,个人观点,哈哈
讨论三:
数据开发了解机器学习当然有好处,方便整个数据工作流的协同,但不是必须的。任何岗位都这样,当你突破了自身岗位限制,着眼于周边甚至全局的时候,更容易发挥自己的价值,推动价值的闭环。
讨论四:
需要。现在越来越多的算法,都已经通过工程和平台的能力降低了使用门槛。从长远看,数据和算法人才是大一统的。很多公司的算法有要求有工程和开发能力,那么同理,工程和开发也应该去学习和拥有算法能力。
讨论一:
基本不需要算法,大学学过 c、java、android,现在搞hadoop最大的感触是除了基本的数据结构(数组、栈、队列、链),树、图、堆基本没用到过,但是有一些算法思想会有助于理解程序,个人观点欢迎指正。
讨论二:
说实话,我觉得数据开发和会算法的,是两个岗位,数据开发不一定要懂得机器学习算法,但是如果想往高处其他岗位走,那算法是少不了的;相反,会机器学习算法的,最好要懂一些数据开发的知识,不然搞好了算法模型,底层数据这块便需要很多数据开发的知识;当然,以下只是我个人的拙解,毕竟我对数据开发了解得不是很深。
讨论一:
这个也要看具体情况的,如果你是做数据平台开发的话,可能对数据算法的要求不高;但是如果你做的涉及到一些数据挖掘之类的,那么你必须要掌握机器学习相关算法;如果你做的是数据开发只是结构化标准数据的结果展示的话,当然不需要了解分类聚类这些东西。
讨论二:
说实话,我觉得数据开发和会算法的,是两个岗位,数据开发不一定要懂得机器学习算法,但是如果想往高处其他岗位走,那算法是少不了的;相反,会机器学习算法的,最好要懂一些数据开发的知识,不然搞好了算法模型,底层数据这块便需要很多数据开发的知识;当然,以下只是我个人的拙解,毕竟我对数据开发了解得不是很深。
对于这个话题,我觉得了解机器学习算法还是很有必要的,不过有必要并不意味着就需要马上去学习。是否现在就要学习算法取决于你现在所处的状态及位置。
总而言之,技多不压身,多学点总是好的,但是也要知道自己所处的状态及眼前需要掌握的技能。根据自己具体的情况安排学习计划就好,最好能做到一精多通,当一个没有精的时候,其余的重要性并不是最高的。
感谢所有参与讨论的朋友!
那么,对于这个话题,你有什么看法呢?