专栏首页arxiv.org翻译专栏知识科学家:解锁数据驱动的组织结构(cs.DB)
原创

知识科学家:解锁数据驱动的组织结构(cs.DB)

所有部门的组织正日益向数据驱动型运营进行深层次的转型和重组。数据的核心问题在于对可靠和干净的数据的需求。不可靠、错误和不完整的数据会导致管道处理中的重点瓶颈,并最终导致服务故障,这对组织的竞争绩效是灾难性的。鉴于其重要性,认识到并采取措施获取可靠数据的组织将在今后十年中更富优势。我们认为,产生可靠数据的技术是由不同的关注和专业知识推动产生的,这些关注和专业知识与数据科学家和数据工程师的担心和专业知识相辅相成。那些能够意识到有意义、可解释、可重复和可维护数据的核心重要性的组织将处于可靠数据民主化的最前沿。知识科学家被我们称之为新的角色,用以发展,以填补这一重要需求。支持知识科学家的工作并将知识科学家这一构想,变为现实的组织结构、工具、方法和技术仍处于起步阶段。随着组织不再仅仅使用数据,而且越来越依赖于数据,所以现在是时候赋予权力给处于这一组织转型过程中的中心人物:知识科学家。

原文标题:Knowledge Scientists: Unlocking the data-driven organization

原文:Organizations across all sectors are increasingly undergoing deep transformation and restructuring towards data-driven operations. The central role of data highlights the need for reliable and clean data. Unreliable, erroneous, and incomplete data lead to critical bottlenecks in processing pipelines and, ultimately, service failures, which are disastrous for the competitive performance of the organization. Given its central importance, those organizations which recognize and react to the need for reliable data will have the advantage in the coming decade. We argue that the technologies for reliable data are driven by distinct concerns and expertise which complement those of the data scientist and the data engineer. Those organizations which identify the central importance of meaningful, explainable, reproducible, and maintainable data will be at the forefront of the democratization of reliable data. We call the new role which must be developed to fill this critical need the Knowledge Scientist. The organizational structures, tools, methodologies and techniques to support and make possible the work of knowledge scientists are still in their infancy. As organizations not only use data but increasingly rely on data, it is time to empower the people who are central to this transformation.

原文作者:George Fletcher, Paul Groth, Juan Sequeda

原文地址:http://arxiv.org/abs/2004.07917

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 开放引文数据模型(cs.DL)

    各种架构和本体目前用于书目实体和引文的机器可读描述。这种多样性,以及对具有不同细微差别的相同本体术语的重用,在数据中会产生不一致。采用单个数据模型将有助于数据集...

    Donuts_choco
  • 在物理激励的半马尔科夫环境下的强化学习(CS Machine Learning)

    强化学习被证实在很多科学发现设计应用这存在着无限潜力。最近的研究包含,像是针对治疗性药物的新的分子结构和组成。很多针对强化学习的都在科学领域相关。但是这些都是保...

    Donuts_choco
  • 用于实时人脸识别的新型分布式近似化近邻算法(cs.CV)

    如今人脸识别,更普遍推广开来就是图像识别,在现代世界中具有许多应用,并广泛应用于我们的日常工作中。本文提出了一种新型的分布式近邻(ANN)方法,用于包含大量类的...

    Donuts_choco
  • 最新综述文章推荐:自然语言生成、深度学习算法、多媒体大数据分析

    【导读】专知内容组整理了最近人工智能领域相关期刊的5篇最新综述文章,为大家进行介绍,欢迎查看! 1 ▌自然语言生成综述:任务,应用,评价 ---- ---- ...

    WZEARW
  • Duke@coursera 数据分析与统计推断 unit1 part2 introduction to data

    roughly the average deviation around themean, and has the same units as the data

    统计学家
  • Sending Alerts for Sensor Data via the Bluemix IoT

    image.png Earlier this month Greg Knowles blogged about the new Bluemix service ...

    首席架构师智库
  • 论文实践讨论 - Pyramid Scene Parsing Network

    for the training, the issues are mainly related to bn layer:

    AIHGF
  • Flink1.3 指南四 命令行接口 转

    Flink提供了一个命令行接口(CLI)用来运行打成JAR包的程序,并且可以控制程序的运行。命令行接口在Flink安装完之后即可拥有,本地单节点或是分布式的部署...

    stys35
  • SAP S/4HANA里如何创建Customer主数据以及执行后续处理

    1, Launch tcode: BP and select the Organization

    Jerry Wang
  • INFORMS TSL Best Paper Award2020

    The Institute for Operations Research and the Management Sciences

    用户1621951

扫码关注云+社区

领取腾讯云代金券