项目管理中AI技术的正确打开方式

1.问题介绍

企业的项目管理(PM)会产生很多数据,包括项目计划、执行和结束过程中生成、捕获和存储的数据。这些数据提供了关于项目目标、参与者、过程、结果、性能或失败等的许多细节。我们可以从这些材料中吸取教训。在最好的情况下,这些数据可用于识别或验证最佳实践,解释过去项目的失败或成功,或预测未来的性能。为了建立项目管理过程成熟度与项目运营绩效之间的因果关系模型,我们可以在几种人工智能(AI)和机器学习(ML)技术中进行选择,这些技术结合了知识表示、数据分析和概率推理和学习。AI和ML技术适合于PM,因为大型组织有一系列的项目;因此,不断产生和更新数据,可以让因果假设得以反驳或验证。

在PM的具体领域,有人建立了PM因素(流程实施、团队管理等)与过去项目绩效之间的统计相关性。更一般地,我们假设AI和ML技术是PM的有价值的解决方案;它们有助于系统地利用项目数据,以便更清楚地了解相关性或因果关系的强度。主要问题之一是选择一个好的AI和ML技术,因为这个非常活跃的领域包括各种各样的统计方法,可以实现自动决策、预测建模、数据分类和数据聚类。这就解释了为什么本文着重于选择适合于PM特性的AI和ML技术。

2.综述人工智能技术在PM文献中的应用

最初,人工智能技术的目的是将表征人类认知、知识、推理等的过程“计算机化”。人工智能的主要挑战是:确定一种可以计算机化的过程类型,然后将其计算机化,并验证其相关性或效率。ML研究的重点是一个特定的过程,即学习。主要的挑战是给计算机提供最少的知识和数据来训练它们。此外,ML需要人与人之间的交互,选择数据并验证机器的结果,以及计算机之间的交互,其思想是赋予计算机更大的决策自主权。自20世纪90年代以来,大型数据集(尤其是标记数据)之间的协同作用,以及使用图形处理器单元增强计算机能力,增强了更强大的技术应用。技术和推理逻辑能够实现几个目标,例如降低语音识别中的单词错误率,处理图像识别,在围棋中击败人类冠军,以及将图像翻译成自然语言。

在项目管理中,一些最常用的技术是:双变相关和多回归测试,数据挖掘,神经网络和贝叶斯网络以及贝叶斯网络和进化算法的混合方法。

这就是为什么为了解决我们的研究问题,我们探索了PM研究者所熟悉的三种建模技术:

(1)神经网络(又称深度学习),因为我们现在已经在几个领域证明了其结果的准确性。

(2)ML的一种类型称为强化学习(RL),因为它与我们对成熟度的概念相似。

(3)贝叶斯网络(BNs),因为这些动态工具结合了专家的数据,因果推理和相关性。

2.1 深度学习或人工神经网络

首先,我们探讨了利用神经网络来预测基于项目管理成熟度的绩效。神经网络用于提取人类无法感知的复杂模式,因为它们能够从复杂的数据中获取趋势。它们在商业应用中有着广泛的应用,尤其是在评估风险管理实践中。在本节中,我们将介绍它们,然后解释如何在我们的研究工作中使用这种技术。

受人类大脑的启发,神经生理学家沃伦·麦卡洛克(Warren McCulloch)和逻辑学家沃尔特·皮茨(Walter Pits)提出了由连接的功能节点组成的第一个神经网络。通过迭代修改连接的权值来训练网络。后来,同样受到神经科学的启发,Rosenblatt开发了感知器,一种用于学习的简单功能。它将每个神经元的输出映射为1或0。它取准则x的一个向量作为输入,权向量w,并计算它们的标量积是否超过阈值u,即如果wx > u,则f(x) = {1;否则0}。在一个简单的层神经网络中,由于二值分类的局限性,这个函数不是很有用。然而,它在多层网络中更有用,称为多层感知器(MLP) (Rumelhart, Hinton, & Williams, 1986)。MLP是在20世纪80年代发展起来的,它包含了反向传播,也就是为神经网络分配好的权值,使神经网络在学习中具有更低的误差。反向传播方法中最常用的一种是随机梯度下降法(SGD),它利用偏导数的链式法则将错误率降到最低。SGD传播所有派生或梯度,从顶部输出到底部,然后直接计算每个链接的各自权重。

自MLP和SGD实现以来,在求解神经网络方面一直没有相关的进展,直到1997年Hochreiter & Schmidhuber提出了另一种反向传播方法Long - Short Term Memory (LSTM)。LSTM缩短SGD;介绍了学习长期依赖关系的递归网络概念。LSTM学习速度快于SGD,解决了复杂的人工长时间滞后任务。

神经网络应用于许多科学和工业领域。然后我们需要绑定对PM有用的神经网络类型。此外,在我们的特殊情况下,神经网络必须具有:(1)作为输入的是表征项目管理成熟度的准则,(2)作为输出的是项目的运行绩效。根据通常的实践,建立一个因果模型可能需要使用多个层次(见图1)。然而,即使神经网络显示出很高的准确性,在PM中,我们也无法获得构建一个足够高效的网络所需要的数据量。按照这些标准,我们没有足够的项目来培训这个网络。神经网络对数据的需求随着输入标准的数量呈指数级增长(图2)。尽管存在固有的局限性,神经网络仍然在一些商业应用中被使用,例如评估风险管理实践(Kampianakis & Oehmen, 2017)。

图1:神经网络结构;图2:准确率vs算法复杂度

神经网络非常有趣,甚至令人着迷。我们在表1中总结了他们与PM相关的优缺点。

表1:神经网络在PM中的优缺点

2.2 强化学习(RL)

从马尔可夫决策过程(MDP)出发,提出了强化学习算法。这是随机情况下决策的数学模型,其中每个事件只依赖于在前一个事件中获得的状态(马尔可夫性质)。在1957年,Bellman提出了一个递归公式来优化MDP中所有奖励的总和。解这个方程意味着找到最优策略。然而,贝尔曼方程是不可能解析解的,因为它涉及到函数的最大化,而函数不能求导。直到1995年沃特金斯提出Q-learning算法,RL才有了相关的进展。该算法有助于解决探索-利用两难困境的挑战:计算机代理花费最优时间探索解决方案并获得奖励,但这并不足以陷入局部最优,而是使一般奖励最大化。

例如,在图3中,黄色方块代理尝试了几种路径来最大化长期累积的奖励并达到其目标:奖励为+1的绿色位置。根据RL,该代理没有直接指示要做出哪些决策,或者哪些决策的直接后果是什么。然而,每个决定将花费-0.04个百分点。代理完成所有步骤(从起点到绿色方块);然后,在决策过程的最后,它会获得累积的回报。然后它会模拟多条路径,直到最大化累积奖励。

图3:二维问题中的强化学习算法

非常令人惊讶的是,RL是基于一个与过程成熟度相近的学习概念。PMMMs的目的是根据实现(或没有实现)的最佳实践的数量和类型对组织进行分类和排序。类似地,在RL下,改进是基于成功地重复某件事,这类似于实现的最佳实践。RL使用计算机代理,这些代理通过与仿真环境的交互直接学习如何做出决策。RL的目标是从经验中获得最大的奖励信号;这是通过创建一个最优策略(类似于项目管理建议)来最大化一个奖励效用函数(类似于项目性能)。在RL下,计算机代理从不知道如何处理外部环境开始;随着它的成熟,它以更有效的方式完成它的任务,如在成熟度过程完善量表(表2)中。

表2:过程成熟概念和强化学习相似性

此外,可以定义PM数据库的标准轴。图4显示了带有两个条件的简化。其思想是这样的:当代理(旨在改进的系统)朝着各个方向移动时。它将从环境中得到回报。项目管理评估代理将探索状态(也就是说,它满足在每个轴上移动到下一个级别的标准),并且它将获得奖励点(项目运营绩效的收益)。RL模型将根据不同层次的通过步骤生成相应的策略,同时产生更好的性能。使用RL需要创建一个模拟,其中包括几个项目管理标准,并在代理满足这些标准时定义“奖励”点。

图4:强化学习算法下成熟度的获得

尽管它的价值,包括在PM中,RL是不容易实现的。许多参数必须预先定义。不幸的是,在我们的研究调查中,我们没有足够的数据来创建健壮的RL场景。表3显示了RL的优缺点。

表3:强化学习的优缺点

神经网络与RL的结合是深度强化学习(DRL)的基础。在这种情况下,处于状态的计算机代理使用深度神经网络来学习策略。使用这个策略,代理在环境中采取一个动作,并从它到达的特定状态中获得奖励。奖励反馈给神经网络并产生更好的策略。这是在一篇名为“Playing Atari with deep reinforcement learning”的论文中开发并应用的,在这篇论文中,他们学习了一台机器直接从像素点玩Atari游戏,经过训练后,机器产生了很好的效果(Mnih, Silver, & Riedmiller, 2013)。作者学习了电脑直接从像素点玩雅达利游戏,经过训练,机器产生了很好的效果。2016年,RL也被用来玩围棋,这是一个非常复杂的游戏,打败了世界冠军(Silver et al., 2016)。在这之后,RL得到了投资者更多的关注。自那以后,投资增加了,申请也在增加。

2.3 贝叶斯网络(BN)

BNs是基于图形的工具建模专家的知识和推理;然后BN结合数据和知识,知识状态和知识更新,相关性和因果关系。bn显式管理的不确定性的能力使他们适合大量的应用程序在一个广泛的现实问题包括风险评估,破产预测,产品的可接受性医学诊断,建筑设计过程诊断,等等。

我们在这篇文章中详细介绍了BNs的第一个演示。然而,我们可以注意到bn适合问题(1)的原因必须与结果,例如项目管理成熟度标准,作为输入变量,和一个特定的项目的操作性能,作为输出,(2)数据量并不大,(3)一个人必须结合数据和专家的知识我们可以总结bn在表的优点和缺点

表4:贝叶斯网络的优缺点

一旦提出了神经网络(NN)、RL和BNs,我们就可以定义一个令人满意的AI和ML技术的以数据为中心的需求,来阐述项目管理过程成熟度与项目运营绩效之间的因果关系。

选择适当的技术

我们提出了三种人工智能和ML技术- NNs, RL, BNs -可以用来解决我们的研究问题。在本节中,我们将对它们进行定性比较,以选择最有价值的。我们将使用的标准是数据,而不是知识。

3.1 数据质量评估框架

我们提出了三种技术可以用来解决我们的研究问题。在本节中,我们将对它们进行定性比较,以选择最合适的一个。为此,我们选择了几个标准来评估如何根据上面介绍的技术处理数据。表5给出了从OECD统计术语表(OECD Glossary of Statistical Terms, 2008)和(Naim, Wuillemin, Leray, Becker, & Pourret, 2008)中提取的概念。

表5:处理数据的评价标准

3.2 与我们的查询相关的数据评估

表6通过上述标准列表显示了NN、RL和BNs之间的比较。每一种AI和LM技术都有一个+符号,如果该特征得到满足,则有一个+符号,如果该技术在该特征中更好,则有一个+符号。同样,如果特征没有得到满足,则用符号表示;如果技术在特征上有一个重要的弱点,则用符号表示。

表6:三种技术的质量评价

访问标准:数据访问在我们的查询范围内是有限的。最大的挑战之一是获得一个结构化的PM成熟度审计和项目运营绩效评估数据库。因此,需要大量数据输入(NN, RL)的方法是不合适的。就可访问性而言,BNs似乎是最合适的。它们突出了处理混合数据(来自数据库和专家)、处理数据的不确定性和易于阅读的能力。

上下文标准:给定项目管理成熟度评估的上下文,数据的类型和数量是有限的。与其他方法相比,BNs方法能更好地保证结果的完整性。创建相关BN所需的数据量与研究问题的现实相符。

表征标准:BNs的图形表示是明确的,直观的,可被PM专家理解的。这有助于模型的验证和使用。决策者对工作可理解的模型比人工神经网络等黑盒模型更有信心。

内在标准:神经网络在准确性、客观性、唯一性和一致性方面表现出了一定的能力。只有当他们收到足够数量的数据时,才能达到这种熟练程度。BNs在“客观性”上失败:他们可能有偏见。然而,BNs可以将数据进化从输入传播到输出,并将信息反向传播,这一特性使得BNs对于本研究问题非常有用。

项目管理数据通常是稀缺和不完整的,从以往的数据中做出正确的决策是本研究的总体挑战。传统的机器学习,如神经网络,会根据现有的数据给出答案,而贝叶斯网络则包括与之相关的非样本或先前的人类专业知识。通常,与专家进行面谈,询问几个参数的影响,是回忆使贝叶斯网络比其他技术更丰富的所有信息的最佳方式。将这种专业知识与示例数据相结合,可以产生一种强大的技术,可以生成一个可实现的、性能足够好的模型。

模型的图形表示结构总是比黑盒模型好,比如神经网络。在与业务领域(即医疗保健,或者在本例中是项目管理)而不是模型技术专家一起工作时,解释和沟通这一点更容易。贝叶斯网络的另一个优点是它可以由专家知识和原始数据构建,即使其中一组知识是不完整的。可以从专家开始并使用数据进行细化,或者首先使用数据创建模型并使用专家进行改进。

本文分享自微信公众号 - 浊酒清味(gh_39aead19f756)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-07-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏小闫笔记

初识人工智能

刚开始接触人工智能的时候,大家肯定看到了一些名词:人工智能、深度学习、机器学习...what??哈哈,先来简单的给大家解释一下这三者的区别,再来谈论其他的问题。...

24740
来自专栏算法与编程之美

深入理解遗传算法(二)

”物竞天择,适者生存。“这是达尔文关于生物进化论的著名观点,指的就是一个种群经过不断的发展,逐步淘汰不适应外部环境,而能够得以生存留下的都是能够适应环境的。

10020
来自专栏算法与编程之美

聊一聊整数编码

网络上有两个用户A和B,用户A想要向B发送一个4字节的整型数据,请问A应该怎么做呢?

10820
来自专栏算法与编程之美

深入理解遗传算法(三)

已知N元一次方程y = w1x1 + w2x2 + w3x3 + w4x4 + w5x5 + w6x6

9220
来自专栏磐创AI技术团队的专栏

DeepMind爆出无监督表示学习模型BigBiGAN,GAN之父点赞!

例如,被称为史上最强图像生成器的BigGAN——许多人看到BigGAN生成的图像都要感叹“太逼真了!DeepMind太秀了吧!”

13530
来自专栏机器之心

图解NumPy,这是理解数组最形象的一份教程了

NumPy 软件包是 Python 生态系统中数据分析、机器学习和科学计算的主力军。它极大地简化了向量和矩阵的操作处理。Python 的一些主要软件包(如 sc...

11920
来自专栏MixLab科技+设计实验室

本周AI见闻 - NO.03

其一,充分挖掘各类有润滑油需求的4S店信息,也可以结合润滑油公司的自有CRM数据库,实现档案补齐,直接提供给润滑油公司销售一定量的销售线索,也可以根据不同行业的...

4920
来自专栏算法与编程之美

浅析UML类图符号理论

这六种关系,每一种都对应着一个符号。加起来就有六种符号,要想在较短的时间内记住这六种符号而且不产生混淆是一件不太容易的事情。那么该如何更有效的来记忆这些符号?

13230
来自专栏算法和应用

讨论覆盖函数中偏函数扩展的复杂性

摘要:覆盖函数是子模块函数的重要子类,可用于机器学习,博弈论,社交网络和设施位置。我们研究了覆盖函数的偏函数扩展的复杂性。也就是说,给定由[m]的子集族和每个点...

11360
来自专栏算法与编程之美

Python涨知识|你懂is和==的神奇区别吗

在编程中我们经常会用到“is”和“==”来表示判断,那么我想问大家一个问题为什么python会出现两个“表面”意思相近的语句呢?

8220

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励