机器学习、神经网络在控制科学中的应用前景探讨

用户1737318

发布于 2018-06-05 11:57:45

1.7K0

发布于 2018-06-05 11:57:45

文章被收录于专栏：人工智能头条

【编者按】这是知乎上的一个问题：“机器学习，神经网络在控制科学中的前景和应用大吗？为什么？”提问者怀疑自动控制领域是否应该偏向纯数学的建模，赫尔辛基大学的@高源回复，分别从机器学习的角度和控制算法的角度进行分析，解答了为什么控制算法转向学习算法是不可避免的。答案颇具参考价值。

疑问：

看到有应用算法来训练新式机器人自我移动的案例（来自斯坦福机器学习老版本课程），觉得很激动，因为这个过程很像生物界的学习过程。自控理论的老师认为当前行业里不太看好神经网络控制的论文，认为水分大，也不够有技术含量。自动控制领域偏向纯数学的建模真的好吗？1，模型本身就是不精确的，各个部件的模型随实践也会改变，仿真的结果可能实际中根本就达不到。2，控制系统日趋复杂，耦合度加大，想要控制如同人一样的机器人，从关节，耦合的表示上就已经很复杂，数学的复杂度必然会限制它的应用。而实际中，1，生物的控制，人的走路，抓取，奔跑，就是长时间训练的结果，模型的精度和可靠性随着我们使用的次数变得越来越高,2，每个人生来就是不一样的，时间增长，每个人会长高，对应在控制理论里就是传递函数的变化，可是人能够很好地适应，说明这个算法适应能力很强，也有很高的通用性（不同的人都使用相同的方法）。

回答：

首先需要澄清的是神经网络只是机器学习的一个模型，也是控制论的一个模型。

她最简单的形式的本质是多个非线性函数合成的函数。

是一个非线性函数，比如tanh。

这样看来他其实就是一个数学模型，并没有什么特殊之处。而且它和生物界的学习过程差很远，只是最初步的优化，要是考虑相似性，IBM neuron morphiccomputing更像一些，效果却不是很好。

下面正式答题。

不好意思，在此畅所欲言，抛砖引玉，也希望听到大家的观点。

我在这儿把控制科学等量于机器人学来讨论，我相信这样简化并不会减少大家的兴趣。

机器人学把对机器人的操控分为两部分，一部分是perception，一部分才是传统意义上的控制，control。

机器学习对于第一点，perception的作用不可谓不深。无论是监督，非监督的方法对机器人视觉，语言，情感都有不可磨灭的贡献。举几个例子，1. 在视觉识别和分类上面，基本都是机器学习的一个模型（卷积神经网络CNN）独占天下。大家可以看看这个数据库The KITTI Vision Benchmark Suite，基本在每个识别竞赛下都是CNN的改变版本第一名。2. 在情感计算方面，机器学习提供了在数据量大的情况下，识别当前状态下的情感的可能。Stefan Wermter用Recurrent Neuron Network（RNN）的模型分析twitter上每个状态的情感从而让机器人针对不同的情况做出不同的反应。机器学习在perception方面作出的贡献其实是对控制非常有用的，和Sensor Fusion结合在一起，他其实提供了机器人一个更真实的反馈。只不过这个方面在传统的控制算法当中不受重视，我也就不在赘述。

第二点就是传统意义上的的控制算法了。由于在计算机科学历史上，控制算法并不是主要的研究方向，所以学习算法在这个方向上的发展就有些慢。（传统上计算机科学的主要研究方向是图像和NLP）。而且以前的控制算法不需要多少输入，和动辄 1086 x 1086 x 3 x n 输入的图像研究不能比。所以人们倾向于找简单的方法（比如各种判定依据）。这一点上和图像的早期算法是相似的，都是人工的找判定依据（比如某种物品的判定依据）。计算机图像学之所以发生改变，是因为人们发现判定依据太过复杂，而计算资源又有发展，所还不如用学习算法学习这些特征。我觉得控制论也在往这个方向发展。现在很多控制算法开始大量考虑优化问题，我觉得就是趋势。优化问题普遍需要数据，很快控制算法就会和学习算法合流（基于机器学习已经合并了统计学习，以后机器学习也可以合并控制算法）。

那么从机器学习本身发展出来的控制算法有没有呢？答案是有的，比如说总有几个神人，比题主和答主早个几十年开始考虑这个问题. 哲学上有名的人是Stefan Schaal，他的文章Is Imitation Learning the Route to Humanoid Robots?是对这个方向最直接的思考。虽然中国对这方面的了解还比较少，但是这篇文章已经有近1000的引用了，说明各国科学家还是很看好这个方向的。这之后很多人有过尝试，但是由于基本是零起步，所以并不是很成功。然后，然后一个叫增强学习方向立功了，这个方向也许很多人都不了解。他是基于强调如何基于环境而行动，以取得最大化的预期利益来学习。也就是说这个机器学习方向的数学模型允许试错存在，也就是你可以尝试，并在错误中学习。具体的数学模型可以参见Sutton的Book。

由于数学比较复杂，在比较的少的时间不好解释。我就简单的带一下他的发展史，在发现增强学习中的马克沃夫决策过程（MDP）可以解决控制问题之后，人们又发现，连续的控制过程离散化之后数据会变得非常大。于是就开始直接优化在决策函数的超参数（叫做Policy Gradient 策略梯度方法），发现学习算法终于可以和传统控制有的一比了。

不过学习算法和传统算法还有些缺陷，比如题主刚刚说的精确问题，普通学习算法精确度就和普通控制算法比就有些问题（毕竟人类帮这些控制算法总结了物理定律），神经网络就更差了。精确性是神经网络一个非常严重的问题，控制问题对模糊的容忍度比识别问题低的多。因为一次不好的控制就会导致的机器人损坏或者报废。就算在机器人学习算法的大牛里面对神经网络也是慎之又慎。大家一般都是倾向于用容易算出bound的基于马克沃夫决策过程的增强学习算法和容易求出方差的高斯过程回归。一个有趣的事实是，虽然大家都担心神经网络，但是一直都有尝试，因为它好处也太多了。比如和在部分领域最好的perception算法结合，比如训练过程简单，比如scalability非常好。解决对神经网络不信任这个问题，我觉得人们需要发展新的数学工具去解释比如CNN，RNN的复杂神经网络。

我认为随着计算能力的增强，控制算法转向学习算法是不可避免的，因为慢慢所有的反馈都由大量的数据组合而成，而没人想一个一个分析。现在人们在研究结构性重组，高斯过程回归，深度学习对算法的改进。而这是我们的时代。

【预告】首届中国人工智能大会（CCAI 2015）将于7月26-27日在北京友谊宾馆召开。机器学习与模式识别、大数据的机遇与挑战、人工智能与认知科学、智能机器人四个主题专家云集。人工智能产品库将同步上线，预约咨询：QQ：1192936057。欢迎关注。

大会官网链接：http://ccai2015.csdn.net

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2015-07-03，如有侵权请联系 cloudcommunity@tencent.com 删除

其他

本文分享自人工智能头条微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

其他

登录后参与评论

0 条评论

热度

机器学习、神经网络在控制科学中的应用前景探讨

机器学习、神经网络在控制科学中的应用前景探讨

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐