文章/答案/技术大牛

发布

AI凭什么可以代替人类做交易？

文章来源：企鹅号 - 债券小馆

彼时，当ALPHA GO打败人类的时候，神经网络、深度学习（Artificial Neural Network、Deep Mind)这二个概念伴随着人工智能，一度传说中大量岗位会被人工智能取代。

作为一个trader, 我也去研究了很多人工智能的文章，想知道trader是否会被人工智能取代？

匆匆在一些地方看到了一些分析，大意是：由于交易本身包含了太多未知信息，并且交易员本身之间的大量操作也给这个交易系统增添了浑沌性，所以只能获得有限信息的电脑是无法获取确定性答案的，于是乎作为一个trader ,我再次心安理得的放下了这方面的关注。开心的做交易去了。

最近发现好友宽客在用神经网络做债市分析的时候，心中一开始是抱着怀疑的态度，随后在被有效性惊讶到的时候，不禁赶紧又去重新学习了神经网络和深度学习，从此路转粉，颠覆了自我对神经网络的认知！（本号相关文章：首发！人工智能债券收益率预测和债券技术指标，人工智能预测债券收益率（4.23-4.27））

先简单的总结一下几个结论：

1 我们在提到人工智能时往往伴随一个名词叫“神经网络”，听上去总感觉神经兮兮的，简单的说：神经网络是可被用来开发的交易型AI工具，使该AI可稳定获利。

2.AI是怎么预测交易的？其实并没有你想象中那么玄乎， AI可凭借有限的数据去成功预测未来并交易，并不需要知道市场全部信息。

3. 不同公司开发的AI可以共存于这个市场同时获利。

4.人类交易员并不会因为AI交易员而全部下岗，但相当大比例的会被淘汰。

除此之外，还有一些呼声比较高的问题，我等下会跟大家细扒：

1.影响市场走势的因素非常多，每个因素之间甚至互相缠绕，人有时甚至不能判断是哪个核心因素影响了市场，AI怎么可能做到？

2. 神经网络算出来的结果是黑箱结果（只有答案没有过程），人无法事后分析AI是怎么思考的，怎么敢把AI用于交易中？大幅亏损怎么办？

3. 不像围棋，只有黑白子，规则简单，下完就结束了可以判断输赢，交易市场信息无穷无尽，市场走势也是一个没有终点，AI怎么能做出一个预测？

4. AI尚且不能理解人类语言的含义，是否能理解复杂的交易逻辑？

要解答这些上面的问题，你首先应该了解 alpha zero的特点：

1 它不是用简单的穷举分析法去分析，而是通过计算局部最优的形式，不断获得局部最优解，从而获得最终的胜利。

2 它的函数包括多个维度，即通过不同的形式反复去综合去判断每一步是不是最优。

3 它的自我学习功能，使得其可以通过少量的数据，即可不断自我进化。

4 局部最优、蒙特卡洛树等理念的引入，使得计算机在思考上获得了超过人的优势。

是不是有点晕？当你仔细阅读他的原理就会感觉好很多。

AlphaGo Zero 采用了蒙特卡洛树搜索＋深度学习算法，我将尽可能用简单易懂的语言解释其工作原理。

树搜索（treesearch）

从一个棋盘的初始状态，开始思考下一步如何走。我们可以回顾一下我们思考的过程，我们会思考自己可以有哪几种走法，如果我走了这里，对手可能会走哪里，那么我还可以在哪里走。我和对手都会选择最有利的走法，最终价值最大的那一手，就是我要选择的下法。很明显这个思维过程是一颗树，为了寻找最佳的行棋点的过程，就是树搜索。

围棋第一手有361种下法，第二手有360种，第三手有359，依次类推，考虑到存在大量不合规则的棋子分布，合理的棋局约占这个数字的1.2%，约为2.081681994 * 10^170。这个一个天文数字，比目前可观测宇宙的所有原子数还要多。要进行完全树搜索，是不可能的。因此我们必须进行剪枝，并限制思考的深度。所谓剪枝，就是指没必要考虑每种下法，我们只需考虑最有价值的几手下法。所谓限制思考的深度，就是我们最多只思考5步，10步，20步。常见的算法是Alpha-beta剪枝算法。但是，剪枝算法也有它的缺陷，它很有可能过早的剪掉了后期价值很大走法。

蒙特卡洛方法(Monte Carlo method)

简而言之，蒙特卡洛方法，是一种“统计模拟方法”。20世纪40年代，为建造核武器，冯.诺伊曼等人发明了该算法。因赌城蒙特卡洛而得名，暗示其以概率作为算法的基础。

假设我们要计算一个不规则形状的面积，我们只需在包含这个不规则形状的矩形内，随机的掷出一个点，每掷出一个点，则N+1，如果这个点在不规则图形内则W+1。落入不规则图形的概率即为 W/N。当掷出足够多的点之后，我们可以认为：不规则图形面积＝矩形面积＊W/N。

要应用蒙特卡洛算法的问题，首先要将问题转化为概率问题，然后通过统计方法将其问题的解估计出来。

蒙特卡洛树搜索（MCTS）

1987年Bruce Abramson在他的博士论文中提出了基于蒙特卡洛方法的树搜索这一想法。这种算法简而言之是用蒙特卡洛方法估算每一种走法的胜率。如果描述的再具体一些，通过不断的模拟每一种走法，直至终局，该走法的模拟总次数N，与胜局次数W，即可推算出该走法的胜率为 W/N。

该算法的每个循环包含4个步骤：选择、扩展、仿真、反向传播。一图胜千言。

图中N表示总模拟次数，W表示胜局次数。每次都选择胜率最大的节点进行模拟。但是这样会导致新节点无法被探索到。为了在最大胜率和新节点探索上保持平衡，UCT（Upper Confidence Bound，上限置信区间算法）被引入。所谓置信区间，就是概率计算结果的可信度。打个比方，如果掷了3次硬币，都是正面朝上，我们就认为掷硬币正面朝上概率是100%，那肯定是错误的，因为我们的样本太少了。所以UCT就是用来修正这个样本太少的问题。具体公式如下：

其中wi 是i节点的胜利次数，ni是i节点的模拟次数，Ni是所有模拟次数，c是探索常数，理论值为 √2，可根据经验调整。公式的后半部分，探索次数越少，值会越大，所以，那些被探索比较少的点，会获得更多的探索机会。

蒙特卡洛树搜索算法因为是直接模拟到游戏终局，所以这种算法更加的准确，而且并不需要一个明确的“估值函数”，你只需要实现游戏机制就足够了。而且，蒙特卡洛算法，可以随时终止，根据其训练的时间给予近似的最优结果。

但是对于围棋这种游戏而言，它的选择点依然太多，这棵树会非常的大。可能有一个分支早已被丢弃，那么它将不会被统计，这可能是李世石能够在第四局击败AlphaGo的主要原因。对于这类情况，我们依然需要依赖一个好的估值函数来辅助。

深度学习

近年来，深度卷积神经网络在视觉领域取得很大的成功，如图片分类，人脸识别等。深度学习的网络结构在此不赘述，简而言之，深度学习是一个最优化算法。

我们可以将深度神经网络理解为一个黑盒，这个黑盒接收一批输入，得到一个输出，并根据输出计算出损失（误差），这个误差会反馈给黑盒，当给了足够多的数据之后，这个黑盒将具备一个特性，就是使误差最小化。

如果这么说还是难以理解的话，可以打个比方：深度神经网络是一种生物，它喜欢吃糖，有学习的能力，你给它看一张图片，它告诉你是猫还是狗，如果它猜对了，你就给它一颗糖，猜错了，就不给糖，久而久之，它就有了分辨猫狗的能力。作为创造者，你甚至不知道它是如何分辨猫狗的，但是它做到了，看得越多，识别的就越准。

这里至关重要的是——输入是什么？输出是什么？什么时候给糖的动作，也就是损失函数如何设计？在实际的操作过程中，网络结构的设计也很重要，这里不再细述。

对于围棋来说，深度网络可以用来评估下一步的主要选点（降低树的宽度），以及评估当前局面的值。

AlphaGo Zero

在AlphaGo Lee版本，有两个神经网络，一个是策略网络，是一个有监督学习，它利用了大量的人类高手的对弈棋局来评估下一步的可能性，另一个是价值网络，用来评价当前局面的评分。而在AlphaGo Zero版本，除了围棋规则外，没有任何背景知识，并且只使用一个神经网络。

这个神经网络以19x19棋盘为输入，以下一步各下法的概率以及胜率为输出，这个网络有多个batch normalization卷积层以及全连接层。

AlphaGo Zero的核心思想是：MCTS算法生成的对弈可以作为神经网络的训练数据。

还记得我们前面说过的深度学习最重要的部分吗？输入、输出、损失！随着MCTS的不断执行，下法概率及胜率会趋于稳定，而深度神经网络的输出也是下法概率和胜率，而两者之差即为损失。随着训练的不断进行，网络对于胜率的下法概率的估算将越来越准确。

这意味着什么呢？这意味着，即便某个下法AGZ没有模拟过，但是通过神经网络依然可以达到蒙特卡洛的模拟效果！也就是说，我虽然没下过这手棋，但凭借我在神经网络中训练出的“棋感”，我可以估算出这么走的胜率是多少！

AlphaGo Zero的对弈过程只需应用深度网络计算出的下法概率、胜率、MCTS的置信区间等数据即可进行选点。

AlphaGo Zero 蒙特卡洛树搜索过程

a: 每次模拟选择的分支，有最大Q+U, 其中Q是动作价值，U是上限置信，U依赖于一个存储在分支上的优先概率P和该分支的访问次数N（每访问一次N+1）。

b: 扩展叶节点，神经网络（P(s, .), V(s)) = fθ(s)评估s; 将向量P的值被存储在s的扩展边上。

c: 根据V更新动作价值（action-value)Q，反映所有该动作的子树的平均值。

d: 一旦搜索结束，搜索概率π被返回，与 Ν^(1/τ) 成正比，N是每个分支的访问次数，而τ是一个参数控制着温度（temperature）。

读完以上问题之后，再重新看之前提的alpha zero几点结论是不是有点明白了？

1 它不是用简单的穷举分析法去分析，而是通过计算局部最优的形式，不断获得局部最优解，从而获得最终的胜利。

2 它的函数包括多个维度，即通过不同的形式反复去综合去判断每一步是不是最优。

3 它的自我学习功能，使得其可以通过少量的数据，即可不断自我进化。

4 局部最优、蒙特卡洛树等理念的引入，使得计算机在思考上获得了超过人的优势。

这也是为什么他可以被运用到交易中的原理，那么现在我们就可以来解答一下文章开头的几个问题：

1.影响市场走势的因素非常多，每个因素之间甚至互相缠绕，人有时甚至不能判断是哪个核心因素影响了市场，AI怎么可能做到？

神经网络的作用，就是模拟人类的思维，把不同的影响因素拆解成单独的因素，并且计算不同的因素对市场造成的影响，再进行不同因素之间的拟合汇总，从而得出结论。通过大量的历史数据的验证、分析、拟合，AI有可能能够判断出这些市场影响因素真正背后孕育的关系。但人脑可能办不到，人脑的构造能够处理比如5-10个市场因素的关系分析，但是更多就无法办到，而电脑可以。

2.神经网络算出来的结果是黑箱结果（只有答案没有过程），人无法事后分析AI是怎么思考的，怎么敢把AI用于交易中？大幅亏损怎么办？

从谷歌的围棋软件战胜人类来看，人类己经不能理解大规模深度神经网络的内在原理。

如果人类能解释(理解)围棋软件为什么能下过人类，人类就不会输。这是悖论。

神经网络可以轻松拟合万维以上的函数，但人类超过了二十维函数极难理解，如弦理论的十一维度超膜理论能理解的人很少。

神经网络单元本质上是多维空间的非线性函数，当函数以一定方式集群时，当输入的拟合数据足够多时可以逼近任意复杂的多维函数，虽然不是最优化解（鬼知道围棋最优化解是什么），但在复杂高维问题上大概率逼近次优化解，完全满足很多现实需要。

神经网络某种程度上是一种概率拟合算法，在足够多的数据量及有效算法巨大算力下，下围棋时总下高概率的位置，只要人类下了一手低概率的棋就会输。

所以调试神经网络靠经验，再漂亮的数学公式结果不泛化不收敛也没用，如以前一批数学家以为激活函数sigmoid可导做论文漂亮推荐使用，结果阻碍神经网络发展好多年，神经网络的几起几落也是一帮学术派不懂工业应用而出现的，深度学习从围棋软件这种工业应用开始所以进入了高速发展期，硬件算力的巨大进步摆脱了学术界迷信paper数学公式的桎梏，人类进入黑箱计算工业化时代，智能算法成为实验学科。

3.不像围棋，只有黑白子，规则简单，下完就结束了可以判断输赢，交易市场信息无穷无尽，市场走势也是一个没有终点，AI怎么能做出一个预测？

可以设定一个确定期限，比如1个月，以1个月之后的终止做出预测，就可以给AI设定一个有目的性的模型。交易规则也可以理解为可编程的游戏规则，市场信息也可以输入计算机。所以是可编程、可量化、可被检验的一个模型。

4.AI尚且不能理解人类语言的含义，是否能理解复杂的交易逻辑？

AI确实不了解语言的意义，目前还没有AI能够办到。

但是交易逻辑是很好理解的，比如在交易上无数人专长的技术分析派，就是通过统计学上的对K线和量的走势分析，去预测各种未来的可能性。著名的MACD,波浪理论等等都是无数人研究的宝典。而这些理论的背后逻辑都是交易系统的价格和量能够解释市场所有的一些潜在信息和行为，并且能够通过K线去预测未来的可能性。

如果你相信K线技术分析有效，你为什么不相信AI能够学会技术分析？

所以最后得出开头的几个结论：

1 神经网络是可被用来开发成功交易型AI的工具，该AI可稳定获利。

2. AI可凭借有限的数据去成功预测未来并交易，并不需要知道市场全部信息。

3. 不同公司开发的AI员可以共存于这个市场同时获利

就像alpha go和alpha zero都可以战胜人类，不同的交易型ai可以侧重于对于短期、中期、长期逻辑的判断交易，可能都能同时获利

4. 人类交易员并不会因为AI交易员而全部下岗，但相当大比例的会被淘汰。

可能过去市场长期处于前50%的交易员是能够长期存活的，那么随着AI的加入，这部分人的业绩也会被拉低，所以可能未来只有前25%的交易员能够活下来，淘汰多少人，取决于AI有多强。

好消息是，目前由于对于交易型AI的开发需要大量的人力、物力、算力，所以目前还没有交易圈的alpha go诞生，只有一些小规模的尝试。至于什么时候能够出来，希望越晚越好：）

在其他行业，人工智能也不断有尝试，一个很重要的例子就是游戏界。

DOTA就是一个对于人工智能开发很有难度的项目，因为里面涉及到计算机对于不同操作的大量理解，怎么去判断某一个时点操控人物做一件什么事情最优？怎么判断什么时候根据对手情况出什么装备？不像是围棋界的精专，DOTA考虑的是AI思维的广度。

很不幸的是，2017年8月一款叫做OPEN AI的软件，在DOTA的世界比赛上，现场连续战胜了当时DOTA2 全球排名第一人。最神奇的是，AI的APM竟然低于平均人水平。全程靠着对赛局走势的精准把握和细致的操作取胜。

还有一点是AI的极大优势就是，AI可以有效弥补人类交易中的贪婪和恐惧心理，这点是非常重要的。

综上是我对神经网络的一家之言，不构成投资依据：）

对于未来的神秘竞争对手“神经网络”AI ，你怎么看？

发表于: 2018-04-252018-04-25 16:50:54
原文链接：http://kuaibao.qq.com/s/20180425B14KGP00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

AI凭什么可以代替人类做交易？

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐