文章/答案/技术大牛

发布

一次历经1800年的模型训练

文章来源：企鹅号 - 人工智能产业技术创新联盟

AI时代决胜的关键是认知。人工智能、神经网络并没有跳出模型建立、数据训练、模型修正和解释的基本方法基本思路。工具决定思维模式。手里提着锤子的人看什么都像钉子。我们学习人工智能的知识，最重要的是明白我们手上究竟提着多大力量的锤子，这样我们才能找到并且搞定合适的“钉子”。

1、模型的建立和初步训练

第一代模型的训练在公元100年由托勒密完成。这个模型是一个由40个圆组成的描述行星运行规律模型。托勒密是古希腊很牛的科学家，其实还挺帅的。下面给大家贴一张素颜照。

公元100年，他在古希腊广阔的天空下看着日月星辰斗转星移的时候，产生了一个大胆的猜想：这些星星的运行似乎是有规律的。他通过长期的记录发现，金星每四年就在天上画一个五角星。进行的运行轨道图如下图。这个规律被著名的小说《达芬奇的密码》作为一种神秘的规律引用并且拍成了电影。

除了金星，其他行星运行还有没有规律呢？这个规律是什么呢？作为古希腊时代一个典型的理工男，托勒密根据观测到的行星运行的规律，用40个圆来描述行星的运行规律。这个规律的复杂程度连现在的计算机都难以望其项背！这40个圆组成的复杂的行星运行规律描述系统就是一个数学模型。

这里插一句，所谓数学模型和飞机模型是不一样的。虽然有时候数学模型可以以图形的方式表示，但是更普遍的方式是一组方程。

2、托勒密模型的误差函数

托勒密对于行星的描述等同于一组方程。这个数学模型是儒勒历的基础。儒勒历的误差很小，每1400年会产生10天的误差，所以用了很久。但是再小的误差也是误差。误差积累到一定程度就会影响按照日历进行的农耕。因此格里高利修正了儒勒历。这次修正不仅修正了10天的误差，并且为了避免类似的误差，每100年去掉一个闰年，每400年恢复一个闰年。现在这个规律还在使用，所以整100年的世纪交接不一定是闰年。比如1900年就不是闰年，2月是28天。顺便说一句，苹果手机的日历里面1900年2月年历上错了，是29天，但是月历是28天（这个bug由一个叫做米奇的小男孩发现并且提交给了苹果公司）。

3、模型第一次迭代修正

我们现在都知道“地心说”是错误的。托勒密也被当作是地心说的代表人物。哥白尼日心说修正了地心说。但是，我不知道有没有人像我一样想过：地心说和日心说不就是运动系统的参考系统不同吗？

我们中学就学过，你坐在火车上。你既可以把地面当作静止，说火车往前跑；也可以把火车当作静止，说地面往后退。那为啥这么笃定的认为日心说对地心说错呢？答案是“简化”。日心说不再需要40个圆而只需要10个圆就可以描述行星的运行规律。当时，哥白尼发现日心说后，仍旧沿用“圆”来描述行星运行规律。这个时候的的日心说虽然精度还不如托勒密的地心说模型，但是却比地心说简单多了。

4、新的数据带来了新的训练，新的训练带来了新的模型

日心说简化了地心说模型，但是还不够简化。

后来出现了一个勤奋的天文学家：第谷。第谷老师穷尽一生收集了很多行星运行的数据，但是直到他去世这些数据也还是数据。差点这些数据就这么湮灭了。还好他有一个学生叫做开普勒。开普勒实际上是公认的一个天资不好的科学家。一生犯过无数低级错误，但是这丝毫不减其伟大的贡献。

顺便说一句，开普勒这个名字被用来命名一个太空望远镜。开普勒望远镜是用来观测类地行星，结果刚发射到太空，转向系统就坏了，只能脸朝一个方向。即使这样，开普勒望远镜还是发现了很多类地行星。

NASA在一份声明中说，开普勒太空望远镜探测到的太阳系外候选行星达到4034颗，其中2335颗已被确认为真正的行星。在这些行星中，49颗被认为是类似地球大小的宜居带候选行星，其中30多颗已获得确认。这个叫做开普勒的望远镜和开普勒本人一样，虽然犯了些小错误，但是还是非常伟大！

开普勒研究这些数据，最终建立了1个数学模型来描述星星运行的规律。这就是开普勒三定律。开普勒第一定律说行星运行轨道是椭圆形的。开普勒第二定律是行星运行和太阳连线单位时间扫过的面积是相同的。距离近就快点，距离远就慢点。开普勒第三定律也叫行星运动定律。开普勒第三定律的常见表述是：绕以太阳为焦点的椭圆轨道运行的所有行星，其各自椭圆轨道半长轴的立方与周期的平方之比是一个常量。

开普勒对每颗行星只用了一个椭圆就描述了其运行轨道。而且不仅是轨道，连运行速度也描述清楚了。开普勒的这三条定律比托勒密的40个圆的模型以及哥白尼的10个圆的模型都简单，不仅简单，还比托勒密的精确。所谓精确，就是不仅和第谷的数据符合度高，而且还对未来行星的运行规律预测的非常精确！

5、开普勒模型的进一步解释

在开普勒第三定律基础上，牛顿最终采用完有引力解释了为什么会这样。这种解释就是因果关系。后来爱因斯坦的广义相对论又重新解释了这个现象，认为不是太阳的吸引力而是太阳造成的空间弯曲导致地球呈现出绕着太阳转的现象。

这些内容咱们就不细说。有兴趣但是又不想纠结太多数学公式的同学可以我推荐看一本小册子《七堂极度简物理课》—很薄，很清楚，没公式。

6、总结

从公元100年托勒密初始化的太阳系行星模型训练，到爱因斯坦1916年正式发表广义相对论。这次模型训练历经了1800多年。我们从模型训练角度来看，整个过程分为6个步骤：

①　将现实世界的问题转化成一个数学问题：托勒密

②　收集数据：托勒密第谷

③　建立模型（猜想）：托勒密

④　用数据去训练模型：托勒密哥白尼开普勒

⑤　确定误差：格里高利

⑥　修正模型并迭代：哥白尼开普勒

除了以上数学模型的训练过程外，还可以附加以下三个步骤：

⑦　分析模型因果关系：牛顿爱因斯坦

⑧　用理论来推导新的理论并且建立模型用数据验证

⑨　用验证好的模型预测现实世界

7、每个人心里都应该有十个八个数学模型

我们今天讲这个模型训练的故事是想说明模型的建立、数据训练、模型修正和解释一直以来都是我们进步的基本方法。人工智能、神经网络并没有跳出这个基本思路。但是，数据的收集、模型的训练、修正的工具发生了翻天覆地的变化。工具决定思维模式。

手里提着锤子的人看什么都像钉子。我们学习人工智能的知识，最重要的是明白我们手上究竟提着多大力量的锤子，这样我们才能找到并且搞定钉子。所以我们每个人心里都应该有十个八个数学模型，因为人工智能技术极大的扩展了我们建立模型、优化模型的能力，我们只要把一些问题从现实世界转化成数学问题，问题就解决了一半。当然，你需要知道哪些问题是神经网络、深度学习能解决的问题以及解决这些问题的条件。

推荐观看：电影《达芬奇密码》

发表于: 2018-01-312018-01-31 12:11:14
原文链接：http://kuaibao.qq.com/s/20180131B0HHG200?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

一次历经1800年的模型训练

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐