再谈谈数学

  在一个很老的群里聊天,群里就那么二十几个人,都是搞这行的,在网上认识了十几年。一人是某大型电子地图公司出来的,说,”地图里面人工智能不就是用初中的概率论搞起来的,谁拿到数据谁都可以搞定“……初中的概率论,听到觉得真的非常的刺耳,于是就在群里争了几句。

  回头来想想,在信息技术领域里,难道数学真的变成了这么低的门槛的东西?再或许,我真的是out了,这些年的执着变得分文不值?可能是因为自己有些偏执,想起以前的时候学习计算机,虽然专业并不是计算机,但依然是一板一眼,一上来是从c语言汇编语言这样的语言开始搞起,数据结构、编译原理、操作系统原理、数据库原理、计算机原理等,过程中潜意识中意识到数学的作用,仿佛所有的计算机知识都可以被形式化。

  准确的说,计算机应该属于工科的东西,有很多工程的性质。如同别的工科工程一样,很多时候因为一些具体业务的需求会有一些用到初等数学的小窍门。打个比方,从时间0开始,两个任务,一个3分钟执行一次,一个5分钟执行一次,那么两个在那些分钟点上,两个任务都执行?如果是三个任务呢?于是突然有一天来了更复杂的问题,已知a,b互质数,找一个c,使得ac除以b余1,结果可能就不会做了。那么,为什么不稍微系统的学一下数论呢?设计算法的时候,可能设计了一个频繁使用的平均复杂度为O(logn)的算法,感觉很满意,可是运行的好好的,突然程序运行偶尔会很不顺畅,原来该算法的最高时间复杂度是O(n)。那么,为什么不系统的学学复杂度的计算呢?感到最烦的就是某些可能是初学者,会问为什么什么什么算法没有什么什么语言的描述之类的问题。我们学习算法学习的是神,而不是型,你学得算法的内涵之后,应该很容易就可以用你熟悉的语法写出来,可是很多人不明白这一点。

  机器学习里最简单的KNN算法,每个学习过的人真的认真去想过吗?KNN的每个维度如何做到公平这个问题,如果书本或者别人不告诉你的情况下,你自己是否会想到如何变的公平?直方图的意义在什么地方?归一化呢?KNN是很简单,可是你会不会想到如何在很多很多的样本中,尽量快速的找到前k个最近的值?我相信,很多人没有想过,乃至书上不会说自己也就永远不会去想。当然,我们的库、我们的工具可能很多地方是很好,让你不用去思考某些细节。所以,我们的研发很多时候只是在那里调节一些老外的参数而已,却很少想着去真正理解它,然后再此基础上改进甚至否定。

  工程两个字很多时候给人一些误解,认为对于某些问题我们只要反复的去试就行了,可实际上是,如果有深入的理论指导,很可能事半功倍,何止事半功倍。有时候想,是什么让人浮躁,是我们的收入使然,还是千变万化而又快速取代的信息技术?或许一切都不是原罪,而只有自己的心。

  我一向觉得,数学很重要,我们的软件工程师大多数数学学的太少,即便有的学了一些,可是依然不想着得其髓。再回到之前的概率论,搞AI的确是需要概率论这样的数学基础的,但是概率论真的很容易吗?我看不见得,当年我们学的时候,感觉是很难的,那一大堆的证明很头疼啊,比如有多少种极限的方式可以得到正太分布?甚至于建立概率空间的Sigma代数都不是那么平易近人。当然,你会反驳,我们是工程师,我们只需要知道怎么使用嘛那么复杂的概率论底层我们凭什么要深入了解。是的,我们甚至可能只需要知道条件概率怎么算,知道贝叶斯公式就OK了。可是,永远不要忘了,如果你站在更高的地方,你的思路会变得更广阔。所有上了大学接触到高等数学的学生可能都不会再觉得高中数学过于困难,那就是因为你上到了一个新的台阶。不需要每个人都像数学系那样深度的去学数学,可是,还是需要深入的想一想。

  我还是建议每个人从数学的角度去看看编译原理,或许可以看到一个不一样的世界,我也希望每个人都可以尝试着用lisp去勾画,好好理解理解lisp的思想,如果所有都是为了实用而实用,思想会禁锢。

  一直遇到一些浮躁的刚毕业大学生,甚至工作了有一定年份的人也有类似的想法。但我的思维可能还是那么古板,也许真是我多想了,不是人们浮躁了,而是世界变的快。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏玉树芝兰

文科生如何高效学数据科学?

看似无边无际、高深难懂而又时刻更新的数据科学知识,该怎样学才更高效呢?希望读过本文后,你能获得一些帮助。

1241
来自专栏CDA数据分析师

作为数据科学家,我都有哪些弱点

如果现代工作面试教会了我们什么,那就是关于“你最大的弱点是什么?”这个问题,正确答案是“我工作太努力了。”显然,说出自己的弱点是很可笑的。虽然在个人简历中列出弱...

693
来自专栏AI科技评论

学界 | 微软研究院资深主任研究员郑宇教授:多源数据融合与时空数据挖掘(一)

AI科技评论按:本文根据郑宇教授在中国人工智能学会AIDL第二期人工智能前沿讲习班*机器学习前沿所作报告《多源数据融合与时空数据》编辑整理而来,AI科技评论在未...

4118
来自专栏数据科学与人工智能

【数据挖掘】这些年,这些挖掘机算法,这些反思

写这篇文章,缘自于前几天部门内部成员们进行了一次部门内部现有涉及的一些算法的review以及整理。不过比较囧的就是,由于boss不在,我们讨论讨论着就成了吐槽大...

2629
来自专栏大数据文摘

前沿 | 国际可视化盛会PacificVis2017的十个精彩案例

2887
来自专栏华章科技

好文丨数据挖掘界领军人物谢邦昌:深度剖析Data Mining

谢邦昌教授,是台北医学大学医务管理学系研究所暨大数据研究中心及管理学院主任,也是数据挖掘界领军人物及世界知名统计学家,他对数据挖掘的定义是:Data Minin...

991
来自专栏程序员Gank

如何高效学习---读书笔记

笔者的话:本书介绍了整体性学习法,强调在学习过程中,需要通过比喻和抽象的方法,将新知识与旧知识相互联系,以提高学习效率和深度的学习方法。笔者亲测,甚是有效,在此...

1033
来自专栏IT派

推荐系统眼中的你:内容画像与用户画像

尽管推荐系统中应用了各种高深的算法、架构,但其基础原理是朴素的:更好的了解待推荐的内容、更好的了解要推荐给的人,从而更高效的完成内容与人之间的对接。断物识人,是...

5715
来自专栏牛客网

cvte春招一面二面终面面经(已通过终面)

本人背景:渣渣二本,渣渣acmer 应聘的是windows应用开发,应届生 今天晚上hr打电话跟我说:面试通过,邀请我参加现场签约,可惜31号有比赛就没办法去了...

40211
来自专栏UML

什么是组织结构图 / What is Organization Chart?

组织结构图显示组织或公司的内部结构。员工和职位由框或其他形状表示,有时包括照片,联系信息,电子邮件和页面链接,图标和插图。直线或肘线将水平线连接在一起。使用我们...

1546

扫码关注云+社区