在互联网的背后,有这么一群人,他们挑灯夜战,操纵者一个有力武器,写着一行又一行的英文字母,阿拉伯数字,一直为互联网大厦的建设添砖加瓦,这个武器就是算法,让这座大厦更高、更稳定、更智能。(这里不扯硬件的事,就是忽略路由器、服务器之类的)
在这里我为什么会介绍算法这个东西呢?因为你只有了解算法原理,才能明白后面的一系列的现象。当然的,这里不需要你精通的,但至少你能理解。
算法是完成分析任务所采纳或者遵循的一整套步骤和规则。
正所谓无规矩不成方圆,平时生活里,很多事情我们都是按照一定的步骤来完成的,像那些手工艺术,汽车之类的,都是要按照一定的顺序来完成的。那这个规则嘛,比如这个英语,汉语都是有一定语法、语义组合规则,遵守这些规则,我们就能够互相交流了。
算法也是类同于上面的这些,有一套自己的步聚和规则,没有多复杂。很多人不能理解算法是个什么东西,感觉是天书,其实是我们相多了。如果你让小孩子去学这些东西,就会发现他们更理解很容易,所以才说读书要趁早。并且在算法界很有名气的那些大拿,如果去研究他们的学习经历的话,就会发现他们接触算法、计算机非常早的。
好了,扯远了。关于数据科学来说,有三大类算法是必须是必须了解的。其实我觉得,不仅仅是数据科学,整个互联网的基础建设都是靠着这三大法宝。
一是数据清理和预处理的算法。在数据科学中就是去除一些假数据,有问题的数据,在现实中来说,就等于去掉杂质之类的。
二是最优化算法。字面意思,是算法更精准。通俗点说,就是打磨、加精,人们常说的工匠精神。
三就是机器学习算法。是人们通过人类的行动,研究的一套可以模拟人类思维模式的算法,不过却又不能完全等同于人类行为。如果学过高等数据的人都知道,永远逼近,但是永远不要交叉。就是说人类总结出来的这套规律也只是在现有基础上整出来的,只能接近自然本来的真相,但是人类永远不知道自然的真相本来是怎么样的,因为你凭什么说这是真相。(这里有点绕,反正记得他就是一套规则)
我们以后重点要了解的是机器学习算法这个,在这里,我们简单说说优化算法和机器学习算法之间的关系。机器学习算法就相当于一套规则,但是这套规则可能还不够完美,甚至还很粗糙,这个时候就要靠优化算法来修补、改进,使得这个这套规则更接地气,更能被使用。
好了,算法的事先简单介绍到这了,不理解没有关系,一开始我也没有理解透,后面我们通分析分析一些现象,多少就能理解了。
领取专属 10元无门槛券
私享最新 技术干货