最近放了一个长假,计划系统地学习下机器学习的基本知识,途径主要是看andrew ng
大牛的斯坦福大学公开课-机器学习课程视频,当然在看的过程中为了加深理解,会记下笔记,此篇为第一篇笔记。
非正式定义:
Arthur Samuel (1959). Machine Learning:
Field of study that gives computers the ability to learn without being explicitly programmed.
在不直接针对问题进行编程的情况下赋予计算机学习能力的一个研究领域。
更现代的定义:
Tom Mitchell (1998). Well-posed Learning Problem:
A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
对于一个计算机程序来说,给它一个任务T和一个性能测量方法P,如果在经验E的影响下,P对T的测量结果得到了改进,那么就说该程序从E中学习。
我们在“监督”问题的算法,这里给算法提供了一组“标准答案”,之后我们希望算法去学习标准输入和标准答案之间的联系,以尝试对于我们的其他输入给我们提供更为标准的答案。
学习理论分析为什么学习型算法是有效的,这样我们才可以让算法尽可能高效地工作。
学习理论可以使人能够真正地将机器学习的理念应用到解决实际问题当中。
给一组数据,不告诉关于数据的任何正确答案,然后算法在这组数据中寻找一些有趣的结构。
用在你不需要进行一次决策的情形中,你通常会在一段时间内做出一系列的决策。在强化学习背后的基本概念是一个称为回报函数的概念。强化学习的关键是需要找到一种方式来定义一个好的行为和一个坏的行为,之后就是需要一个学习型算法来尽可能地获得更多的回报和更少的惩罚。