他的杰作也是大家比较熟悉的西洋棋程序,通过编程让程序跟自己下了几万盘棋,通过学习那种布局会赢那种布局会输,一段时间之后,该西洋棋程序就知道什么是好的布局什么是坏的布局,再然后就牛逼了~
在此之后,机器学习的鼻祖级的人物...半监督学习
1、 给定一个来自某未知分布的样本集S=L∪U, 其中L 是已标签样本集L={(x1,y1),(x2,y2), … ,(x |L|,y|L|)}, U是一个未标签样本集U={x’1,x’2,...…,x’|U|},希望得到函数f:X → Y可以准确地对样本x预测其标签y,这个函数可能是参数的,如最大似然法;可能是非参数的,如最邻近法、神经网络法、支持向量机法等;也可能是非数值的,如决策树分类。...如何综合利用已标签样例和未标签样例,是半监督学习需要解决的问题。...强化学习把学习看作试探评价过程,Agent选择一个动作用于环境,环境接受该动作后状态发生变化,同时产生一个强化信号(奖或惩)反馈给Agent,Agent根据强化信号和环境当前状态再选择下一个动作,选择的原则是使受到正强化