机器学习是人工智能的一个分支,主要是设计和分析一些让计算机可以自动“学习”的算法,这些算法可以从数据中自动分析获得规律,并利用规律对未知数据进行预测。当前,机器学习已广泛应用于计算机视觉、自然语言处理、生物特征识别、战略游戏和机器人等领域。
本课程围绕机器学习的实践展开,首先分享了一些使用机器学习的经验和建议,包含确定最小预测单元、确定最优框架、依赖性分析、从回归到分类、舍弃和切分数据等;然后详细讲解了如何选择并处理数据、如何选择和评估模型、如何进行模型调试和提升,并对每个主题给出了相应的流程或建议;最后对一些常见的问题做了解释,比如如何快速掌握机器学习基础知识、TensorFlow对普通机器学习使用者的意义、神经网络是否可以代替据册数模型等。
【课程目标】
了解机器学习及其学习路径
掌握如何更好的完成数据处理、模型选择、模型评估等环节
【适用对象】
商务、AI开发者、学生
【课程大纲】
知识模块 | 简介 |
---|---|
使用机器学习的经验和建议 | 确定最小预测单元、确定最优框架、依赖性分析、从回归到分类、舍弃和切分数据 |
经典流程的选择和建议 | 如何选择并处理数据、如何选择和评估模型、如何进行模型调试和提升 |
解释常见问题 | 如何选择并处理数据、如何选择和评估模型、如何进行模型调试和提升 |
AI 慕课学院是和雷锋网联合创办的人工智能教育平台。旨在通过利用雷锋网自身在学术界、工业界、开发者圈等积累的资源与品牌优势,联合三界合作,为企业、学术圈和开发者提供直接对话学习的机会,带学生系统学习人工智能,培养优秀AI人才。
实际问题抽象化(1)-“ 哲学问题”
实际问题抽象化(2) -确定最优框架
实际问题抽象化(3) -确定最优框架
如果缺乏标签或标签获取成本很高,可以考虑半(无)监督学习
监督学习vs.无监督:精确度Vs.未知性
半监督学习:成本与效果的一种妥协
用有限的标签训练模型监督模型,并用于无标签数据再人为修正
强化学习/结构性预测: The future ;
实际问题抽象化(4) -依赖性分析
考虑时间与空间上的依赖性(dependency):
如果不考虑时空依赖性,问题会得到简化,但可能有严重偏差
如果需要考虑时间与空间。上的依赖性,优先从简单的角度入手
实际问题抽象化(5) -从回归到分类
分类问题(classification)指的是预测值是有限个离散值的情况,最常见的是二分类(binary classification),也就是{0,1}或者{-1,1}。
回归问题(regression)指的是预测值为连续值的情况,这样的取值往往有无数个,常见的有预测价格,可以是19.9, 19.99,或者19.998等。
回归问题总可以被转化为分类问题,分类问题-般比回归问题更简单,因此会有更好的效果,但同时也会损失信息。
实际问题抽象化(6) -从回归到分类
一般来说,以下情况适合进行回归到分类的转化:
实际问题抽象化(7) -舍弃和切分数据
数据质量往往不是连贯的。如果一定要使用整个数据段,那么预测效果往往较差。如果需要,可以选择“抛弃”数据质量较差的部分。
部分价值>>毫无价值
将预测范围缩少后,预测效果往往能有大幅度的提高
将数据分割后单独处理,预测效果往往也有提升
实际问题抽象化-总结
开始一个机器学习项目以前,值得几个“小问题”:
课程学习交流
请扫码关注腾讯产业互联网学堂微信公众号