首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

李沐:从头开始介绍机器学习,眼花缭乱机器学习应用

换言之,我们需要用数据训练机器学习模型,其过程通常如下: 初始化一个几乎什么也不能做模型; 抓一些标注数据集(例如音频段落及其是否为唤醒词标注); 修改模型使得它在抓取数据集上能够更准确执行任务...例如我们可以把本月公司财报数据抽取出若干特征,如营收总额、支出总额以及是否负面报道,利用分类预测下个月该公司CEO是否会离职。...该算法排序结果并不取决于特定用户检索条目。这些排序结果可以更好地为所包含检索条目的网页进行排序。 推荐系统 推荐系统与搜索排序关系紧密,并广泛应用于购物网站、搜索引擎、新闻门户网站等等。...下图展示了亚马逊网站对笔者之一有关深度学习类书籍推荐结果。 ? 搜索引擎搜索条目自动补全系统也是个好例子。它可根据用户输入前几个字符把用户可能搜索条目实时推荐自动补全。...而对非监督学习而言,例如聚类学习可以把一堆无标识图片自动聚合成若干类,其中每类分别对应一种动物。 以下我们简要介绍一些常见非监督学习任务。

98950

SQL语句执行原理清空缓存方法

语法符合后,就开始验证它语义是否正确,例如,表名,列名,存储过程等等数据库对象是否真正存在,如果发现有不存在,就会报错给应用程序,同时结束查询。...说明:SQL缓存分好几种,这里兴趣朋友可以搜索一下,有时因为缓存存在,使得我们很难马上看出优化结果,因为第二次执行因为缓存存在,会特别快速,所以一般都是先消除缓存,然后比较优化前后性能表现...DBCC FREESYSTEMCACHE 从所有缓存中释放所有使用缓存条目。SQL Server 2005 数据库引擎会事先在后台清理使用缓存条目,以使内存可用于当前条目。...但是,可以使用此命令从所有缓存中手动删除使用条目。 这只能基本消除SQL缓存影响,目前好像没有完全消除缓存方案,如果大家有,请指教。 执行顺序: FROM 子句返回初始结果集。...WHERE 子句排除不满足搜索条件行。 GROUP BY 子句将选定行收集到 GROUP BY 子句中各个唯一值组中。 选择列表中指定聚合函数可以计算各组汇总值。

2.1K50
您找到你想要的搜索结果了吗?
是的
没有找到

开发 | MxNet李沐:机器学习简介——动手学深度学习0.1

换言之,我们需要用数据训练机器学习模型,其过程通常如下: 初始化一个几乎什么也不能做模型; 抓一些标注数据集(例如音频段落及其是否为唤醒词标注); 修改模型使得它在抓取数据集上能够更准确执行任务...例如我们可以把本月公司财报数据抽取出若干特征,如营收总额、支出总额以及是否负面报道,利用分类预测下个月该公司CEO是否会离职。...该算法排序结果并不取决于特定用户检索条目。这些排序结果可以更好地为所包含检索条目的网页进行排序。 推荐系统 推荐系统与搜索排序关系紧密,并广泛应用于购物网站、搜索引擎、新闻门户网站等等。...下图展示了亚马逊网站对笔者之一有关深度学习类书籍推荐结果。 ? 搜索引擎搜索条目自动补全系统也是个好例子。它可根据用户输入前几个字符把用户可能搜索条目实时推荐自动补全。...而对非监督学习而言,例如聚类学习可以把一堆无标识图片自动聚合成若干类,其中每类分别对应一种动物。 以下我们简要介绍一些常见非监督学习任务。

1.2K40

专栏 | 李沐《动手学深度学习》第一章:机器学习简介

换言之,我们需要用数据训练机器学习模型,其过程通常如下: 初始化一个几乎什么也不能做模型; 抓一些标注数据集(例如音频段落及其是否为唤醒词标注); 修改模型使得它在抓取数据集上能够更准确执行任务...例如我们可以把本月公司财报数据抽取出若干特征,如营收总额、支出总额以及是否负面报道,利用分类预测下个月该公司 CEO 是否会离职。...互联网时代早期一个著名网页排序算法叫做 PageRank。该算法排序结果并不取决于特定用户检索条目。这些排序结果可以更好地为所包含检索条目的网页进行排序。...它可根据用户输入前几个字符把用户可能搜索条目实时推荐自动补全。...而对非监督学习而言,例如聚类学习可以把一堆无标识图片自动聚合成若干类,其中每类分别对应一种动物。 以下我们简要介绍一些常见非监督学习任务。

92650

一篇非常详尽NLP深度学习方法调研 | 论文精萃 | 14th

结果表明诸多好处,字符感知神经网络可以使用只有190万个训练参数网络在PTB数据集上实现最好水平效果。可以更好处理语料库中罕见单词。增加highway层之后,可以更好处理语义相似的问题。...一种用于非分割语言RNN词法语言模型:这种模型用RNN模型,加上一个定向搜索编码器,通过语料库训练后,在词法分析、词性标注、词形还原等任务中均超过了所有基线性能。 6....这些弧线可以是右弧线,也可以是左弧线,这取决于上面的单词(在句子中更右边)是否依赖于下面的单词(在更左边),或者底部单词是否依赖于上面。一旦确定了依赖关系,单词就会从堆栈中弹出。...截至文章撰写时最佳方法:是一种基于转移依存语法分析方法,使用了可选择算法来生成向无环图,而不是一个简单树。...研究发现,语义分析模型同时跨多个领域训练在一个域训练更为有效。, 8.信息提取:利用算法从文本中提取显性或隐性信息过程。

1.5K00

一个模板承包你所有表情包!

深度学习自然语言处理 原创 作者:cola meme是一种现代交流形式,其模板具有基本语义,任何人都可以在社交媒体上发布它。...由于机器学习系统没有足够上下文来理解meme,因为它比图像和文本更丰富内容,所以机器学习系统很难处理meme。...KYM中模因条目提供了基本模板和有关它附加信息,如它含义、来源、各种例子等。通过查看不熟悉模板条目并查看其使用示例,用户可以学习如何解释和使用模板本身来为其特定通信需求创建新实例。...因此,我们考虑训练集和测试集划分。 实验结果 TLC优于微调 我们比较了嵌入文本、编码模板、模板和示例。...MEMEX不是把模因和标签配对,而是用一个模因和一个解释配对创建一个新任务,其中标签是解释是否与模因相关。理解模因需要额外背景,但该方法不能应用于包含在数据集中模因,因为它依赖于一个解释。

24650

自然语言处理全家福:纵览当前NLP中任务、数据、模型与论文

模型通常在一个和训练源域不同目标域上评估,其仅能访问目标域标记样本(无监督域适应)。评估标准是准确率和对每个域取平均分值。 ? 语言建模 语言建模是预测文本中下一个词任务。...数据可以从 MultiNLI 网站上下载:https://www.nyu.edu/projects/bowman/multinli/ 语型内(匹配)和跨语型(不匹配)评估公开排行榜可查看(但这些条目没有对应已发表论文...词性标注 词性标注(POS tagging)是一种标注单词在文本中所属成分任务。词性表示单词所属类别,相同类别一般相似的语法属性。...语义文本相似性 语义文本相似性在于推断两段文本之间距离,例如我们可以分配 1 到 5 来表示文本多么相似。对应任务释义转换和重复识别。...类别取决于选择数据集,可以不同主题。 AG News AG News 语料库包含来自「AG's corpus of news articles」新文章,在 4 个最大类别上预训练

1.2K30

自然语言处理全家福:纵览当前NLP中任务、数据、模型与论文

模型通常在一个和训练源域不同目标域上评估,其仅能访问目标域标记样本(无监督域适应)。评估标准是准确率和对每个域取平均分值。 ? 语言建模 语言建模是预测文本中下一个词任务。...数据可以从 MultiNLI 网站上下载:https://www.nyu.edu/projects/bowman/multinli/ 语型内(匹配)和跨语型(不匹配)评估公开排行榜可查看(但这些条目没有对应已发表论文...词性标注 词性标注(POS tagging)是一种标注单词在文本中所属成分任务。词性表示单词所属类别,相同类别一般相似的语法属性。...语义文本相似性 语义文本相似性在于推断两段文本之间距离,例如我们可以分配 1 到 5 来表示文本多么相似。对应任务释义转换和重复识别。...类别取决于选择数据集,可以不同主题。 AG News AG News 语料库包含来自「AG's corpus of news articles」新文章,在 4 个最大类别上预训练

2.8K00

亚马逊AI主任科学家李沐:机器学习简介

以网络搜索为例,相较于判断页面是否与检索条目有关,我们更倾向于判断在浩如烟海搜索结果中,应向用户显示哪个结果。这就要求我们算法,能从较大集合中生成一个有序子集。...该算法排序结果并不取决于用户检索条目,而是对包含检索条目的结果进行排序。现在搜索引擎使用机器学习和行为模型来获得检索相关性分数。不少专门讨论这个问题会议。...它可根据用户输入前几个字符把用户可能搜索条目实时推荐自动补全。...你可以把监督学习看成一个非常专业工作,一个非常龟毛老板。老板站在你身后,告诉你每一种情况下要做什么,直到学会所有情形下应采取行动。...在欧几里德空间(例如,ℝnRn 中向量空间)中是否存在一种符号属性,可以表示出(任意构建)原始对象?这被称为表征学习(representation learning)。

1.6K60

谷歌借AI打破十年排序算法封印,每天被执行数万亿次,网友却说是最不切实际研究?

近日,谷歌 DeepMind AI 小组如今开发出一种强化学习工具 AlphaDev,能够在无需通过人类代码示例做预训练情况下,开发出极限优化算法。...AlphaDev 学习算法可以结合 DRL 和随机搜索优化算法来玩组装游戏。...AlphaDev 中主要学习算法是 AlphaZero 33 扩展,AlphaZero 33 是一种著名 DRL 算法,其中训练神经网络以指导搜索完成游戏。...AlphaDev 必须有效地搜索大量可能指令组合,以找到可以排序算法,并且还要比当前最好算法更快,同时代理模型可以根据算法正确性和延迟获得奖励。...从排序到散列 在发现更快排序算法后,DeepMind 测试了 AlphaDev 是否可以概括和改进不同计算机科学算法:散列。 哈希是计算中用于检索、存储和压缩数据基本算法。

19730

谷歌首席科学家:半监督学习悄然革命

作者认为在实际环境中重新审视半监督学习价值是一个激动人心时刻。 作为一个机器学习工程师,可能平时最常打交道就是海量数据了。这些数据只有少部分是标注可以用来进行监督学习。...那么接下来,我们就会顺理成章想到用这些已标注过数据进行训练,再利用训练学习器找出标注数据中,对性能改善最大数据,让机器自己标注数据进行分析来提高泛化性能, 这种介于监督学习和无监督学习之间方式...对于ImageNet,一种称为AutoAugment方法,它使用验证集上强化学习学习图像操作策略(比如旋转,剪切,改变颜色),以提高验证准确性。...(2)在半监督学习中,越来越倾向于使用一致性损失作为利用标记数据一种方式。...一次,他们使用BERT模型作为基线,在其半监督训练之前以无人监督方式进行微调,并表明他们增强方法甚至可以在无人监督训练值之上增加价值。

65050

推荐系统遇上深度学习(十一)--神经协同过滤NCF原理及实战

这对隐性反馈学习提出了挑战,因为它提供了关于用户偏好噪声信号。虽然观察到条目至少反映了用户对项目的兴趣,但是未查看条目可能只是丢失数据,并且这其中存在自然稀疏负反馈。...在隐性反馈上推荐问题可以表达为估算矩阵 Y中观察到条目的分数问题(这个分数被用来评估项目的排名)。形式上它可以被抽象为学习函数: ?...为了处理缺失数据,两种常见做法:要么将所有观察到条目视作负反馈,要么从没有观察到条目中抽样作为负反馈实例。...1.3 NCF 本文先提出了一种通用框架: ? 针对这个通用框架,论文提出了三种不同实现,三种实现可以用一张图来说明: ?...上面的表格设置了两个变量,分别是Embedding长度K和神经网络层数,使用类似网格搜索方式展示了在两个数据集上结果。增加Embedding长度和神经网络层数是可以提升训练效果

3.9K42

【综述】NLP领域迁移学习现状

在当前自然语言处理领域中,也同样普遍存在着不同类型迁移学习。这大致可以从三个维度进行分类:a)源设置和目标设置是否处理相同任务;b)源域和目标域是否相同属性;c)task学习顺序是否相同。...序列迁移学习是目前改进最大一种形式。一般做法是先使用你选择方法在大规模标注文本语料库上进行预训练,然后使用标注数据将这些表示应用到一个监督目标任务上。如下所示: ?...为了有机会解决这个难题,模型需要学习语法,语义以及某些世界常识。给定足够数据,大量参数和足够计算能力,模型就可以不错学习成果。...使用语法进行预训练,能够取得较好效果;即使没有明显地对语法进行编码,表征仍然可以学习到一些语法概念 (Williams 等人,2018)。...四、适配 为了使预训练模型适应目标任务,我们可以做出若干不同方向上决策:架构修改,优化方案以及是否要获得更多学习信号。

51720

NLP领域中迁移学习现状

在当前自然语言处理领域中,也同样普遍存在着不同类型迁移学习。这大致可以从三个维度进行分类:a)源设置和目标设置是否处理相同任务;b)源域和目标域是否相同属性;c)task学习顺序是否相同。...序列迁移学习是目前改进最大一种形式。一般做法是先使用你选择方法在大规模标注文本语料库上进行预训练,然后使用标注数据将这些表示应用到一个监督目标任务上。...为了有机会解决这个难题,模型需要学习语法,语义以及某些世界常识。给定足够数据,大量参数和足够计算能力,模型就可以不错学习成果。...使用语法进行预训练,能够取得较好效果;即使没有明显地对语法进行编码,表征仍然可以学习到一些语法概念 (Williams 等人,2018)。...四、适配 为了使预训练模型适应目标任务,我们可以做出若干不同方向上决策:架构修改,优化方案以及是否要获得更多学习信号。

84541

DeepLog:基于深度学习系统日志异常检测与诊断

这项工作提出了DeepLog,这是一种数据驱动异常检测方法,可以利用大量系统日志。DeepLog设计背后关键直觉来自自然语言处理:我们将日志条目视为遵循特定模式和语法规则序列元素。...我们评估表明,在之前研究过一个大型HDFS日志数据集上,DeepLog训练了正常系统执行日志条目的很小一部分(不到1%),对剩下99%日志条目,DeepLog几乎可以达到100%检测精度。...一般情况下,当要扩展任务T2个以上日志key时,当检查kx是否可以被包括为新头或尾时,我们需要检查kx与T中每个对数键是否大于τ共现概率,一直到距离d',其中d'是:i) T长度较小值,...不仅异常日志条目难以获取,而且训练数据中包含新类型异常可能无法检测到。相比之下,DeepLog将其LSTM模型训练为多类分类器,只需要正常数据进行训练。...LSTM方法和基于密度聚类方法都可以成功地分离所有任务。第一种方法需要LSTM;它是一种监督方法,需要提供训练数据。第二种方法是对一定距离阈值内日志键共现进行聚类,这是一种无监督方法。

6K30

动态 | 谷歌开源 TF-Ranking:专用于排序学习可扩展 TensorFlow 库

排序是一种以最大化整个列表效用为目的,对项目列表进行排序过程,适用于搜索引擎、推荐系统、机器翻译、对话系统,甚至还能用于计算生物学等众多领域。...在诸如这些(以及其他诸多)应用中,研究人员经常使用一系列称作排序学习监督机器学习技术。...因此,任何对构建 web 搜索或新闻推荐等基于真实世界数据排序系统感兴趣的人,都可以将 TF-Ranking 作为强稳、可扩展解决方案。 经验评估是所有机器学习或信息检索研究重要组成部分。...多条目评分 TF-Ranking 支持一种评分机制,在新评分机制中可以对多个条目进行联合评分,这是对只能对单个条目进行独立评分传统评分机制扩展。...开启 TF-Ranking 使用 TF-Ranking 实现了 TensorFlow Estimator 接口,它通过封装训练、评估、预测和导出服务,可以大大简化机器学习编程。

89630

LDAP概述

文件系统每个节点或者是文件或者是目录,但不能同时是二者。在文件系统中,只有目录可以子节点,而且只有文件可以包含数据。LDAP中条目可以是数据同时也可以兼任目录角色。...1.4 操作数据 1.4.1 查询类操作 查询类操作允许用户搜索目录并取回目录数据,两个查询操作:查询和比较。 LDAP查询操作用来在目录中搜索条目,并取出单个目录条目。...1.5.1 属性类型(attribute types) 属性类型控制属性格式,包括属性语法、匹配规则、是否可以多值、修改权限和用法等。...“操作属性”(操作属性是一种独立于Object Class而存在属性,它可以赋给目录中任意条目)。...1.6 安全特性 LDAP认证分为:无认证、基本认证、SSL/TLS三种,简单介绍一下。 无认证(匿名) 是最简单一种方法,这种方法在没有数据安全问题并且不涉及访问控制权限时候才能使用。

3.1K30

图解2018年领先两大NLP模型:BERT和ELMo

Word2Vec表明我们可以用一个向量(一个数字列表)以捕捉语义或意义关系(如判断单词近义、反义关系)、以及语法语法关系(例如, “had”和“has” 、“was” and “is”同样语法关系...ELMo秘诀是什么ELMo通过训练预测单词序列中下一个单词来获得语言理解能力——这项任务被称为语言建模。这很方便,因为我们大量文本数据,这样模型可以从这些数据中学习,不需要标签。...NLP终于找到了一种方法,可以像计算机视觉那样进行迁移学习。...如何使用它来预训练可以针对其他任务进行微调语言模型(在NLP领域,使用预训练模型或组件监督学习任务被称为下游任务)。...通过这个结构,我们可以继续在相同语言建模任务上训练模型:使用大量(标记)数据集预测下一个单词。只是,我们可以把足足7000本书文本扔给它,让它学习

1.3K20

机器学习(四)通过递归矩阵向量空间预测组合语义摘要简介方法结果结论

但是,它们无法捕捉到更长短语位置意义,这样就阻碍了它们对语言深入理解。我们介绍一种递归神经网络(RNN)模型,该模型学习任意句法类型和长度短语和句子组合向量表示。...我们模型为解析树中每个节点分配向量和矩阵:向量捕获组成部分固有含义,而矩阵捕获它如何改变相邻单词或短语含义。这种矩阵向量RNN可以学习命题逻辑运算符和自然语言含义。...组合.png 训练 我们通过在每个父节点顶部添加一个softmax分类器来训练向量表示,以一种情感分类或一些关系分类 ? softmax.png 其中W label∈R K×n是权重矩阵。...•使用功能是手动开发,不一定会捕获该单词所有功能。 结论 我们模型建立在语法上合理解析树上,可以处理组合现象。 我们模型主要新颖性是矩阵向量表示与递归神经网络组合。...它可以学习一个单词意义向量,以及该单词如何修改其邻居(通过其矩阵)。 MV-RNN将有吸引力理论性能与大型噪声数据集良好性能相结合。

83070

图解 2018 年领先两大 NLP 模型:BERT 和 ELMo

” 谷歌推出 BERT 模型被认为是 NLP 新时代开始,NLP 终于找到了一种方法,可以像计算机视觉那样进行迁移学习。本文用图解方式,生动易懂地讲解了 BERT 和 ELMo 等模型。...Word2Vec 表明我们可以用一个向量(一个数字列表)以捕捉语义或意义关系(如判断单词近义、反义关系)、以及语法语法关系(例如, “had” 和 “has” 、“was” and “is”同样语法关系...ELMo 通过训练预测单词序列中下一个单词来获得语言理解能力——这项任务被称为语言建模。这很方便,因为我们大量文本数据,这样模型可以从这些数据中学习,不需要标签。 ?...NLP 终于找到了一种方法,可以像计算机视觉那样进行迁移学习。...通过这个结构,我们可以继续在相同语言建模任务上训练模型:使用大量(标记)数据集预测下一个单词。只是,我们可以把足足 7000 本书文本扔给它,让它学习

95211
领券