首页
学习
活动
专区
工具
TVP
发布

机器学习与自然语言处理

专栏作者
38
文章
54229
阅读量
43
订阅数
将句子表示为向量(下):基于监督学习的句子表示学习(sentence embedding)
上一篇介绍了如何用无监督方法来训练sentence embedding,本文将介绍如何利用监督学习训练句子编码器从而获取sentence embedding,包括利用释义数据库PPDB、自然语言推理数据SNLI、以及综合利用监督训练数据和无监督训练数据。
llhthinker
2019-05-25
1.2K0
Stanford机器学习笔记-3.Bayesian statistics and Regularization
3. Bayesian statistics and Regularization Content   3. Bayesian statistics and Regularization.      3.1 Underfitting and overfitting.      3.2 Bayesian statistics and regularization.      3.3 Optimize Cost function by regularization.        3.3.1 Regulariz
llhthinker
2018-03-13
8500
Stanford机器学习笔记-4. 神经网络Neural Networks (part one)
4. Neural Networks (part one) Content:   4. Neural Networks (part one)      4.1 Non-linear Classification.     4.2 Neural Model(神经元模型)     4.3 Forward Propagation     4.4 神经网络实现与或非门以及异或门       4.4.1 实现与或非门(AND/OR/NOT)        4.4.2 实现异或/同或门(XOR/XNOR)      4
llhthinker
2018-03-13
9470
Stanford机器学习笔记-5.神经网络Neural Networks (part two)
5 Neural Networks (part two) content:   5 Neural Networks (part two)     5.1 cost function     5.2 Back Propagation     5.3 神经网络总结 接上一篇4. Neural Networks (part one). 本文将先定义神经网络的代价函数,然后介绍逆向传播(Back Propagation: BP)算法,它能有效求解代价函数对连接权重的偏导,最后对训练神经网络的过程进行总结。 5.1
llhthinker
2018-03-13
7510
Stanford机器学习笔记-6. 学习模型的评估和选择
6. 学习模型的评估与选择 Content   6. 学习模型的评估与选择     6.1 如何调试学习算法     6.2 评估假设函数(Evaluating a hypothesis)     6.3 模型选择与训练/验证/测试集(Model selection and training/validation/test sets)      6.4 偏差与方差       6.4.1 Diagnosing bias vs. variance.        6.4.2 正则化与偏差/方差
llhthinker
2018-03-13
8810
Stanford机器学习笔记-9. 聚类(Clustering)
9. Clustering  Content   9. Clustering     9.1 Supervised Learning and Unsupervised Learning     9.2 K-means algorithm     9.3 Optimization objective     9.4 Random Initialization     9.5 Choosing the Number of Clusters 9.1 Supervised Learning an
llhthinker
2018-03-13
1.3K0
Stanford机器学习笔记-10. 降维(Dimensionality Reduction)
10. Dimensionality Reduction Content  10. Dimensionality Reduction   10.1 Motivation     10.1.1 Motivation one: Data Compression     10.2.2 Motivation two: Visualization   10.2 Principal Component Analysis     10.2.1 Problem formulation     10.2.2
llhthinker
2018-03-13
8390
机器学习之分类问题实战(基于UCI Bank Marketing Dataset)
导读: 分类问题是机器学习应用中的常见问题,而二分类问题是其中的典型,例如垃圾邮件的识别。本文基于UCI机器学习数据库中的银行营销数据集,从对数据集进行探索,数据预处理和特征工程,到学习模型的评估与选择,较为完整的展示了解决分类问题的大致流程。文中包含了一些常见问题的处理方式,例如缺失值的处理、非数值属性如何编码、如何使用过抽样和欠抽样的方法解决分类问题中正负样本不均衡的问题等等。 作者:llhthinker 1. 数据集选取与问题定义 本次实验选取UCI机器学习库中的银行营销数据集(Bank Ma
llhthinker
2018-03-13
5K0
信息量,熵,交叉熵,相对熵与代价函数
本文将介绍信息量,熵,交叉熵,相对熵的定义,以及它们与机器学习算法中代价函数的定义的联系。 1. 信息量 信息的量化计算: 解释如下: 信息量的大小应该可以衡量事件发生的“惊讶程度”或不确定性: 如果
llhthinker
2018-03-13
6500
深度学习在文本分类中的应用
近期阅读了一些深度学习在文本分类中的应用相关论文(论文笔记),同时也参加了CCF 大数据与计算智能大赛(BDCI)2017的一个文本分类问题的比赛:让AI当法官,并取得了最终评测第四名的成绩(比赛的具体思路和代码参见github项目repo)。因此,本文总结了文本分类相关的深度学习模型、优化思路以及今后可以进行的一些工作。欢迎转载 1. 文本分类任务介绍 文本分类是自然语言处理的一个基本任务,试图推断出给定的文本(句子、文档等)的标签或标签集合。 文本分类的应用非常广泛。如: 垃圾邮件分类:二分类问
llhthinker
2018-01-24
3K0
Stanford机器学习笔记-7. Machine Learning System Design
7 Machine Learning System Design Content   7 Machine Learning System Design     7.1 Prioritizing What to Work On      7.2 Error Analysis     7.3 Error Metrics for Skewed Classed        7.3.1 Precision/Recall        7.3.2 Trading off precision and re
llhthinker
2018-01-24
5820
Stanford机器学习笔记-1.线性回归
Content: 1. Linear Regression   1.1 Linear Regression with one variable     1.1.1 Gradient descent algorithm   1.2 Linear Regression with multiple variable     1.2.1 Feature Scaling     1.2.2 Features and polynomial regression     1.2.3 Normal equation    
llhthinker
2018-01-24
6950
Stanford机器学习笔记-2.Logistic Regression
Content: 2 Logistic Regression.    2.1 Classification.    2.2 Hypothesis representation.      2.2.1 Interpreting hypothesis output.    2.3 Decision boundary.      2.3.1 Non-linear decision boundaries.    2.4 Cost function for logistic regression.      2.4.
llhthinker
2018-01-24
5890
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档