首页
学习
活动
专区
工具
TVP
发布

AI小白入门

专栏作者
163
文章
192904
阅读量
36
订阅数
清华大学唐杰教授:人工智能的下个十年
本文从人工智能发展的历史开始,深入分析人工智能近十年的发展,阐述了人工智能在感知方面取得的重要成果。
yuquanle
2020-10-23
7850
【NLP】通俗易懂的Attention、Transformer、BERT原理详解
网上关于这部分内容的好文章数不胜数,都讲的特别的详细,而今天我写这篇博客的原因,一是为了加深对这部分知识的理解,二是希望博客内容能够更多的关注一些对于和我一样的新同学难以理解的细节部分作一些自己的描述,三也是为了写一下我自己的一些思考,希望能和更多的人交流。这篇文章主要内容不在于原理的详细描述,期望的是对那些原理有了整体的认识,但是总是感觉似懂非懂的朋友们有所帮助。所以内容偏向于可能对于大佬来说很简单,但是对于刚刚接触NLP的朋友来说可能不了解的部分。希望有缘的朋友看到不吝赐教。
yuquanle
2020-08-27
2.1K0
流水的NLP铁打的NER:命名实体识别实践与探索
作者:王岳王院长 知乎:https://www.zhihu.com/people/wang-yue-40-21 github: https://github.com/wavewangyue 编辑:yuquanle
yuquanle
2020-08-18
4.3K0
【GCN】图神经网络入门(二)
除了GCN,还有一种趋势是在传播步骤中使用诸如GRU或LSTM等RNN的门控机制,以减少来自基本GNN模型的限制并提高整个图上的长期信息传播。
yuquanle
2020-07-24
2.5K0
【GCN】图卷积网络入门(一)
图是一种数据结构,可对一组对象(节点)及其关系(边)进行建模。近年来,由于图的强大表达能力,利用机器学习来分析图的研究受到越来越多的关注,即图可以用作包括社会科学(社会网络)在内的各个领域的大量系统的表示图是一种数据结构,可对一组对象(节点)及其关系(边)进行建模。
yuquanle
2020-07-24
1.7K0
147页详述「结构在神经网络中的复兴」,图注意力网络一作博士论文公开
在一项针对 2019 年到 2020 年各大顶会论文关键词的统计中,「图神经网络」的增长速度位列榜首,成为上升最快的话题。
yuquanle
2020-06-04
4170
【ML】分类树算法原理及实现
机器学习领域中的树模型其实就是结合了数据结构中的二叉树来开展机器学习任务的方法。本文所讲解的分类树为CART树中的一种,而CART树是决策树中的一种,其它还有ID3和C4.5。决策树算法是一类常用的机器学习算法,在分类问题中,决策树算法通过样本中某一维特征属性值的分布,将样本划分到不同的类别中,而这一功能就是基于树形结构来实现的。
yuquanle
2020-05-25
8560
Keras vs PyTorch,哪一个更适合做深度学习?
深度学习有很多框架和库。这篇文章对两个流行库 Keras 和 Pytorch 进行了对比,因为二者都很容易上手,初学者能够轻松掌握。
yuquanle
2020-05-19
1.4K0
BERT适应业务遇难题?这是小米NLP的实战探索
近年来,预训练模型在自然语言处理(Natural Language Processing, NLP)领域大放异彩,其中最重要的工作之一就是 Google 于 2018 年发布的 BERT 预训练模型 [1]。自被发布以来,BERT 预训练模型就在多项自然语言理解任务上取得了优异的效果,并开启了预训练-微调的 NLP 范式时代,启发了 NLP 领域后续一系列的预训练模型工作。与此同时,BERT 模型在 NLP 相关工业领域也得到了广泛应用,并取得了良好的效果。但由于工业领域相关业务的数据格式的复杂性,以及工业应用对推理性能的要求,BERT 模型往往不能简单直接地被应用于 NLP 业务之中,需要根据具体场景和数据对 BERT 模型加以调整和改造,以适应业务的现实需求。
yuquanle
2020-05-04
6870
【机器学习】EM算法
本文介绍了一种经典的迭代求解算法—EM算法。首先介绍了EM算法的概率理论基础,凸函数加jensen不等式导出算法的收敛性,算法核心简单概况为固定其中一个参数,优化另一个参数逼近上界,不断迭代至收敛的过程。然后介绍高斯混合,朴素贝叶斯混合算法基于EM算法框架的求解流程。最后介绍了基于概率隐因子的LDA主题模型,这一类基于隐因子模型-包括因子分解,概率矩阵分解皆可通过EM算法求解,且与EM思想相通。
yuquanle
2020-04-15
8690
【机器学习】XGboost
本文介绍了XGboost模型。首先在GBDT的基础上介绍XGboost,然后对比了XGboost与GBDT的不同之处,最后介绍了XGboost的损失函数和学习过程。
yuquanle
2020-04-07
3820
【机器学习】GBDT
本文介绍了提升树模型中的梯度提升树算法GBDT (Gradient Boosting Decision Tree) 。首先介绍了提升树通过拟合残差来提升学习器的设计思想。然后介绍了基于梯度提升的GBDT算法,核心在于学习器本身不再拟合残差,而是学习器拟合残差的一阶梯度,权重拟合残差的一阶系数。最后介绍了GBDT对应分类和回归场景的学习流程。
yuquanle
2020-04-07
6180
【机器学习】随机森林
本文介绍了结合集成学习思想的随机森林算法。首先介绍了集成学习中两种经典的集成思想Bagging和Boosting。然后介绍了Bagging的两个关键点:1)样本有放回随机采样,2)特征随机选择。最后介绍了Bagging的代表学习算法随机森林,从方差和偏差的角度分析了Bagging为什么能集成以及随机森林为什么能防止过拟合。
yuquanle
2020-04-01
9170
【机器学习】决策树
本文介绍了 ID3,C4.5,CART三种基本的决策树模型。首先介绍了决策树的特征选择,包括信息增益,信息增益率、基尼指数、最小均方差分别对应分类树ID3、C4.5、CART、回归树CART。然后介绍了决策树建树的一般流程、对比分类树和回归树建树的区别。最后介绍了树模型中避免过拟合问题的剪枝方法,包括前剪枝和后剪枝。
yuquanle
2020-04-01
6010
【智能司法】可解释的Rationale增强罪名预测系统
论文标题:Interpretable Rationale Augmented Charge
yuquanle
2020-03-31
8970
【NLP实战】手把手带你RNN文本分类
参考的的论文是来自2016年复旦大学IJCAI上的发表的关于循环神经网络在多任务文本分类上的应用:Recurrent Neural Network for Text Classification with Multi-Task Learning[1]
yuquanle
2020-03-13
5560
【NLP实战】手把手带你RCNN文本分类
之前介绍的都是属于深度神经网络框架的,那么在Deep Learning出现或者风靡之前,文本分类是怎么做的呢?
yuquanle
2020-03-13
1.3K0
【NLP】一文完全搞懂序列标注算法
序列标注模型用到了长短期记忆网络(LSTM),条件随机场(CRF),Highway网络,本文循序渐进的介绍了序列标注算法,Be patience ! 跟着小编的文章完全搞懂序列标注算法吧。
yuquanle
2020-03-13
4.7K0
【NLP】关于Transformer,面试官们都怎么问
前些时间,赶完论文,开始对 Transformer、GPT、Bert 系列论文来进行仔仔细细的研读,然后顺手把站内的相关问题整理了一下
yuquanle
2020-03-12
1.3K0
【DL】Self-Attention与Transformer
答:编码器-解码器(Encoder-Decoder)模型最初是由Cho等提出应用在机器翻译中。由于在机器翻译中是文本到文本的转换,比如将法语翻译成英语,Sutskever等也称编码器-解码器模型为序列到序列学习(Seq2Seq)。
yuquanle
2020-02-25
9090
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档