首页
学习
活动
专区
工具
TVP
发布

技术圈

专栏作者
99
文章
92853
阅读量
13
订阅数
Layer Normalization
在学习Layer Normalization之前建议大家先自行学习Batch Normalization.
张凝可
2022-05-11
6870
GPT : Improving Language Understanding by Generative Pre-Training
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
张凝可
2019-08-22
2.1K0
Deep contextualized word representations
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
张凝可
2019-08-22
6450
Batch Normation
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
张凝可
2019-08-22
5190
集成学习---如何增强个体学习器的多样性
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
张凝可
2019-08-22
1.2K0
ID3、C4.5、CART三种决策树的区别
很早就想写写决策树,说起决策树做过数据挖掘的就不会感觉陌生,但是可能对ID3决策树算法、C4.5决策树算法以及CART决策树之间的区别不太了解,下面就这三个比较著名的决策树算法分别写写
张凝可
2019-08-22
8740
支持向量机
支持向量机自己就是一个很大的一块,尤其是SMO算法,列出来也有满满几页纸的样子,虽然看过但是并不能完全看懂其中精髓。
张凝可
2019-08-22
5680
支持向量回归
就拿最简单的线性回归来讲,通过模型输出的f(x)与真实输出的y值之间的差别来计算损失。而SVR假设模型输出f(x)与真实的y值之间可以容忍有eps大小的偏差,也就意味只要样本的预测值落在f(x)两侧在y轴方向上绝对值只差小于eps的间隔带上就是预测正确的。
张凝可
2019-08-22
1K0
关于词向量
参考论文:Efficient Estimation of Word Representations in Vector Space
张凝可
2019-08-22
8540
Attention Is All You Need
主流的Seq-Seq的模型通常采用RNN或者是CNN,一般在网络结构中都会用到encoder和decoder, 效果比较好的模型会通过attention(注意力机制)连接encoder和decoder。但是这种网络结构也存在一些问题:
张凝可
2019-08-22
5630
Netural Machine Translation By Joinly Learning To Align And Translate
参考论文:Netural Machine Translation By Joinly Learning To Align And Translate
张凝可
2019-08-22
4410
模型评估与选择
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
张凝可
2019-08-21
4040
集成学习---随机森林
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
张凝可
2019-08-21
4950
朴素贝叶斯模型
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
张凝可
2019-08-21
3530
没有更多了
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档