小七的各种胡思乱想-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

小七的各种胡思乱想

专栏成员

102

文章

194409

阅读量

54

订阅数

模型优化4. 正则化+数据增强 Mixup Family代码实现

serverless 编程算法正则表达式 NLP 服务

前三章我们陆续介绍了半监督和对抗训练的方案来提高模型在样本外的泛化能力，这一章我们介绍一种嵌入模型的数据增强方案。之前没太重视这种方案，实在是方法过于朴实。。。不过在最近用的几个数据集上mixup的表现都比较哇塞，所以我们再来聊聊~

风雨中的小七

2022-10-30

1.5K0

Bert不完全手册9. 长文本建模 BigBird & Longformer & Reformer & Performer

github git 开源编程算法 https

这一章我们来唠唠如何优化BERT对文本长度的限制。BERT使用的Transformer结构核心在于注意力机制强大的交互和记忆能力。不过Attention本身O(n^2)的计算和内存复杂度，也限制了Transformer在长文本中的应用。

风雨中的小七

2022-10-08

1.8K0

Tree - Gradient Boosting Machine with sklearn source code

编程算法 serverless

This is the second post in Boosting algorithm. In the previous post, we go through the earliest Boosting algorithm - AdaBoost, which is actually an approximation of exponential loss via additive stage-forward modelling. What if we want to choose other loss

风雨中的小七

2019-09-08

3970

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态