首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏作者
2138
文章
1931010
阅读量
188
订阅数
独家 | 人工智能的记忆与泛化(附链接)
在机器学习的背景下,大多数模型都是建立在数据是i.i.d.(独立同分布)的基础之上进行训练和评估的,它意味着对于同一个给定任务来说,需要对相同分布的训练数据和测试数据进行采样。泛化意味着需要从训练数据中提取出共享的底层分布。
数据派THU
2022-12-16
2200
6种方案|防止模型过拟合(overfitting)!
来源:深度学习基础与进阶、极市平台本文约2700字,建议阅读6分钟本文对几种常用的防止模型过拟合的方法进行了详细的汇总和讲解。 其实正则化的本质很简单,就是对某一问题加以先验的限制或约束以达到某种特定目的的一种手段或操作。在算法中使用正则化的目的是防止模型出现过拟合。一提到正则化,很多同学可能马上会想到常用的L1范数和L2范数,在汇总之前,我们先看下LP范数是什么? LP范数 范数简单可以理解为用来表征向量空间中的距离,而距离的定义很抽象,只要满足非负、自反、三角不等式就可以称之为距离。 LP范数不是一个范
数据派THU
2022-09-19
3920
借助OCR和正则表达式,复旦博士用130行代码核查核酸报告,800份只需要2分钟!
来源:大数据文摘本文约2000字,建议阅读5分钟800张图只要2分钟,程序已封装。 近日,根据复旦大学报道,学校信息科学与工程学院博士生李小康使用OCR和正则表达式帮助学院几分钟核查完数百人核酸完成截图,大大提高了核查效率和精度。 相关话题在知乎上也引起了众多讨论,目前该话题已经得到了300多万次浏览。 用OCR和正则表达式“防疫” 首先,我们需要简单介绍一些OCR。 OCR,英文全称Optical Character Recognition,即光学字符识别,也可简单地称为文字识别,这是文字自动输入的
数据派THU
2022-04-18
7610
正则化方法小结
来源:机器学习方法那些事、极市平台本文约2800字,建议阅读9分钟本文为你带来正则化概念及其方法的概述。 导读 本文先对正则化的相关概念进行解释作为基础,后对正则化的方法进行了总结,帮助大家更加清晰的了解正则化方法。  阅读目录 LP范数 L1范数 L2范数 L1范数和L2范数的区别 Dropout Batch Normalization 归一化、标准化 & 正则化 Reference 在总结正则化(Regularization)之前,我们先谈一谈正则化是什么,为什么要正则化。 个人认为正则化这个字眼有点太
数据派THU
2022-03-04
2790
教你简单解决过拟合问题(附公式)
翻译:韩海畴 校对:丁楠雅 本文带大家认识了什么是过拟合,并且示范了用正则化的方法来避免过拟合的问题。 多项式回归&过拟合 你可能训练过这样的机器学习模型,它在训练样本上表现得无可挑剔,却在新样本预
数据派THU
2018-03-26
1.1K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档