首页
学习
活动
专区
工具
TVP
发布

大数据文摘

专栏作者
5572
文章
4037537
阅读量
253
订阅数
小数据集也能大有作为:特征工程的妙用
作者:Krzysztof Pałczyński 翻译:王闯(Chuck) 校对:zrx 特征工程可以弥补数据的不足。 在快速发展的人工智能 (AI) 世界中,数据已成为无数创新应用和解决方案的命脉。实际上,大型数据集通常被认为是训练强大且准确的 AI 模型的支柱。但是,当手头的数据集相对较小时该怎么办呢?在本文中,我们将探讨特征工程在克服小数据集的局限性方面所起到的关键性作用。 玩具数据集 我们的旅程将从创建数据集开始。在这个例子中,我们将进行简单的信号分类。该数据集有两个类别:频率为1的正弦波属于类别0
大数据文摘
2023-04-30
4110
智源小分子预测赛进行中:基于CatBoost建模的baseline分享
赛题任务为根据从小分子结构中提取的3177个维度特征,预测小分子的六个化学性质。作者将赛题归纳为一个回归问题,直接训练六个模型来分别预测对应的六个性质,此baseline评测得分为8.30。
大数据文摘
2020-03-10
9360
10万元奖金,开启“智源粒子分类赛”下半时,三篇高分Baseline带你突破瓶颈!
高能质子对撞中会产生大量粒子团喷注(jet),喷注可以根据其不同内在特性分为胶体喷注、轻夸克喷注、魅夸克喷注、美夸克喷注。
大数据文摘
2020-03-04
6390
关于机器学习实战,那些教科书里学不到的12个“民间智慧”
这意味着数据量越大,这些算法就可以解决更加复杂的问题。然而,开发成功的机器学习应用程序需要一定的“民间技巧”,这在教科书或机器学习入门课程中很难找到。
大数据文摘
2019-05-15
3240
为什么说自动化特征工程将改变机器学习的方式
没有什么是一成不变的,尤其是在数据科学领域。毕竟,一些库、算法、工具一直在更新迭代。
大数据文摘
2019-03-04
5800
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档