首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏成员
2149
文章
2148136
阅读量
191
订阅数
特征工程:基于梯度提升的模型的特征编码效果测试
来源:DeepHub IMBA本文4300字,建议阅读8分钟展示梯度提升模型下表格数据中的数字和分类特征的各种编码策略之间的基准测试研究的结果。 为梯度提升学习选择默认的特征编码策略需要考虑的两个重要因素是训练时间和与特征表示相关的预测性能。Automunge库是处理表格数据常用的库,它可以填充空值,也可以进行分类的编码和归一化等操作,默认的境况下Automunge对分类特征进行二值化处理,并对数值特征进行z-score归一化。本文将通过对一系列不同数据集进行基准测试来验证这些默认值是否是最优化的选项。
数据派THU
2022-04-06
4520
独家 | 提升API设计技能的22个最佳实践(附链接)
作者:Mohammad Faisal翻译:张一然校对:和中华 本文约2000字,建议阅读7分钟本文介绍了有关设计REST api的一些实用建议。
数据派THU
2021-07-16
5490
用哪种语言写的应用漏洞最严重?六大主流语言代码漏洞分析报告出炉
静态代码分析安全公司 Veracode 近日发布了一份应用程序分析报告,结果发现比起 JavaScript 和 Python 等语言,C++ 和 PHP 的安全漏洞要严重得多。
数据派THU
2021-01-13
1K0
2 行代码,将 .NET 执行时间降低 87%!(附代码)
长期以来,我一直在致力于提高性能,并且努力避免在关键代码路径中进行内存分配。例如,使用Span<T>在解析数据时避免内存分配,以及使用ArrayPool避免为临时缓冲区分配数组。这样的修改虽然对性能有好处,但会增加新版本代码的维护难度。
数据派THU
2020-10-26
4850
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档