Datawhale专栏

169 篇文章
27 人订阅

全部文章

Datawhale

自动机器学习新进展!性能超过人类调参师6个点,AutoGluon 低调开源

近日,亚马逊正式推出了开源代码库 AutoGluon。开发者依靠仅仅几行代码,就可以编写出 AI 嵌入应用程序。

1810
Datawhale

天池-安泰杯跨境电商智能算法大赛(冠军)方案分享

在19年9月下旬结束的"安泰杯"跨境电商智能算法大赛中,来自京东零售的法国南部队伍成功从1960支队伍中脱颖而出,在复赛阶段成功逆袭到第一,并通过答辩获得冠军。...

9930
Datawhale

Python数据分析之Pandas读写外部数据文件

数据分析、数据挖掘、可视化是Python的众多强项之一,但无论是这几项中的哪一项都必须以数据作为基础,数据通常都存储在外部文件中,例如txt、csv、excel...

5710
Datawhale

combo:机器学习模型合并工具库

机器学习中的模型合并(model combination)可以通过合并多个模型达到提升性能与稳定性的目的。模型合并往往被认为是集成学习(ensemble lea...

6310
Datawhale

90%的人会遇到性能问题,如何用1行代码快速定位?

今天,齐光将会基于之前列举的众多指标,给出一些常见的调优分析思路,即:如何在众多异常性能指标中,找出最核心的那一个,进而定位性能瓶颈点,最后进行性能调优。整篇文...

7320
Datawhale

一行代码将Pandas加速4倍

虽然 panda 是 Python 中用于数据处理的库,但它并不是真正为了速度而构建的。了解一下新的库 Modin,Modin 是为了分布式 panda 的计算...

7210
Datawhale

机器学习中特征选择怎么做?这篇文章告诉你

据《福布斯》报道,每天大约会有 250 万字节的数据被产生。然后,可以使用数据科学和机器学习技术对这些数据进行分析,以便提供分析和作出预测。尽管在大多数情况下,...

6420
Datawhale

一文盘点AutoML 库,自动机器学习演讲摘要

Jeff Dean在ICML 2019上进行了有关AutoML的演讲,并将自动化分为4个级别:

7620
Datawhale

本科生晋升GM记录 & Kaggle比赛进阶技巧分享

去年9月中的时候,刚上大四不久,之前一直对热衷于DL的我,其实都只是在自学看书,学习一些理论知识,但动手实践非常少,框架也只是会一些Tensorflow/Ker...

7410
Datawhale

机器学习中有哪些形式简单却很巧妙的 idea?

作者:桔了个仔 https://www.zhihu.com/question/347847220/answer/836019446

7530
Datawhale

美观实用!Star 过万,用 Python 做交互式图形的这款工具火了!

这一工具名为 Bokeh,官方介绍称,它能读取大型数据集或者流数据,以简单快速的方式为网页提供优美、高交互性能的图形。

8730
Datawhale

如何团队协作,代码托管?Git使用教程:最详细、最浅显、一文读懂Git常用操作!

导读:因为教程详细,所以行文有些长,新手边看边操作效果出乎你的预料。GitHub虽然有些许改版,但并无大碍。

6210
Datawhale

基于 Python 的 11 种经典数据降维算法

网上关于各种降维算法的资料参差不齐,同时大部分不提供源代码。这里有个 GitHub 项目整理了使用 Python 实现了 11 种经典的数据抽取(数据降维)算法...

9930
Datawhale

【时空序列预测】什么是时空序列问题?这类问题主要应用了哪些模型?

有幸接触这个有趣的领域,也在最近和很多这个领域的大牛有了一些浅度的交流,真切的感觉到这个领域的缺乏和重要性,这个领域在我看来,商业价值大,有前途,但难度大,不过...

8010
Datawhale

哈工大车万翔教授:NLPer的核心竞争力是什么?

【导读】自然语言处理是当前人工智能研究的重要方向之一,那么从事NLP的人员如何能够不断升级、构建核心竞争力?请看哈工大SCIR车万翔教授受邀在学生研讨会上作的一...

7210
Datawhale

手绘 | 深入解析风控8大场景中的机器学习应用

本文详细梳理风控领域的基本概念,并将风控模型的使用场景分为8大板块,逐一解析机器学习在其中的应用。

9310
Datawhale

Pandas基础用法合集(中文官档)

head() 与 tail() 用于快速预览 Series 与 DataFrame,默认显示 5 条数据,也可以指定要显示的数量。

8320
Datawhale

一文详尽系列之模型评估指标

在机器学习领域通常会根据实际的业务场景拟定相应的不同的业务指标,针对不同机器学习问题如回归、分类、排序,其评估指标也会不同。

4910
Datawhale

NLP与推荐系统的比较、联系与未来

(观众批驳:nlp有大量缺乏自动评价指标的问题,尤其在生成类nlp问题上十分严重,很多问题只能靠人工评估,甚至靠人工都很难做到无偏和信服的评价结论,比如开放域闲...

9210
Datawhale

All Attention You Need

起因:《Sequence to Sequence Learning with Neural Networks》

10120

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励