腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Datawhale专栏

专栏作者

504

文章

699933

阅读量

75

订阅数

2022华为全球校园AI算法精英赛：季军方案！

腾讯云测试服务

笔者鲤鱼，是西安交通大学人工智能学院的一名研究生，在2022华为全球校园AI算法精英赛的赛道二取得了季军的成绩。

2023-01-09

2780

《如何打一场数据挖掘赛事》进阶版

数据挖掘腾讯云测试服务机器学习神经网络深度学习

经过上一篇的入门学习，大家已经熟悉如何去打一场比赛，并能训练经典的机器学习算法模型，去解决实际的问题。如果你还不了解，可以先学习《如何打一个数据挖掘比赛》入门版，然后再进行本节的学习。

2022-10-31

3230

最新数据挖掘赛事方案梳理！

腾讯云测试服务编程算法

科大讯飞：糖尿病遗传风险检测挑战赛。背景：截至2022年，中国糖尿病患者近1.3亿。中国糖尿病患病原因受生活方式、老龄化、城市化、家族遗传等多种因素影响。同时，糖尿病患者趋向年轻化。

2022-10-31

3800

天池算法大赛项目：基于大规模日志的故障诊断亚军方案！

特征工程日志数据腾讯云测试服务数据挖掘

第三届阿里云磐久智维算法大赛：本次比赛要求选手基于故障工单与系统日志数据构建多分类模型，要求能够快速高效的定位出故障类型。

2022-10-31

8910

本硕非科班，单模型获得亚军！

大数据腾讯云测试服务 https 网络安全

我的本科与硕士都是非科班，几乎没有相关的基础。接触机器学习竞赛的半年左右的时候参加了去年kaggle规模最大的jane street量化大赛，比赛前期屠榜了几次，最终也拿到了冠军。与此同时也拿了一些其他比赛的top名次。本次比赛的主要目的还是学习，通过比赛学习一些CTR建模方面的基础知识。这一次比赛的队友很强，有幸再次拿到了好名次。

2021-12-13

7540

CCF推荐系统项目代码解读！

推荐系统神经网络深度学习人工智能腾讯云测试服务

本文以CCF大数据与计算智能大赛（CCF BDCI）图书推荐系统竞赛为实践背景，使用Paddle构建用户与图书的打分模型，借助Embedding层来完成具体的匹配过程。后台回复 211208 可获取完整代码。

2021-12-13

6090

如何检测两组数据是否同分布？

腾讯云测试服务 https 机器学习网络安全神经网络

一个模型中，很重要的技巧就是要确定训练集与测试集特征是否同分布，这也是机器学习的一个很重要的假设，但很多时候我们默认这个道理，却很难有方法来保证数据同分布。

2021-10-13

1.4K0

图片分类赛官方baseline解读！

腾讯云测试服务 pytorch

为进一步加快“6+5+6+1”西安现代产业以及养老服务等行业领域急需紧缺高技能人才培养，动员广大职工在迎十四运创文明城、建设国家中心城市、助力西安新时代追赶超越高质量发展中展现新作为，市委组织部、市人社局、市总工会决定举办西安市2021年“迎全运、强技能、促提升”高技能人才技能大赛（全市计算机程序设计员技能大赛）。

2021-10-13

5210

机器学习过拟合与欠拟合！

https 网络安全腾讯云测试服务神经网络机器学习

模型的预测误差可以分解为三个部分: 偏差(bias)，方差(variance) 和噪声(noise).

2021-10-13

1.8K0

人脸识别模型的动手实践！

python 网络安全安全腾讯云测试服务人脸识别

人脸识别已经成为生活中越来越常见的技术，其中最关键的问题就是安全，而活体检测技术又是保证人脸识别安全性的一个重要手段，本文将向大家简单介绍活体检测，并动手完成一个活体检测模型的训练，最终实现对摄像头或者视频中的活体进行识别。

2021-08-27

8450

抛弃P值，选择更直观的A/B测试！

腾讯云测试服务机器学习神经网络深度学习人工智能

在两个选项中做出选择，该如何选？一个简单而又智能的方法就是A/B。本篇文章将简要地解释A/B测试背后的动机，并概述其背后的逻辑，以及带来的问题：它使用的P值很容易被误解。

2021-07-12

7210

基于LightGBM算法实现数据挖掘！

数据挖掘腾讯云测试服务编程算法

本赛题是一个多分类的数据挖掘问题。赛题以医疗数据挖掘为背景，要求选手使用提供的心跳信号传感器数据训练模型并完成不同心跳信号的分类的任务。

2021-04-20

7160

5种数据同分布的检测方法！

腾讯云测试服务 https 网络安全机器学习 html

在数据挖掘比赛中，很重要的一个技巧就是要确定训练集与测试集特征是否同分布，这也是机器学习的一个很重要的假设。但很多时候我们知道这个道理，却很难有方法来保证数据同分布，这篇文章就分享一下我所了解的同分布检验方法。

2021-03-11

2.9K0

从0梳理1场数据挖掘赛事！

特征工程数据挖掘数据分析腾讯云测试服务 https

摘要：数据竞赛对于大家理论实践和增加履历帮助比较大，但许多读者反馈不知道如何入门，本文以河北高校数据挖掘邀请赛为背景，完整梳理了从环境准备、数据读取、数据分析、特征工程和数据建模的整个过程。

2021-02-05

6840

算法模型自动超参数优化方法！

机器学习神经网络深度学习人工智能腾讯云测试服务

学习器模型中一般有两类参数，一类是可以从数据中学习估计得到，我们称为参数（Parameter）。还有一类参数时无法从数据中估计，只能靠人的经验进行设计指定，我们称为超参数（Hyper parameter）。超参数是在开始学习过程之前设置值的参数。相反，其他参数的值通过训练得出。

2021-01-07

2.8K0

GNN教程：GraghSAGE算法细节详解！

数据结构编程算法腾讯云测试服务

本文为GNN教程的第三篇文章【GraghSAGE算法】，在GCN的博文中我们重点讨论了图神经网络的逐层传播公式是如何推导的，然而，GCN的训练方式需要将邻接矩阵和特征矩阵一起放到内存或者显存里，在大规模图数据上是不可取的。

2020-11-23

1.3K1

机器学习工业复现的 12 个要素！

机器学习神经网络深度学习人工智能腾讯云测试服务

过去二十年来，我们对软件开发的理解有了大幅提升。其中一大部分原因是 DevOps 概念的出现及其在软件开发行业的广泛应用。领先的软件公司都遵循着同样的模式：首先是在软件开发过程中快速迭代，然后进行持续集成、持续交付、持续部署。每个特性都要经过测试，看其提供价值的能力如何，而且软件始终要处于就绪的状态，并且通过自动化方法进行部署。机器学习这个领域虽不同于传统的软件开发，但我们也能从软件开发行业汲取很多实用的经验教训。过去几年里，我们一直在开发生产型机器学习项目。我们的目标并不只是概念验证，而是与软件开发一样的可复现能力（reproducibility）。因此，我们构建了一套流程协调器、强大的自动化能力并建立了一套用于实现该目标的工作流程。为什么不直接使用 Jupyter Notebook？从头开始构建一组包含所有处理步骤的笔记需要多长时间？为团队纳入新成员的难易程度如何？你现在可以复现两个月前的结果吗？能以多快的速度复现？你能将今天的结果和历史结果进行对比吗？你能在训练过程中关注到数据的出处吗？如果你的模型过时了又会发生什么？我们遇到过所有这些问题。现在，我们将这些经验进行了归纳总结，得到了成功构建生产型机器学习的 12 个要素（类似于软件开发中的十二要素应用/12 factor app）。

2020-11-09

3410

机器学习模型训练全流程！

数据分析腾讯云测试服务机器学习神经网络深度学习

周末在家无聊闲逛github，发现一个很有趣的开源项目，作者用手绘图的方式讲解了机器学习模型构建的全流程，逻辑清晰、生动形象。同时，作者也对几张图进行了详细的讲解，学习之后，收获很多，于是将其翻译下来，和大家一起学习。

2020-08-12

1.9K0

数据分析（EDA）学习总结！

腾讯云测试服务编程算法数据分析

探索性数据分析（Exploratory Data Analysis，EDA）是一种探索数据的结构和规律的一种数据分析方法。其主要的工作包含：对数据进行清洗，对数据进行描述（描述统计量，图表），查看数据的分布，比较数据之间的关系，培养对数据的直觉和对数据进行总结。

2020-08-04

6390

自查自纠 | 线性回归，你真的掌握了嘛？

线性回归腾讯云测试服务编程算法

寄语：本文对线性回归算法的原理及模型，学习策略、算法求解和sklearn参数做了详细的讲解。同时，用例子进行Python代码实践。

2020-04-28

5220

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态