腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
大数据文摘
专栏成员
举报
5574
文章
4222976
阅读量
255
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
大数据(999+)
人工智能(999+)
其他(880)
深度学习(620)
神经网络(586)
网络安全(585)
https(575)
机器学习(558)
编程算法(455)
机器人(411)
安全(277)
数据分析(263)
数据库(171)
游戏(155)
python(151)
模型(146)
NLP 服务(127)
开源(127)
微信(124)
图像处理(118)
数据(118)
自动驾驶(117)
黑客(114)
无人驾驶(91)
存储(81)
数据可视化(81)
github(79)
工作(79)
系统(76)
论文(75)
自动化(73)
硬件开发(71)
物联网(70)
sql(68)
企业(67)
腾讯云测试服务(64)
区块链(62)
网站(60)
git(58)
http(58)
ios(54)
强化学习(50)
数据挖掘(48)
api(44)
研发(44)
汽车(43)
数据处理(42)
设计(39)
chatgpt(38)
测试(38)
视频(38)
人脸识别(37)
医疗(36)
云计算(35)
产品(35)
tensorflow(34)
html(34)
iphone(33)
算法(33)
卷积神经网络(29)
r 语言(28)
开发(28)
科技(28)
搜索引擎(27)
推荐系统(27)
go(26)
分布式(26)
图像识别(26)
网络(26)
比特币(25)
nat(24)
监督学习(23)
windows(23)
工具(23)
行业(22)
语音识别(21)
android(21)
互联网金融(21)
互联网医疗(21)
数学(21)
爬虫(20)
互联网(20)
性能(20)
linux(19)
hadoop(19)
5g(19)
facebook(19)
gpt(19)
创业(19)
ide(18)
腾讯云开发者社区(17)
数字货币(16)
机器翻译(16)
pytorch(16)
模式识别(16)
服务(16)
基础(16)
苹果(16)
java(15)
javascript(15)
com(15)
openai(15)
效率(15)
缓存(14)
tcp/ip(14)
app(14)
手机(14)
google(13)
工程师(13)
计算机(13)
连接(13)
搜索(13)
访问管理(12)
金融(12)
无监督学习(12)
安全漏洞(12)
oracle(11)
express(11)
unity(11)
管理(11)
统计(11)
知识图谱(10)
数据安全(10)
spark(10)
决策树(10)
小程序(10)
数据结构(10)
twitter(10)
硬件(10)
mac os(9)
云直播(9)
电商(9)
vr(9)
程序员(9)
优化(9)
单片机(8)
arm(8)
apache(8)
学习方法(8)
meta(8)
语音(8)
c++(7)
matlab(7)
线性回归(7)
sas(7)
gps(7)
编程(7)
对象(7)
函数(7)
开发者(7)
腾讯(7)
隐私(7)
对象存储(6)
php(6)
.net(6)
nosql(6)
运维(6)
opencv(6)
教育(6)
youtube(6)
接口(6)
配置(6)
软件(6)
通信(6)
协议(6)
云镜(主机安全)(5)
c 语言(5)
node.js(5)
嵌入式(5)
mongodb(5)
高性能计算(5)
正则表达式(5)
numpy(5)
keras(5)
迁移学习(5)
特征工程(5)
amazon(5)
apple(5)
百度(5)
变量(5)
程序(5)
地图(5)
框架(5)
摄像头(5)
数据科学(5)
swift(4)
bash(4)
css(4)
jquery(4)
打包(4)
文字识别(4)
短信(4)
o2o(4)
渲染(4)
出行(4)
erp(4)
dns(4)
ddos(4)
架构设计(4)
airbnb(4)
it(4)
na(4)
paypal(4)
uber(4)
wifi(4)
部署(4)
动画(4)
阿里巴巴(4)
架构(4)
解决方案(4)
事件(4)
芯片(4)
音频(4)
原型(4)
元宇宙(4)
容器镜像服务(3)
mapreduce(3)
批量计算(3)
文件存储(3)
日志服务(3)
短视频(3)
大数据处理套件 TBDS(3)
政务云专区(3)
容器(3)
devops(3)
系统架构(3)
智能教育(3)
分类算法(3)
es(3)
aigc(3)
excel(3)
gpu(3)
hololens(3)
ip(3)
linkedin(3)
lstm(3)
microsoft(3)
prompt(3)
state(3)
编码(3)
布局(3)
插件(3)
电子商务(3)
翻译(3)
计算机科学(3)
计算机视觉(3)
漏洞(3)
实践(3)
数据中心(3)
虚拟现实(3)
远程工作(3)
重构(3)
云点播(2)
ruby(2)
scala(2)
bootstrap(2)
opengl(2)
qt(2)
云数据库 SQL Server(2)
access(2)
maven(2)
unix(2)
windows server(2)
nginx(2)
spring(2)
黑石物理服务器(2)
语音合成(2)
智能投顾(2)
智能硬件(2)
html5(2)
gui(2)
二叉树(2)
微服务(2)
nest(2)
信息流(2)
sdk(2)
迁移(2)
数据库管理(2)
验证码(2)
Elasticsearch Service(2)
智能推荐平台(2)
设计协作平台(2)
智能客服机器人(2)
智能家居(2)
alert(2)
alexa(2)
chat(2)
cto(2)
data(2)
db(2)
ipad(2)
mac(2)
mean(2)
medium(2)
midi(2)
min(2)
model(2)
nlp(2)
space(2)
token(2)
whatsapp(2)
yahoo(2)
编译(2)
播客(2)
博客(2)
产品经理(2)
代理(2)
技巧(2)
加密(2)
监控(2)
脚本(2)
教程(2)
蓝牙(2)
浏览器(2)
求职(2)
软件工程(2)
树莓派(2)
数组(2)
特效(2)
同步(2)
图表(2)
远程办公(2)
原理(2)
在线教育(2)
增强现实(2)
费用中心(1)
创业扶持(1)
渠道代理(1)
perl(1)
c#(1)
lua(1)
actionscript(1)
angularjs(1)
vue.js(1)
react(1)
xml(1)
json(1)
云数据库 Redis(1)
mvc(1)
ubuntu(1)
bash 指令(1)
云数据库 MongoDB(1)
TDSQL MySQL 版(1)
SSL 证书(1)
数据加密服务(1)
腾讯git代码托管(工蜂)(1)
云推荐引擎(1)
双螺旋(1)
人脸支付(1)
DevOps 解决方案(1)
数据备份(1)
生物基因(1)
智能交通(1)
工业物联(1)
sass(1)
云+未来(1)
serverless(1)
压力测试(1)
数据迁移(1)
shell(1)
hive(1)
openstack(1)
asp(1)
ftp(1)
npm(1)
grep(1)
cdn(1)
selenium(1)
flash(1)
markdown(1)
scikit-learn(1)
uml(1)
lamp(1)
fpga(1)
hbase(1)
mqtt(1)
kafka(1)
虚拟化(1)
内容安全(1)
聚类算法(1)
供应链金融(1)
rust(1)
dart(1)
无线技术(1)
性能测试(1)
ghost(1)
drupal(1)
高性能计算平台(1)
视频审核(1)
腾讯云图数据可视化(1)
应急响应服务(1)
应用安全开发(1)
数据集成(1)
图像搜索(1)
图像分析(1)
手势识别(1)
即时通信 IM(1)
数据湖(1)
智慧交通(1)
acm(1)
ada(1)
alpha(1)
analytics(1)
arduino(1)
average(1)
bi(1)
blender(1)
bug(1)
children(1)
cs(1)
csv(1)
dataframe(1)
ddl(1)
dos(1)
dst(1)
dt(1)
dump(1)
equation(1)
finance(1)
flex(1)
form(1)
foursquare(1)
frame(1)
frequency(1)
get(1)
gif(1)
global(1)
gmail(1)
gmp(1)
gsm(1)
h2(1)
image(1)
interface(1)
iot(1)
jackson(1)
julia(1)
jupyter(1)
kill(1)
launch(1)
lazarus(1)
macbook(1)
mask(1)
media(1)
mozilla(1)
mq(1)
network(1)
office(1)
oop(1)
pandas(1)
pascal(1)
permutation(1)
physics(1)
plot(1)
pm2(1)
probability(1)
progress(1)
project(1)
reference(1)
robotics(1)
salesforce(1)
samba(1)
scaling(1)
self(1)
set(1)
show(1)
slack(1)
sleep(1)
snapchat(1)
sum(1)
system(1)
target(1)
task(1)
text(1)
theory(1)
this(1)
time(1)
tm(1)
usb(1)
var(1)
watch(1)
web(1)
web3(1)
闭包(1)
编程语言(1)
编辑器(1)
编译器(1)
表格(1)
操作系统(1)
产品设计(1)
登录(1)
低代码(1)
递归(1)
二维码(1)
反射(1)
服务器(1)
后台(1)
集合(1)
集群(1)
计算机图形学(1)
计算机网络(1)
兼容性(1)
镜像(1)
开源软件(1)
可视化(1)
量化(1)
流媒体(1)
模块化(1)
内存(1)
排序(1)
配色(1)
企业应用(1)
权限(1)
数据管理(1)
数据类型(1)
索引(1)
推送(1)
信息安全(1)
序列化(1)
虚拟机(1)
压缩(1)
异常(1)
用户体验(1)
语法(1)
域名(1)
云服务(1)
重定向(1)
终端(1)
主机(1)
作用域(1)
搜索文章
搜索
搜索
关闭
小数据集也能大有作为:特征工程的妙用
特征工程
测试
可视化
模型
数据
作者:Krzysztof Pałczyński 翻译:王闯(Chuck) 校对:zrx 特征工程可以弥补数据的不足。 在快速发展的人工智能 (AI) 世界中,数据已成为无数创新应用和解决方案的命脉。实际上,大型数据集通常被认为是训练强大且准确的 AI 模型的支柱。但是,当手头的数据集相对较小时该怎么办呢?在本文中,我们将探讨特征工程在克服小数据集的局限性方面所起到的关键性作用。 玩具数据集 我们的旅程将从创建数据集开始。在这个例子中,我们将进行简单的信号分类。该数据集有两个类别:频率为1的正弦波属于类别0
大数据文摘
2023-04-30
455
0
智源小分子预测赛进行中:基于CatBoost建模的baseline分享
神经网络
机器学习
深度学习
人工智能
特征工程
赛题任务为根据从小分子结构中提取的3177个维度特征,预测小分子的六个化学性质。作者将赛题归纳为一个回归问题,直接训练六个模型来分别预测对应的六个性质,此baseline评测得分为8.30。
大数据文摘
2020-03-10
978
0
10万元奖金,开启“智源粒子分类赛”下半时,三篇高分Baseline带你突破瓶颈!
特征工程
https
网络安全
高能质子对撞中会产生大量粒子团喷注(jet),喷注可以根据其不同内在特性分为胶体喷注、轻夸克喷注、魅夸克喷注、美夸克喷注。
大数据文摘
2020-03-04
652
0
关于机器学习实战,那些教科书里学不到的12个“民间智慧”
编程算法
特征工程
机器学习
决策树
神经网络
这意味着数据量越大,这些算法就可以解决更加复杂的问题。然而,开发成功的机器学习应用程序需要一定的“民间技巧”,这在教科书或机器学习入门课程中很难找到。
大数据文摘
2019-05-15
340
0
为什么说自动化特征工程将改变机器学习的方式
特征工程
自动化
机器学习
神经网络
深度学习
没有什么是一成不变的,尤其是在数据科学领域。毕竟,一些库、算法、工具一直在更新迭代。
大数据文摘
2019-03-04
598
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档