腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
Datawhale专栏
专栏作者
举报
504
文章
697843
阅读量
75
订阅数
订阅专栏
申请加入专栏
全部文章(504)
神经网络(181)
机器学习(170)
编程算法(166)
深度学习(158)
人工智能(112)
https(92)
网络安全(81)
python(60)
开源(39)
NLP 服务(34)
数据分析(31)
github(27)
数据挖掘(26)
腾讯云测试服务(24)
特征工程(23)
数据结构(22)
git(19)
监督学习(19)
强化学习(18)
决策树(18)
图像识别(16)
大数据(16)
numpy(14)
http(11)
卷积神经网络(11)
线性回归(11)
模型(11)
api(9)
推荐系统(9)
pytorch(9)
数据库(8)
sql(8)
ide(8)
linux(8)
tensorflow(7)
图像处理(7)
opencv(7)
学习方法(7)
html(6)
matlab(6)
存储(6)
游戏(6)
数据可视化(6)
javascript(5)
批量计算(5)
分布式(5)
正则表达式(5)
tcp/ip(5)
迁移学习(5)
数据处理(5)
分类算法(5)
数据(5)
人脸识别(4)
java(4)
css(4)
嵌入式(4)
云直播(4)
知识图谱(4)
markdown(4)
无监督学习(4)
self(4)
基础(4)
c++(3)
node.js(3)
jquery(3)
json(3)
云数据库 SQL Server(3)
文件存储(3)
文字识别(3)
渲染(3)
容器(3)
缓存(3)
uml(3)
安全(3)
腾讯云开发者社区(3)
联邦学习(3)
agent(3)
error(3)
series(3)
工具(3)
云服务器(2)
语音识别(2)
区块链(2)
c 语言(2)
xml(2)
硬件开发(2)
apache(2)
mapreduce(2)
命令行工具(2)
日志数据(2)
企业(2)
serverless(2)
自动化(2)
爬虫(2)
spark(2)
hadoop(2)
hive(2)
keras(2)
kernel(2)
anaconda(2)
机器人(2)
物联网(2)
系统架构(2)
架构设计(2)
processing(2)
jupyter notebook(2)
flink(2)
数据集成(2)
google(2)
label(2)
lambda(2)
lm(2)
mask(2)
mean(2)
pandas(2)
precision(2)
size(2)
笔记(2)
函数(2)
量化(2)
论文(2)
实践(2)
视频(2)
索引(2)
性能(2)
原理(2)
云点播(1)
云镜(主机安全)(1)
对象存储(1)
自动驾驶(1)
iphone(1)
go(1)
bash(1)
actionscript(1)
bootstrap(1)
typescript(1)
ecmascript(1)
android(1)
access(1)
打包(1)
搜索引擎(1)
unix(1)
nginx(1)
容器镜像服务(1)
黑石物理服务器(1)
短视频(1)
访问管理(1)
NAT 网关(1)
腾讯git代码托管(工蜂)(1)
语音合成(1)
机器翻译(1)
视频处理(1)
金融风控(1)
数据安全(1)
运维(1)
黑客(1)
html5(1)
无人驾驶(1)
sql server(1)
自动化测试(1)
二叉树(1)
单元测试(1)
scrapy(1)
gcc(1)
scikit-learn(1)
windows(1)
网站建设(1)
nat(1)
信息流(1)
云计算(1)
虚拟化(1)
聚类算法(1)
sdk(1)
模型测试(1)
ghost(1)
手势识别(1)
智能客服机器人(1)
数据湖(1)
教育(1)
智能家居(1)
account(1)
action(1)
apply(1)
auto(1)
axis(1)
backbone(1)
bat(1)
bi(1)
block(1)
boxplot(1)
config(1)
data(1)
dataframe(1)
decode(1)
decoding(1)
embedding(1)
encode(1)
encoding(1)
excel(1)
filter(1)
gpt(1)
hidden(1)
it(1)
kaggle(1)
key(1)
layer(1)
list(1)
matrix(1)
max(1)
min(1)
nan(1)
numbers(1)
openai(1)
plot(1)
product(1)
rename(1)
reset(1)
sample(1)
slice(1)
sort(1)
tail(1)
task(1)
text(1)
transformation(1)
word2vec(1)
xgboost(1)
部署(1)
行业(1)
技巧(1)
教程(1)
解决方案(1)
开发者(1)
框架(1)
前端工程师(1)
求职(1)
入门(1)
事件(1)
搜索(1)
腾讯(1)
网络(1)
系统(1)
压缩(1)
优化(1)
搜索文章
搜索
搜索
关闭
WanJuan-CC数据集:为大型语言模型训练提供高质量Webtext资源
数据
开源
安全
数据处理
模型
如何在参差不齐的海量网页数据中提炼高质量内容?如何保证模型训练数据的质量和安全性,如何构建高效的处理策略?上海人工智能实验室的这篇论文提供了一种不错的参考方案。
Datawhale
2024-04-24
80
0
交通时空大数据如何分析,我写了本书!
大数据
数据分析
数据可视化
数据处理
大数据时代到来,随着智能设备与物联网技术的普及,人在社会生产活动中会产生大量的数据。在我们的日常活动中,手机会记录下我们到访过的地点;在使用城市公交IC卡、共享单车等服务时,服务供应商会知道这些出行需求产生的时间与地点;公交车与出租车的定位信息,也可以告诉我们城市交通状态的具体情况。这些具备时间、空间与个体属性的数据能够为城市交通的智慧管控提供强有力的支持。
Datawhale
2022-10-31
1.9K
0
目标检测的常用数据处理方法!
图像识别
python
json
数据处理
xml
在上节内容中,我们介绍了目标检测的基础概念,并分析了实现目标检测的常用思路,本篇文章将重点介绍在该领域的经典数据集:VOC数据集,以及使用Dataloader对其进行数据读取和预处理的全过程。
Datawhale
2021-01-07
777
0
数据处理遇到麻烦不要慌,5个优雅的Numpy函数助你走出困境
numpy
编程算法
数据处理
Numpy 允许我们根据给定的新形状重塑矩阵,新形状应该和原形状兼容。有意思的是,我们可以将新形状中的一个参数赋值为-1。这仅仅表明它是一个未知的维度,我们希望 Numpy 来算出这个未知的维度应该是多少:Numpy 将通过查看数组的长度和剩余维度来确保它满足上述标准。让我们来看以下例子:
Datawhale
2019-11-11
408
0
整理一份详细的数据预处理方法
数据挖掘
数据库
数据分析
sql
数据处理
熟悉数据挖掘和机器学习的小伙伴们都知道,数据处理相关的工作时间占据了整个项目的70%以上。数据的质量,直接决定了模型的预测和泛化能力的好坏。它涉及很多因素,包括:准确性、完整性、一致性、时效性、可信性和解释性。而在真实数据中,我们拿到的数据可能包含了大量的缺失值,可能包含大量的噪音,也可能因为人工录入错误导致有异常点存在,非常不利于算法模型的训练。数据清洗的结果是对各种脏数据进行对应方式的处理,得到标准的、干净的、连续的数据,提供给数据统计、数据挖掘等使用。
Datawhale
2019-10-30
801
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档