腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
小詹同学
专栏作者
举报
539
文章
675655
阅读量
61
订阅数
订阅专栏
申请加入专栏
全部文章(539)
python(198)
编程算法(134)
https(81)
网络安全(69)
深度学习(55)
神经网络(53)
机器学习(49)
git(49)
github(48)
爬虫(46)
人工智能(42)
开源(36)
其他(35)
http(30)
微信(22)
数据分析(21)
php(20)
人脸识别(19)
数据库(18)
sql(18)
ide(18)
api(18)
数据结构(18)
网站(17)
numpy(16)
tensorflow(14)
linux(14)
windows(14)
html(13)
tcp/ip(13)
游戏(12)
NLP 服务(10)
java(10)
安全(10)
图像处理(9)
卷积神经网络(9)
json(8)
文件存储(8)
存储(8)
图像识别(8)
matlab(7)
面向对象编程(7)
opencv(7)
keras(7)
javascript(6)
android(6)
unix(6)
markdown(6)
大数据(6)
xml(5)
打包(5)
mongodb(5)
强化学习(5)
正则表达式(5)
监督学习(5)
决策树(5)
pytorch(5)
scrapy(5)
数据可视化(5)
c++(4)
ajax(4)
云数据库 SQL Server(4)
ubuntu(4)
企业(4)
分布式(4)
gui(4)
线性回归(4)
腾讯云图数据可视化(4)
数据挖掘(3)
ios(3)
iphone(3)
go(3)
.net(3)
node.js(3)
jquery(3)
django(3)
批量计算(3)
云数据库 MongoDB(3)
腾讯云测试服务(3)
自动化(3)
缓存(3)
黑客(3)
ssh(3)
二叉树(3)
小程序(3)
腾讯云开发者社区(3)
费用中心(2)
云服务器(2)
区块链(2)
自动驾驶(2)
mac os(2)
c 语言(2)
perl(2)
css(2)
云数据库 Redis(2)
搜索引擎(2)
容器镜像服务(2)
spring(2)
云直播(2)
访问管理(2)
数据加密服务(2)
serverless(2)
shell(2)
无人驾驶(2)
kotlin(2)
selenium(2)
scikit-learn(2)
socket编程(2)
机器人(2)
特征工程(2)
app(2)
axis(2)
leetcode(2)
list(2)
max(2)
min(2)
sum(2)
程序员(2)
ICP备案(1)
对象存储(1)
负载均衡(1)
官方文档(1)
bash(1)
highcharts(1)
qt(1)
arm(1)
硬件开发(1)
sqlite(1)
nosql(1)
memcached(1)
中文分词(1)
sphinx(1)
windows server(1)
负载均衡缓存(1)
mapreduce(1)
命令行工具(1)
SSL 证书(1)
文字识别(1)
机器翻译(1)
金融(1)
医疗(1)
容器(1)
devops(1)
运维(1)
spark(1)
mybatis(1)
dns(1)
推荐系统(1)
udp(1)
模式识别(1)
uml(1)
无监督学习(1)
迁移学习(1)
数据处理(1)
视频分析(1)
虚拟化(1)
聚类算法(1)
jupyter notebook(1)
unicode(1)
迁移(1)
flink(1)
验证码(1)
汽车(1)
adb(1)
config(1)
copy(1)
detect(1)
excel(1)
exe(1)
focus(1)
header(1)
int(1)
postman(1)
precision(1)
requests(1)
return(1)
tm(1)
txt(1)
xpath(1)
zip(1)
编辑器(1)
插件(1)
产品经理(1)
互联网(1)
内存(1)
排序(1)
视频(1)
树莓派(1)
音频(1)
源码(1)
搜索文章
搜索
搜索
关闭
你会用Python做数据预处理吗?
编程算法
数据分析
数据挖掘
在拿到一份数据准备做挖掘建模之前,首先需要进行初步的数据探索性分析(你愿意花十分钟系统了解数据分析方法吗?),对数据探索性分析之后要先进行一系列的数据预处理步骤。因为拿到的原始数据存在不完整、不一致、有异常的数据,而这些“错误”数据会严重影响到数据挖掘建模的执行效率甚至导致挖掘结果出现偏差,因此首先要数据清洗。数据清洗完成之后接着进行或者同时进行数据集成、转换、归一化等一系列处理,该过程就是数据预处理。一方面是提高数据的质量,另一方面可以让数据更好的适应特定的挖掘模型,在实际工作中该部分的内容可能会占整个工作的70%甚至更多。
小小詹同学
2019-11-12
1.1K
0
除了Kaggle,还有哪些高质量的数据科学竞赛平台?
数据挖掘
https
http
网络安全
在听了上百节慕课(MOOC)、看了上千本书和笔记、聆听了上百万人对数据科学的看法后,你会做什么呢?你要开始应用这些概念啦。应用机器学习概念的唯一方法就是亲自动手。你可以在感兴趣的领域选一些现实问题,也可以参加编程马拉松(Hackathon)和机器学习竞赛。
小小詹同学
2019-05-05
1.7K
0
为什么你的Python代码质量如此不堪……
python
爬虫
数据分析
数据挖掘
数据可视化
作者:笑虎(Python爱好者,关注爬虫、数据分析、数据挖掘、数据可视化等) 原文链接:http://codebay.cn/post/7953.html
小小詹同学
2018-07-24
1.2K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档