腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
数据科学与人工智能
专栏作者
举报
811
文章
1010247
阅读量
170
订阅数
订阅专栏
申请加入专栏
全部文章
机器学习
编程算法
大数据
python
数据分析
其他
人工智能
数据挖掘
深度学习
神经网络
数据可视化
数据库
数据处理
开源
scikit-learn
hadoop
决策树
sql
监督学习
https
NLP 服务
spark
物联网
线性回归
r 语言
爬虫
numpy
游戏
github
anaconda
安全
数据结构
区块链
mapreduce
自动化
网络安全
keras
sas
tensorflow
java
apache
http
分布式
推荐系统
ide
matlab
文件存储
图像处理
存储
面向对象编程
无监督学习
微信
数据科学
网站
金融
容器
互联网金融
图像识别
data
model
git
api
linux
ubuntu
容器镜像服务
互联网医疗
hive
正则表达式
scrapy
腾讯云开发者社区
jupyter notebook
pandas
面试
费用中心
对象存储
人脸识别
自动驾驶
c++
php
javascript
go
bootstrap
node.js
html
jquery
单片机
嵌入式
硬件开发
云数据库 SQL Server
oracle
打包
搜索引擎
知识图谱
短信
腾讯云测试服务
mongodb
医疗
企业
智慧零售
yarn
serverless
运维
黑客
ssh
卷积神经网络
强化学习
flash
敏捷开发
gcc
模式识别
迁移学习
windows
nat
云计算
特征工程
联邦学习
隐私计算
build
core
cut
enterprise
frequency
hidden
input
max
mean
min
models
process
profiling
sample
series
streaming
技巧
统计
搜索文章
搜索
搜索
关闭
【Python环境】数据挖掘有哪些工作流程?
python
数据挖掘
爬虫
scrapy
数据挖掘工作流程: 一、收集数据 收集数据一般是补充外部数据,包括采用爬虫和接口,获取,补充目前数据不足部分。Python scrapy,requests是很好的工具。 二、准备数据 主要包括数据清洗,预处理,错值纠正,缺失值填补。连续值离散化,去掉异常值,以及数据归一化的过程。同时需要根据准备采用的挖掘工具准备恰当的数据格式。 三、分析数据 通过初步统计、分析以及可视化,或者是探索性数据分析工具,得到初步的数据概况。分析数据的分布,质量,可靠程度,实际作用域,以确定下一步的算法选择。 R的ggplot,p
陆勤_数据人网
2018-02-27
612
0
【Python环境】Scrapy爬虫轻松抓取网站数据
python
scrapy
爬虫
网络爬虫(Web Crawler, Spider)就是一个在网络上乱爬的机器人。当然它通常并不是一个实体的机器人,因为网络本身也是虚拟的东西,所以这个“机器人”其实也就是一段程序,并且它也不是乱爬,而是有一定目的的,并且在爬行的时候会搜集一些信息。例如 Google 就有一大堆爬虫会在 Internet 上搜集网页内容以及它们之间的链接等信息;又比如一些别有用心的爬虫会在 Internet 上搜集诸如 foo@bar.com 或者 foo [at] bar [dot] com 之类的东西。 除此之外,还有一
陆勤_数据人网
2018-02-26
1.6K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档