腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
数据处理
专栏成员
举报
97
文章
152024
阅读量
33
订阅数
订阅专栏
申请加入专栏
全部文章(97)
其他(25)
python(16)
编程算法(10)
tensorflow(5)
函数(4)
数据库(3)
spark(3)
numpy(3)
递归(3)
scala(2)
正则表达式(2)
二叉树(2)
scikit-learn(2)
数据分析(2)
sas(2)
root(2)
机器学习(1)
java(1)
c 语言(1)
actionscript(1)
sql(1)
ide(1)
matlab(1)
神经网络(1)
爬虫(1)
shell(1)
ssh(1)
卷积神经网络(1)
hive(1)
面向对象编程(1)
决策树(1)
selenium(1)
大数据(1)
安全(1)
unicode(1)
code(1)
count(1)
distribution(1)
driver(1)
foreach(1)
gaussian(1)
having(1)
init(1)
lambda(1)
map(1)
media(1)
nan(1)
object(1)
random(1)
regression(1)
sh(1)
sleep(1)
space(1)
txt(1)
vim(1)
遍历(1)
登录(1)
脚本(1)
权限(1)
事件(1)
搜索(1)
系统(1)
压缩(1)
搜索文章
搜索
搜索
关闭
人大代表数据分析爬取代表数据正则表达式提取需要的数据还可以把上面数据画成饼图民族词云图统计代表姓氏人数姓氏词云
数据分析
正则表达式
爬虫
爬取代表数据 import requests import re import time from lxml import html from selenium import webdriver r = requests.get(url='http://www.sohu.com/a/223885358_118392') # 最基本的GET请求 time.sleep(60) html = r.text 正则表达式提取需要的数据 content = re.findall(u'<p>([\u2E80-\u9
用户1733462
2018-06-07
928
0
LDA有标签数据降维
数据分析
之前无标签数据降维PCA,那么像下图带有标签数据,如果用PCA降维将会投影到v轴上,这个投影方差最大,数据将变成不可分状态,LDA将把数据投影加上已有分类这个变量,将数据投影到u轴上 假设原数据分成n
用户1733462
2018-06-01
1.1K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档