首页
学习
活动
专区
工具
TVP
发布

数据处理

专栏成员
97
文章
151924
阅读量
33
订阅数
人大代表数据分析爬取代表数据正则表达式提取需要的数据还可以把上面数据画成饼图民族词云图统计代表姓氏人数姓氏词云
爬取代表数据 import requests import re import time from lxml import html from selenium import webdriver r = requests.get(url='http://www.sohu.com/a/223885358_118392') # 最基本的GET请求 time.sleep(60) html = r.text 正则表达式提取需要的数据 content = re.findall(u'<p>([\u2E80-\u9
用户1733462
2018-06-07
9280
LDA有标签数据降维
之前无标签数据降维PCA,那么像下图带有标签数据,如果用PCA降维将会投影到v轴上,这个投影方差最大,数据将变成不可分状态,LDA将把数据投影加上已有分类这个变量,将数据投影到u轴上 假设原数据分成n
用户1733462
2018-06-01
1.1K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档