首页
学习
活动
专区
工具
TVP
发布

机器学习和数学

专栏成员
68
文章
102854
阅读量
31
订阅数
[编程经验] 链家23个全国主要城市的现房数据分析
今天起来看到一个公众号发的推文,分析了链家上面成都的房价数据,自己好奇也玩了一把,收集了全国23个主要城市的在售房产数据,并作了对比,拿出来跟大家分享。涉及的城市有广州,大连,杭州,济南,石家庄,武汉
用户1622570
2018-04-11
7580
[编程经验] 基于bs4的拉勾网AI相关工作爬虫实现
年初大家可能是各种跳槽吧,看着自己身边的人也是一个个的要走了,其实是有一点伤感的。人各有志吧,不多评论。这篇文章主要是我如何抓取拉勾上面AI相关的职位数据,其实抓其他工作的数据原理也是一样的,只要会了这个,其他的都可以抓下来。一共用了不到100行代码,主要抓取的信息有“职位名称”,“月薪”,“公司名称”,“公司所属行业”,“工作基本要求(经验,学历)”,“岗位描述”等。涉及的工作有“自然语言处理”,“机器学习”,“深度学习”,“人工智能”,“数据挖掘”,“算法工程师”,“机器视觉”,“语音识别”,“图像处理
用户1622570
2018-04-11
6510
[编程经验] 拉勾网爬虫数据的后续处理
上一篇我们介绍了如何爬拉勾的数据,这次介绍一下如何分析爬下来的数据,本文以自然语言处理这个岗位为例。 上次那个爬虫的代码有一点问题,不知道大家发现没有,反正也没有人给我说。。然后后面我把我最后改好的代码附在本文的最后。 本文主要分析的是岗位职责和岗位要求,基本思路是先分词,然后统计词频,最后最词云展示出来。先看下效果 从这个图可以看出来,自然语言处理大多数需要掌握深度学习,需要用深度学习去解决问题,然后是工作经验,项目经验,以及对算法的理解。 首先分词,要正确分词,需要有一份高质量的词典,因为在岗位
用户1622570
2018-04-11
2.1K0
[编程经验] CVPR2017论文全集下载代码脚本分享
还记得之前的一次图片爬虫的教程吗~,原理是类似的,想把今年的论文都下载下来,虽然不一定(肯定不)都看,没事的时候拜一拜~~也行。然后就自己写了个脚本,如果你也想下载的话可以用这个比较方便。有时间,我也会把我看过的今年的理解比较好的文章,和大家分享一下~。 import urllib import re import os import urlparse def auto_down(url, filename): try: image = urllib.urlretrieve(ur
用户1622570
2018-04-11
7540
[编程经验] 我是如何半自动抓取素材公社图片的
网络爬虫是一件比较繁琐的事情,特别考验人的耐心。但又是非常令人着迷的一件事,因为当你从网络上爬到了自己的想要的数据,满满的成就感油然而生。但是我对爬虫掌握的并不好,所以我只能把我知道了,在这里做个分享,讲的不好,请见谅。记得当时找实习工作的时候,去面试某家公司的Python工程师,去了给了我一份标准的爬虫工程师的试卷,做完一脸懵逼啊!面试官都不想和我说话的感觉(./嫌弃.sh)。我觉得哈,面试者能力在差,你也不能表现出满眼的鄙视吧,这说明什么?!这种公司不去也罢! 简单介绍一下我对爬虫的理解。开始学习爬虫是
用户1622570
2018-04-11
1.2K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档