机器学习和数学-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

机器学习和数学

专栏成员

68

文章

102869

阅读量

31

订阅数

[编程经验] 链家23个全国主要城市的现房数据分析

爬虫数据分析

今天起来看到一个公众号发的推文，分析了链家上面成都的房价数据，自己好奇也玩了一把，收集了全国23个主要城市的在售房产数据，并作了对比，拿出来跟大家分享。涉及的城市有广州,大连,杭州,济南,石家庄,武汉

2018-04-11

7600

[编程经验] 基于bs4的拉勾网AI相关工作爬虫实现

人工智能爬虫 NLP 服务

年初大家可能是各种跳槽吧，看着自己身边的人也是一个个的要走了，其实是有一点伤感的。人各有志吧，不多评论。这篇文章主要是我如何抓取拉勾上面AI相关的职位数据，其实抓其他工作的数据原理也是一样的，只要会了这个，其他的都可以抓下来。一共用了不到100行代码，主要抓取的信息有“职位名称”，“月薪”，“公司名称”，“公司所属行业”，“工作基本要求（经验，学历）”，“岗位描述”等。涉及的工作有“自然语言处理”，“机器学习”，“深度学习”，“人工智能”，“数据挖掘”，“算法工程师”，“机器视觉”，“语音识别”，“图像处理

2018-04-11

6520

[编程经验] 拉勾网爬虫数据的后续处理

爬虫 NLP 服务深度学习编程算法

上一篇我们介绍了如何爬拉勾的数据，这次介绍一下如何分析爬下来的数据，本文以自然语言处理这个岗位为例。上次那个爬虫的代码有一点问题，不知道大家发现没有，反正也没有人给我说。。然后后面我把我最后改好的代码附在本文的最后。本文主要分析的是岗位职责和岗位要求，基本思路是先分词，然后统计词频，最后最词云展示出来。先看下效果从这个图可以看出来，自然语言处理大多数需要掌握深度学习，需要用深度学习去解决问题，然后是工作经验，项目经验，以及对算法的理解。首先分词，要正确分词，需要有一份高质量的词典，因为在岗位

2018-04-11

2.1K0

[编程经验] CVPR2017论文全集下载代码脚本分享

还记得之前的一次图片爬虫的教程吗~，原理是类似的，想把今年的论文都下载下来，虽然不一定(肯定不)都看，没事的时候拜一拜~~也行。然后就自己写了个脚本，如果你也想下载的话可以用这个比较方便。有时间，我也会把我看过的今年的理解比较好的文章，和大家分享一下~。 import urllib import re import os import urlparse def auto_down(url, filename): try: image = urllib.urlretrieve(ur

2018-04-11

7540

[编程经验] 我是如何半自动抓取素材公社图片的

网络爬虫是一件比较繁琐的事情，特别考验人的耐心。但又是非常令人着迷的一件事，因为当你从网络上爬到了自己的想要的数据，满满的成就感油然而生。但是我对爬虫掌握的并不好，所以我只能把我知道了，在这里做个分享，讲的不好，请见谅。记得当时找实习工作的时候，去面试某家公司的Python工程师，去了给了我一份标准的爬虫工程师的试卷，做完一脸懵逼啊！面试官都不想和我说话的感觉（./嫌弃.sh）。我觉得哈，面试者能力在差，你也不能表现出满眼的鄙视吧，这说明什么？！这种公司不去也罢！简单介绍一下我对爬虫的理解。开始学习爬虫是

2018-04-11

1.2K0

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态