首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    [编程经验] 拉勾网爬虫数据的后续处理

    上一篇我们介绍了如何爬拉勾的数据,这次介绍一下如何分析爬下来的数据,本文以自然语言处理这个岗位为例。 上次那个爬虫的代码有一点问题,不知道大家发现没有,反正也没有人给我说。。然后后面我把我最后改好的代码附在本文的最后。 本文主要分析的是岗位职责和岗位要求,基本思路是先分词,然后统计词频,最后最词云展示出来。先看下效果 从这个图可以看出来,自然语言处理大多数需要掌握深度学习,需要用深度学习去解决问题,然后是工作经验,项目经验,以及对算法的理解。 首先分词,要正确分词,需要有一份高质量的词典,因为在岗位

    08

    腾讯技术工程沙龙深圳站来了,我们一起聊聊“工业互联网”

    工业互联网是新一代信息通信技术与现代工业技术深度融合的产物,是制造业数字化、网络化、智能化的重要载体,也是全球新一轮产业竞争的制高点。 工业互联网通过构建连接机器、物料、人、信息系统的基础网络,实现工业数据的全面感知、动态传输、实时分析,形成科学决策与智能控制,提高制造资源配置效率,正成为领军企业竞争的新赛道、全球产业布局的新方向、制造大国竞争的新焦点——第四次工业革命(工业4.0)。 工业互联网最大的价值在于,全面连接了数据和实体,并且基于连接(Connect),形成了计算(computation)和控

    02
    领券