首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    [编程经验] 拉勾网爬虫数据的后续处理

    上一篇我们介绍了如何爬拉勾的数据,这次介绍一下如何分析爬下来的数据,本文以自然语言处理这个岗位为例。 上次那个爬虫的代码有一点问题,不知道大家发现没有,反正也没有人给我说。。然后后面我把我最后改好的代码附在本文的最后。 本文主要分析的是岗位职责和岗位要求,基本思路是先分词,然后统计词频,最后最词云展示出来。先看下效果 从这个图可以看出来,自然语言处理大多数需要掌握深度学习,需要用深度学习去解决问题,然后是工作经验,项目经验,以及对算法的理解。 首先分词,要正确分词,需要有一份高质量的词典,因为在岗位

    08

    对话达观数据陈运文:文本智能处理潜力无限,“AI员工”将为企业处理90%的文本工作

    消费互联网和企业互联网领域的认知隔阂由来已久,踏入所谓的DT时代后,黑科技滋生的速度仿佛跟不上人们对自动化、智能化美好生活的向往速度。在极客网看来,大数据、AI的应用才刚刚起步。在占据传媒头条的人脸识别、刷脸支付等锦上添花型应用的背后,大家似乎忽略了一个现实:占据人们大部分学习工作时间的文字文本,也还存在大量需要被AI化的地方。尤其是在企业级市场,倘若职员们能够从日常繁复的文字工作中解放出来,那将是一个多么令人兴奋的场景! 近日,达观数据的CEO陈运文接受了极客网的专访——一个曾经打卡于百度、盛大和腾讯,后

    03
    领券