专栏首页玉树芝兰如何不编程,采集网站评论信息?(视频教程)

如何不编程,采集网站评论信息?(视频教程)

如果你不想学编程,数据采集爬虫也是可以用的。

简介

最近的一次组会,我们请来了一位分享嘉宾——15级研究生庞琳同学,给我们科研团队分享网站评论数据的采集。

还记得去年这个时候,庞琳过来找我,询问Python爬数据的问题。

她之前没有接触过任何编程技术,自学Python爬虫一段时间,觉得很吃力。

编写程序只是一个方面,毕竟还有许多样例可以参考。

许多网站对于爬虫并不友好,所以她时常遇到各种意想不到的问题。

针对她的具体情况,我直接给她推荐了几个第三方数据采集工具。

她看后很兴奋,回去之后就做了尝试。

后来又通过论坛发帖询问等方式,找到了一个更适合自己的采集器。

这样一来,她不需要编写任何代码,就完成了毕业论文里的数据采集工作。

预答辩之后,我邀请她过来,给我们团队分享数据爬取的具体流程。

庞琳以某个网站为例,展示了文章链接与评论数据的采集。

她做了很充分的准备,讲解非常细致。

演示之后,我让学生们趁热打铁,动手实践。

庞琳给他们进行了答疑辅导,手把手教他们爬取了指定网站的评论数据。

组会结束的时候,全体学生都觉得收获颇丰。

分享

我一直坚信,教是最好的学。

为了巩固学生们的学习成果,我让17级研究生马峥牵头,做了个视频教程,发布出来。

这样一来,不但锻炼了学生,也可以把相关的知识分享给更多有需要的人。

这个视频为你传递一个信息:

如果你不想学编程,数据采集爬虫也是可以用的。

希望观看视频后,你也亲自动手实践一下,抓一些真实网站的数据,体验那种兴奋与成就感。

视频的链接在这里。

视频内容

延伸阅读

如果你打算尝试 Python 爬虫,欢迎阅读我的另一篇文章《如何用Python爬数据?(一)网页抓取》。

如果你对数据科学感兴趣,欢迎阅读这篇《如何用《玉树芝兰》入门数据科学?

讨论

看过视频后,你是否通过实践,成功收集到自己感兴趣的数据了?视频中有没有让你觉得疑惑的地方?你有哪些意见和改进建议?欢迎留言,把你的经验和思考分享给大家,我们一起交流讨论。

本文分享自微信公众号 - 玉树芝兰(nkwangshuyi)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-04-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 编程语言 10 月排行榜:Java/C/C++ 固守前三,Swift/GO持续下降,惨!

    而Swift、Objective-C、Visual Basic、Go处于持续下降的趋势。

    养码场
  • 如何入门 Python 爬虫?

    之前转载过两篇关于“爬虫”的文章,小编在后台收到不少相关的留言,希望能够继续深入,所以有了下面这篇文章。

    华章科技
  • 清华大学数据科学认证项目 为你未来10年的竞争力加持砝码

    在2016年和2017年的全美最佳岗位排行榜中,“数据科学家”一职位已经连续两年位列前茅;

    华章科技
  • 人生苦短,为什么我要用Python?

    本教程的目的是让你相信两件事:首先,Python 是一种非常棒的编程语言;其次,如果你是一名科学家,Python 很可能值得你去学习。本教程并非想要说明 Pyt...

    CDA数据分析师
  • BSON及mongoDB数据类型

    //字符型,存储数据常用的数据类型。在 MongoDB 中,UTF-8 编码的字符串才是合法的

    Leshami
  • 用Spark学习FP Tree算法和PrefixSpan算法

        在FP Tree算法原理总结和PrefixSpan算法原理总结中,我们对FP Tree和PrefixSpan这两种关联算法的原理做了总结,这里就从实践的...

    刘建平Pinard
  • 用Spark学习矩阵分解推荐算法

        在矩阵分解在协同过滤推荐算法中的应用中,我们对矩阵分解在推荐算法中的应用原理做了总结,这里我们就从实践的角度来用Spark学习矩阵分解推荐算法。

    刘建平Pinard
  • 面对数据科学人才的巨大缺口,我们该如何提升自身技能

    如今,数据科学家炙手可热。在世界各地,成千上万的学生都在大学或在线课程中选择了数据分析课程。

    CDA数据分析师
  • 针对“Java老矣,尚能饭否?”,我们想说:驰骋码场,Java你英姿依旧!

    养码人B:JAVA是学院派的玩具,功能和架构非常完善,但笨重,开发效率太低,javascript、python和go语言将不断蚕食JAVA的市场。

    养码场
  • 细数数据科学团队中的十大关键角色

    应用数据科学是一项高度跨学科的团队工作,需要用多样性的角度看问题。事实上,比起专业知识和经验,观点和态度的重要性也不容小觑。以下是我对数据科学团队构成的看法。

    CDA数据分析师

扫码关注云+社区

领取腾讯云代金券