专栏首页华章科技《 打工人分析简报 》

《 打工人分析简报 》

导读:打工人怎么就火了?本文用Python爬取微博、b站相关话题的数据,来一探究竟。

作者:小Z远辰

来源:数据不吹牛(ID:shujubuchuiniu)

最近打工人这个梗和相关的沙雕梗火得直烧眉毛。

微博、b站、知乎、朋友圈...广大东西南北漂们突然找准了定位,大家也自知不是满腔热血已经沸腾的奋斗者,我们的真实身份是——打工人。

忽如一夜春风来,千人万人打工仔。

我很好奇,这个神奇的定位(梗)怎么就火起来了?广大工友们在网上都贡献了哪些优质的工作笔记?于是我用Python爬取了微博、b站相关话题的数据,来一探究竟。

b站部分爬取代码(直接跳过完全不影响阅读体验):

url = 'https://search.bilibili.com/all?keyword=%E6%89%93%E5%B7%A5%E4%BA%BA&from_source=nav_suggest_new0&page={}'

def get_target(url,num = 10):
    result = pd.DataFrame()

    for i in range(1,num + 1):
        headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}
        html = requests.get(url.format(i),headers = headers)
        bs = etree.HTML(html.text)

        for sig in bs.xpath('//li[@class = "video-item matrix"]'):
            title = sig.xpath('div[@class = "info"]/div/a/@title')[0]
            click = sig.xpath('div[@class = "info"]/div[3]/span[1]')[0].xpath('string(.)').strip('\n        ')
            danmu = sig.xpath('div[@class = "info"]/div[3]/span[2]')[0].xpath('string(.)').strip('\n        ')
            date = sig.xpath('div[@class = "info"]/div[3]/span[3]')[0].xpath('string(.)').strip('\n        ')
            up = sig.xpath('div[@class = "info"]/div[3]/span[4]')[0].xpath('string(.)').strip('\n        ')
            df = pd.DataFrame({'标题':[title],'播放量':[click],'弹幕':[danmu],'日期':[date],'UP主':[up]})
            result = pd.concat([result,df])

        time.sleep(random.random() + 0.5)
        print('已经完成b站第 {} 页爬取'.format(i))

    return result

01 打工人的火热

马克思曾经没说过:看一个现象有多火,百度指数是最简单粗暴的工具。

对比热度非常高的“特朗普”,“打工人”起于微末,10月20号开始才作为一个独立词条被记录,随后爬坡式增长,到22号和特朗普还有鸿沟般的热度差异。10月23号,“打工人”搜索指数从前一日的8469,飙升至24216,竟然能硬压话题之王“特朗普”一筹。

但是百度指数在新鲜热词的追踪上总是滞后的,我们再看看b站数据,找到这个梗火遍鬼畜区的时间秘密。

9月22日,b站上有了第一声“早安,打工人”的问候,但播放量寥寥。9月23日-10月14日,每天有不到5个新的打工人视频诞生。

10月15号打工人原创视频达到两位数,20号开始,打工人开了狂暴模式,每天原创视频量以阶梯式增长,截止24日,日新增视频达到了258个。

原创视频数量上涨,是拜打工人梗的热度所赐,b站上有哪些魔性又火热的“打工人”视频呢?

从数据上很容易发现有两个明显的爆点,10月16号,“老摸鱼艺术家”的《加油!打工人!》播放量已破320万,充分点燃了打工人的热情。

10月22号up主“三Lu有毒”也在《早安,打工人!》埋伏了一手,把各种打工人优秀的工作笔记串联起来,500万播放量已是唾手可得。

不错,很有精神!

看了一圈鬼畜区的打工人视频,我发现文本都有一些相似的影子,他们都来源于“优秀人打工笔记”。

02 打工人优秀工作笔记

根据爬取的内容,我们挑选了热度比较高的10条优秀打工人笔记,供各位工友学习,共同进步!

早起的打工人要学会忍受孤独!

靠自己的打工人,才是光荣的!

我爱打工,更爱喝水!

单身,可能是因为打工不够努力!

打工必须得努力!

累吗?累就对了,舒服是留给有钱人的。早安,打工人!

冷吗?冷就对了,温暖是留给开小轿车的人。早安,共享单车人 !

奶茶好喝吗?好喝就对了!奶茶是奖励给打工人心灵慰籍的一剂良药!早安,打工人!

....

打工人段子爆火的背后,其实是大家对于工作现状不满,但又无法通过个体力量短时间改变现状的一种自嘲。

段子的背后总是辛酸。

加油吧,打工人!

本文分享自微信公众号 - 大数据(hzdashuju)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-11-02

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 除了悠闲地跟人类下棋,AI正在努力终结这一“危险状态”

    以往没有任何一个时期,会比现在的人工智能距离我们更近。事实上,人工智能已经潜移默化地深入到了现代生活的各个角落,革命性地改变着传统人力模式的运作逻辑,将过去让人...

    华章科技
  • 清华唐杰教授:认知图谱是人工智能的下一个瑰宝(PPT下载)

    导读:近日,清华大学计算机系教授、系副主任,智谱·AI 首席科学家唐杰在 MEET 2021 智能未来大会上作了题为《认知图谱——人工智能的下一个瑰宝》的精彩演...

    华章科技
  • 人工智能核爆力:当AI发展到一定程度,人类会消失?(附PPT下载)

    导读:本文选自近期清华大学计算机系60周年系庆之产业论坛上,日本工程院院士、欧盟科学院院士、中国人工智能学会副理事长任福继教授所做的题为“人工智能的未来”的演讲...

    华章科技
  • 【AI TOP 10】马化腾点赞搜狗 AI 答题助手,周鸿祎说太流氓;中国首条无人驾驶单轨线路正式通车

    新智元AI TOP 10 新智元 “每日AI ·TOP 10” 是新智元推出的一档快读栏目,精选汇集每日国内外最重大产业新闻,第一时间为读者送上新鲜资讯,...

    新智元
  • R语言画热图时图例(legend)过多超出画图边界

    但是如果添加多组注释信息的话,他的图例是从上到下依次排列,如果太多图例就会超过绘图边界,比如

    用户7010445
  • 来自谷歌首席的灵魂追问:想当研究科学家,一事无成你受得了吗?

    作为 Vincent 的同行,人工智能先驱, FAIR 负责人 Yann LeCun 看到这篇文章之后表示非常赞同:成为研究科学家有风险。同时他也在九条之前...

    机器之心
  • 来自谷歌首席的灵魂追问:想当研究科学家,一事无成你受得了吗?

    作为 Vincent 的同行,人工智能先驱, FAIR 负责人 Yann LeCun 看到这篇文章之后表示非常赞同:成为研究科学家有风险。同时他也在九条之前...

    CDA数据分析师
  • python等待10秒执行下一命令的方法

    然后在需要等待执行的命令前调用sleep()方法,并在方法的括号里将等待时间设置为10秒即可。

    砸漏
  • 为什么要换位思考?

    从小老师和家长就一直在我们耳边叨念一句话,叫做“己所不欲,勿施于人”。这是一种典型的换位思考。

    王树义
  • 数据告诉你:两周时间,你的GPS位置信息被发送了5398次

    微信号:freebuf 你知不知道你的手机把你的位置信息发送给各种公司的频率如何?答案是:2周时间,超过5000次。虽然有点吓人,但这却是真的。 卡内基梅隆大...

    FB客服

扫码关注云+社区

领取腾讯云代金券