专栏首页软件测试小助手3分钟实现语音播报微博热搜

3分钟实现语音播报微博热搜

前几天看到一篇爬取微博热搜并语音播报的文章,觉得很好玩,就试着自己写了一下,我写的是简单版的代码,为了便于理解,做完熬夜做了一个小视频讲解。

主要思路:

1、获取热搜页面的返回数据

2、筛选热搜页面中的热搜名称、排行等信息

3、百度语音播报

微博热搜页面:https://s.weibo.com/top/summary

这个页面不需要用户登录,就能获取页面数据,所以我们不需要考虑登录时获取token的问题,这个下次会单独做个视频讲解。

获取微博热搜内容:

(由于语音识别只能支持1024个字节,所以我只爬取了前十的排行榜)

url = 'https://s.weibo.com/top/summary'
header = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
                  '(KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
def get_text():
    list = []
    response = requests.get(url=url, headers=header)
    if response.status_code == 200: #判断接口请求是否正确
        html = etree.HTML(requests.get(url, headers=header).text) # 构造XPath解析对象
        hot_search_name = html.xpath('//td[@class="td-02"]/a/text()')  # 热搜名 字符串列表
        hot_search_rank = html.xpath('//td[@class="td-01 ranktop"]/text()')  # 热搜排行
        hot_search_name_true = hot_search_name[1:]  # 只取热搜排行,不取置顶热搜
        for i in range(0, 10):
            s = '第'+hot_search_rank[i]+'名' + hot_search_name_true[i] # 排行和热搜组合
            list.append(s)
    else:
        print('wrong')
    result = ''.join(list) # list转str
    return result

百度语音API地址:https://ai.baidu.com/ai-doc/SPEECH/Gk4nlz8tc

使用方法:创建百度账号->添加应用->获取id、key和secret_key,具体可以参考下面这篇文章,有讲过如何创建应用 【巧用校验码

百度语音识别

APP_ID = '19942258'
API_KEY = 'XXX'
SECRET_KEY = 'XXX'
def speech():
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
    result = client.synthesis(get_text(), 'zh', 1, {
        'vol': 5,  #音量
        'per': 0,  # 发音人选择
        'pit': 7, # 音调
        'spd': 4 # 语速
    })
    # 识别正确返回语音二进制 错误则返回dict 参照下面错误码
    if not isinstance(result, dict):
        with open('auido.mp3', 'wb') as f:
            f.write(result)

代码很简单,有空的可以尝试下,挺好玩的。最后给大家贴一下我爬取后的音频。

本文分享自微信公众号 - 软件测试小助手(gh_2282fef3410c),作者:小雯子打豆豆

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-05-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 数据分析师哪里找数据?

    它的功能很齐全,可以做单个抖音号的数据管理,查看日常的运营情况;也可以对单个视频做数据追踪,知晓它的传播情况。除此之外,通过灰豚数据,你还能搜集到热门视频、音乐...

    开心鸭
  • 搜狗AI合成主播再次进化,发布站立式合成主播

    现在,3个月后,这个AI主播不仅能“坐在”演播室,开始替代人类播报新闻。还能“手舞足蹈”,运用起肢体语言丰富表达了。

    量子位
  • A站凉了,B站上市,微博曲线入局 破壁的二次元市场成巨头盛宴

    上周,二次元视频网站、弹幕鼻祖ACFUN发出“我想再活500年”的微博与百万“猴子”告别,走向长期关闭,让内容行业为之震动。事实上,2017年ACFUN至少已有...

    罗超频道
  • 超过十分之一的报告篇幅给语音,互联网女皇为何看好麦克风?

    KPCB合伙人、享有“互联网女皇”称号的玛丽·米克尔的互联网趋势报告于今天正式发布。毫不夸张地说,这份报告是互联网行业分析的“超级碗”,它用200多页的Keyn...

    罗超频道
  • 微博复苏时间线拉长

    作为一个社交媒体,微博尽到了搭建用户社交广场,为用户提供实时信息的责任。但2009年至今微博成立11年了,在历经与搜狐、网易、腾讯微博大战,一战成名;打响与微信...

    刘旷
  • "我们做的微博数据挖掘"

    作者:数控小V http://www.36dsj.com/archives/48650 新浪微博在2012年-2013年红得发紫,也是移动互联网快速成长的年...

    机器学习AI算法工程
  • 太阳底下无隐私:那些年我们做的微博数据挖掘

    新浪微博在2012年-2013年红得发紫,也是移动互联网快速成长的年代。主页君当时就读于北京邮电大学,在实验室老师的指导下,从4G研发转战数据挖掘。从此我们项目...

    华章科技
  • 【大数据分析必备】超全国内常用API接口汇总

    下面列举了100多个国内常用API接口,并按照 笔记、出行、词典、电商、地图、电影、即时通讯、开发者网站、快递查询、旅游、社交、视频、天气、团队协作、图片与图像...

    IT派
  • 【数据】常用API接口汇总

    下面列举了100多个国内常用API接口,并按照 笔记、出行、词典、电商、地图、电影、即时通讯、开发者网站、快递查询、旅游、社交、视频、天气、团队协作、图片与图像...

    陆勤_数据人网
  • 搜狗分身技术再进化,让AI合成主播“动”起来

    去年 11 月的互联网大会期间,搜狗与新华社联合发布全球首个AI合成主播一经亮相,引起了人们对“AI+媒体”的广泛讨论。如今,搜狗 AI 合成主播不断更新迭代。

    AI科技大本营
  • 2019年,这11个数字营销趋势不容忽视!

    引言:本文详细介绍了在2019年里,随着SEO、社交媒体、PPC等数字营销格局发生巨大变化,目前出现的最新且不容忽视的11个数字营销趋势。

    iCDO互联网数据官
  • 响铃:网红“有毒”,被“感染”的短视频、直播平台真能赢得下半场?

    昨日微博、朋友圈被美拍举办的两周年生日会话题刷屏,热闹的原因不只是因为有李开复、钟丽缇、李晨、张伦硕、晓雪等大咖的出席,而是美拍邀请在其平台上活跃的近500名网...

    曾响铃
  • 腾讯借微信封杀抖音,抖音虐快手反杀腾讯

    没有人会想到,一款毫不起眼的APP 快手,能从农村起家,迅速以星星之火,燃烧整个中国,收割几亿用户。

    挖数
  • 9102年,你已经是个大春节了,你要自己学会用AI了

    2019 年,AI 为我们「渐渐无趣」的春节增色不少……它不仅可以帮助人们送出新年祝福,也能为人高效传递信息。在繁忙的春运期间,人工智能也能帮助人们更快地回到家...

    机器之心
  • 新浪微博技术分享:微博短视频服务的优化实践之路

    本文来自新浪微博视频转码平台技术负责人李成亚在LiveVideoStackCon 2017上的分享,由LiveVideoStack整理成文。李成亚分享了微博短视...

    JackJiang
  • 13款Apple Watch 中文应用初体验:不及自带功能实用和有趣,期待下一版本

    今天办公室收到了 6 块 Apple Watch,小伙伴们很兴奋,玩得不亦乐乎,很久没有一款硬件产品能够让所有人都如此兴奋了。Apple 宝刀不老,Apple ...

    罗超频道
  • 一分钟AI | Numpy将放弃Python2.7全面支持Python3,柯洁苦战终结AI41连胜深夜失眠发文感慨

    一分钟AI 柯洁深夜发微博,庆祝自己击败已经41连胜的新锐围棋AI“符合预期” 《时代》杂志评选 2017 年最佳发明榜单发布:iPhone X,特斯拉Mode...

    AI科技大本营
  • 肚里有粮,心中不慌,语音直播成下一个内容富矿?

    在前几天的微博V影响力峰会上,自媒体今年收入117亿的消息已不胫而走,用我在另一篇文章中的话说,今天内容就是如同黄金一样的硬通货。而内容最火爆的形态非直播莫属,...

    罗超频道
  • 【晓周报】教育部官方小程序发布/公众号测试「标题党标记」功能/「微信热词」功能推出

    从今天开始,知晓程序会在每周一,为你带来全新的「晓周报」栏目。 在「晓周报」里,你可以简单了解上周微信小程序的新能力、新动向。

    知晓君

扫码关注云+社区

领取腾讯云代金券