前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python带你朗读网页

Python带你朗读网页

作者头像
我被狗咬了
发布2019-09-23 10:19:35
1.4K0
发布2019-09-23 10:19:35
举报
文章被收录于专栏:Python乱炖Python乱炖

万能的Python大法可以做很多有趣的事情,那我们今天来看看使用简单的Python来实现对一个网页的朗读吧!

首先我们需要装一些必要的库:

readability

它是用来提取网页内的内容的

pip install readability-lxml

goose

它是一个文章提取器,我们用它来进行文章的提取

pip install goose3

baidu-aip

百度提供的 Python SDK,接口文档:http://ai.baidu.com/docs#/TTS-Online-Python-SDK/top。

pip install baidu-aip

对于百度的SDK我们也来简单的教大家用一下:

浏览器输入网址登陆:https://cloud.baidu.com/?from=console

找到语音识别:

点进去创建应用:

输入一些有用的创建信息:

回到管理控制台,获取应用的APPID,apikey,secretkey:

写代码的时候会用到,来调用这个接口

pydub

它可以用来生成音频文件,在 Windows 环境需要到 https://ffmpeg.zeranoe.com/builds/ 下载 FFmpeg,并将其配置到环境变量中(如果是使用ubuntu系统,还需要再安装下依赖apt-get install libav-tools)

需要在AudioSegment这个类中,把变量converter换成ffmpeg的路径:

pip install pydub

playsound

播放音频文件用到的包

pip install playsound

现在所有的包都安装完毕了,我们可以来安心敲代码了,完成网页到音频的转换。

首先导入用到的包:

import uuid

import re

import os

import argparse

from pydub import AudioSegment

from aip import AipSpeech

from playsound import playsound

from goose3 import Goose

from goose3.text import StopWordsChinese

调用百度语言的api,传入APP_ID, API_KEY, SECRET_KEY:

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

定义函数:文字转化成声音:

定义从网页获取文章的函数:

将音频文件合并:

下面我们就可以运行我们的程序了:

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-09-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python乱炖 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档