专栏首页小鹏的专栏[语音识别] 文本加标点--LSTM预测

[语音识别] 文本加标点--LSTM预测

文本加标点--训练BLSTM

bert4keras==0.5.9

# -*- coding:utf-8 -*-
import os 
import re
import sys
import time
import jieba
import gensim   
import logging
import numpy as np
import pandas as pd
from tqdm import tqdm
import multiprocessing
from bert4keras.snippets import sequence_padding, DataGenerator
from bert4keras.optimizers import Adam
import warnings
warnings.filterwarnings(action='ignore', category=UserWarning, module='gensim')# 忽略警告

from keras.models import *
from keras.layers import *
from keras.optimizers import *
from keras.regularizers import l2
from keras.callbacks import *
from keras.optimizers import *
from keras.callbacks import *
from keras import backend as K

def txt2p_model():
    # 模型构建
    model = Sequential()
    model.add(LSTM(256, input_shape=(None, 256),return_sequences=True)) 
    # model.add(LSTM(100, return_sequences=True)) 
    # model.add(Dropout(0.5)) #防止过拟合ÿ

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • [语音识别] 文本加标点--BERT预测

    MachineLP
  • 06. OCR学习路径之CRNN文本识别

    在了解了如何检测到文本之后,我们需要识别出检测文本内的文字信息。在文本识别完成之后,整个OCR光学字符识别的过程才算基本完成。那么,本次课程主要讲述识别文本的算...

    Aalto
  • 教程 | 如何使用TensorFlow构建、训练和改进循环神经网络

    选自SVDS 作者:Matthew Rubashkin、Matt Mollison 机器之心编译 参与:李泽南、吴攀 来自 Silicon Valley Dat...

    机器之心
  • 学界 | 5.5%语音识别词错率究竟如何炼成?IBM发布相关研究论文

    选自arXiv 机器之心编译 参与:晏奇、吴攀 语音识别是人工智能领域所研究的核心问题之一,研究者一直以来都在竞相努力以期能首先达到比肩人类的里程碑。去年十月,...

    机器之心
  • 腾讯 AI Lab 副主任俞栋:过去两年基于深度学习的声学模型进展

    本文摘取该论文主干部分进行编译介绍,希望为读者提供相关进展的概括性了解。

    腾讯AI实验室
  • 腾讯数平精准推荐 | OCR技术之识别篇

    本文介绍了腾讯数平精准推荐团队的OCR识别算法,包括识别算法的演进之路以及4个代表性方法。

    腾讯大数据
  • 谷歌通过定制的深度学习模型升级了其语音转文字的服务

    程序你好
  • 「LSTM之父」 Jürgen Schmidhuber访谈:畅想人类和 AI 共处的世界 | WAIC 2019

    2019 年 8 月 29 日,世界人工智能大会 WAIC 2019 在上海世博中心举行。瑞士 USI 和 SUPSI 教授,NNAISENSE 联合创始人兼首...

    AI科技评论
  • 来,我们告诉你:为什么不该使用LSTM预测股市

    近年来,机器学习得到了很大的发展和兴趣,在语音和图像识别方面取得了可喜的成果。本文分析了一种深度学习方法——LSTM在以标普500指数为代表的美国股市中的应用效...

    量化投资与机器学习微信公众号
  • 理解LSTM网络(整合)Recurrent Neural Networks长期依赖(Long-Term Dependencies)问题LSTM 网络GRU - Gated Recurrent Unit

    致Great
  • LSTM之父发文:2010-2020,我眼中的深度学习十年简史

    作为LSTM发明人、深度学习元老,Jürgen Schmidhuber于2月20日发表了一篇博文,着重介绍了近十年来基于作者研究工作最重要的开发和应用,最后对2...

    CV君
  • 机器语音识别技术发展脉络概览 | 文末有彩蛋

    通常我们说到语音识别技术的时候,指的是整个语音对话系统,如图所示,语音对话系统通常包括四个主要组成部分的一个或多个:语音识别系统将语音转化为文本...

    用户7623498
  • 开发 | AI股市预测实战:用LSTM神经网络预测沪深300未来五日收益率

    LSTM Networks(长短期记忆神经网络)简介 LSTM Networks 是递归神经网络(RNNs)的一种,该算法由 Sepp Hochreiter...

    AI科技评论
  • LSTM之父发文:2010-2020,我眼中的深度学习十年简史

    作为LSTM发明人、深度学习元老,Jürgen Schmidhuber于2月20日发表了一篇博文,着重介绍了近十年来基于作者研究工作最重要的开发和应用,最后对2...

    AI科技大本营
  • 循环神经网络综述-语音识别与自然语言处理的利器

    循环神经网络是一种具有记忆功能的神经网络,适合序列数据的建模。它在语音识别、自然语言处理等领域取得了成功。是除卷积神经网络之外深度学习中最常用的一种网络结构。在...

    SIGAI学习与实践平台
  • 吴恩达deeplearning.ai五项课程完整笔记了解一下?

    来源:机器之心 通过本文为大家解读如何构建自然语言、音频和其他序列数据的模型。 自吴恩达发布 deeplearning.ai 课程以来,很多学习者陆续完成了所...

    数据派THU
  • 看硅谷数据工程师如何使用TensorFlow构建、训练和改进RNN

    在本文中,我们提供了一个用于训练语音识别的RNN的简短教程,其中包含了GitHub项目链接。 ? 作者:Matthew Rubashkin、Matt Molli...

    AI研习社
  • CNCC2017梳理

    早上的论坛可以在爱奇艺下载视频 下午的分论坛是多个同时进行的,我也只去了一部分,这里先按时间顺序写自己的一些收获,之后会从另外的角度做一个总结。 ...

    梦里茶
  • [深度学习概念]·主流声学模型对比

    语音识别建模对语音识别来说是不可或缺的一部分,因为不同的建模技术通常意味着不同的识别性能,所以这是各个语音识别团队重点优化的方向。也正是因为如此,语音识别的模型...

    小宋是呢

扫码关注云+社区

领取腾讯云代金券