专栏首页小鹏的专栏[语音识别] 文本加标点--训练LSTM

[语音识别] 文本加标点--训练LSTM

文本加标点--训练LSTM

keras版本:

# -*- coding:utf-8 -*-
import os 
import re
import sys
import time
import jieba
import gensim   
import logging
import numpy as np
import pandas as pd
from tqdm import tqdm
import multiprocessing
from bert4keras.snippets import sequence_padding, DataGenerator
from bert4keras.optimizers import Adam
import warnings
warnings.filterwarnings(action='ignore', category=UserWarning, module='gensim')# 忽略警告
np.random.seed(2019)

import keras
from keras.models import *
from keras.layers import *
from keras.optimizers import *
from keras.regularizers import l2
from keras.callbacks import *
from keras.optimizers import *
from keras.callbacks import *
from keras import backend as K


# 超参数
batch_size = 32
learning_rate = 0.001
epochs = 50



def load_data(filename1, filename2):
    xlist = np.load('./wikiw2v.npy') 
    ylist = np.load('./wikipunc.npy&#

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 谷歌语音转录背后的神经网络

    用户1737318
  • 腾讯 AI Lab 副主任俞栋:过去两年基于深度学习的声学模型进展

    本文摘取该论文主干部分进行编译介绍,希望为读者提供相关进展的概括性了解。

    腾讯AI实验室
  • [语音识别] 文本加标点--训练BERT

    MachineLP
  • [语音识别] 文本加标点--训练BLSTM

    MachineLP
  • 教程 | 如何使用TensorFlow构建、训练和改进循环神经网络

    选自SVDS 作者:Matthew Rubashkin、Matt Mollison 机器之心编译 参与:李泽南、吴攀 来自 Silicon Valley Dat...

    机器之心
  • GMM-HMM模型 vs. DNN-HMM模型 vs. DNN-CTC模型 | 语言模型之战 | 老炮儿聊机器语音 | 4th

    随着语音识别技术越来越热,声学模型的训练方法也越来越多,各种组合和变化也是层出不穷,而随着深度学习的兴起,使用了接近30年的语音识别声学模型HMM(隐马尔科夫模...

    用户7623498
  • 06. OCR学习路径之CRNN文本识别

    在了解了如何检测到文本之后,我们需要识别出检测文本内的文字信息。在文本识别完成之后,整个OCR光学字符识别的过程才算基本完成。那么,本次课程主要讲述识别文本的算...

    Aalto
  • 学界 | 5.5%语音识别词错率究竟如何炼成?IBM发布相关研究论文

    选自arXiv 机器之心编译 参与:晏奇、吴攀 语音识别是人工智能领域所研究的核心问题之一,研究者一直以来都在竞相努力以期能首先达到比肩人类的里程碑。去年十月,...

    机器之心
  • [深度学习概念]·主流声学模型对比

    语音识别建模对语音识别来说是不可或缺的一部分,因为不同的建模技术通常意味着不同的识别性能,所以这是各个语音识别团队重点优化的方向。也正是因为如此,语音识别的模型...

    小宋是呢
  • 深度学习在语音识别上的应用

    我今天演讲主要分四个部分,第一个是分享语音识别概述,然后是深度神经网络的基础;接下来就是深度学习在语音识别声学模型上面的应用,最后要分享的是语音识别难点以及未来...

    腾讯云AI
  • 看硅谷数据工程师如何使用TensorFlow构建、训练和改进RNN

    在本文中,我们提供了一个用于训练语音识别的RNN的简短教程,其中包含了GitHub项目链接。 ? 作者:Matthew Rubashkin、Matt Molli...

    AI研习社
  • [语音识别] 文本加标点--训练BLSTM+ATTENTION

    MachineLP
  • 深度学习2017成果展

    来源:Statsbot 编译:Bing 编者按:圣诞节前夕,数据公司Statsbot对过去一年(也许更久)深度学习领域的成果做了总结,全文共分为6部分,分别是文...

    企鹅号小编
  • 【AIDL专栏】陶建华:深度神经网络与语音(附PPT)

    “人工智能前沿讲习班”(AIDL)由中国人工智能学会主办,旨在短时间内集中学习某一领域的基础理论、最新进展和落地方向,并促进产、学、研相关从业人员的相互交流。对...

    马上科普尚尚
  • 学界 | 谷歌联合英伟达重磅论文:实现语音到文本的跨语言转录

    选自arxiv 机器之心编译 参与:吴攀、李亚洲、蒋思源 机器翻译一直是人工智能研究领域的重头戏,自去年谷歌推出了神经机器翻译(GNMT)服务以来,相关技术的研...

    机器之心
  • [语音识别] 文本加标点--准备训练数据 (适用于LSTM与BERT)

    MachineLP
  • 博客 | 论文解读:对端到端语音识别网络的两种全新探索

    雷锋网 AI 科技评论按:语音识别技术历史悠久,早在上世纪 50 年代,贝尔研究所就研究出了可以识别十个英文数字的简单系统。从上世纪 70 年代起,传统的基于统...

    AI研习社
  • 干货 | 对端到端语音识别网络的两种全新探索

    AI 科技评论按:语音识别技术历史悠久,早在上世纪 50 年代,贝尔研究所就研究出了可以识别十个英文数字的简单系统。从上世纪 70 年代起,传统的基于统计的 H...

    AI科技评论
  • 腾讯数平精准推荐 | OCR技术之识别篇

    本文介绍了腾讯数平精准推荐团队的OCR识别算法,包括识别算法的演进之路以及4个代表性方法。

    腾讯大数据

扫码关注云+社区

领取腾讯云代金券