专栏首页小鹏的专栏[语音识别] 文本加标点--训练BLSTM+ATTENTION

[语音识别] 文本加标点--训练BLSTM+ATTENTION

文本加标点--训练BLSTM

bert4keras==0.5.9

# -*- coding:utf-8 -*-
import os 
import re
import sys
import time
import jieba
import gensim   
import logging
import numpy as np
import pandas as pd
from tqdm import tqdm
import multiprocessing
from bert4keras.snippets import sequence_padding, DataGenerator
from bert4keras.optimizers import Adam
import warnings
warnings.filterwarnings(action='ignore', category=UserWarning, module='gensim')# 忽略警告
np.random.seed(2019)

import keras
from keras.models import *
from keras.layers import *
from keras.optimizers import *
from keras.regularizers import l2
from keras.callbacks import *
from keras.optimizers import *
from keras.callbacks import *
from keras import backend as K
from keras_self_attention import SeqSelfAttention
from keras_multi_head import MultiHead, MultiHeadAttention


# 超参数
batch_size = 32
learning_rate = 0.001
epochs = 5



def load_data(filename

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • [语音识别] 文本加标点--训练BLSTM

    MachineLP
  • 腾讯 AI Lab 副主任俞栋:过去两年基于深度学习的声学模型进展

    本文摘取该论文主干部分进行编译介绍,希望为读者提供相关进展的概括性了解。

    腾讯AI实验室
  • CV学习笔记(二十一):CRNN+CTC

    上次的一篇文章说了下DenseNet,这一篇文章来说一下CRNN+CTC的识别原理以及实现过程。这篇文章原理部分主要参考于白裳老师的“一文读懂CRNN+CTC文...

    云时之间
  • CV学习笔记(二十一):CRNN+CTC

    上次的一篇文章说了下DenseNet,这一篇文章来说一下CRNN+CTC的识别原理以及实现过程。这篇文章原理部分主要参考于白裳老师的“一文读懂CRNN+CTC文...

    云时之间
  • 学界 | 小米加入 AI 研究大家庭!联合西工大推出基于注意力机制的普通话语音识别算法

    AI 科技评论按:小米近期发布了自己的 AI 音箱,加入了智能家居的战局。正当我们觉得小米会不会只是蹭“人工智能”热点的时候,小米的这篇论文证明了自己真的是把人...

    AI科技评论
  • 王珺:智能音箱语音技术分享

    这次分享介绍了在研究方面的一系列新的方法和改进,主要是语音识别,语音识别,声纹识别,以及TTS,在落地应用方面,语音识别中心为多个腾讯的产品有技术支持的输出,如...

    云加社区技术沙龙
  • 实战:基于tensorflow 的中文语音识别模型 | CSDN博文精选

    目前网上关于tensorflow 的中文语音识别实现较少,而且结构功能较为简单。而百度在PaddlePaddle上的 Deepspeech2 实现功能却很强大,...

    AI科技大本营
  • 重磅 | 小米首次公开发表论文:基于注意力机制的端对端语音识别(附论文翻译)

    文/CSDN周翔 今年 3 月,雷军在两会的媒体沟通会上表示,“去年年初,小米设立了探索实验室,不久将有重磅级的人工智能产品发布。” 昨日(7 月 26 日)下...

    AI科技大本营
  • 大牛讲堂 | 深度学习Sequence Learning技术分享

    雷锋网按:本文作者都大龙,2011年7月毕业于中科院计算技术研究所;曾任百度深度学习研究院(IDL)资深研发工程师,并连续两次获得百度最高奖—百万美金大奖;现在...

    AI科技评论
  • 【情感分析】基于Aspect的情感分析模型总结(PART IV)

    文章借鉴了来自QA领域的记忆网络解决ABSA问题。Memory Network提出的目的之一就是为了解决RNN、LSTM等网络的记忆能力较差的问题。它维护了一个...

    NewBeeNLP
  • 博客 | 论文解读:对端到端语音识别网络的两种全新探索

    雷锋网 AI 科技评论按:语音识别技术历史悠久,早在上世纪 50 年代,贝尔研究所就研究出了可以识别十个英文数字的简单系统。从上世纪 70 年代起,传统的基于统...

    AI研习社
  • 干货 | 对端到端语音识别网络的两种全新探索

    AI 科技评论按:语音识别技术历史悠久,早在上世纪 50 年代,贝尔研究所就研究出了可以识别十个英文数字的简单系统。从上世纪 70 年代起,传统的基于统计的 H...

    AI科技评论
  • Robust Scene Text Recognition with Automatic Rectification 学习笔记

    识别自然图像中的文字仍是一个充满挑战的任务,本文提出了RARE(Robust text recognizer with Automatic REctificat...

    Natalia_ljq
  • 语音识别真的比肩人类了?听听阿里 iDST 初敏怎么说

    用户1737318
  • 大会 | 思必驰-上海交大实验室14篇ICASSP 2018入选论文解读

    AI 科技评论按:为期 5 天的 ICASSP 2018,已于当地时间 4 月 20 日在加拿大卡尔加里(Calgary)正式落下帷幕。ICASSP 全称 In...

    AI科技评论
  • 一文读完GitHub30+篇顶级机器学习论文(附摘要和论文下载地址)

    作者:常佩琦 弗格森 【新智元导读】 今天介绍Github上的开源项目,专门用于更新最新的研究突破,具体说来,就是什么算法在哪一个数据集上取得了state-of...

    新智元
  • [语音识别] 文本加标点--训练BERT

    MachineLP
  • [语音识别] 文本加标点--训练LSTM

    MachineLP
  • 10小时训练数据打造多语种语音识别新高度

    本文联合撰写: 腾讯:吕志强,颜京豪,胡鹏飞,康健,阿敏巴雅尔 导语|在刚刚结束的NIST OPENASR评测中,TEG AI语音联合清华大学,刷新世界小语种...

    腾讯高校合作

扫码关注云+社区

领取腾讯云代金券