transducer - 腾讯云开发者社区

CTC每个时间步进行的解码是independent的，这样的设定能够简化模型，但却不是很合理。事实上，实际应用中的序列，往往前后token都是有约束关系的。为了达到比较好的识别效果，在CTC的输出之后，通常需要再经过一个Language Model进行后处理。因为本质上来说，Language Model得到的就是前后token之间的转化概率，Language Model的引入弥补了CTC中时间步之间独立假设的缺陷。那能不能不用Language Model，抛弃时间步独立假设呢？

您找到你想要的搜索结果了吗？

是的

没有找到

谷歌手机输入法可以离线语音识别了！模型精度远超经典CTC

Scalaz（53）－ scalaz-stream: 程序运算器－application scenario

从上面多篇的讨论中我们了解到scalaz-stream代表一串连续无穷的数据或者程序。对这个数据流的处理过程就是一个状态机器（state machine）的状态转变过程。这种模式与我们通常遇到

语音关键词检测方法综述【附PPT与视频资料】

随着智能音箱、语音助手等应用的出现，普通人也可以像科幻场景一样使用语音与机器进行交流。语音关键词检测是实现人机语音交互的重要技术，被广泛地应用于各类智能设备、语音检索系统当中。语音关键词检测可以分成两种，一种是用于设备唤醒、设备控制keyword spotting；一种是应用于语音文档检索的spoken termdetection，二者虽然名字类似，但从功能侧重和技术路线上都有所区别。本次分享介绍语音关键词检测的主要方法与最新进展。

中山大学宋尔卫/苏士成Nature Immunology：抑制RGS1可增强肿瘤特异性T细胞在乳腺癌中的浸润

抗肿瘤淋巴细胞浸润减少仍然是肿瘤免疫逃逸的主要原因，并且与肿瘤的低存活率密切相关。在此，中山大学的宋尔卫、苏士成报道了增强肿瘤特异性T细胞在乳腺癌中浸润的通路。研究人员发现，辅助TH1细胞和细胞毒性T淋巴细胞（CTL）中RGS1（regulator of G protein signaling 1）的上调减少了它们向肿瘤的运输和存活，并且与乳腺癌和肺癌患者的存活期缩短有关。

汽车电子控制系统的构成

汽车电子控制系统主要由传感器（Sensor）、电子控制单元（Electronic Control Unit，ECU）和执行器（Actuator）组成，对被控对象（Controlled Object）进行控制。如下图所示：

大数据计数原理1+0=1这你都不会算(五)No.55

Hello哈，又好久没聊大数据相关的东西了，是不是又忘记了吖？这次聊聊B-树的升级版，B+树。前面的内容小伙伴可以回顾一下。大数据计数原理1+0=1这你都不会算(一)No.47 <- HashSet 大数据计数原理1+0=1这你都不会算(二)No.50 <- BitMap 大数据计数原理1+0=1这你都不会算(三)No.51 <- BloomFilter 大数据计数原理1+0=1这你都不会算(四)No.52 <- B-Tree 所谓B+树

Scalaz（49）－ scalaz-stream: 深入了解-Sink/Channel

一个完整的scalaz-stream有以下几个部分组成：Source -> Transducer -> Sink，用直白文字来描述就是：“输入 -> 传换 -> 输出”。我们已经在前面几篇讨论中

Google又逆天：语音输入离线实时输出文字，仅占80MB！然而……

这次出手的，又是谷歌 AI 团队。刚刚，他们为旗下的一款手机输入法 Gboard （不要跟谷歌拼音输入法搞混了啊~）上线了新功能：离线语音识别。目前这一新功能，只能在其自家的产品 Pixel 系列手机上使用。

SP Module 5 Speech Synthesis – Phonemes and the Front End

When processing almost any text, we need to find the words. This involves splitting the input character sequence into tokens and normalising each token into words.

Human Language Processing——LAS

语音识别也和图像处理一样，有传统的语音识别算法和基于DeepLearning的语音识别算法。当然，现在的主流都是采用Deep Learning去做的。那么，在传统语音识别领域，一般用什么方法呢？用得最多的就是3个算法，HMM（Hidden Markov Model）；GMM（Gaussian Mixture Model）；CTC（Connectionist Temporal Classification）

如何通过HART协议将流量计实时数据读取到上位机

HART(Highway Addressable Remote Transducer)，可寻址远程传感器高速通道的开放通信协议，是美国ROSEMOUNT公司于1985年推出的一种用于现场智能仪表和控制室设备之间的通信协议。

神乎其技，Magic Leap要跑路了？

朋友们，新年好，断更这么久，我又回来啦，今天我又可以胡诌有关Magic Leap这个东东了。

全国产传感器的基本特性

全国产传感器的概念，全国产传感器的分类，全国产传感器的基本特性，传感器的标定和传感器技术现状。

8倍提升表现：谷歌新算法，从多人对话里分清谁在发言，错误率降到2%

他们不想被传统做法困住，开发了新方法：利用语音识别，把语言学线索和声学线索搭配食用，帮助区分。

有限状态机抽取地址

有限状态机（英语：finite-state machine，缩写：FSM）又称有限状态自动机，简称状态机，是表示有限个状态以及在这些状态之间的转移和动作等行为的数学模型。

张海腾：语音识别实践教程

作为智能语音交互相关的从业者，今天以天池学习赛：《零基础入门语音识别：食物声音识别》为例，带大家梳理一些自动语音识别技术（ASR）关的知识，同时给出线上可运行的完整代码实践，供大家练习。

谐振式传感器是如何产生异常谐振（共振），该怎么解决？

利用谐振元件把被测参量转换为频率信号的传感器，又称频率式传感器。当被测参量发生变化时，振动元件的固有振动频率随之改变，通过相应的测量电路，就可得到与被测参量成一定关系的电信号。70年代以来谐振式传感器在电子技术、测试技术、计算技术和半导体集成电路技术的基础上迅速发展起来。其优点是体积小、重量轻、结构紧凑、分辨率高、精度高以及便于数据传输、处理和存储等。按谐振元件的不同，谐振式传感器可分为振弦式、振筒式、振梁式、振膜式和压电谐振式等（见振弦式传感器、振筒式传感器、振梁式传感器、振膜式传感器、石英晶体谐振式传感器）。谐振式传感器主要用于测量压力，也用于测量转矩、密度、加速度和温度等。

Scalaz（47）－ scalaz-stream: 深入了解-Source

scalaz-stream库的主要设计目标是实现函数式的I/O编程（functional I/O）。这样用户就能使用功能单一的基础I/O函数组合成为功能完整的I/O程序。还有一个目标就是保证资源

金融/语音/音频处理学术速递[11.8]

Update！H5支持摘要折叠，体验更佳！点击阅读原文访问arxivdaily.com，涵盖CS|物理|数学|经济|统计|金融|生物|电气领域，更有搜索、收藏等功能！ q-fin金融，共计3篇 cs.

全国产压力传感器选型

压力传感器是指将接收到的气体、液体等压力信号转变成标准的电流信号（4~20mADC），以供给指示报警仪、记录仪、调节器等二次仪表进行测量、指示和过程调节的元器件。它主要是由测压元件传感器、测量电路和过程连接件等组成的（进气压力传感器）。

SAW BAW 滤波器概述

很多通信系统发展到某种程度都会有小型化的趋势。一方面小型化可以让系统更加轻便和有效，另一方面，日益发展的IC制造技术可以用更低的成本生产出大批量的小型产品。

7 Papers & Radios | 模型鲁棒性一键式评测平台；CPU训练神经网络比GPU快十几倍

机器之心 & ArXiv Weekly Radiostation 参与：杜伟、楚航、罗若天本周的重要论文包括腾讯 PCG 应用研究中心提出的利用生成人脸先验 GFP 的人脸复原模型 GFP-GAN；希伯来大学、特拉维夫大学、Adobe 等机构的研究者提出了一种名为「StyleCLIP」的模型；复旦大学自然语言处理实验室发布模型鲁棒性评测平台 TextFlint等。目录： Towards Real-World Blind Face Restoration with Generative Facial Pr

谷歌Recorder实现说话人自动标注，功能性与iOS语音备忘录再度拉大

机器之心专栏作者：王泉、张帆在今年的 Made By Google 大会上，谷歌公布了 Recorder 应用的自动说话人标注功能。该功能将实时地为语音识别的文本加上匿名的说话人标签（例如 “说话人 1” 或“说话人 2”）。这项功能将极大地提升录音文本的可读性与实用性。谷歌于 2019 年为其 Pixel 手机推出了安卓系统下的录音软件 Recorder，对标 iOS 下的语音备忘录，并支持音频文件的录制、管理和编辑等。在此之后，谷歌陆续为 Recorder 加入了大量基于机器学习的功能，包括语音识

这玩意儿不赖！——聊聊HART协议（1）（留言赠书）

以前只知道有个HART协议，说是由罗斯蒙特公司搞的，叫做什么可寻址远程传感器高速通道(Highway Addressable Remote Transducer)，缩写为HART，提出的时间在文献中查到的有1980年的说法，但较多的说法是1985年。

Elasticsearch在日志分析领域应用和运维实践

场景描述：Elasticsearch及相关产品，介绍基于ELK + Kafka 的日志分析系统，Elasticsearch优化经验，阿里云 Elasticsearch服务以及Elasticsearch 运维实践。

Elasticsearch在日志分析领域应用和运维实践

场景描述：Elasticsearch及相关产品，介绍基于ELK + Kafka 的日志分析系统，Elasticsearch优化经验，阿里云 Elasticsearch服务以及Elasticsearch 运维实践。

传感器实现仿微信摇一摇功能

如果你英文不错以及可以翻墙访问的话，建议您不妨直接去谷歌官网看文档：https://developer.android.com/reference/android/hardware/Sensor.html。

腾讯万亿级 Elasticsearch 内存效率提升解密

Elasticsearch（ ES ）是一款功能强大的开源分布式实时搜索引擎，在日志分析（主要应用场景）、企业级搜索、时序分析等领域有广泛应用，几乎是各大公司搜索分析引擎的开源首选方案。

025

重磅纯干货 | 超级赞的语音识别/语音合成经典论文的路线图（1982-2018.5）

网址：https://github.com/zzw922cn/awesome-speech-recognition-speech-synthesis-papers

看Lucene源码必须知道的基本规则和算法

上中学的时候写作文，最喜欢的季节我都是写冬天。虽然是因为写冬天的人比较少，那时确实也是对其他季节没有什么特殊的偏好，反而一到冬天，自己皮肤会变得特别白。但是冬天啊，看到的只有四季常青盆栽：瓜栗(就是发财树，好吧，算我矫情，反正我不喜欢这个名字)，绿萝，永远看不到它开花的巴西铁，富贵竹，散尾葵……过年的时候家里的杜鹃就开花了，零星的几朵小花儿更突显了这个季节的凄凉。红掌，蝴蝶兰总是美美的在那里，开不败却看不到生机。插到水里的勿忘我，洋桔梗，看到他们也只会联想到过几天他们会枯萎的命运。春天来了，先是迎春花，

动态 | 语音识别如何突破延迟瓶颈？谷歌推出了基于 RNN-T 的全神经元设备端语音识别器

AI 科技评论按：在近二十年来，尤其是引入深度学习以后，语音识别取得了一系列重大突破，并一步步走向市场并搭载到消费级产品中。然而在用户体验上，「迟钝」可以算得上这些产品最大的槽点之一，这也意味着语音识别的延迟问题已经成为了该领域研究亟待解决的难点。日前，谷歌推出了基于循环神经网络变换器（RNN-T）的全神经元设备端语音识别器，能够很好地解决目前语音识别所存在的延迟难题。谷歌也将这项成果发布在了官方博客上，AI 科技评论进行编译如下。

GPU解码提升40倍，英伟达推进边缘设备部署语音识别，代码已开源

这篇论文提出了一种经过优化的加权式有限状态变换器（WFST/ weighted finite-state transducer）解码器，能够使用图像处理单元（GPU）实现对音频数据的在线流处理和离线批处理。这种解码器能高效利用内存、输入/输出带宽，并为最大化并行使用了一种全新的维特比（Viterbi）实现。内存节省让该解码器能比之前处理更大的图，同时还能支持更多数量的连续流。对 lattice 段进行 GPU 预处理能让中间 lattice 结果在流推理期间返回给请求者。

腾讯万亿级 Elasticsearch 内存效率提升解密

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐