产品动态 | 腾讯云AI 12月产品更新

腾讯云 AI 团队修改时间:
248

12月,腾讯云文字识别OCR、语音合成TTS、自然语言处理NLP推出全新功能。语音识别ASR、机器翻译 TMT更新后性能提升。

腾讯云AI团队联合腾讯优图、AI Lab、微信智聆、微信智言等实验室,帮助合作伙伴和客户高效打造针对性的解决方案,助力各行各业的数字化和智能化转型。

全新功能

文字识别 OCR

文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室领先的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。腾讯云OCR 已支持近50余项子能力,如身份证、发票等卡证类和票据类的印刷体识别,也支持运单等手写体识别,可以有效地代替人工录入信息。  

新功能

支持智能扫码:

微信同款扫码服务,支持多种码制,准确率高、鲁棒性强,速度快、集成方便,产品成熟度高。支持iOS、Android、LINUX、Windows多个平台。

支持房产证识别:

新增房产证关键字段的识别,包括房地产权利人、共有情况、登记时间、规划用途、房屋性质、房屋坐落等。

支持户口本识别:

新增居民户口簿户主页及成员页关键字段的识别,包括姓名、户别、地址、籍贯、身份证号码等。

应用场景

智能扫码解决一图多码、扫码环境复杂、干扰因素多、像素低、模糊等问题。同时,也期待未来有更多“码”加入!

智能扫码详情咨询:cloudai@tencent.com

房产证识别、户口本识别可应用于政务、银行等多种场景,大幅提升信息处理效率。

官网demo地址:https://cloud.tencent.com/act/event/ocrdemo

语音合成 TTS

语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多种音色选择,支持自定义音量、语速,让发音更自然、更专业、更符合场景需求。语音合成广泛应用于语音导航、有声读物、机器人、语音助手、自动新闻播报等场景,提升人机交互体验,提高语音类应用构建效率。  

新功能

12月语音合成TTS支持通过CAM创建、管理和销毁用户组,并使用身份管理和策略管理控制其他用户使用语音合成的权限。

应用场景

为了支持母子账号功能,母账号对子账号使用语音合成时进行授权和权限管理。

自然语言处理 NLP 

腾讯云自然语言处理(Natural Language Process,NLP)深度整合了腾讯内部顶级的NLP技术,依托千亿级中文语料累积,提供18项智能文本处理能力,包括智能分词、实体识别、文本纠错、情感分析、文本分类、敏感审核、词向量、关键词提取、自动摘要、智能闲聊、百科知识图谱查询等等。可广泛应用于用户评论情感分析、互联网文本敏感审核、资讯热点挖掘、电话投诉分析等场景,满足各行各业的文本智能需求。 

新功能

支持广告文本纠错:

新增针对广告物料审核场景的文本纠错功能,该功能采用对抗式纠错的方法,可以有效处理广告物料场景下各种文本类型的纠错需求。

支持博彩文本审核:

新增针对博彩相关文本数据审核场景的功能,该功能可以有效鉴别出文本的恶意等级(EvilFlag),并能审核得到相关的恶意类型(EvilType)。

应用场景

可用于广告物料审核、博彩内容审核、敏感信息过滤、舆情监控等场景。帮助客户和相关运营人员及时、精准地发现问题,降低文本违规风险。

性能提升

语音识别 ASR

腾讯云语音识别(Automatic Speech Recognition,ASR) 为开发者提供语音转文字服务的最佳体验。语音识别服务经微信、腾讯视频、王者荣耀等大量内部业务验证,同时也在线上线下大量外部客户业务场景下成功落地,具备识别准确率高、接入便捷、性能稳定等特点。腾讯云语音识别服务开放实时语音识别、一句话识别和录音文件识别三种服务形式,满足不同类型开发者需求。 

性能提升

1)录音文件识别、实时语音识别和一句话识别更新16k-LFR(low frame rate)新模型,大幅提升识别效果;

LFR(low frame rate)即低帧率系统,低帧率和高帧率系统相对,低帧率一般指30ms进行一次预测,高帧率则为10ms进行一次预测,我们在低帧率系统中做了若干改进,最终在多个测试集上相对提升4%,同时加速一倍,创新开发出tlc blstm模型,并基于这个改进,我们成型一套以tlc blstm为主体,前后叠加CNN和DNN结构,形成CTLBNN结构。

2)云函数接入:对于将音频文件存储在腾讯云 COS 上的用户,使用云函数方式的录音文件识别是一种比 API 和 SDK 更加便捷的接入方式,可以明显减少前期的接入开发工作。该方式可以通过云函数的方式,将录音文件识别请求通过触发器函数自动执行,将识别结果通过触发器函数自动保存回COS或者其他存储器上,用户只需关注最终的识别结果;

3)小程序插件更新,现支持粤语、英语等更多语种模型。

价格更新,1月开始生效

腾讯云语音识别 ASR 提供预付费和后付费两种计费模式,开通正式付费版本后默认使用后付费的计费模式。如果您拥有免费资源包或者付费资源包,将优先对资源包进行扣减,资源包耗尽后自动转入后付费的方式。实时语音识别、一句话识别和录音文件识别均支持两种计费模式。

机器翻译

腾讯机器翻译(Tencent Machine Translation)使用纯神经网络翻译,从大规模双语语料库自动学习翻译知识,实现从源语言到目标语言的自动翻译;在WMT2018国际翻译大赛中,夺得中英方向世界第一名;目前支持17个语种、近100种语言对的翻译。 

性能提升

针对有结构化信息的网页、文章,以前需要根据不同段落结构,分多次上传文本进行翻译,速度较慢;现在支持一次请求批量上传所有网页内容文本进行翻译,一次返回全部信息,速度快体验更好。

自然语言处理 NLP 

性能提升

自然语言处理NLP优化了产品控制台,增加了“快速使用”指引,将API 3.0 Explorer工具的入口增添到了新版控制台上,为客户和开发者提供了在线调试NLP接口及代码生成的线上工具。

用户可以按照相关指引快速使用NLP的接口服务,并查看调用结果。该工具针对NLP公有云用户群,可以显著降低使用云API的难度,提高NLP产品的自服务能力。(自然语言处理NLP为每个腾讯云账号提供每天50万次的免费调用额度

文字识别 OCR

文字识别(Optical Character Recognition,OCR ),基于腾讯优图实验室世界领先的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。

我来说两句

0 条评论
登录 后参与评论

相关产品动态

扫码关注云+社区

领取腾讯云代金券