今天，腾讯开源这些技术，希望能帮助到有需要的人

文章来源：企鹅号 - 腾讯

之前，我们介绍过这样一个功能，

可以让视障者也能“看见”图片

：

一直以来，当视障用户使用智能手机时，都能通过自带的读屏功能听到文字。

可一旦碰上图片动态，他们就只能听见“图片”、“图片”、“图片”......

而我们做了一个尝试，希望这些图片也能“说话”。

在最新安卓版QQ空间APP中，增加了「图片语音即时描述功能」。它能识别图片的内容，并“说出”一句文字描述。就像这样——

一位参与内测体验的视障小伙伴说：

可能你不会觉得有什么，但对我而言却仿佛打开了一扇全新的大门。

QQ空间这个功能，来源于2017年产品团队与合作伙伴深圳信息无障碍研究会的一次交流。而同年，我们试着开放了高精度图像识别服务能力。

令人惊喜的是，许多国内PC和手机读屏软件接入后实现了对图片的朗读，一定程度上让视障人士有了更多选择。

这也让我们更加坚信，AI 不仅要 “IN ALL”，更需要 “FOR ALL”。

于是今天，我们在科技无障碍发展大会上宣布，在中国残疾人联合会的支持下，正式启动“AI无障碍：QQ空间无障碍技术开源项目”。

我们会开放这样一批AI技术，让更多企业、开发者能够自由接入并使用——

能听的图片：图片转语音技术

它能通过深度神经网络识别图片的内容，然后组织语言，以通顺并符合人类语言习惯描述图片，并通过语音说出来，就像QQ空间里能“说话”的图片一样；

看图识字：OCR识别技术

它可以识别图片上的文字，比如身份证、指示牌、一张PPT的照片等等，能让你对文本信息的获取更为便捷，不仅在日常生活中很实用，结合语音技术还能为许多障碍人群提供便利；

多角色定制语音：语音合成技术

它能通过机器学习训练，将文字以特定角色的声音诵读出来，让语音合成更加真实有情绪、获取信息更加容易，未来也许能用你的声音为奶奶念出一份说明书；

这些技术，你都可以在小程序 “多媒体AI平台”中找到。

我们还为这些特别适用于无障碍场景的AI技术开辟了专门的入口：

腾讯从2009年开始就进入到无障碍产品的改造中。

在探索中，我们越来越强烈地意识到，所有用户都有权利更方便地获取信息、更自由地交流，而这绝不是一个人就能走下去的道路。

所以，我们希望无障碍技术的普及，能降低产品应用新技术的门槛，让越来越多的行业和企业都加入这项探索中。

这样，我们才能一起消除前方的障碍，为更多人打开新的大门。

今日互动：

哪位大牛把摘要翻译一下？

以及未来你还希望看到

哪些技术也能开放出来？

- 第一时间解读鹅厂最新动态 -

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货