学习
实践
活动
工具
TVP
写文章

微信图片翻译技术优化之路

随着翻译质量的提升,微信翻译的应用形态从文本逐步扩展到图片、语音、网页、文档、视频等众多场景。本文以微信图片翻译为例介绍近一年的技术优化。 微信图片翻译 1.0 首先简要介绍微信图片翻译 1.0 版本的技术方案,重点梳理其中的关键问题。 1.0 版本中微信图片翻译采用相对简单的方案,主要分为两个模块:后台 Server 负责图片的文字识别、段落合并、段落翻译等,客户端根据文字识别和翻译结果渲染生成翻译图片。 从文章最开始微信图片翻译 1.0 版本的 badcase 可以发现,图文合成的结果对于最终的图片翻译体验尤为重要。 同时对于微信图片翻译 2.0 和 1.0 版本,人工评估 GSB,2.0 版本提升显著,结果如下: 图片翻译 2.0 版本已上线到微信 iOS 客户端,体验方式:微信聊天框点击图片选择翻译、扫一扫图片翻译等入口

36620

Unity 接入有道智云AI - 图片翻译

一、接口介绍 基于文字识别与文本翻译技术,满足用户翻译图片文字的需求。 只需要通过调用图片翻译API,传入图片的Base64编码,指定源语言与目标语言,通过POST请求方式,就可以识别图片中的文字并进行翻译。 在应用总览中创建应用,填写相关内容 3.获取应用ID、密钥 三、在Unity中应用 1.定义请求数据结构 根据官方文档中接口调用参数说明定义对应的数据结构: ///

/// 图片翻译请求数据结构 /// public ResRegion[] resRegions; } /// /// 图片翻译的具体内容 /// [ /// 文字的高度 /// public int textHeight; } 3.封装调用函数 /// /// 图片翻译

18940
  • 广告
    关闭

    腾讯云精选爆品盛惠抢购

    腾讯云精选爆款云服务器限时体验20元起,云数据库19.9元/年起,还有更多热门云产品满足您的上云需求

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Python批量图片识别并翻译——我用python给女朋友翻译化妆品标签

    我打算开发一个能批量翻译图片的demo,把家里的各种化妆品都翻译好。 机智如我,是不会自己从训练模型做起的,打开有道智云的友好的AI接口页面 ,果然有图片翻译服务,体验了一下可是真不错,于是果断使用。 make up for ever 虽然没翻译成玫珂菲,哈哈哈但是关键词长期保湿、固定喷雾都翻译出来了~~棒 这个更是不明觉厉,韩文、英文混合都能翻译~~~ 樱花水的表现也不错哦~ 再乱入一个开起来更像包装盒的图片识别 具体个人注册的过程和应用创建过程详见文章分享一次批量文件翻译的开发过程 开发过程介绍 1、api接口介绍 先介绍下该工程的核心部分,有道智云图片翻译服务的调用接口 API HTTPS地址:https: transclass.py实现了图片读取、处理等逻辑,最后通过pictranslate.py中的方法来调用图片翻译API。

    48100

    flocked翻译_physicked翻译

    Fleck is a WebSocket server implementation in C#. Branched from the Nugget proje...

    4210

    翻译翻译,什么叫多态!

    上面的例子就是多态,多态就是同一个行为 eat(),作用在不同的对象上(Cat、Pig),会有不同的表现形式(猫吃老鼠,猪吃草)。

    17820

    翻译翻译,什么叫接口!

    我们知道抽象类里面可以有普通方法也可以有抽象方法,子类继承抽象类必须要实现父类的抽象方法。

    12420

    翻译翻译,什么叫继承!

    这让我想起了电影《西虹市首富》,处于人生低谷期的王多鱼偶然间继承了二爷遗产,从此走向人生巅峰。

    12130

    翻译翻译,什么叫final!

    final 就相当于一把锁,而且这把锁的钥匙还丢了,所以被他修饰的所有东西都是最终的。

    20720

    图片文字识别神器OCR、翻译、朗读集合一体的工具

    今天要分享一款多功能识别软件,一款能识别图片文字+翻译+朗读+弹窗PandaOCR工具。 PandaOCR 适用系统:PC 在这方面的软件挺多,例如天若OCR,我一直有用主要方便,但是功能比较少。 PandaOCR不一样功能强大,支持用户将图片上的内容翻译成文字的识别工具,进行快速扫描图片、拍照记录信息、内容提取等功能等等。 ? 当然主要是免费啦! 除了图片文字识别之外,还支持多国文字翻译,单单这识别+翻译引擎就调用了非常多的平台,不一一列举啦。 ? 翻译使用起来也很简单,只要把文字复制或者识别到之后,点击翻译就行,可以选择翻译引擎,左下角选择翻译类型,应该研究一两遍大家就会了。 ? 文字识别功能只要按F4,选中你要识别的文字,就能显示到软件窗口上并做了翻译和朗读,当然不需要朗读就去掉就行。 有个更厉害的只要复制到图片,打开软件就能自动识别到图片上的文字内容。 ?

    7K30

    翻译翻译,什么TMD叫EXPLAIN

    PRIMARY是指查询中包含子查询,并且该查询位于最外层,而SUBQUERY翻译过来就是子查询。上面的SIMPLE则是最普通,最简单的查询。 补充说明: MATERIALIZED翻译过来是物化的意思,即将子查询结果集中的记录保存到临时表的过程。 临时表称之为物化表。 possible_keys 翻译一下就是可能用到的key,但不一定真正会用到,有可能是因为MySQL认为有更合适的索引,也可能因为数据量较少,MySQL认为索引对此查询帮助不大,选择了全表查询。

    9320

    ICDM 2019最佳论文:从图片、文本到网络结构数据翻译,一种新型的多属性图翻译模型

    例如,图像处理和计算机视觉中的许多问题都可以看作是从输入图像到相应输出图像的「翻译」。这种翻译问题非常重要并且有极为广泛的,但实际上却极为困难,近年来引起了越来越多的关注。 传统研究只考虑特定结构类型的数据翻译(转换)问题,然而在许多实际应用中,需要处理比网格和序列更灵活的结构的数据,因此需要更强大的转换技术来处理更通用的图结构数据。 现有图结构翻译模型有两种形式,第一种假设来自输入域和目标域的图共享相同的图拓扑结构,但是无法建模或预测图拓扑的变化, 例如对交通网络中节点处车流量的预测 [1]。

    36520

    翻译翻译,什么是滑动窗口

    马上翻译:滑动窗口就是可以滑动的窗口。

    8040

    Styling Broken Images (给加载失败的图片加上css样式) - 不完全翻译

    Styling Broken Images (给加载失败的图片加上css样式) - 不完全翻译 前言 Broken images are ugly. 图片加载失败的默认样式是很难看的。 如果图片没有加载出来,我们可以给alt值增加样式 如果图片没有加载出来,我们可以设置:before和:after伪元素。当然,图片正常加载时是没作用的。 实战 准备一张图片Kanye Laughing 给失败图片添加帮助信息 One way we can 原文地址:Styling Broken Images 英文不好,第一次翻译文章,大家见谅。

    15930

    ·第三方网络图片处理框架:SDWebImage(官方文档翻译篇)

    这篇文章翻译自https://github.com/rs/SDWebImage 。 目前,虽然AFNetworking也提供了图片下载及缓存策略,但更专业的时候,图片加载框架一般用SDWebImage,正如主流APP(如QQ和微信)会用到。

    1.3K20

    翻译翻译,什么叫类与对象!

    比如要想学会降龙十八掌,需要先学第一式,再学第二式......最后学第十八式,每一式与每一式之间的关联性很强,只有依次学完每一式,才能练成。

    14350

    中英翻译(基于百度翻译

    只做了简单的在线翻译,语音翻译图片翻译都要钱,哈哈 市面上有名气的翻译公司就是有道和百度了,有道尝试了一下,分为API和SDK两种,但是demo下载下来跑不了 百度的就是API,也很简单,就是通过百度的协议去请求他们的服务器 ,得到翻译后的值,每个月有200万的免费,够用了 百度文档地址http://api.fanyi.baidu.com/api/trans/product/apidoc#joinFile 步骤: ? :layout_width="match_parent" android:layout_height="wrap_content" android:hint="请输入要翻译的中文 :layout_width="match_parent" android:layout_height="wrap_content" android:hint="请输入要翻译的英文 layout_gravity="right" android:layout_margin="10dp" android:padding="10dp" android:text="翻译

    1.1K30

    翻译翻译,什么叫抽象类!

    我们都知道类是抽象的,对象是具体的。那抽象类是什么玩意?是比抽象的类还要抽象的类叫抽象类?

    14320

    fizz buzz 翻译_thefizzbuzz中文翻译

    查看PDF文件 翻译自: https://www.ibm.com/developerworks/opensource/library/x-gbuzz/index.html fizz buzz 版权声明

    5610

    谷歌翻译

    // 法语 "fr" SPA, // 西班牙语 "es" <--- 添加语种(自定义语种代号) KOR, // 韩语 "ko" ''' # 设置Google翻译服务地址 居然有这么多的消息包,我们一个一个找,直到找到Response中有翻译内容的。这个时候我们去看一下它的header: 可以看到是get方式,于是我们可以浏览器里直接去请求这个url。 果然我们的得到了一个文件,这个时候打开文件,文件里就是请求回来的翻译结果: 这时候我们去分析一下请求的参数,看看我们是否可以构造,可以看到原来要翻译的文本,就是跟着q这个参数出去的: 只不过在请求的时候 ,文字被encode成了%**%,这时候我们试着换一个文字去请求,结果发现返回: 仔细上网查过之后,每次翻译的文字不同,参数中的tk值就会不同,ticket这种策略就是google用来防爬虫的。 /translate.js'); // 调用翻译结果 trans.gettrans('你好') 直接调用了 translate.js,我们看看这个文件: // 得到TKK var exec = require

    18210

    文献翻译

    另一个中央以前与肌肉衰老相关的途径是雷帕霉素(mTOR)的哺乳动物靶标,包括mTOR复合体I(mTORC1)在骨骼肌翻译的调节。

    28910

    扫码关注腾讯云开发者

    领取腾讯云代金券