展开

关键词

上线,全面揭秘扫一扫背后的技术!

12月23 日,  iOS 版本正式上线。从识别特定编码形态的图片,到精准识别自然场景中商品图片,有哪些难点需要去克服? 信长期招收计算机视觉和OCR方向的人才, 欢迎简历breezecheng@tencent.com 一. 扫一扫概述 1.1 扫一扫是做什么的? 这里我们基本覆盖了全量优质小程序电商涵盖上亿商品 SKU,可以支持用户货比 N 家并直接下单购买,百科和资讯则是聚合了信内的搜一搜、搜狗、百度等头部媒体,向用户展示和分享与该拍摄商品相关的资讯内容 1.png 百闻不如一试,欢迎大家更新 iOS 新版本 → 扫一扫 → 自行体验,也欢迎大家通过界面中的反馈按键向我们提交体验反馈。图 2 即为扫实拍展示。 视频内容 1.2 扫一扫落地哪些场景? 扫一扫的目的是开辟一个用户直达信内部生态内容的一个新窗口,该窗口以用户扫图片的形式作为输入,以生态内容中的百科、资讯、电商作为展示页提供给用户。

5K72

揭秘「扫一扫」为什么这么快?

作者:arlencai,腾讯 WXG 应用研究员 “扫一扫”已上线一段时间,在公司内外均受到极大的关注。相比于行内相关竞品的“拍”,“扫一扫”的特点在于“扫”,带来更为便捷的用户体验。 一、背景 “扫”是“扫一扫”的亮点,带来更为便捷的用户体验。相比于“拍”的交互方式,“扫”的难点在于如何自动地选择包含物体的图像帧,这离不开高效的移动端物体检测。 综上,我们选取CenterNet作为“扫一扫”的移动端检测模型(见图 2)。 抛开“扫一扫”的场景,CenterNet 在通用的物体检测上仍存在以下问题:如何解决类别增加带来的检测头爆炸性增长?可形变卷积(DeformConv)是否存在更通用的替代品? 推荐阅读: 「扫一扫」 的背后技术揭秘 ?

91841
  • 广告
    关闭

    【玩转 Cloud Studio】有奖调研征文,千元豪礼等你拿!

    想听听你玩转的独门秘籍,更有机械键盘、鹅厂公仔、CODING 定制公仔等你来拿!

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    AI从到通用图像搜索的探索揭秘

    2020 年,拓展了更多识别场景,上线了版的图片搜索。本篇文章将与大家分享拓展到通用图像搜索领域的发展过程。 以上小视频简单介绍了的产品形态,它对扫一扫的扫封面能力进行了升级。 打开扫一扫,左滑切换到“”功能,对准想要了解的物品正面,可以获取对应的物品信息,包括物品百科、相关资讯、相关商品。在发布不久,也快速地支持了像花、车这些实用的识别能力。 ? 我们的识别效果究竟如何,我们也跟公司内外的识别引擎作了一些对比发现,基于自研的引擎和小程序商城海量的商品数据,我们取得了一流的识别效果。 识图又是怎么样的,如何基于的场景做出差异化?这是我们首先思考的问题。 识图 ? 接下来这个图,是我对识图的一个设计蓝图。

    87130

    数据集暴增压力下,「扫一扫」训练如何优雅破局?

    引言 “扫一扫”上线一段时间,由前期主要以商品图(鞋子/箱包/美妆/服装/家电/玩具/图书/食品/珠宝/家具/其他)作为媒介来挖掘信内容生态中有价值的信息,扩张到各种垂类领域的识别,包括植物/ 下文将通过从分布式训练方法的选择、多机通信技术原理进行讲解,基于Horovod的框架在自研平台打通分布式训练和实验结果来介绍扫一扫中的深度学习模型分布式训练。 二、分布式训练 1. 通过比对不同分布式并行方式、系统架构和参数更新,扫一扫最终选择基于数据并行的参数同步更新的Ring all-reduce的分布式训练方法。 基于此,扫一扫选择Horovod的分布式训练框架,在自研的训练平台上进行训练。 Horovod的多机通信初始化是基于MPI的,通过MPI初始化通信环境和进程分配。 六、总结与展望 目前扫一扫自研训练平台上能够成功进行分布式训练,但仍然存在以下问题:如何能够高效地存放读取大量图片小文件,减少IO的耗时。

    37610

    如何基于的场景差异化,做出有腾讯特色的扫一扫

    扫一扫为直达信内部生态的新窗口,提供电商、百科、资讯等信息。目前扫一扫提供的服务有:图像识别、图像搜索、二维码识别、文字提取。 下表列出了各大平台之图像搜索的功能细项。 在图像搜索领域,百家争鸣的局势下,我们如何做到基于的场景差异化,做出有特色的扫一扫呢? 二、产品切入 从经典的Pony三问去思考这个问题: 1. 如果你不做用户会损失什么? 2. 让原本要打开大众点评App的用户,转而从扫一扫,进入大众点评小程序,抢占入口流量。养成用户使用扫景点、扫餐厅、扫美食的习惯。 三、用户想要的是精准吗? 举个例子,我今天扫描了一个黑色的Logitech的鼠标,确实扫一扫很给力,找到了这鼠标在京东和苏宁的购买链接。我继续往下滑动,不到3秒就到底了。 然后,就没有然后了。 我认为,这是扫一扫的产品价值所在。 从扫一扫,到知你所看。 借由腾讯连接一切的生态内容,开启认识真实世界的新姿势。

    56650

    狗君小程序的部署

    在后台有收到朋友询问狗君小程序的部署,我开始觉得之前的几篇文章已经讲的很清楚,问的朋友多了,返回去再看,发觉几篇文章是站在开发的角度写的,比较散,决定在2018年最后的一篇文章整理一下关于狗君小程序的部署 如果你还不了解狗君小程序这个项目,请参考以下几篇文章: 当小程序遇上TensorFlow:Server端实现 当小程序遇上TensorFlow:Server端实现补充 当小程序遇上 /mogoweb/AIDog 说是小程序的部署,但本文并不打算讲解如何申请、开发和审核小程序,而是说明服务端的部署。 如果想了解小程序的开发,请参考腾讯官方文档。 小程序的代码可以参见github项目,这里就不多说明了。 小结 到这里,关于狗君小程序的部署就讲完了,如果这个步骤中有疑问的地方,请与我联系。

    85241

    扫一扫有多强大?的技术揭秘:抠图与检索

    |  扫一扫是典型的“离线写,在线读”的业务,业务数据的存储和检索库的构建都是在离线环节完成。 0 什么是 是以图像或视频作为输入,用以挖掘生态下商品、物品等有价值等信息。 工程上,工作主要可以分为三块,如图 1 所示: ? 未来扫一扫将引入更多场景的识别,拓展更多维度的物品,追求“万皆可扫”的目标。 ? ? 仅需少量视频观看记录,就可以精准推断你的习惯 ? 产品成长期如何用设计提升产品增长 ? 从支付看研发如何提高运营效能 ?

    63740

    「扫一扫」为什么这么快?背后的秘诀竟然是

    “扫一扫”已上线一段时间,受到了外界极大的关注。相比于行内相关竞品的“拍”,“扫一扫”的特点在于“扫”,带来更为便捷的用户体验。“扫”离不开高效的移动端物体检测,本文将为你揭秘。 作者 | arlencai,腾讯 WXG 应用研究员 一、背景 “扫”是“扫一扫”的亮点,带来更为便捷的用户体验。 “扫一扫”需要一个什么样的移动端检测(Class-wise or Object-ness)呢? 综上,我们选取CenterNet作为“扫一扫”的移动端检测模型(见图 2)。 抛开“扫一扫”的场景,CenterNet 在通用的物体检测上仍存在以下问题: 如何解决类别增加带来的检测头爆炸性增长?可形变卷积(DeformConv)是否存在更通用的替代品?

    5.3K22

    声音锁降临 以声人设备不再遥远

    语音短信是的一大特色,方便了广大受众。 语音命令是未来的一个趋势,搜索引擎支持语音搜索,谷歌眼镜可以语音开始拍照,现在创新性推出声音锁功能,只要读出相应的数字,无需输入密码就能登录,使用声纹识别技术更安全快捷。 ? 声音锁功能背后的技术原理是声纹识别,这个由模式识别中心语音技术组开发的新功能,是腾讯首次将声纹识别技术应用于用户产品中的一次尝试。目前该功能仍在灰度上线期间,仅部分用户可以体验到该功能。 想要开启声音锁功能,用户需要多次读出随机分配的一段数字,这个过程将帮助提取并制成与说话人相关的声音特征参数。当用户使用声音锁登录时,读出的数字若与此前声音特征参数匹配,即可登录成功。 此次添加声音登录功能也采用了更稳妥的做法,比如用户只有在登录过的老设备上才能使用该功能,同时使用技术来防止用录音冒充登录。

    64340

    如何开通公众号同步?(打开)

    ,选择在浏览器中打开网页 2.截屏保存授权二维码图片至手机相簿 截屏小Tip:可同时按住开机键+home键,完成截屏 3.在主页面打开「扫一扫」,右上角选择「相册」,选中刚刚保存的二维码截屏图片

    2.1K224

    再更新:朋友圈可以斗图!群消息支持引用!

    ▲ 切换账号 最高可以支持 5 个账号的切换 之前很克制的啊? 为什么这次反而增加到了 5 个呢? 这不是更方便运营者了吗? ▲ 权限项细化 可以设置好友是否可以访问朋友圈、运动等 五、扫一扫变化 之前: ? ▲ 之前扫一扫 现在: ? ▲ 现在扫一扫 变化: 1、样式全屏化; 2、单独放了出来; 扫描物品后,可以得到相关的咨询 ? ▲ 结果 还有就是购买链接了,相当于为平台的电商导流,利好购物小程序 ? ▲ 结果 ----

    33810

    MacOs如何双开

    需求:小助手工作的时候,需要用到两个,那么常见的就是在mac下程序中copy一个新的出来,但是这样极其麻烦,小助手每次启动的时候就必须进入到复制的信中的Contents打开 UzJuMarkDownImageimage -20220108223034176.png 这样就非常的影响效率,小助手回复信息的速度就变慢了,而且显示出来的图标也不美观,那么该如何配置才能让小助手更快的登录呢? UzJuMarkDownImageimage-20220108223125642.png 万皆可机器人 image.png 首先来到应用程序,直接command+c和command+v复制一个,将名字修改一下 png 点击运行 UzJuMarkDownImageUzJuMarkDownImageimage-20220108223741872.png 没有问题我们保存即可 但是现在保存出来的程序图标比较丑,那么如何让它跟一样呢 20220108223920510.png 首先来到应用程序,选择右键简介 因为我这里修改过了,所以只做演示 UzJuMarkDownImageimage-20220108224022843.png 然后我们再打开我们复制的

    17020

    如何缓存数据?

    缓存数据.png

    23310

    扫码关注腾讯云开发者

    领取腾讯云代金券