首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

OCR突破:Facebook推出大规模图像文字检测识别系统——Rosetta

另一方面,社交网络上每天上传的图像数量都是庞大的,对于如此大量的图片进行处理也是目前这项任务所要面临的一挑战。...本文,我们提出一种可扩展的 OCR 系统 Rosetta,为 Facebook 日常网络社交提供支持。...所提取的文本信息及图像中文本的位置信息都被存储在 TAO 中,这是 Facebook 的一个分布式图形数据库 (图4中的步骤6)。...图4 Rosetta 系统结构,这是 Facebook 的可扩展的文本识别系统。 实验 我们对 Rosetta OCR 系统进行了大量的评估实验。...为了解决 COCO-Text 数据Facebook 上图片数据分布不匹配的问题,我们还通过随机重叠 Facebook 中图像的文本来生成了一个大规模的合成数据集。

2.5K70
您找到你想要的搜索结果了吗?
是的
没有找到

Facebook广告4成功案例

Facebook广告,不仅在视觉上非常吸引人,产品还通常是消费者感兴趣的,因此效果非常好。下面,是4成功的Facebook广告案例,卖家可从中吸取经验,让自己的广告更加具有说服力。...Facebook广告案例1#:云之家(Slack) 这家公司的Facebook广告非常吸引人。 众所周知,人们都讨厌开那些繁杂而毫无意义的会议。...明丽生动的浅蓝色不仅与Facebook页面本身的深蓝色相搭配,还传达了颜色本身所代表的信任、坚定这类情感(这也是为什么很多大型科技公司图标都使用蓝色)。...卖家可从中学到: • 品牌价值观可成为一卖点。 • 审视目标设定和主要受众——看是否能将现有产品线推广到全新的消费群中?...Facebook广告案例4#:Shopify Shopify 4月份发布在Facebook上的广告,非常引人注目,而且敏锐地揭示了业务发展的核心客户群体和目标市场。

1.5K50

【学习】Facebook的实时Hadoop系统

Messaging 就是 Facebook 的新型消息服务,Insight 是提供给开发者和网站主的数据分析工具,ODS 则是 Facebook 内部的软硬件状态统计系统。...这三个应用场景都有各自的特色,但简单地来说,面临的问题是同样的:单机或者拆分的关系型数据库无法满足需求。 基于应用场景的数据特征,Facebook 抽象出了几个对存储系统的需求。...,Facebook 认为这种灾难很难发生,因而愿意接受这种风险; 跨数据中心的数据热备服务能力,Facebook 假设用户数据是分配到固定的数据中心的,可能带来的响应延迟问题应该通过缓存来解决。...2.2 Hadoop RPC 兼容性和数据块可用性 在之前的系统需求中,有提到一点是 Fault Isolation,并且 Facebook 的 Hadoop 系统是在单机房部署的,因而同一个服务必然会使用多套...看法和感想 以前我们也曾经讨论过如何在分布式文件系统的基础上搭建一套实时数据分析系统,当时认为如果有成熟的 GFS 可用的话,这个工作会比较简单。

96840

系统设计:Facebook的新闻流设计

需求 让我们设计Facebook的新闻提要,其中包含来自Facebook的帖子、照片、视频和状态更新 用户关注的所有人和页面。...关注Facebook。...换句话说,它是一个完整的可滚动版本的来自照片、视频、位置、状态更新和其他活动的朋友和你的生活故事 对于你设计的任何社交媒体网站——Twitter、Instagram或Facebook——你都需要一些新闻提要系统显示来自朋友和追随者的更新...2.系统的要求和目标 让我们根据以下要求为Facebook设计一个新闻提要: 功能要求: 1.新闻提要将基于用户访问的人员、页面和组的帖子生成跟随。...4.系统API � 一旦我们确定了需求,定义系统API明确说明系统的期望值。我们可以使用SOAP或RESTAPI来公开服务的功能。

6.1K283

Facebook数据泄露事件解读

“ 本月中旬,Facebook数据泄露丑闻爆发,上周一Facebook股价更是大跌7%,市值蒸发360多亿美元,CEO扎克伯格也因此身家缩水,跌出福布斯富豪榜前五位。...Facebook数据泄露事件(以下称“事件”)无疑是企业向第三方提供数据方面的一本反面教材。...,致使Facebook上5000万用户的数据泄露。...同时说明在2014年已对Facebook Platform的数据安全系统进行了全面的优化,在2015年发现科甘违规后已经采取了相应安全措施,包括管理权限和要求删除等,承诺将采取措施监管第三方的数据使用。...根据《个人信息安全规范》,进行安全审计时,应对隐私政策和相关规程,以及安全措施的有效性进行审计;同时建立自动化审计系统,监测记录个人信息处理活动;审计记录应为安全事件的处置、应急响应和事后调查提供支撑;

1.4K50

揭秘Facebook增长引擎——深度学习推荐系统

Facebook 2014年提出的GBDT+LR组合模型引领特征工程模型化的方向开始,业界迎来了深度学习推荐系统应用的浪潮。 本文将由简入深,细致讲解Facebook的深度学习推荐系统。...从某种意义上讲,Facebook基于GBDT+LR的广告推荐系统成了连接传统机器学习推荐系统时代和深度学习推荐系统时代的桥梁。...本节先介绍Facebook基于GBDT+LR组合模型的推荐系统实现,再深入到DLRM的模型细节和实现中,一窥社交领域巨头企业推荐系统的风采。...实时数据流架构 为了实现模型的准实时训练和特征的准实时更新,Facebook基于Scribe(由Facebook开发并开源的日志收集系统)构建了实时数据流架构,被称为online data joiner...模块(在线数据整合),该模块与Facebook推荐系统其他模块的关系如下。

1.3K20

分布式日志收集系统Facebook Scribe

1.分布式日志收集系统:背景介绍 许多公司的平台每天会产生大量的日志(一般为流式数据,如,搜索引擎的pv,查询等),处理这些日志需要特定的日志系统,一般而言,这些系统需要具有以下特征: (1...2.分布式日志收集系统Facebook Scribe主要内容 (1)Scribe简介及系统架构 (2)Scribe技术架构 (3)Scribe部署结构 (4)Scribe主要功能和使用方案...(5)Scribe的具体应用实例 (6)Scribe的扩展 (7)Scribe研究体会 3.Scribe简介 Scribe是facebook开源的日志收集系统,在facebook...4.Scribe的系统架构 image.png 如上图所示:Scribe从各种数据源上收集数据,放到一个共享队列上,然后push到后端的中央存储系统上。...5.Scribe的技术架构 image.png 如上图所示:Scribe服务器底层数据通信框架是Thrift,Thrift也是Facebook开源的,并得到了广泛的使用。

1.8K30

Facebook教你如何玩转大数据

就在今年情人节后第三天, Facebook通过其开发博客公布了其数据研究部门科学家团队的一项发现,即利用Facebook网站的统计数据,可以判断发帖的用户是否、何时擦出了 爱的火花。...迪乌克的同事、Facebook数据研究团队的另一位科学家格登·史塔特(Bogdan State)还透露了两项好玩儿的发现: 第一、如果通过Facebook发展的一段恋爱关系能维持三个月以上时间,很可能会持续四年甚至更久...不瞒你说Facebook还真的是喜欢利用情人节档期来玩转数据分析。 早在2012年始,Facebook数据研究团队就开始利用用户主动公开感情的数据做出一些有趣的尝试。...2011年底,Facebook开始让用户在社交网络上分享自己(数据来自Spotify插件)的收听习惯,Facebook数据工作团队也同一时间开始工作。...Facebook数据挖掘团队就像一群已经掌握了爱情“读心术”的魔法师,而从谈(ren)情(zhi)说(chang)爱(qing)做起使用 大数据,这个路数看起来更接地气。

94650

Facebook CDN系统中的文件下载漏洞

这篇Writeup分享的是Facebook CDN系统的文件下载漏洞,Facebook CDN平台中的文件名会被以某种加密方法进行编码,当发生请求调用或下载时则指向一个加密字符串作为代替,作者通过破解了这种加密方法...这里,就拿Facebook 的公开CDN系统 scontent.*.fbcdn.net来说,它代表了以scontent开头的一类CDN系统,它负责托管用户上传的大量文件。...,就能从Facebook的CDN系统scontent.ftun12-1.fna.fbcdn.net中下载到对应文件。...因为我已成功破解了Facebook的这种文档ID加密方法,所以,我可以尝试修改这个文档ID加密串以指向其它文件(如音视频文档),实现Facebook CDN系统中的任意托管文件下载。...之后,我把这种方法稍做修改,竟然能成功从Facebook的一些内部(非公开直接访问)CDN系统如interncache-*.fbcdn.net,获取到一些文件,这些文件涉及到了Facebook的部份敏感源代码

1.4K40

Facebook布局区块链的小算盘和棋局

文/孟永辉 尽管之前有关Facebook即将布局区块链的消息传得沸沸扬扬,但是当Facebook真正宣布拥抱区块链的时候依然引起了不少的轰动。...Facebook全面布局说明区块链技术在社交领域具有一定的应用前景,不然,Facebook不会在这个档口主动拥抱区块链技术。...马库斯周二下午在他的Facebook页面确认了他的新角色。 他表示将组建一个新的区块链部门,探讨如何让Facebook最大限度地利用区块链,从零开始。...以Facebook为代表的互联网巨头仅仅只是一个集中表现而已,在中小型的企业上这种表现更加明显。 科技巨头们在大数据、智能科技、云计算、IOT上的布局是这种现象的集中表现。...诞生于数字货币,区块链技术在于应用并非发币 值得注意的是,此次Facebook拥抱区块链技术明确表示不会发币。这表明Facebook更加关注的是区块链技术在应用层面的潜力。

65860

Facebook 开源 FAISS;MIT 开发机器学习数据合成系统 SDV | 开发者头条

更高效的聚类、相似性搜索算法库,Facebook 开源 FAISS MIT 黑科技,合成数据也能用于机器学习 机器学习算法成功预测人造地震 每日推荐阅读 ViZDoom 使用教程:训练 AI 来玩《毁灭战士...》 █ Facebook 开源 FAISS ?...Kalyan Veeramachaneni 发明的这个机器学习系统名为 Synthetic Data Vault (SDV),能基于真实数据创建机器学习算法模型,来自动生成人造、合成数据。...这套系统基于名为 "recursive conditional parameter aggregation" 的算法。...该突破在地质学界造成了相当的震动。可以预料,将会有一批科研人员着手研究如何将机器学习应用于对地震前兆信号的识别。

1.1K40

Facebook数据被滥用?8个视频案例教你用好Facebook Graph API

数据文摘作品 编译:Aileen 过去的一个周末,社交网络Facebook因为用户数据被第三方API滥用帮助美国大选的事情上了热搜。...也有人提出犯法的是第三方API, 原罪不在Facebook。 先把这件事情放一边,可以确定的是Facebook拥有大量可供人们浏览的数据,人们可以使用此数据做很多事情。...Facebook拥有大量数据供您探索,您可以使用以下数据做很多事情:分析Facebook页面或Facebook群组,将这些数据用于社交网络分析(SNA),为数字营销做数据分析, 甚至收集和保存自己个人项目的数据...第2课:下载并保存Facebook数据 在本视频中,我将向您展示如何从Facebook页面或Facebook群组下载并保存所有数据,并记住某些要点。...第3课:设置和清理数据 在第三课中,我将使用notebook来清理和审计从Facebook获得的数据,并为分析做好准备。

1.2K20

破解YouTube、Facebook推荐系统背后的那些算法

我之前翻译过一篇文章《破解 YouTube 的视频推荐算法》,得到了很多人的好评,在各个算法、大数据公号上纷纷转载。...最初看到这篇文章是@fengyoung 在Facebook上分享的,觉得题目很有意思就看了一遍,看完后感觉很有启发,遂决定翻译一下让更多人看到。...关于Facebook的算法,我在《推荐系统36式》专栏里都有提到,你也可以看下图,总结了推荐系统背后的那些算法,都是需要你花时间去学习和实践的。 ? 为什么会有《推荐系统36式》这个专栏?...甚至有人说在未来,推荐系统会成为所有数据型产品的标配。 然而推荐系统前方技术蓬勃发展,后方却落地困难。...推荐系统前期投入吗? 2. 推荐系统这事容易整吗?里面那些算法到底是怎么回事? 3. 搭建一个推荐系统,这里面有哪些坑? 4. 推荐架构、搜索引擎和广告系统之间应该如何协同? 5.

1.7K50

2017国外10云故障盘点:亚马逊、Facebook、IBM等

这次故障主要原因是,一位员工在维护流程中将一个数据库目录从错误的数据库服务器中删除导致的。...Facebook,2月2日 在漫长而痛苦的三个小时中,全球各地的一些用户被锁在Facebook之外,担心他们的帐户被黑客入侵。...一位AWS工程师试图对位于弗吉尼亚州数据中心内的一个S3存储系统进行调试的时候,意外地输入了一个错误命令行,随后大部分互联网,包括Slack、Quora和Trello在内的很多企业平台停机了4个小时。...相反,意外的命令导致更大范围服务器处于脱机状态,其中包括为服务器提供特定数据存储所需的一个子系统,以及另一个分配新存储的子系统。...这次让北欧第二云计算提供商出现故障的原因是意外启动了灭火系统。微软表示,对系统的日常维护工作导致灭火气体释放,自动出发空调系统关闭,从而让设备温度升高,迫使计算机系统自动关闭。

1.3K40

Facebook数据:兴奋与恐惧同行?

作者:Bernard Marr 翻译:大数据文摘翻译组 瑾儿小浣熊 Facebook, 这个在世界范围内拥有1200亿用户的流行的社交网络,由于其拥有的巨量数据,已经成为一个大数据天堂。...作为一个帮助公司获取大数据的专业工作者,笔者敬畏Facebook正在创造的大数据金矿。笔者相信,即使我们现在停止使用Facebook,这家公司也拥有足够未来几年使用的数据来研究我们(他的用户)。...我们越多使用Facebook,他们也就会越了解我们,而他们拥有的数据信息也就将会更有价值。Facebook现在正在大力投资收集、存储以及分析用户提供的数据,但是他们对数据的渴求并没有止步于此!...Facebook超越了简单的用户数据分析和数据挖掘。“今日美国”揭示了Facebook如何通过网络跟踪用户。通过使用“追踪cookies”,Facebook可以收集你所访问的任何网站的信息。...笔者对Facebook使用用户数据有一个的忧虑:它不是通过一个真正透明的方式进行!他们一直借口到:这些对数据的使用都被用小字阐述了。但是我们又有多少人在注册一个网页的时候会去读那些小字呢?

42890

Hadoop大数据系统的七危险信号

导读:大多数企业大数据应用案例尚处于实验和试点阶段,对于少数首次在生产环境部署Hadoop系统的用户来说,最常遇到的就是扩展问题,此类问题往往导致企业因噎废食,终止大数据应用项目。...哪些危险信号表示Hadoop大数据系统出现扩展问题? ?...以下是Hadoop大数据系统出现扩展问题的七危险信号: 危险信号一: 永远进入不了生产阶段 大数据应用从概念验证到生产环境是一个巨大的飞跃,Hadoop系统的可扩展性将面临巨大的挑战。...在进入生产环境前,大数据团队需要对Hadoop系统进行模拟真实数据规模的压力测试,此类测试能够检验大数据应用的可扩展性和容错性能,还能帮你做出更加准确的性能(资源需求)规划模型。...到最后,你的Hadoop系统因为没有足够多的数据而不再是“大数据系统数据保留窗口的缩水是因为存储的扩展性遇到问题,这与前面的计算性能问题类似。当你的容量预测模型出现问题时,需要尽快调整。

68390
领券