首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

YouTube 数据库如何保存巨量视频文件?

本文会对 YouTube 使用 数据库 和后端数据基础设施进行深入讲解,它们使得该视频平台能够存储如此巨量数据,并能扩展至数十亿用户。 那我们就开始吧。...他们在最初 MySQL 环境中面临问题是什么,使他们在此基础上实现了一个额外框架? 3 为何需要 Vitess 网站最初只有一个数据库实例。...它需要进行冗余,并将用户数据备份到世界不同地理区域数据中心。丢失用户数据或服务不可用是不允许。...5 部署到云中 Vitess 是云原生,很适合云中部署,因为就像模式一样,容量是逐步添加到数据库。...它们相当昂贵,也容易随着时间推移逐渐丢失数据。这使得它们不适合用于归档数据存储。 另外,谷歌正在开发一个适用于大规模数据中心新磁盘系列。

1.5K10

Java:并发不易,先学会用

而我,非常乐意与他们一道,对使用Java线程进行并发程序开发基础知识进行新一轮学习。 01、我们为什么要学习并发? 脑袋没有被如来佛祖开过光,所以喜欢一件事接着一件事想,做不到“一脑两用”。...换做是,面对司马懿千万大军,不仅弹不了琴,弄不好还被吓得屁滚尿流。 每个人都只有一个脑子,就像电脑只有一个CPU一样。但一个脑子并不意味着不能“一脑两用”,关键就在于脑子有没有“并发”能力。...有一次陪家人在商场里面逛街,出电梯时候有一个傻叉非要抢着进电梯。...下面这段代码使用ThreadPoolExecutor创建了一个线程池,池里面的每个线程会对共享资源count进行+1操作。现在,闭上眼想一想,当1000个线程执行结束后,count值会是多少呢?...因为一个线程正在写这个变量时候,另外一个线程可能正在读这个变量,或者正在写这个变量。这个变量就变成了一个“不确定状态”数据。这个变量必须被保护起来。

35420
您找到你想要的搜索结果了吗?
是的
没有找到

YouTube 数据库如何保存巨量视频文件?

这些都是令人难以置信数字。 本文会对 YouTube 使用 数据库 和后端数据基础设施进行深入讲解,它们使得该视频平台能够存储如此巨量数据,并能扩展至数十亿用户。 那我们就开始吧。...他们在最初 MySQL 环境中面临问题是什么,使他们在此基础上实现了一个额外框架? 3为何需要 Vitess 网站最初只有一个数据库实例。...它需要进行冗余,并将用户数据备份到世界不同地理区域数据中心。丢失用户数据或服务不可用是不允许。...5部署到云中 Vitess 是云原生,很适合云中部署,因为就像模式一样,容量是逐步添加到数据库。...它们相当昂贵,也容易随着时间推移逐渐丢失数据。这使得它们不适合用于归档数据存储。 另外,谷歌正在开发一个适用于大规模数据中心新磁盘系列。

1.6K40

520还找不着对象?50个以色列年轻人研发出AI红娘,4700多对成功牵手

想象一下:一个WhatsApp机器人问你一些关于你自己问题;然后将这些数据与成千上万已婚夫妇个性进行比较,并提供相应匹配。...他们意识到,像TA们这样单身人士,要想找到另一半,多半只有两种方法:要么去找朋友求介绍,要么上约会网站。  ...「约会后情侣们会不时地更新是否在继续约会状态,是否已经分手、是否已经订婚等。」 他说,基于这些用户资料更新,算法会进行学习和改进,做出更准确建议。...98%用户如果第一次没有找到合适会对象,会再次使用Algo,并要求再次匹配。」 此外,Algo团队定期分析元数据,了解如何改进算法,改善结果精度。...另一对通过Algo认识情侣表示:「与一般约会网站不同是,我们觉得这个AI红娘就像一个朋友,在我们约会时与我们保持联系。它和任何平台都不一样,而且真的很有效。」

46110

袭击GA数据新型引荐垃圾

一个账号下所有媒体资源中间数字(账号ID)都是一样。 破折号后面的数字是媒体资源编号,这些数字范围是1到50。引荐垃圾攻击主要针对编号是1媒体资源,有时候是媒体资源2和媒体资源3。...它就像我们在邮箱中习惯使用反垃圾邮件过滤器一样,但这些过滤器需要不断地更新,因为引荐垃圾发送者也在不断地发展新战术。...Sullivan以每个网站每年$75收费来管理这个解决方案。对于负责数百个网站顾问或公司市场营销部门来讲,这是一笔不小成本。对于整个GA用户群来说,这是一笔很大资金。...对于成千上万网站管理员来说,实施相同过滤器和自定义细分来解决同一个引荐垃圾问题也是非常地浪费时间。 相反地,谷歌应提供一组预定义过滤器去消除绝大多数虚假数据。...John答复是,“所以它们是没有非ascii编码字符URLs?相信@googleanalytics牛人正在开发一些更通用解决方案。”)

1.1K70

「全栈之路」Web前端开发后端指南

也就是说,它是一台可运行多个Web应用程序(网站、软件等)相对独立机器,每个用户拥有部分资源。...Blob / 文件存储 虽然数据库通常用于存储动态数据(例如,由最终用户或API客户端生成),但是存在某些类别的数据( 非结构化数据),这些数据不能由用户改变或者基于文件而不适合数据库存储,例如: 前端网站资源...传统网络访问: ? 但是,假设用户位于中国,S3存储位于美国西部 - 数据传输距离数千英里,因此用户会看到延迟。 CDN是什么?使用CDN有什么优势?...例如,假设存在一个数据库查询,该查询对昨天数据执行计算,其结果每天经常被成千上万用户访问。每次用户请求此数据时联系数据库就没有任何意义。...确切一次传送 在不容许重复情况下,FIFO (先进先出) 消息队列会通过自动筛选重复来确保每个消息均精确地传输了一次 (且只有一次)。

1.3K30

浅谈 REST API 身份验证四种方法

认证认证,简单来说就是验明身份,就像我们身份证一样,警察在查户口时候会看一下我们身份证,证明“你确实是你”。图片鉴权鉴权,简单来说就是看你是否有权限做某些事。...就像你在公司一样,有些代码仓库你是没有权限写只有权限。...API KEY缺点API KEY实际意义上并不是授权,有人还是可以获取 API 密钥并获得对他们可用所有信息访问权限,就像使用 HTTP 基本身份验证一样,API 密钥只是消除了攻击者猜测进入系统方式能力...:OIDC,是一个 OpenID 基金会 (OIDF) 标准,它是基于 OAuth 2.0 框架之上身份验证协议,允许在用户尝试访问受保护 HTTPs 端点时验证用户身份。...最大原因就是OAuth 2.0 本质上是一种授权协议,试想一下这样场景:有多个资源服务器,你从一个资源服务器上得到授权并且拿到token,你就可以用这个token去访问跟此资源服务器授权类型网站

2.3K30

3 个值得注意软件即服务(SaaS)站点

每隔几个月,想要谈谈当前网上流行最佳软件即服务(SaaS)网站。与其他那些评选最好服务名单不同,SaaS 这个领域更加活跃,因此那些半年或者一年一次评选对这个领域不适用。...SaaS 是一个新兴服务和软件分发、部署新模式,所以它就像小孩脸色,说变就变。 那么现在让我们来看看目前发展得最好一些 SaaS 网站。...与大多数云计算服务不同,OpSource 上对访问需求、用户级别和计算资源可扩展性只能在 5 个单位中调节,而不是其他服务那样提供数百或数千个选择。...在客户服务和客户关系管理(CRM)文章中,常常不会对服务台和工单系统发表任何正面评价,就像我现在对呼叫中心一样,没没什么好看法。...他们正在尝试通过整合社交网络功能、提供聊天系统,甚至提供基于 Skype 呼叫中心等各种手段,使客服能与用户实时交流,而不像老旧工单系统一样需要被动等待对方回应。

91180

技术债务在工作中意味着什么

需要在每个维护要求中预算额外时间就是你为偿还这笔债务而支付利息。就像金融债务一样,利息越高,偿还优先级就越高。 有工作要做。...每次我们创建新网站时,都需要使用版本控制有问题CMS。网站只是基于“基础框架”相互复制,因此每次创建新网站时,它都会包含其他网站所有错误,必须一遍又一遍地修复它们。...现在正在一个 4k 行脚本,它是由一位老 C 程序员编写猜是这样,因为脚本中使用所有 40 个变量都在文件顶部声明),想清理一下。...解决合并冲突祝你好运 持续内存泄漏无法发现,因此我们每 3 天重启一次服务。 需要从 Java 8 迁移到 Java 17。Spring 版本较旧。Swagger 较旧。使用另一个 DBMS。...审计将于 9 月到期,可以说,这感觉就像看着泰坦尼克号全速驶向冰山一样

3910

以太坊会是区块链终极形态吗?

回顾这段历史时候,我们很容易理解以太坊之所以能发展成最有价值区块链原因 —— 在其它项目还在一次解决一个问题时候,它就通过系统化方法一举解决了成千上万个问题。...常有人问:以太坊会是区块链终极形态吗?还是说未来会出现一个区块链,其之于以太坊就像以太坊之于比特币一样?下一个时代会是什么样子?...然而我不认为这些关于区块链抽象提案能让以太坊达到与 CKB 同等抽象层级,因为要对一个正在运行生态系统做如此底层改变是极其困难就像我们无法在不破坏宇宙情况下改变普朗克常数那样。...从用户角度来看,如果是一名比特币用户,想要将我比特币转移到以太坊上参与 DeFi 应用,必须先运行比特币钱包,发起一笔跨链交易,然后使用另外一个以太坊钱包。...相信这才是生活应该有的样子,就像一位互联网用户访问网站时才不会关心这个网站是用 PHP 还是 JAVA 编写,使用是 MySQL 还是 PostgreSQL。

58630

Kubernetes-卷概念

PersistentVolume 是由管理员设置存储,他是集群一部分。就像节点是集群中资源一样,PV也是集群中资源。 PV是Volume之类卷插件,但具有独立于适用PVPod生命周期。...Pod消耗节点资源,PVC消耗PV资源,Pod可以请求特定级别的CPU和内存 PVC可以请求特定大小和访问模式。...持久化卷声明保护 PVC保护目的是确保Pod正在使用PVC不会从系统中移除 当启用PVC保护alpha功能时候,如果用户删除了一个Pod正在使用PVC,则该PVC不会被立即删除 ,PVC删除将会被延迟...(例如AWS EBS) 当前只有NFS和HostPath支持回收策略 AWS EBS Azure Disk支持删除 状态 卷可以处于以下某种状态 Available:可用-一块空闲资源还没有被任何声明绑定...Bound:已绑定-卷已经声明绑定 Released:已释放-声明被删除,但是资源还未被集群重新声明 Failed:失败-该卷自动回收失败 PVC创建 安装NFS就不写了 # 先部署PV apiVersion

1.1K00

201910个最佳WordPress画廊插件

当今市场上有成千上万WordPress画廊插件,因此有时选择一个适合您插件可能会令人困惑,耗时且令人沮丧。 在这篇文章中,整理了一些流行杰出插件列表,以使您决定更加容易。...是否集成了社交网络,电子邮件营销平台和支付网关? 响应速度和移动友好性 —网站访问70%以上来自移动设备。 您图库插件可以在移动网站上使用吗?...正如我在简介中所述,当今市场上有成千上万WordPress画廊插件,选择适合您插件有时会造成混乱,耗时且令人沮丧。 在本文其余部分,将介绍CodeCanyon上可用一些最佳画廊插件。...它甚至可以将您图像组织成一个完美平衡水平照片网格 ,从左到右吸引您眼球,就像您阅读叙述一样。 您摄影故事自然流淌,并且图像作为一个完整整体元素一起工作。...用户haraldpalma说: 一个伟大而美丽产品—非常干净,运转良好画廊,提供绝对快速和称职支持! 谢谢你为一切! 8.

4.6K51

Java:并发不易,先学会用

诸葛大佬就有着超强“并发”能力啊。换做是,面对司马懿千万大军,不仅弹不了琴,弄不好还被吓得屁滚尿流。 每个人都只有一个脑子,就像电脑只有一个CPU一样。...如果就你一个用户也就算了,但假如有一百个用户呢?这一百个用户难道也要在那傻傻地等着,那真要等到花都谢了。 可想而知,并发编程是多么重要!...有一次陪家人在商场里面逛街,出电梯时候有一个傻叉非要抢着进电梯。...下面这段代码使用ThreadPoolExecutor创建了一个线程池,池里面的每个线程会对共享资源count进行+1操作。现在,闭上眼想一想,当1000个线程执行结束后,count值会是多少呢?...因为一个线程正在写这个变量时候,另外一个线程可能正在读这个变量,或者正在写这个变量。这个变量就变成了一个“不确定状态”数据。这个变量必须被保护起来。

37630

面试官问我:如何设计一个秒杀场景?

秒杀场景核心问题是如何解决海量请求带来性能问题,那么我们如何在有限资源下,尽最大限度去提高服务器访问性能?按照以往经验,大致总结有这几点:热点数据处理、流量削峰、资源隔离、服务器优化。...如上,消息队列就像我们平常见到水库一样,当洪水来临时,拦住并对其进行储蓄,以减少对下游冲击,避免了洪水灾害。...这种做法需要买家付款前,再做一次商品库是否还有保留,如果没有保留,则再次尝试预扣,预扣失败则不允许继续付款;如果有保留,付款完成后执行真正减扣库存动作。...面对这种情况,你可以将热点数据进行数据库隔离,把这些热点商品单独放在一个数据库中。 如何实现高可用性?...服务限流 限流目的是通过对并发访问/请求进行限速或者一个时间窗口内请求进行限速来保护系统,常用有 QPS 限流,用户请求排队限流,需要设置过期时间,一旦超过过期时间则丢弃,这样做是为了用户请求可以做到快速失败效果

1.3K30

如何设计出高可用、高性能接口

当我们设计接口,我们或多或少都会有上面列举一些考虑,我们只有更多才能让让我们接口更加完善,个人觉得100%完美的接口是不存在,只有适合才是最重要。...C:其他方面:nginx层面做缓存、加机器、用ssd,资源放cdn,多机房部署、资源文件预加载。 高可用:如何保证服务高可用,需要从几个维度来实现: A:消除单点,基于可用第二位。...高可用保证,基于第一位 下图是从一个基本请求出发来梳理需要涉及到各个段,以及各个端能做事情。谈谈接口服务,但不局限于接口本身。 客户端:资源预加载、限制请求、数据上报。...本地缓存能减少我们访问DB或者分布式缓存,本地缓存推荐使用guava,guava里面有很多特性很好用,例如基于令牌桶限流;当缓存失效时只穿透一个请求去访问后端。 线程池。 模块拆分。...在前司,数据库一般都是采用mysql+MongoDB两种,MySQL存储用户用户数据,MongoDB存储业务数据,就像阅读和生活服务里面的业务数据就存储在MongoDB里面。

2.2K41

为不擅长编程的人准备19个数据科学工具

敢肯定有无数个想要进入数据科学领域的人,编码却不是非常好。事实上,在参加第一份工作之前,也曾经是像你们一样非编程联盟成员。...所以,十分理解一个你从来没有了解过东西现在时时刻刻困扰你,这种感觉是多么可怕。 好消息是,发现了一个解决办法。而且,已经找到了可以点燃你食欲19种不需要做编码方式来学习数据科学。...(本文视频均为YouTube链接,请使用访问外国网站方法观看。)...它提供了一个很好GUI,需要用户通过以下6个步骤来进行: 资料来源:利用各种信息源 数据集:使用给定资源创建数据集 型号:制作预测模型 预测:基于模型生成预测 集合:创建各种型号集合 评价:对抗验证集典范...FeatureLab - 它支持使用GUI轻松建模和部署预测模型。 如果你是第一次听到这些名字,你会惊奇地发现有这么多工具存在(就像一样)。但好处是,现在他们没有造成混乱影响。

40020

架构详解

分层架构是逻辑上,在物理部署上,三层架构可以部署在同一个物理机器上,但是随着网站业务发展,必然需要对已经分层模块分离部署,即三层结构分别部署在不同服务器上,是网站拥有更多计算资源以应对越来越多用户访问...分布式意味着可以使用更多计算机完同样工作,计算机越多,CPU、内存、存储资源就越多,能过处理并发访问和数据量就越大,进而能够为更多用户提供服务。 在网站应用中,常用分布式方案有一下几种....安全 网站在安全架构方面有许多模式:通过密码和手机校验码进行身份认证;登录、交易需要对网络通信进行加密;为了防止机器人程序滥用资源,需要使用验证码进行识别;对常见XSS攻击、SQL注入需要编码转换;垃圾信息需要过滤等...而不能一次是1,下次又是2),从而平滑突发流入速率; 令牌桶允许一定程度突发,而漏桶主要目的是平滑流入速率; 两个算法实现可以一样,但是方向是相反,对于相同参数得到限流效果是一样。...测试服务是否可用:在断开状态下,熔断器可以采用定期ping远程服务或者资源,来判断是否服务是否恢复,而不是使用计时器来自动切换到半断开状态。

23210

前15个寻找PHP开发者最棒地方

PHP Classes 撇开糟糕用户界面,PHP Classes是一个很好网站找到招聘PHP开发人员。该网站一个PHP开发者大型社区,提供了丰富教育资源,并提供论坛和工作板。...所以,就像“Upwork和People Per Hour”一样,你必须自己缩小搜索范围。此外,与许多自由网络一样,审核和面试将由您决定。 12. ...寻找完美的PHP开发人员就像在大海捞针一样。 尽管网站开发是Freelancer最受欢迎工作类别之一,但您仍然需要搜索数以千计自由职业者个人资料,自行审核和面试候选人,并自行管理付款。...张贴一个30天工作职位只有99美元。 他们还提供订阅包,每个月可以提供10个职位。...该网站带有从薪金推荐到招聘指南大量资源,并提供低价格工作列表。和“真”和“怪物”一样,你会得到很多曝光。SimplyHired拥有超过十亿份工作申请,是值得深入研究备受推崇工作。

1.1K20

详细了解 Cookie、Session、Token以及oauth2、jwt

那就对数据做一个签名吧,比如说用 HMAC-SHA256 算法,加上一个只有才知道密钥,对数据做一个签名,把这个签名和数据一起作为 token,由于密钥别人不知道,就无法伪造 token 了。...当然,如果一个 token 被别人偷走了,那也没办法,也会认为小偷就是合法用户,这其实和一个 Session ID 被别人偷走是一样。...在使用 Ajax 抓取另一个资源,就可能会出现禁止请求情况。 跨站请求伪造(CSRF):用户访问银行网站时,很容易受到跨站请求伪造攻击,并且容易被利用访问其他网站。...NoSession 意味着程序可以根据需要去增减机器,而不用担心用户是否登录。...甚至能创建一个基于权限 token 传给第三方应用程序,这些第三方程序能够获取到我们数据(当然只有在我们允许特定 token)。

39140

10 个疯狂 Python 项目创意

那么,为什么不能将它们结合在一起,通过与计算机对话来创建一个用户界面呢? 这是一个全新概念,经过一番研究,发现还没有人尝试这样做。因此,它可能比下面提到那些更具挑战性。...你甚至可以获得类似 Leela Zero 这样程序 源码。 想表达一点是,人工智能正在变得比我们更聪明。这意味着它可以通过考虑所有的可能性并从过去经验中学习来更好地预测一些事情。...初学者交易策略 只有通过了这五步测试才能进行交易 读完这两篇文章后,你会对什么时候买股票,什么时候卖股票有一个更好理解。这些知识可以很容易地转换为 Python 程序,从而自动地为我们做出决策。...相反,我们可以简单地显示“购票”链接,就像它在我们应用程序中一样,以便进行手动操作。 6....认为,这是使用 Python 实现自动化一个绝佳场景。我们可以编写一些代码,在网站 SSL 证书到期之前自动续订。

67720
领券