首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

金融风控数据管理——海量金融数据离线监控方法

背景 在金融业务上,质量和稳定是生命线,我们需要对所有已经上线的风控要素,如策略、模型、标签、特征等构建监控。...非衍生指标即指标计算仅仅依赖于数据源表,而不依赖与历史的监控指标,例如PSI值、迁移率等,这些指标描述了监控要素分布的变化,其计算只依赖于源表的当前周期和对比周期数据,不需要对监控指标进行衍生,如PSI...衍生指标是指对监控指标进行二次运算后得到的监控指标,衍生指标的计算不依赖源表,只依赖监控指标及其历史记录。...监控指标衍生与检查(Checker)模块 监控指标衍生与检查(Checker)模块核心逻辑为: 读取未检查的监控指标; 按gen_procedures衍生逻辑中配置方法对监控指标衍生后,按check_strategies...-n周期的直方图分布h2; - 步骤三:由于“分割点”不一致,我们无法直接根据直方图计算PSI,因此对直方图进行分割,使得当前周期直方图和上一周期直方图的分割点一致,取h1、h2直方图分割点的并集作为新分割点

2.7K10

容器和微服务器如何改变安全性

当然,你的安全程序应该解决原生云应用程序的整个生命周期,这可以分为两个不同的阶段:构建和部署阶段以及运行时阶段。...这些阶段中的每一个阶段都有一组不同的安全因素,必须解决这些安全因素以形成一个全面的安全程序。...其次,声明式容器元数据和网络分段策略不能完全预测高度分布式环境中的所有合法应用程序活动。最后,运行时控件使用起来很复杂,经常会配置错误,使应用程序容易受到威胁。...安全小组需要对安全事件的根本原因进行鉴别分类、调查和确认,以便对其进行充分的补救。以下是成功运行时阶段的安全性的关键方面: · 为持续可见性测量整个环境。...选择可以处理容器的容积和速度的关键。 · 关联分布式威胁指标。把容器设计成按资源可用性分布在计算基础设施。

1.3K60
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    外卖排序系统特征生产框架

    离线生产流程是一个周期性的Pipeline,目前是以天为周期。 为此,我们设计了一套通用的框架,基于此框架,只需要简单的配置和少量代码开发,就可以新增一组特征。下文将详细介绍框架的各个部分。...另外,统计通常是在一定时间窗口内进行的,由于不同时期的数据价值不同(新数据比老数据更有价值),我们引入了时间衰减,对老数据降权。...计算维度。支持维度算子,可以对原始维度字段做处理,如对金额字段做分段处理,以分段后的金额作为维度。 按统计维度聚合(GROUP BY)。这是在对象聚合的基础上做的二次聚合。...统计量是对Map做一个聚合操作。每个统计量对应输出Hive表中的一个字段。...特征加载 通过前面几步,我们已经准备好特征数据,并存储于KV中。线上有诸多模型在运行,不同模型需要不同的特征数据。特征加载这一步主要解决怎么高效便捷地为模型提供相应的特征数据。

    1.8K40

    Kubernetes NameSpace 介绍

    一、什么是命名空间,为什么它很重要 命名空间(namespace)是Kubernetes提供的组织机制,用于给集群中的任何对象组进行分类、筛选和管理,每一个添加到Kubernetes集群的工作负载必须放在一个命名空间中...例如,如果使用命名空间来划分应用程序生命周期环境(如开发、staging、生产),则可以在每个环境中维护利用同样的名称维护相同对象的副本。...使用命名空间对生命周期环境进行分区: 命名空间非常适合在集群中划分开发、staging以及生产环境。通常情况下我们会被建议将生产工作负载部署到一个完全独立的集群中,来确保最大程度的隔离。...不过对于较小的团队和项目来说,命名空间会是一个可行的解决方案。 使用命名空间隔离不同的使用者: 根据使用者对工作负载进行分段。...比如,如果你的集群为多个客户提供基础设施,那么按命名空间进行分段就能够实现管理每个客户,同时跟踪账单的去向。

    38510

    猫头虎分享:AI时代SaaS项目程序员一定要懂的技术名词详解(下)

    这些活动的总成本除以在此期间获得的新客户数量,即为CAC。 MQL/SQL/商机 概念:潜在客户在销售漏斗中的不同阶段:MQL(营销合格潜在客户)、SQL(销售合格潜在客户)和商机。...留存率 定义:在特定时间段内,用户继续使用产品或服务的比例。 计算:留存率 = (特定时期末仍在使用的用户数 / 时期初的用户总数) * 100%。 指标:衡量用户对产品或服务的持续兴趣和满意度。...案例:智能猫头虎平台分析特定周期(如30天)内新用户的留存情况,以此评估新功能或服务改进对用户留存的影响,从而指导产品迭代和市场策略。...Microservices Architecture (微服务架构) 定义:一种将应用程序作为一组小型、独立服务开发的架构风格。 概念:每个服务运行在其独立的进程中,通常围绕特定业务功能构建。...案例:智能猫头虎平台采用多租户架构,使得不同企业客户能够在同一个平台上拥有独立的用户界面和数据存储,而无需为每个客户单独部署服务。

    16210

    Kafka最基础使用

    发送者和接收者间没有依赖性,发送者发送消息之后,不管有没有接收者在运行,都不会影响到发送者下次发送消息; 接收者在成功接收消息之后需向队列应答成功,以便消息队列删除当前接收的消息; 发布订阅模式 发布...对副本关系较大的就是,producer配置的acks参数了,acks参数表示当生产者生产消息的时候,写入到副本的要求严格程度。它决定了生产者如何在性能和可靠性之间做取舍。...去接着获取数据 在ZK中,不同的消费者组(group)同一个topic记录不同的offset,这样不同程序读取同一个topic,不会受offset的影响 缺点 不能控制offset,例如:想从指定的位置读取...这个周期可以通过broker端参数log.retention.check.interval.ms来配置,默认值为300,000,即5分钟。 日志分段的保留策略有3种 基于时间的保留策略。...删除日志分段时: 从日志文件对象中所维护日志分段的跳跃表中移除待删除的日志分段,以保证没有线程对这些日志分段进行读取操作 将日志分段文件添加上“.deleted”的后缀(也包括日志分段对应的索引文件)

    32250

    袋鼠云产品功能更新报告03期丨产品体验全面优化,请查收!

    新增功能说明:对周期和补数据实例将按实例所涉及流程进行诊断,提示异常原因,给出建议方案。另外针对 SparkSQL 任务还支持根据参数展示给出提升运行性能的调参建议。...任务诊断功能的目的是帮助数据开发进行任务异常原因排查,以便快速采取应对策略解决问题,减少问题持续时间以及技术支持和产研的排查投入。2....周期实例中按条件杀实例入口调整按条件杀实例中可以根据任务条件进行批量选中任务。27.Spark SQL 语法校验从平台下移到插件Spark SQL 语法校验从平台下移到插件,且新增语法检查按钮。...实时采集支持自定义 SQL间隔轮询模式下的实时采集任务,支持用户自定义 SQL 对采集源表进行过滤、关联、计算等计算,然后再写入结果表。...角色权限点可自由勾选用户痛点:每个角色的权限固定,无法满足不同客户对不同角色权限的需求,支持用户自由配置角色的权限才能满足复杂的权限场景。新增功能说明:支持自由配置普通角色的系统权限。4.

    53700

    质量运营在美团点评智能支付业务测试中的初步实践

    对于“质量时代”下的互联网企业,如何在快速迭代的节奏中兼顾质量,真正落地“人人重视质量、人人创造质量、人人享受质量”,这是对QA的要求,也是整个产品技术团队面临的重要挑战。...但要注意,部分指标的计算需要对Metrics提供的数据进行二次处理,以保证数据的精准性。如:在计算千行代码缺陷率时,需要排除掉开发自测缺陷等。...多维度的数据聚合与分析相结合 周维度数据聚合:对周数据中的异常进行分析,并排除掉因周期偏短导致的数据噪点,重在对问题进行风险预警。...月维度数据聚合:对月数据中的异常进行分析,并结合数据的变化趋势,重在对问题进行确认和改进。周维度和月维度相结合,构成了质量管理中的问题发现与改进周期。...季度维度数据聚合:对季度数据的分析,重在得出对质量目标的完成度并给出质量评分,并对过程中的问题进行回顾和总结,构成了质量管理中的考核周期。 ?

    1.6K70

    Kubernetes架构原来这么简单

    每个 VM 是一台完整的计算机,在虚拟化硬件之上运行所有组件,包括其自己的操作系统。 容器部署时代:容器类似于 VM,但是更宽松的隔离特性,使容器之间可以共享操作系统(OS)。...自动完成资源计算:Kubernetes 提供许多节点组成的集群,在这个集群上运行容器化的任务。你告诉 Kubernetes 每个容器需要多少 CPU 和内存 (RAM)。...Node 组件 Kubelet 真正运行容器的组件,管理pod的声明周期,每个 Node 上都会启动一个 kubelet 服务进程。...,那么就要过滤掉资源不够的主机 5、主机打分:对第一步筛选出的符合要求的主机进行打分,在此阶段,调度器会考虑一些整体优化策略,比如把一个Replication Controller的副本分布到不同的主机上...POD创建完成 Namespace Namespace(命名空间)是对一组资源和对象的抽象集合,比如可以用来将系统内部的对象划分为不同的项目组或用户组。

    1.3K41

    存储器体系结构学习笔记

    当每次访问(无论读写)这个块时,都需要根据LRU算法对LRU位进行设置;当写一个块时,就将脏位拉高,因为只要块被写入,就认为其与低级缓存不同。...由此计算存储器平均访问时间: ? 若要计算每条指令的平均停顿时间,首先要计算缺失数: ? 随后根据缺失代价和缺失数计算每条指令的平均停顿时间: ?...但使用虚拟地址会产生一系列问题: 保护问题:虚拟地址转为物理地址时需要检查页级保护,解决方法为在缺失时从主存中复制保护信息保存到缓存中,每次访问都进行检查 切换进程:每个进程都有自己的虚拟地址空间,可能出现两个进程的相同虚拟地址对应不同的物理地址...别名地址:对于一个进程,可能给一个物理地址赋予多个不同的虚拟地址,因此可能出现一个物理块在缓存中有多个副本,若对一个副本进行写入,则会出现多个块不一致的问题。...首先每个进程具有其独有的分页表,使其仅能获取属于自己的页对应的物理地址,其次还有以下方式对内存进行保护: 界限检查:在分页表或分段表中标明偏移量的上界,即提供的偏移量不可超过这个固定的值,阻止其访问超过上界的地址空间

    2K20

    关于Oracle Sharding,你想知道的都在这里

    Oracle分片使用水平分区在分片之间分布数据,通过分片分割数据库表,以便每个分片包含具有相同列但行的不同子集的表。 从数据库管理员的角度来看,SDB由可以集中或单独管理的多个数据库组成。...每个分片可以运行不同版本的Oracle数据库,只要应用程序与最早运行的版本向后兼容即可 - 从而在执行数据库维护时轻松维护应用程序的可用性。...Oracle Sharding使用水平分区来跨分片(离散物理数据库)分割数据库表,以便每个分片包含具有相同列但行的不同子集的表。 跨分片的分区的分布在表空间级别完成。...这两个级别的分片使得可以将数据映射到一组分片,然后自动保持该组分片上的数据的平衡分布。 3、如何在单个分片上包含多个事务?...块是一组表空间,用于存储表系列中所有表的相应分区。块包含来自表系列的每个表的单个分区。这保证来自不同分片表的相关数据一起移动。在创建SDB时指定每个分片中的块数。图1显示了一个具有3个块的碎片。

    1.9K80

    MySQL 8 复制(十)——组复制性能与限制

    Paxos的组复制实现包括许多优化,如并行处理多条消息,并将多个消息打包成一个消息,以便在可能的时候发送到每个节点。从用户角度来看到的结果是: 在现有网络带宽下,发送者将尽可能多的事务发送到其它节点。...(2)认证 从组通信层接收到的事务消息会被放入一个队列进行认证。在每个节点中运行的算法判断认证结果以决定如何处理事务。...对于每个组件,组复制提供了若干选项,适当配置这些选项可以从底层计算资源中获取最佳性能。后面小节中将详细介绍这些选项。...成员落后于组会带来一些问题,例如:对这些成员的读取可能会使旧数据外化到应用程序;组中其它成员可能必须保存更多复制上下文,以便能够满足来自慢成员的数据传输请求等等。...监控数据每秒与组中其它成员共享一次。一旦成员收到其它成员的统计信息,它将计算在上一个监控周期内认证、应用和本地执行的事务数量。

    2.2K40

    linux线程调度策略

    每个线程都包含一个调度策略以及一个静态的调度优先级sched_priority,调度器根据系统上所有线程的调度策略和静态优先级来决定如何进行调度。...线程的调度策略决定了如何根据静态优先级来将一个线程插入到同静态优先级的线程列表(list of runnable threads)中,以及如何在该列表中调整线程的位置。...在当前的实现下,两个进程的nice差值中,每单位的nice差值对CFS调度的影响因子为1.25 (参见how-is-nice-working,CFS根据虚拟时间进行CPU调度:vruntime = 实际运行时间...任务组间有继承关系,会继承系统上被称为"root任务组"的初始化任务组。任务组遵循以下条件(按顺序): CPU cgroup中的所有线程为一个任务组。...相反的,对于不同会话(如,不同的终端窗口,这些任务都绑定到不同的autogroups)中绑定了唯一的CPU的2个进程,修改一个会话中的进程的nice值不会影响其他会话中的进程的调度。

    4.8K30

    论文研读-多目标自适应memetic算法

    此外,除了合并一些现有的优化器或运算符之外,还有对种群采取随机扰动策略的MA[11],不同阶段周期性进行探索的MA[12]和通过不同进化策略并行优化的MA[13]。...在[4]中,MA被定义为在生成周期内具有局部搜索的进化算法,而模因计算方法则包括使用混合算子对解进行扰动。...但是,应该引入一种控制机制来逐步监测搜索,以便管理信息共享的平衡。 如何在多个优化器中挑选最合适的优化器--选择能在生成大量不同后代的优化器。EDA使用适应度景观的解的概率分布所以只使用全局的信息。...,每个优化算子的概率会根据算法2进行计算,原理是生成更多优势解的算子会被赋予更大的概率。...在archiving state,对2N的种群进行非支配排序和拥挤距离计算。 在elitism state,挑选出N个优秀的解 随后,种群中K%的解被挑选出来成为一个子集并且使用EGS算法。

    2.1K30

    客户生命周期分析的6个关键点

    在与各种业务团队合作之后,许多人都在寻求加强对如何在客户旅程的关键点上更好地锁定受众的理解。例如,营销团队需要决定如何调整信息传递和优化定位策略。...需要与有能力的数据工程师合作,TA们既能理解业务需求,又能准确地设计以及应用基于设计的明确定义的业务逻辑,以计算客户生命周期的成功指标,用于进行定期报告和分析。...客户流失的主要原因是什么?如果制造商要为客户提供更多个性化体验,则TA们还需要了解客户在其生命周期每个关键阶段的行为因不同的角色细分而有所不同,以便能够确定与这些客户互动的机会。...TA们还需要了解在客户生命周期的不同阶段,哪些营销渠道、营销活动、内容产品和设备类型能够带来更多的流量,以便能够通过更复杂、针对性更强且数据驱动的策略来推动改进和提高效率。...在客户生命周期的关键阶段,系统地跟踪和监控核心指标和成功指标,以便业务团队能够在恰当的时间与适当的客户进行有针对性的信息交流。这将使团队能够做出适当的调整以改善客户体验,并从产品和服务中获取核心价值。

    1.7K349

    storm如何分配任务和负载均衡?

    ,由worker启动,是运行task的物理容器,其和task是1 -> N关系. 3. component是对spout/bolt/acker的抽象. 4. task也是对spout/bolt/acker...并行度的计算 相关配置及参数的意义 具体有多少个worker,多少个executor,每个executor负责多少个task,是由配置和指定的parallelism-hint共同决定的,但指定的并行度并不一定等于实际运行中的数目...来说,其并行度计算如下: (1) 如果指定了TOPOLOGY-ACKER-EXECUTORS,按这个值计算. (2) 如果未指定,那么按TOPOLOGY-WORKERS的值来设置并行度,这种情况下,一个...6、如果配置了NIMBUS-EXECUTORS-PER-TOPOLOGY,如第5点,会验证topology所需的executor总数,如果超出,也会抛出异常。...并行度计算在任务分配中的体现 先回顾下任务分配中的几个主要角色: 接着看几段重要的并行度计算代码: 1、计算所有topology的topology-id到executors的映射关系: ;;;;;;;

    1.7K60

    组复制性能 | 全方位认识 MySQL 8.0 Group Replication

    本节介绍如何使用可用的系统变量对组复制进行性能优化,以便获得最佳性能。 6.1. 微调组通信线程 当加载并启动MGR插件时,组通信线程(GCT)就会不断循环运行。...快速适应组中不断变化的环境。如,适应不同的工作负载或更多写操作。 让组中的每个成员能够提供的写服务能力得到一个平衡。 在非严格必要的情况下,不降低吞吐量,以避免浪费资源。...流量控制依赖于两个基本机制: 对组成员进行监控,并收集所有组成员的吞吐量和队列大小的一些统计信息,从而对每个组成员能够承受的最大写压力进行有根据的猜测(评估); 对组中的所有成员的并发写能力时刻保持监控...认证队列大小 复制应用队列大小 认证完成的事务总数 组成员中应用的远程事务的总数 本地事务的总数 一旦一个成员收到来自另一个成员的带有统计信息的消息,它就会计算关于在最后一个监控探测期间,认证、应用和本地执行的事务数量等相关的度量指标...监控数据定期与组内其他成员共享。监控周期(频率)必须足够高,以便其他成员能够根据这些监控信息来确定当前的写请求量,但也必须足够低,以便对组带宽的影响最小。

    1.2K31

    如何设计一个海量任务调度系统

    应用层采用多级调度思路,按数据分片将大任务拆分成小粒度任务动态根据计算节点数完成分配,实现通过增加计算节点快速提升任务触发能力; 高可用:MTTR 分段治理思路,架构层在设计阶段考虑到单点、单机房风险,...init 状态的调度流水、并根据任务类型、任务周期计算下一次调度时间,将 insert flow 和 update task 两个操作合并到一个事务中更新到 DB,通过事务保证每次任务肯定能被调度到;...根据当前可调度的机器数(n)将 512 个 job 打包成 n 个 jobGroup 将每个 jobGroup 绑定到一个机器上,通过指定 ip 方式通知服务执行阶段二(阶段二的详细实现见下节) 如领域模型中描述...tjobs 跑批任务采用 CyclicBarrier 栅格模式运行,这样做的目的 1)、期望每个周期各个 job 都能完成所有待触发任务(即 T1 周期完成 T1 时间之前所有的任务)防止任务积压;2...)、每个任务都以相同的执行周期和参数运行可以幂等,防止任务被重复调度,从平台侧尽力提供 only once 的触发保障。

    1.6K30

    【地铁上的面试题】--基础部分--操作系统--内存管理

    内存管理是指操作系统或编程语言运行时环境对计算机系统中的内存资源进行分配、使用和回收的过程。其主要目标是有效地管理内存资源,以提供给程序足够的内存空间来存储和执行程序所需的数据和指令。...计算机系统中的内存层次结构包括多级缓存、主存和辅助存储器(如硬盘)。不同层级的内存具有不同的访问速度、容量和成本。...分段机制和地址映射是分段式虚拟内存管理的核心概念。 分段机制:在分段式虚拟内存管理中,进程的地址空间被划分为多个段,每个段代表着不同的逻辑单位,如代码段、数据段、堆段、栈段等。...通过为每个段设置访问权限,可以对进程或线程对不同段的访问进行精细的控制。 页表项:在分页式内存管理中,通过页表项来记录每个页的访问权限。...通过为每个段设置访问权限,可以对进程或线程对不同段的访问进行精细的控制。 页表项:在分页式内存管理中,通过页表项来记录每个页的访问权限。

    36531

    004.Windows Server 故障转移群集 (WSFC)简介

    客户端可以使用网络名称访问组中的资源,类似于使用计算机名称访问物理服务器上的服务。但是,因为故障转移群集实例是一个组,所以该实例可以故障转移到另一个节点,而不会影响基础名称或地址。...首选所有者 (Preferred owner) 资源组优先运行的节点。每个资源组都按优先顺序与首选的所有者列表关联。在自动故障转移过程中,资源组将移动到首选所有者列表中的下一个首选节点。...每个副本均由 WSFC 群集的不同节点上的 SQL Server 实例承载。可用性组和相应的虚拟网络名称注册为 WSFC 群集中的资源。...3.4 WSFC 节点间运行状况检测和仲裁投票 WSFC 群集中的每个节点都参与周期性信号通信,以便与其他节点共享该节点的运行状况。未响应的节点被认为是处于故障状态。...两个或更多活动的节点或见证服务器构成一个仲裁,以便对 WSFC 群集的运行状况进行投票。 AlwaysOn 可用性组注册表项是 WSFC 群集的子项。

    2.2K30
    领券