专栏首页arxiv.org翻译专栏高效回答耐久性预测查询(CS DB)

高效回答耐久性预测查询(CS DB)

我们考虑一类在预测分析中通常出现的称为持久性预测查询的查询,其中我们使用给定的预测模型来回答关于可能的未来的问题,从而为我们的决策提供信息。耐久性预测查询的例子包括:“这种金融产品在未来12个季度继续亏损的可能性有多大?”“我们提议的服务器集群有什么机会在服务级协议到期之前失败?”我们设计了一种名为多级分裂抽样(MLSS)的通用方法,只要模型允许我们一步一步地模拟可能的未来,就可以有效地处理复杂查询和复杂模型--包括涉及黑匣子函数的查询和复杂模型。我们的方法解决了标准蒙特卡罗(MC)方法的低效问题,利用重要性分裂的思想,让一个“有前途”的样本路径前缀生成多条“后代”路径,从而将仿真工作引向更有前途的路径。我们提出了设计分裂策略的实用技术,使用户免于手动调优。实验表明,我们的方法能够实现与标准MC一样的无偏估计和同样的误差保证,同时提供了数量级的成本降低。

原文题目:Efficiently Answering Durability Prediction Queries

原文:We consider a class of queries called durability prediction queries that arise commonly in predictive analytics, where we use a given predictive model to answer questions about possible futures to inform our decisions. Examples of durability prediction queries include "what is the probability that this financial product will keep losing money over the next 12 quarters before turning in any profit?" and "what is the chance for our proposed server cluster to fail the required service-level agreement before its term ends?" We devise a general method called Multi-Level Splitting Sampling (MLSS) that can efficiently handle complex queries and complex models -- including those involving black-box functions -- as long as the models allow us to simulate possible futures step by step. Our method addresses the inefficiency of standard Monte Carlo (MC) methods by applying the idea of importance splitting to let one "promising" sample path prefix generate multiple "offspring" paths, thereby directing simulation efforts toward more promising paths. We propose practical techniques for designing splitting strategies, freeing users from manual tuning. Experiments show that our approach is able to achieve unbiased estimates and the same error guarantees as standard MC while offering an order-of-magnitude cost reduction.

原文链接:https://arxiv.org/abs/2103.12887

原文作者:Junyang Gao, Yifan Xu, Pankaj K. Agarwal, Jun Yang

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Redis应用及安装

    Redis听到最多的一句话就是Redis的使用难吗?不难,Redis用好容易吗?不容易,有时候觉得这句话说的挺好,但又是让读者挺心里咯噔一下的,还不如不说! 概...

    牛嗷嗷
  • 软件测试——面试指南,磨刀不误砍柴工,看完对你绝对有用!

    面试官你好,我叫***,从事测试工作有3年。以前工作中做过Web端的测试,以及手机APP的测试。熟悉测试的流程、方法、以及常用工具等。在项目中除了功能测试也涉及...

    艳艳代码杂货店
  • Datawhale 知识图谱组队学习 Task 2 基于医疗知识图谱的问答系统操作介绍

    该项目是GITHUB上的一个开源项目QASystemOnMedicalGraph。是基于医疗领域知识图谱的问答系统。具体内容为从无到有搭建一个医疗领域知识图谱(...

    听城
  • Go 语言操作 MySQL 之 预处理

    预处理是 MySQL 为了防止客户端频繁请求的一种技术,是对相同处理语句进行预先加载在 MySQL 中,将操作变量数据用占位符来代替,减少对 MySQL 的频繁...

    Meng小羽
  • 缓存穿透、缓存并发、缓存失效之思路变迁

    来源:https://www.jianshu.com/p/d96906140199

    芋道源码
  • 缓存穿透、缓存并发、缓存失效之思路变迁

    我们在项目中使用缓存通常都是先检查缓存中是否存在,如果存在直接返回缓存内容,如果不存在就直接查询数据库然后再缓存查询结果返回。这个时候如果我们查询的某一个数据在...

    Java_老男孩
  • 缓存穿透、缓存并发、缓存失效之思路变迁

    我们在用缓存的时候,不管是Redis或者Memcached,基本上会通用遇到以下三个问题:

    小程故事多
  • VLDB 2021 EA&B最佳论文:IEEE数据工程新星奖王健楠带队,深度解析机器学习的基数估计为何无法实现

    近年来随着机器学习以及深度学习方面技术的进步以及在其它领域内被成功应用的先例,ML for DB这个课题变得越来越火,但是大多数方法尚局限于学术圈的探索阶段。

    新智元
  • 2021年最新大厂php+go面试题集(1)

    首先面试都是从小公司到大公司的过程,小公司主要为了练手,熟悉面试节奏,后面才去面大公司。尽量不要一开始就奔着大公司去,容易出现准备不足的情况。。。另外,算法是真...

    码农编程进阶笔记
  • 【DB笔试面试530】在Oracle中,有哪些重要后台进程?

    对于后台进程,首先需要掌握3个概念:后台进程、服务器进程和用户进程,它们之间的关系如下图:

    小麦苗DBA宝典
  • 奖学金评分系统(系统分析与设计版与Delphi实现代码)

    在奖学金评比过程中,学生综合测评是学校普遍采用的评比手段。对学生实施综合素质测评的目的在于正确评价学生的综合素质,为评奖学金提供依据,实现学生教育管理工作的标准...

    用户1621453
  • 数据库课程设计指南(BS or CS 及所需知识储备)

    •B/S架构的全称为Browser/Server,即浏览器/服务器结构。Browser指的是Web浏览器,无须特别安装

    种花家的奋斗兔
  • 架构师眼中的高并发架构

    高并发经常会发生在有大活跃用户量和用户高聚集的业务场景中,如:秒杀活动、定时领取红包等。

    数据和云
  • 测试工程师进阶面试题目大合集

    很多软件测试工程师在面试的时候都会遇到考官给的各种各样的面试题,这也反应了测试工程师对企业的重要性,面试通常分为以下几个方面,由于篇幅有限,在这里就只给大家分享...

    优测utest
  • 使用缓存必须注意的事项

    关系型数据库在TPS上的瓶颈往往会比其他瓶颈更容易暴露出来,尤其对于大型web系统,由于每天大量的并发访问,对数据库的读写性能要求非常高;而传统的关系型数据库的...

    用户7676729
  • 非对称泄露下的私人信息检索(CS IT)

    在各种情况下,对私人信息检索 (PIR) 问题的信息理论公式进行了研究。对称私有信息检索 (SPIR) 是一种变体,在这种变体中,用户能够从 非共存的复制...

    刘持诚
  • 轻松搞定RocketMQ入门

    (1)NameServer是一个几乎无状态的节点,可集群部署,节点之间无任何信息同步

    烂猪皮
  • 【STM32H7教程】第73章 STM32H7的SPI总线应用之驱动W25QXX(支持查询,中断和DMA)

    本章节为大家讲解标准SPI接线方式驱动W25QXX,实现了查询,中断和DMA三种方式。

    armfly
  • 架构师眼中的高并发架构

    责编:乐乐 | 链接:my.oschina.net/u/3772106/blog/1793561

    用户1516716

扫码关注云+社区

领取腾讯云代金券