专栏首页arxiv.org翻译专栏学习如何在基于LSM的键值存储中学习(CS DG)
原创

学习如何在基于LSM的键值存储中学习(CS DG)

在本文中,我们介绍了BOURBON,一种日志结构合并(LSM)树,它利用机器学习提供快速查找功能。我们在设计和实施BOURBON的基础上,对LSM设计进行了仔细分析并基于经验总结出了一些原则。BOURBON使用贪婪的分段线性回归来学习密钥分布,以最小的计算量实现快速查找,并应用成本效益策略来决定什么值得学习。我们对合成数据集和真实数据集进行了一系列实验,结果表明,与最先进的生产LSM相比,BOURBON的查找性能提高了1.23倍到1.78倍。

原文题目:Learning How To Learn Within An LSM-based Key-Value Store

原文:We introduce BOURBON, a log-structured merge (LSM) tree that utilizes machine learning to provide fast lookups. We base the design and implementation of BOURBON on empirically grounded principles that we derive through careful analysis of LSM design. BOURBON employs greedy piecewise linear regression to learn key distributions, enabling fast lookup with minimal computation, and applies a cost-benefit strategy to decide when learning will be worthwhile. Through a series of experiments on both synthetic and real-world datasets, we show that BOURBON improves lookup performance by 1.23x-1.78x as compared to state-of-the-art production LSMs.

原文作者:Yifan Dai, Yien Xu, Aishwarya Ganesan, Ramnatthan Alagappan, Brian Kroth, Andrea C. Arpaci-Dusseau, Remzi H. Arpaci-Dusseau

原文链接:https://arxiv.org/abs/2005.14213

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 测量误差对聚类算法的影响(CS LG)

    聚类由一组流行的技术组成,这些技术用于将数据分成兴趣小组以进行进一步分析。许多进行聚类的数据源都存在随机的或系统的测量误差,这些错误可能会对集群产生不利影响。虽...

    Elva
  • 论文的短期科学影响力排名(CS DL)

    科学论文的发表速度不断提高,使得研究人员很难识别出目前对他们感兴趣的研究领域有影响的论文,因此,能够有效识别出高影响力论文的方法从过去开始就引起了极大的关注。在...

    Elva
  • 光无线系统的适应性(CS NI)

    通信服务的高可靠性和高可用性是服务提供商必须保证的一项关键要求。在室内光无线通信系统中,由于直瞄(LOS)波束容易发生阻塞,因此在发生阻塞时需要有备用链路,所以...

    Elva
  • iOS XMPP系列教程(Swift)三 代码实战

    剑行者
  • shell定时执行

    删除test1.sh的任务 sed -i '/test1.sh/d' /var/spool/cron/root 删除文件中含有test1.sh的行

    用户1171305
  • Python3 基本数据类型

    Python 中的变量不需要声明。每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。

    py3study
  • 【AI-1000问】机器学习和模式识别是什么关系?

    当今要是说起人工智能,聊起AI,每个人或多或少都能说出一点,从历史到未来,从图灵到冯诺依曼,从SVM到CNN等等,但是如果问你是否知道机器学习和模式识别有什么区...

    用户1508658
  • jquery取消元素默认冒泡事件

    十月梦想
  • 去掉Xcode工程中的某种类型的警告

    在我们的项目中,通常使用了大量的第三方代码,这些代码可能很复杂,我们不敢改动他们,可是作者已经停止更新了,当sdk升级或者是编译器升级后,这些遗留的代码可能会出...

    freesan44
  • 基于TensorFlow的机器学习速成课程25讲视频全集(01-03讲)

    【导读】前些日子,大家都知道,Google 上线了基于 TensorFlow 的机器学习速成课程,它包含 40 多项练习、25 节课程以及 15 个小时的紧凑学...

    WZEARW

扫码关注云+社区

领取腾讯云代金券