专栏首页arxiv.org翻译专栏从非单调数据学习MR-Sort模型

从非单调数据学习MR-Sort模型

多数规则排序(MR-Sort)方法将根据多个标准评估的备选项分配给预定义的有序类别之一。逆MR-Sort问题(invo -MR-Sort)计算匹配数据集的MR-Sort参数。现有的invr - mr - sort学习算法在标准上考虑了单调偏好。我们将这个问题扩展到对标准的偏好不一定是单调的,但可能是单峰(或单谷)的情况下。我们提出了一种基于混合整数规划的算法,从训练数据中学习对标准的偏好和其他MR-Sort参数。我们使用数值实验研究算法的性能,并在实际案例研究中说明它的使用。

原文标题:Learning MR-Sort Models from Non-Monotone Data

The Majority Rule Sorting (MR-Sort) method assigns alternatives evaluated on multiple criteria to one of the predefined ordered categories. The Inverse MR-Sort problem (Inv-MR-Sort) computes MR-Sort parameters that match a dataset. Existing learning algorithms for Inv-MR-Sort consider monotone preferences on criteria. We extend this problem to the case where the preferences on criteria are not necessarily monotone, but possibly single-peaked (or single-valley). We propose a mixed-integer programming based algorithm that learns the preferences on criteria together with the other MR-Sort parameters from the training data. We investigate the performance of the algorithm using numerical experiments and we illustrate its use on a real-world case study.

原文链接:https://arxiv.org/pdf/2107.09668.pdf

原文作者:Pegdwende Minoungou,Vincent Mousseau, Wassila Ouerdane, Paolo Scotton

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Hadoop核心学习之MapReduce编程入门

    在IT技术领域,大数据是热点,大数据技术也是热点,以Hadoop为例,作为主流的第一代大数据技术框架,可以说是入门必学。而学习Hadoop,通常从核心框架HDF...

    成都加米谷大数据
  • EMR入门学习之MR、Tez、Spark之间的关系(六)

    Hadoop MapReduce是一个软件框架,基于该框架能够容易地编写应用程序,这些应用程序能够运行在由上千个商用机器组成的大集群上,并以一种可靠的,具有容错...

    披荆斩棘
  • 腾讯大数据之计算新贵Spark

    前言 Spark作为Apache顶级的开源项目,项目主页见http://spark.apache.org。在迭代计算,交互式查询计算以及批量流计算方面都...

    腾讯大数据
  • Spark一出,Hadoop必死?Spark才是大数据的未来?

    最近公司邀请来王家林老师来做培训,其浮夸的授课方式略接受不了。其强烈推崇Spark技术,宣称Spark是大数据的未来,同时宣布了Hadoop的死刑。 那么与Ha...

    CSDN技术头条
  • 每周学点大数据 | No.74 Spark 的核心操作——Transformation 和 Action

    编者按:灯塔大数据将每周持续推出《从零开始学大数据算法》的连载,本书为哈尔滨工业大学著名教授王宏志老师的扛鼎力作,以对话的形式深入浅出的从何为大数据说到大数据算...

    灯塔大数据
  • Hadoop离线数据分析平台实战——380MapReduce程序优化Hadoop离线数据分析平台实战——380MapReduce程序优化

    Hadoop离线数据分析平台实战——380MapReduce程序优化 项目进度 模块名称 完成情况 用户基本信息分析(MR)� 完成 浏览器信...

    Albert陈凯
  • 每周学点大数据 | No.33最大独立集

    No.33期 最大独立集 Mr. 王:好,现在我们来谈谈最大独立集的问题。首先求解最大独立集是一个NP-hard问题,接下来要介绍的这个求解方法是一个近...

    灯塔大数据
  • Hadoop及其生态系统的基本介绍【转载】

    用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    foochane
  • Hive面试题

    刘浩的BigDataPath
  • 人工智能学术速递[7.22]

    【1】 Neural Fixed-Point Acceleration for Convex Optimization 标题:凸优化的神经不动点加速算法

    公众号-arXiv每日学术速递
  • 医学图像跨域合成

    这篇文章主要介绍一些基于深度学习的医学图像合成的论文,医学图像跨域合成一般是指从一种模态转化为另一种模态,包括CT到PET,MR到CT,CT到MR及MRI中T1...

    Natalia_ljq
  • mapreduce项目调优

    一、调优的目的 充分的利用机器的性能,更快的完成mr程序的计算任务。甚至是在有限的机器条件下,能够支持运行足够多的mr程序。 二、调优的总体概述 从mr程...

    Albert陈凯
  • 大数据高速计算引擎Spark

    从狭义的角度上看:Hadoop是一个分布式框架,由存储、资源调度、计算三部分组 成; Spark是一个分布式计算引擎,由 Scala 语言编写的计算框架,基于内...

    用户2337871
  • 大数据框架发展史

    这几年大数据的飞速发展,出现了很多热门的开源社区,其中著名的有 Hadoop、Storm,以及后来的 Spark,他们都有着各自专注的应用场景...

    大数据老哥
  • 每周学点大数据 | No.1何谓大数据

    No.1期 带你认识大数据 咚咚咚。 一天下午,王老师的门被敲响了。 Mr. 王:请进。 门被轻轻地推开了,随后被有礼貌地关上了。 Mr. 王:你就是小可吧?...

    灯塔大数据
  • R语言使用特征工程泰坦尼克号数据分析应用案例

    特征工程对于模型的执行非常重要,即使是具有强大功能的简单模型也可以胜过复杂的算法。实际上,特征工程被认为是决定预测模型成功或失败的最重要因素。特征工程真正归结为...

    拓端
  • 万字全面总结 | HiveSQL优化方法

    Hive作为大数据领域常用的数据仓库组件,在平时设计和查询时要特别注意效率。影响Hive效率的几乎从不是数据量过大,而是数据倾斜、数据冗余、job或I/O过多、...

    大数据老哥
  • AD分类论文研读(1)

    原文链接 摘要 将cv用于研究需要大量的训练图片,同时需要对深层网络的体系结构进行仔细优化。该研究尝试用转移学习来解决这些问题,使用从大基准数据集组成的自然...

    范中豪
  • 硬刚Hive | 4万字基础调优面试小总结

    Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理,提供了类似于SQL语言的查询语言–HiveQL,...

    王知无-import_bigdata

扫码关注云+社区

领取腾讯云代金券