AI 科技评论按:经过 7 月 10 日的三个 Tutorial Session 和 Opening Reception 晚宴之后,在瑞典斯德哥尔摩举办的机器学习顶会 ICML 2018 正式进入第一天的正会。
而复旦大学副教授黄增峰一人署名的论文《Near Optimal Frequent Directions for Sketching Dense and Sparse Matrices》则和 DeepMind、斯坦福大学的两篇论文一同位居「亚军」论文行列。
随着人工智能系统和应用程序在我们日常生活中的广泛应用,人工智能已经成为了辅助人们决策的重要工具,例如,使用推荐系统算法做出电影推荐、购买产品推荐等,使用预测和分析系统用于贷款申请、约会和雇佣等高风险决策。美国法院使用了一款人工智能软件—「选择性制裁罪犯管理档案」(Correctional Offender Management Profiling for Alternative Sanctions,COMPAS),用于预测一个人再次犯罪的风险,辅助法官决定是释放罪犯,还是把罪犯关进监狱。对该软件的一项调查发现了对非洲裔美国人的一种偏见:相较于白人罪犯,COMPAS 更有可能给非洲裔美国人罪犯打出较高的潜在风险分数,从而不予以释放 [1]。
最高学府清华大学2016~2021六年级优秀毕业生统计,从省份维度,来解读优秀人才从哪里来。
第一篇缩略版本:公正反而会伤害弱势群体么?有一定情况下是的:对弱势群体降低门槛会致使他们无法完成期预期目标,使他们信用度降低,造成更长久的伤害。我们不仅要考虑算法本身是否符合人对道德的定义,更要考虑算法对社会的实际影响。
选自arXiv 机器之心编译 参与:Pedro、刘晓坤 4月11日,NAACL 2018公布了四篇杰出论文,分别关注于词表征、语句映射、文本生成和RNN。机器之心对最后一篇论文进行了编译介绍,该论文探
到目前为止,我们已经非常熟悉选择模型和相应损失函数的过程,并通过选择最小化损失函数的
2020 年的 ICLR 会议原计划于4 月 26 日至 4 月 30 日在埃塞俄比亚首都亚的斯亚贝巴举行,这本是首次在非洲举办的顶级人工智能国际会议,但受到疫情影响,ICLR 2020 被迫取消线下会议改为线上虚拟会议。今年的 ICLR 论文接受情况如下:共计接收 679 片文章,其中:poster-paper 共 523 篇、Spotlight-paper(焦点论文)共 107 篇、演讲 Talk 共 48 篇,另有被拒论文(reject-paper)共计 1907 篇,接受率为 26.48%。
实践证明,基于梯度的元学习在学习模型初始化、表示形式和更新规则方面非常有效,该模型允许从少量样本中进行快速适应。这些方法背后的核心思想是使用快速适应和泛化(两个二阶指标)作为元训练数据集上的训练信号。但是,其他可能的二阶指标很少被关注。在本文中,研究者提出了一种不同的训练信号——对灾难性干扰的鲁棒性。与仅通过快速适应性最大化学习的表示相比,通过引导干扰最小化学习的表示更有利于增量学习。
正如您现在听说的那样,生成对抗网络是一种能够从生成器和鉴别器之间的竞争中学习分布的框架。生成器学习生成希望与真实数据无法区分的样本,而鉴别器学习分类给定图像是真实的还是虚假的。自 GAN 发明以来,它们经历了各种改进,被认为是用于各种问题的强大工具,尤其是在生成和重建任务中。
联邦学习无疑是近期 AI 界最火爆的技术范式之一,在过去的2019年,涌现了大量联邦学习相关研究。
IBM研究院的AI基金会负责人,AI Science for Social Good计划的联合主席Aleksandra Mojsilovic今天表示,创建,测试,训练,部署和评估AI服务没有一致的,广泛认可的方式。同样不清楚这些系统应该如何运作,以及它们应该(或不应该)怎样使用。
数据资产已经成为产品和服务设计的关键工具,但是集中采集用户数据会使个人隐私面临风险,进而使组织面临法律风险。从2016年开始,人们开始探索如何在用户隐私保护下使用数据的所有权和来源,这使得联邦学习和联邦分析成为关注的热点。随着研究范围的不断扩大,联邦学习已经开始应用到物联网等更广泛的领域。
导读:今天分享一下阿里优酷视频在KDD 2020上的一篇关于新热视频保量分发上的实践,建立了新热内容曝光敏感模型并给出了一种多目标优化保量的算法,推荐工业界实战干货论文,值得细读。
一.问题描述:VRPOPB问题 (Vehicle Routing Problem with Outsourcing and Profit Balancing) 从前有一位商人,他要把货物送到他的顾客手中,那么他现在就必须做好运输的规划,让自己的运输成本最小。这就是我们熟知的VRP(Vehicle Routing Problem,车辆路径)问题。 但是,作为一个小小的商人,怎么可能自己拥有那么大一支车队呢? 就算能买下一支车队,保养车辆,发放司机的工资,这不是白白地给企业增加风险吗? 在这时,一种新的业态就产
Negative Sampling 模型的CBOW和Skip-gram的原理。它相对于Hierarchical softmax 模型来说,不再采用huffman树,这样可以大幅提高性能。 一、Negative Sampling 在负采样中,对于给定的词w,如何生成它的负采样集合NEG(w)呢?已知一个词w,它的上下文是context(w),那么词w就是一个正例,其他词就是一个负例。但是负例样本太多了,我们怎么去选取呢?在语料库C中,各个词出现的频率是不一样的,我们采样的时候要求高频词选中的概率较大,而低频词选中的概率较小。这就是一个带权采样的问题。设词典D中的每一个词w对应线段的一个长度: 任何采样算法都应该保证频次越高的样本越容易被采样出来。基本的思路是对于长度为1的线段,根据词语的词频将其公平地分配给每个词语:
【新智元导读】机器学习顶会ICML 2018从2473份提交论文中接收了621篇,其中有63余篇强化学习相关论文,作者将这些论文分成了多个类别,并对每篇文章的核心贡献做了精炼的总结,这些文章也是追踪强化学习最前沿技术的绝佳材料,精炼的总结也也便于我们快速查找与自己研究相关的文章。
【导读】一年一度的国际机器学习会议( ICML ),于7月15日在瑞典斯德哥尔摩闭幕,ICML 的会议日程之紧凑,会议内容之丰富,令人目不暇接。今年从2,473份提交论文中接收了621篇,其中有63余篇强化学习相关论文,作者将这些论文分成了多个类别,并对每篇文章的核心贡献做了精炼的总结,这些文章也是追踪强化学习最前沿技术的绝佳材料,精炼的总结也也便于我们快速查找与自己研究相关的文章。
作者提出一种在矢量装箱问题下的,基于深度强化学习的,资源调度算法(原文称作业调度),该算法可自动获得合适的计算方法,该方法将最小化完成时间(最大化吞吐量),本文从trace-driven的仿真演示了DeepJS的收敛和泛化性以及DeepJS学习的本质,同时实验表明DeepJS优于启发式的调度算法
性能为王,系统的性能提升是每一个工程师的追求。目前,性能优化主要集中在消除系统软件堆栈中的低效率上或绕过高开销的系统操作。例如,内核旁路通过在用户空间中移动多个操作来实现这个目标,还有就是为某些类别的应用程序重构底层操作系统.
CART是一种DT算法,根据从属(或目标)变量是分类的还是数值的,生成二进制分类树或回归树。它以原始形式处理数据(不需要预处理),并且可以在同一DT的不同部分多次使用相同的变量,这可能会揭示变量集之间的复杂依赖关系。
【导读】 ICML ( International Conference on Machine Learning),国际机器学习大会如今已发展为由国际机器学习学会(IMLS)主办的年度机器学习国际顶级会议。今天,第35届 ICML 大会在瑞典的斯德哥尔摩正式召开,与大家一同分享这一领域在这一年里的突破。ICML 2018 共有 2473 篇论文投稿,共有 621 篇论文杀出重围入选获奖名单,接受率接近25%。其中 Google 强势领跑,Deep Mind 、FaceBook和微软也是精彩纷呈;而在高校中 UC Berkeley 和 Stanford 、CMU 以近 30 篇荣登 Top 榜。
什么叫做回归呢?举个例子,我们现在有一些数据点,然后我们打算用一条直线来对这些点进行拟合(该曲线称为最佳拟合曲线),这个拟合过程就被称为回归。 利用Logistic回归进行分类的主要思想是: 根据现有数据对分类边界线建立回归公式,以此进行分类。 这里的”回归“一词源于最佳拟合,表示要找到最佳拟合参数集。训练分类器时的嘴阀就是寻找最佳拟合曲线,使用的是最优化算法。 基于Logistic回归和Sigmoid函数的分类 优点:计算代价不高,易于理解和实现 缺点:容易欠拟合,分类精度可能不高 使用数据类型:数值
扩散概率模型(DPMs)在高分辨率图像生成方面显示出显著性能,但由于通常需要大量采样步骤,其采样效率仍有待提高。高阶ODE求解在DPMs中的应用的最新进展使得能够以更少的采样步骤生成高质量图像。然而,大多数采样方法仍使用均匀的时间步长,在使用少量步骤时并不是最优的。
本文介绍了Fraternal Dropout一种简单RNNs正则化方法,通过作为正则项来减少模型在不同的dropout mask上预测结果的方差。实验证明,该方法在基准语言建模任务上取得了最先进的成果,同时具有更快的收敛速度。
编译 | Troy·Chang、爱心心、reason_W 校对 | reason_W 下个月机器学习领域的顶会Nips就要在大洋彼岸开幕啦,那么这次的Nips又有什么值得关注的亮点呢?Bengio在新作中提出了RNN优化的新概念fraternal dropout,通过最小化使用不同的dropout mask的同一个RNN的预测差异,提升RNN对于不同dropout mask的不变性,来对RNN进行优化。模型在对比实验中取得了非常惊艳的效果,同时在图像标注和半监督任务上也表现不俗,下面就跟随小编对这篇文章
在一些推荐排名应用中马太效应同样存在,比如大家经常浏览的微博、知乎热搜。同一类话题排名越靠前被点击的概率也就越大,这样,在一段时间内,越是靠前的话题就越会被人点击,然后它越会靠前,然后它就越会......
选自BAIR 作者:Lydia T. Liu、Sarah Dean、Esther Rolf、Max Simchowitz、Moritz Hardt 机器之心编译 参与:刘天赐、晓坤 由于机器学习系统容易受到历史数据引入的偏见而导致歧视性行为,人们认为有必要在某些应用场景中用公平性准则约束系统的行为,并期待其能保护弱势群体和带来长期收益。近日,伯克利 AI 研究院发表博客,讨论了静态公平性准则的长期影响,发现结果和人们的期望相差甚远。相关论文已被 ICML 2018 大会接收。 以「最小化预测误差」为目的训
不久前,来自 UIUC 和南洋理工大学的三名研究者投入了 20 个月的时间,研究了 673 篇论文,撰写了一篇翔实而深入的可信机器学习综述。他们使用统一的数学语言,以数据为中心视角,总结了这个领域的最新研究进展。他们尝试解答以下三个问题:
AI大模型学习建立在深厚的数学和算法基础之上。其中,深度学习技术是支撑大模型学习的重要基石。深度学习模型通过模拟人脑神经元的连接方式,构建出具有强大表示学习能力的网络结构。这些模型能够自动地从大量数据中提取特征,并学习到数据的内在规律和模式。
给一个庞大的GPU集群,在实际的应用中,现有的大数据调度器会导致长队列延迟和低的性能,该文章提出了Tiresias,即一个GPU集群的调度器,专门适应分布式深度学习任务,该调度器能够有效率的调度并且合适地放置深度学习任务以减少他们的任务完成时间(JCT(Job Completion Time)),一个深度学习任务执行的时间通常是不可预知的,该文章提出两种调度算法,基于局部信息的离散化二维Gittins索引(Discretized Two Dimensional Gittins index)以及离散化二维LAS,对信息不可知并且能够降低平均的JCT,在实验中JCT能够快5.5倍,相比于基于Apache YARN的资源管理
本文主要介绍使用VBA自定义函数(UDF)实现一个名叫MaxMinFair的有趣的算法。
任何时代,大部分人的研究所得都不过是基于前人的研究成果,前人所做的是开创性工作,而这往往是最艰难最有价值的,他们被称为真正的先驱。牛顿也曾说过,他不过是站在巨人的肩上。你,我,更是如此。 本次文章的大纲: 1----线性学习器之感知机 2----非线性学习器之Mercer定理 3----常用损失函数分析 1----线性学习器 1-1----感知机 这个感知机算法是1956 年提出的,年代久远,依然影响着当今,当然,可以肯定的是,此算法亦非最优,后续会有更详尽阐述。不过,有一点,你必须清楚,这个算法是为了干嘛
---- 作者:卢思迪 上海交通大学 【新智元导读】上海交通大学APEX实验室研究团队提出合作训练(Cooperative Training),通过交替训练生成器(G)和调和器(M),无需任何预训
---- 新智元专栏 作者:卢思迪 上海交通大学 【新智元导读】上海交通大学APEX实验室研究团队提出合作训练(Cooperative Training),通过交替训练生成器(G)和调和器(M),无需任何预训练即可稳定地降低当前分布与目标分布的JS散度,且在生成性能和预测性能上都超越了以往的算法。对于离散序列建模任务来说,该算法无需改动模型的网络结构,同时计算代价较理想,是一种普适的高效算法。本文是论文第一作者卢思迪带来的解读。 论文地址:https://arxiv.org/pdf/1804.
选自Analytics India 作者:Richa Bhatia 机器之心编译 《欧盟一般数据保护条例》(General Data Protection Regulation,GDPR)是 20 年来数据隐私条例的最重要变化,它将取代《欧盟个人资料保护指令》95/46/EC,并将协调全欧洲的数据隐私法律,为所有欧盟民众保护和授权数据隐私,并将重塑整个地区的数据隐私保护形式。在 GDPR 中,有关「算法公平性」的条款要求所有公司必须对其算法的自动决策进行解释,这意味着目前大量 AI 应用依赖的深度学习算法不
当我们在谈论人工智能的时候,我们究竟在谈论什么?是“机器人超越人类阅读水平,令数百万人面临失业风向“还是“计算机的阅读能力正在赶超人类?”
2021年12月10日,Nature Medicine杂志发表文章,对医疗人工智能中偏见产生的原因和解决方法进行了分析。
在上一篇介绍的几种多道编程的内存管理模式中,以交换内存管理最为灵活和先进。但是这种策略也存在很多重大问题,而其中最重要的两个问题就是空间浪费和程序大小受限。那么有什么办法可以解决交换内存存在的这些问题呢?答案是分页,它是我们解决交换缺陷的“不二法门”。
Content 6. 学习模型的评估与选择 6.1 如何调试学习算法 6.2 评估假设函数(Evaluating a hypothesis) 6.3 模型选择与训练/验证/测试集(Model selection and training/validation/test sets) 6.4 偏差与方差 6.4.1 Diagnosing bias vs. variance. 6.4.2 正则化与偏差/方差(Regularization and bi
微软近日在博客文章中宣布了Face API的重大更新,它改进了面部识别平台识别不同人种性别的能力,此前,这一直是计算机视觉平台面临的挑战。
不知道什么时候朋友圈与微信群流行了公众号的互推,也就是几个公众号主组队一起相互在自己的公众号,微信群以及朋友圈来扩散队友的公众号。我认为这是一个好的现象,这个社会是一个资源共享,互利合作的社会,你在帮助别人的同时,别人也会别帮你,这是双赢的,彼此之间的格局也会更大,接触到的人脉与信息也会更多,所以我要为这样的互推活动点赞!
深度学习在许多情况下都涉及优化。例如,模型中的进行推断(如PCA)涉及求解优化问题。我们经常使用解析优化去证明或设计算法。在深度学习涉及到的诸多优化问题中,最难的是神经网络训练,甚至是几百台机器投入几天到几个月来解析单个神经网络训练问题,也是很常见的。因为这其中的优化问题很重要,代价也很高,因此研究者们开发了一组专门为此设计的优化技术。下面关注一类特定的优化问题:寻找神经网络上的一组参数 ,它能显著的降低代价函数 ,该代价函数通常包括整个训练集上的性能评估和额外的正则化。
a)我们向学习算法提供训练集 b)学习算法的任务是输出一个函数(通常用小写h表示),h代表假设函数 c)假设函数的作用是,把房子的大小作为输入变量(x),而它试着输出相应房子的预测y值 h:是一个引导从x得到y的函数
在线凸优化(OCO)已经成为了一种用于建模各种真实世界问题的常用学习框架,比如在线路由、搜索引擎的广告选择和垃圾信息过滤 [Hazan, 2016]。OCO 的协议如下:在第 t 次迭代,在线学习器从凸集 X 选择 x_t。在学习器确认这个选择之后,会揭示出一个凸成本函数
自由能原理(FEP)为生物如何感知和与环境相互作用提供了一个雄心勃勃的理论(弗里斯顿,2009年,2010年)。FEP假设,为了使一个主体在时变的环境条件下存在(并持续),它必须在主体的内部(“生成”)环境观察模型下最小化自由能泛函(Friston等人,2006)。
主动推理代理的理论性质令人印象深刻,但我们如何在边缘设备上实现有效的硬件和软件工作的代理?这是一个有趣的问题,因为策略探索的计算负载呈指数级增长,而边缘设备的计算资源非常有限。在本文中,我们讨论了支持一个有能力的非专家工程师开发工作的主动推理代理的软件工具箱的必要特征。我们引入了一个正在开发的工具箱,旨在以类似于TensorFlow推动的深度学习技术应用的方式,加速主动推理代理的民主化。
8月13日上午,全国人大常委会法制工作委员会举行记者会。发言人臧铁伟介绍了立法工作有关情况并回答记者提问。
领取专属 10元无门槛券
手把手带您无忧上云