首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

深度学习技术将乳癌诊断的误差率降低 85%

一支来自哈佛医学院贝斯以色列女执事医疗中心(BIDMC)的研究团队,在 2016 Camelyon Grand Challenge 竞赛活动里运用深度学习技术来克服了这项难题。...这支来自 BIDMC 的研究团队出现戏剧性的结果,病理学家以采用 GPU 技术的深度学习方法进行分析时,将人类在诊断方面的误差率降低 85%。...这支团队在进行这项研究计划时,使用 NVIDIA Tesla K80 GPUs 搭配 cuDNN 加速 Caffe 深度学习架构,Beck 说此举大幅加快训练其运算模型的速度。...虽然未达人类病理学家 96% 的成功辨识率,其优异表现也足以在 Camelyon Grand Challenge 竞赛活动的两个类别里获得冠军。...这也证明了团队的假设:人类的分析能力加上深度学习结果,达到 99.5% 的成功率,意指人类病理学家搭配人工智能系统能提高分析能力,象征在辨识和治疗癌症方面出现重大进展。

728100

基于标记数据学习降低误报率的算法优化

本文介绍利用专家经验持续优化机器学习的方法,对告警数据进行二次分析和学习,从而显著地降低安全威胁告警的误报率。...MIT的研究人员[1] 介绍了一种将安全分析人员标记后的告警日志作为训练数据集,令机器学习算法学习专家经验,使分析算法持续得到优化,实现自动识别误报告警,降低误报率的方法(以下简称“ 标签传递经验方法”...基于模拟数据,我们想要达到的目的是通过持续的强化机器学习能够降低误报率。...达到我们所预期的效果,当训练数据越来越多的时候,测试数据当中的误报率从20%多降低到了10%。通过对告警数据和标签的不断自学习,可以剔除很多告警误报。...前面提到,数据当中引入了9%的噪音,所以误报率不会再持续的降低。

1.9K80
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    深度神经网络框架改善AI持续学习的能力,降低遗忘率

    研究人员开发了一种新的深度神经网络框架,允许人工智能系统在更好地学习新任务的同时,尽可能减少对先前任务所学到的知识的遗忘。使用框架学习新任务可以使AI更好地执行以前的任务,这种现象称为逆向迁移。...北卡罗来纳州电气和计算机工程助理教授Tianfu Wu表示,人们有能力不断学习,我们一直在学习新的任务,而不会忘记我们已知的事情,到目前为止,使用深度神经网络的人工智能系统并不是很擅长这一点。...该论文的联合主要作者,Salesforce Research的研究科学家Yingbo Zhou说,“我们已经提出了一个新的持续学习框架,它将网络结构学习和模型参数学习分离开来,我们将其称为Learn to...这意味着当网络进入其系统中的每一层时,它可以决定做以下四件事之一:跳过层;以与先前任务使用的方式相同的方式使用层;将轻量级适配器连接到层,稍微修改它;创建一个全新的层。...研究人员还进行了实验,将框架学习新任务的能力与其他几种持续学习方法相比较,并发现框架在完成新任务时具有更高的准确性。

    45220

    matlab使用贝叶斯优化的深度学习:卷积神经网络CNN

    p=7954 此示例说明如何将贝叶斯优化应用于深度学习,以及如何为卷积神经网络找到最佳网络超参数和训练选项。 要训练深度神经网络,必须指定神经网络架构以及训练算法的选项。...脚本后面的目标函数将每一层中的卷积过滤器数量与成正比1/sqrt(SectionDepth)。结果,对于不同的截面深度,每次迭代的参数数量和所需的计算量大致相同。...最佳学习率取决于您的数据以及您正在训练的网络。 随机梯度下降动量。 L2正则化强度。...训练固定的时期数,并在最后一个时期将学习率降低10倍。这减少了参数更新的噪音,并使网络参数的沉降更接近损耗函数的最小值。...在验证集上评估经过训练的网络,计算预测的图像标签,并在验证数据上计算错误率。 创建一个包含验证错误的文件名,然后将网络,验证错误和训练选项保存到磁盘。

    2.2K10

    图神经网络(GNN)和神经网络的关系

    2.3 作为关系图的通用神经网络 本节讨论了如何将关系图推广到通用神经网络,特别是可变宽度MLP。...每一层都配备了ReLU非线性层和BatchNorm层。我们采用余弦学习率计划,初始学习率为0.1,退火至0,不重新启动,批量大小为128,训练了200个epoch。...所有模型都使用余弦学习率计划进行100个时期的训练,初始学习率为0.1。在NVIDIA Tesla V100 GPU上,训练MLP模型需要5分钟,训练ImageNet上的ResNet模型需要一天。...右图:在中间训练时期和最终时期(100个时期)确定的最佳点之间的相关性。 需要多少个训练周期?...结果发现,在3个epoch后训练的模型已经具有很高的相关性(0.93)。这一发现表明,良好的关系图在早期的训练epoch就表现良好,因此可以大大降低确定关系图是否有前途的计算成本。

    23710

    谁说阿尔法狗们只会下棋玩游戏?DeepMind用它们给油管视频做压缩

    这样一来,如何将压缩后的视频画质、流畅度等损失降到最小就成了视频厂商关注的重要问题,也是一个有望用强化学习解决的问题。...DeepMind 的 Muzero 可以在保证视频质量相似的前提下降低大约 4% 的比特率。...比特率是指发送每帧视频所需的 1 和 0 的数量,是服务和存储视频所需的计算量和带宽的主要决定因素,影响视频加载所需时间、分辨率、缓冲和数据使用等很多指标。...通过学习视频编码的动态变化和确定如何最好地分配比特,MuZero 速率控制器(MuZero-RC)能够在不降低质量的情况下降低比特率。QP 选择只是编码过程中众多编码决策中的一个。...实验表明,在大量不同的 YouTube 实时视频中,比特率平均降低了 4% 。

    60520

    ​清华 & 国家重点实验室 PeriodicLoRA | 通过周期性累积低秩更新打破参数高效微调的性能瓶颈!

    如图4所示,经过四个时期后,排名第一的模型在GSM8K上的表现下降,而排名第八的模型在第三个时期出现下降。GSM8K的峰值比MMLU晚,这表明GSM8K更具挑战性,需要更高的学习能力。...从表3中可以看出,当只改变学习率并保持其他设置不变时,在1个训练周期后,较大的学习率会取得更好的结果。...与使用通用学习率2e-5的全量微调大型语言模型不同,在LoRA训练中,实际上需要从初始化的LoRA矩阵 AB 开始训练,因此更高的学习率更适合LoRA训练。...然而,由于PLoRA方法在微型批次上累积LoRA训练,如果使用过高的学习率,反而会降低学习的有效性。...从表3中,作者可以观察到,当使用PLoRA训练秩为8的模型时,设置学习率为5e-4相比于设置学习率为1e-4,性能要低得多。 在应用LoRA的线性层数量方面,作者主要关注将LoRA应用于所有线性层。

    35210

    Ensemble Learning

    根据基学习器的生成方式,目前的集成学习大体可以分成以下两类: ①序列集成方法,其中参与训练的基学习器按照顺序生成。...并行方法的原理是利用基学习器之间的独立性来显著降低错误率。 前者的代表是Boosting,而后者的代表是Bagging,我们一个一个来聊。...Boosting Boosting是一族将弱学习器提升为强学习器的算法。 Boosting的两个核心问题 Q1:在每一轮如何改变训练数据的权值或概率分布? Q2:如何将弱分类器组合成一个强分类器?...Boosting:每一轮的训练集不变,只是训练集中每个样例在分类器中的权重发生变化,而其权值是根据上一轮的分类结果进行调整。   ...2)样例权重:   Bagging:使用均匀取样,每个样例的权重相等   Boosting:根据错误率不断调整样例的权值,错误率越大则权重越大   3)基分类器权重:   Bagging:所有基分类器权重相等

    47910

    评测 | 谷歌 TPU 二代来了,英伟达 Tesla V100 尚能战否?

    以上情况还包括当租用 12 个月时的情况(在 AWS 上的 p3.8xlarge 保留实例的价格(无预付款))。这种租用情况将明显得将价格降低至每 1 美元处理 375 张图像的成本。...两个实现在进行了 90 个时期训练后的首位准确率(即只考虑每张图像具有最高可信度的预测情况下) 如上图所示,TPU 实现 进行了 90 个时期训练后的首位准确率比 GPU 多 0.7%。...让我们来看一下在不同的训练时期模型学习识别图像的首位准确率。 ?...设置了验证的两个,实现的首位准确率 上表中放大图部分首位准确率的剧烈变化,与 TPU 和 GPU 这两个 实现上模型的学习速率是相吻合的。...TPU 实现上的收敛过程要好于 GPU,并在 86 个时期的模型训练后,最终达到 76.4% 的首位准确率,但是作为对比,TPU 实现则只需 64 个模型训练时期就能达到相同的首位准确率。

    1.7K10

    获取更稳健的收益:趋势策略与因子选股的结合

    这种组合策略的目标是通过优质的股票选择产生长期优于市场的回报,同时通过使用强劲的趋势跟踪策略显著降低下行风险。...在本文中,我将演示如何将这种以防守为中心的趋势跟踪策略与以进攻为中心的基于因子的股票选择模型相结合,例如那些基于质量、价值、动量或低波动性的模型,可以产生更好的长期表现。...然而,尽管表现突出,但所有的因子组合在这一时期也都经历了显著的下降,只有质量和低波动率组合的最大下降幅度低于两个市场指数。...图4 组合趋势跟踪单因子策略与趋势跟踪单因子策略对比 此外,如图5-8所示,在最近的三个市场危机时期以及金融危机后的牛市期间,组合4因子趋势跟踪策略产生了最一致的绝对和风险调整后的表现。...尽管合并的4因子趋势跟踪策略的表现在任何一个时期都没有排在第一位,但在这些牛市和熊市期间,其持续的中期至上半绝对和风险调整的表现表明,它是应对多种市场环境的最佳策略。

    65340

    机器学习|AdaBoost

    01 基本思想 对于分类问题而言,给定一个训练样本集,求比较粗糙的分类规则(弱分类器)要比求精确的分类规则(强分类器)容易的多,提升方法就是从弱学习算法出发,反复学习,得到一系列弱分类器(基本分类器)...大多数的提升方法都是改变训练数据的概率分布,针对不同的训练数据分布调用弱学习算法学习一系列弱分类器。...对于提升方法来说,有两个问题需要回答:一是在每一轮如何改变训练数据的权值或概率分布;二是如何将弱分类器组合成一个强分类器。...关于第一个问题,Adaboost的做法是,提高那些被前一轮弱分类器错误分类样本的权值,而降低那些被正确分类样本的权值。...04 AdaBoost例子 这里拿李航博士《统计学习方法》中的例子来说明一下: 我们有下表所示的训练数据,假设弱分类器由xv产生,其阈值v使该分类器在训练数据集上分类误差率最低,我们尝试使用Adaboost

    68610

    必备必考 | 调参技能之学习率衰减方案(一)—超多图直观对比

    为什么要调整我们的学习率并使用学习率方案 要了解为什么学习率方案是一个有价值的方法,可用于提高模型的准确率并降低loss,考虑到几乎所有神经网络使用的标准权重更新公式: ?...相反,我们可以做的是降低我们的学习率,从而允许我们的网络采取更小的步长——这种降低的学习率使我们的网络能够下降到“更优化”的loss landscape区域,否则用我们的学习率将完全错过。...实验3:阶梯型学习率方案结果让我们继续并执行阶梯型学习率调整方案,这将使我们的学习率每15个时期降低0.25倍: $ python train.py --schedule step --lr-plot...图5 实验#3演示了阶梯型的学习率方案(左)。训练历史准确率/loss曲线显示在右侧。 图5(左)显示了我们的学习率方案。请注意,在每15个时期之后,我们的学习率会下降,从而产生“阶梯式”效果。...没有两个深度学习项目是相似的,因此需要运行自己的一组实验,包括改变初始学习率和时期总数,以确定适当的学习率计划。 是否存在其他学习率方案?

    4.4K20

    练好数据分析基本功,掌握常用的统计学指标和六大分析方法

    前面几讲,我们从数据岗的知识体系出发,学习了常用的SQL语法,复习了统计学的基础知识。今天的分享我们是数据分析岗的最后一讲,着重于分享常用的统计学指标以及数据分析师的常用分析方法。...时期、群体交叉,得到同期群分析,如各年的新客,在后续各年的小手工线,可以用于预测后续年份的销售趋势。 一张图告诉你,什么是同期群分析。 ?...对处于相同生命周期阶段的用户进行垂直分析(横向比较),从而比较得出相似群体随时间的变化(图中例子表明:从初始行为开始,留存的用户在逐渐降低)。 2....而对于节点来说,最核心的指标就是转化率,公式如下: 转化率 = 通过该层的流量/到达该层的流量 整个漏斗的转化率以及每一层的转化率,可以帮助我们明确优化的方向:找到转化率低的节点,想办法提升它。...目的是提升效率、降低成本。换句话说就是将很小的单位聚成几类,所关注的对象量级减少。 前提:特征是用于业务。 人群的特征千千万,单业务也有自己的形态,例如线下的业务不适合用消费者线上行为作为聚类特征。

    1.2K30

    如何理解和预测客户终身价值

    CLTV=ARPU(或ARPPU)*毛利率*留存率 CLTV的计算包括三个主要部分: ARPU(或ARPPU) 毛利率 留存率 ARPU(Average Revenue per User,每用户平均收入...快照留存率=留存客户数/收入客户群 假设在某一时期开始时,拥有900名客户,而在这一时期内增加了100名新客户,流失了300名客户。该时期结束时的留存客户数为800名。...同期群留存率计算的是某一客户同期群在其初始购买日期或注册日期之后的每个连续时期的留存率。...此外,可以利用高级分析和机器学习来识别客户概况和行为属性,并预测现有客户和潜在客户保留业务或从业务中流失的可能性有多大。...例如,可以通过增加ARPU或ARPPU(即向上销售、交叉销售等)和/或降低COGS(即生产成本、服务成本等)来提高毛利率。还要注重提高客户的留存率,想办法让客户更长时间地保留业务。

    2.4K2512

    提升方法-Adaboost算法

    在概率近似正确学习的框架中(简称PAC),一个概念(类),如果存在一个多项式的学习算法能够学习它,并且正确率很高,那么就称这个概念是强可学习的;一个概念,如果存在一个多项式的学习算法能够学习它,学习的正确率仅比随机猜测略好...这样,对于提升方法来说,有两个问题需要解决:一是在每一轮如何改变训练数据的权值或概率分布;二是如何将弱分类器组成一个强分类器。...对于第一个问题,AdaBoost的做法是,提高那些被前一轮弱分类器错分类样本的权值,而降低那些被正确分类样本的权值。...,M(m表示反复训练的次数) (a)使用具有权值分布的 Dm的训练数据集学习,得到基本分类器 ? (b)计算Gm(x)在训练数据集上的分类误差率(误分类样本权值之和) ? 上式中 ?...前向分步算法求解这一优化问题的想法是:因学习的是加法模型,如果能够从前向后,每一步只学习一个基函数及其系数,逐步逼近优化目标函数,那么就可以简化优化的复杂度。具体地,每步只需要优化如下目标函数: ?

    80540

    干货分享 | 互联网教育三种流量获取玩法解析

    如何将多渠道流量更有效的承接与转化? 如何分类留存新老学员降低流失率? 扫描下方二维码 马上观看 教育行业Workshop现场直播!...如果培训机构的老师质量、课程产品、教学服务很好,学生获得了很好的体验,分数得到提高,那么进一步带来了口碑,强化了机构品牌。口碑和品牌会进一步降低流量的获取和转化成本,进而降低整个招生成本。...社区聚拢了一大批目标学习用户,为付费课程转化,源源不断的提供流量,社区论坛可以大大降低招生成本的原因在于: 总流量成本更低:社区的长期流量获取成本远低于传统机构的营销成本。...广告销售模式的弊端:这种流量获取策略,适用于在品牌成立初期,需要大规模建立用户心智的推广时期。广告的投放、以及与之配合的电话营销都非常烧钱,不是非常良性的运作方式。...认清教育流量的内涵和转化逻辑 文章开头讲了,招生成本取决于流量大小和流量转化率,流量转化率也至关重要。只有在品牌原生的流量导给品牌原生的课程产品时,转化率才最高。

    1.3K10

    王晓刚:图像识别中的深度学习

    这不仅大大降低了计算的复杂度,而且使神经元的输出具有稀疏的特征,对各种干扰更加鲁棒。第三,Alex Net通过对训练样本镜像映射和加入随机平移扰动,产生了更多的训练样本,减少了过拟合。...2013年,采用人脸确认任务作为监督信号,利用卷积网络学习人脸特征,在LFW上取得了92.52%的识别率。这一结果虽然与后续的深度学习方法相比较低,但也超过了大多数非深度学习算法。...在后续工作中,DeepID2通过扩展网络结构,增加训练数据,以及在每一层都加入监督信息,在LFW达到了99.47%的识别率。...以往的视觉研究方法对动态特征的描述往往依赖于光流估计、对关键点的跟踪和动态纹理。如何将这些信息体现在深度模型中是个难点。最直接的做法是将视频视为三维图像,直接应用卷积网络在每一层学习三维滤波器。...与图像识别相关的各种应用也在推动深度学习在网络结构、层的设计和训练方法各个方面的快速发展。可以预见在未来数年内,深度学习将会在理论、算法和应用各方面进入高速发展时期。

    1.3K21

    ImageNet训练再创纪录,EfficientNet异军突起,ResNet:感受到了威胁

    例如,如果我们将每核的批处理大小固定为32,则1024个核上的全局批处理大小将为32768。...另一方面,如果在扩展到多个核时全局批处理大小是固定的,则每核的批处理大小会降低,导致效率低下和吞吐量降低。 因此,为了更好地利用每个TPU内核的内存并提高吞吐量,必须使用较大的全局批处理大小。...学习率规划 为了在使用大批量时保持模型质量,作者还采用了学习率预热和线性缩放技术。 在保持epoch数固定的同时增加全局批量大小将导致更新权重的迭代数较少。...为了解决这个问题,作者将线性缩放规则应用于批次中每256个样本的学习率。 但是,较高的学习率会导致发散。因此,作者还应用了学习率预热,其中训练以较小的初始学习率开始,并在可调整的时期内逐渐提高学习率。...使用bfloat16格式进行卷积可提高硬件效率,而不会降低模型质量。

    1.2K30

    机器学习系列:深度探秘K线结构新维度

    传统的时间K线使用的是每根K线时间跨度一致的结构化发方式,这种构造方式在传统人工环境、低频环境下有比较直观的好处:人们在处理任何事情时都习惯于以时间为刻度。...相比于非时间K线,时间K线的异方差现象更为严重。我们可以通过周内波动序列来体现股票收益在不同时期的波动变化。每一周的周内波动是以当周内所有K线的收益率为样本计算方差得到的。...从比较直观的逻辑出发,如果某个时段内知情交易概率增大,则表明市场内有新的信息进入,市场在接下来一段时期会开始消化这个新信息,从而未来波动率大概率会上升;反之若知情交易概率下降,则市场在未来一段时期波动率大概率会下降...对于所有等价频率与K线结构上,模型的预测准确率基本上都随着窗宽边长而降低。这个可以理解为随着窗宽拉长,所需要预测的未来信息变得更多,其难度也相应增大。 2....时间K线与非时间K线结构在模型上的表现差异随着等价频率的降低而缩小。在60分钟频率上不同K线结构上的预测效果差异很小。

    2.1K42
    领券