尽管大模型非常强大, 但是解决实践的问题也可以不全部依赖于大模型。一个不太确切的类比,解释现实中的物理现象,未必要用到量子力学。有些相对简单的问题,或许一个统计分布就足够了。对机器学习而言, 也不用言必深度学习与神经网络,关键在于明确问题的边界。
Machine Learning Mastery 计算机视觉教程 通道在前和通道在后图像格式的温和介绍 深度学习在计算机视觉中的 9 个应用 为 CNN 准备和扩充图像数据的最佳实践 8 本计算机视觉入门书籍 卷积层在深度学习神经网络中是如何工作的? DeepLearningAI 卷积神经网络课程(复习) 如何在 Keras 中配置图像数据扩充 如何从零开始为 CIFAR-10 照片分类开发 CNN 用于 Fashion-MNIST 服装分类的深度学习 CNN 如何为 MNIST 手写数字分类开发 CNN
在农业、自动驾驶、航空或能源领域,预测和了解天气是十分重要的。例如,天气条件对航空和物流公司在规划最快和最安全的航线方面起着重要作用,可再生能源公司也需要根据天气预测他们在给定的一天将生产多少能源。因此,各种天气模型被开发出来并正在世界各地应用。但是这些模型通常需要关于大气和确切条件的高度具体的信息,这样使得模型对数据的需求变得非常复杂。
一种方法是先对数据集进行探查,然后思考什么模型适用于这个数据集,先尝试一些简单的模型,最后再开发并调优一个稳健的模型。
AI科技评论按:本文由图普科技编译自《Applying Deep Learning to Real-world Problems》,AI科技评论独家首发。 近年来,人工智能的崛起可以说是得益于深度学习的成功。驱动深度神经网络突破的三个主要因素分别是:海量的训练数据、强大的计算架构和学术领域的相关进展。因此,深度学习在图像分类、面部识别等任务的表现上不仅超越了传统方法,还超越了人类水平。这一切都为那些使用深度学习解决实际问题的新业务创造了巨大的发展潜力。 在位于柏林的Merantix总部,我们致力于研究这项新
今天为大家介绍的是来自Yasushi Okuno团队的一篇论文。识别化合物-蛋白质相互作用(CPI)对于药物发现至关重要。由于实验验证CPI通常耗时且昂贵,因此期望计算方法能够促进这一过程。可用的CPI数据库迅速增长加速了许多机器学习方法用于CPI预测的发展。然而,它们的性能,特别是它们在外部数据上的泛化能力,往往受到数据不平衡的影响,这归因于缺乏经验证的非活性(负面)样本。在这项研究中,作者开发了一种自我训练方法,用于增加可信和信息丰富的负样本,以改善由数据不平衡导致的模型性能下降问题。构建的模型表现出比使用其他传统方法解决数据不平衡时更高的性能,且在外部数据集上改进明显。
【导读】2020 年的三月春招要来了,现在想要 Get 一个算法工程师的实习或全职机会,已经不是一件易事了。如果现在着手复习,茫茫题海不能毫无重点,我们要先抓住那些刚需必备的面试题。这次,作者收集了 12 个 AI 工程师职位的面试问题,助你攻下你心仪的 offer。
人们认为理所当然的任务对于机器来说往往很难完成。这就是为什么通过CAPTCHA测试证明自己是人时,总是被问到一个简单的问题,比如图像是否包含道路标志,或者选择包含食物的图像子集(参见Moravec悖论)。这些测试在确定用户是否是人类方面是有效的,因为对于机器来说,语境中的图像识别是很困难的。训练计算机以自动,高效的方式准确地回答这些问题是很复杂的。 为了解决这个问题,像Facebook和亚马逊这样的公司花费大量的资金来手动处理图像和视频分类问题。例如,TechRepublic认为手动标记数据可能是“未来的蓝
类别不平衡是机器学习中的一个常见问题,尤其是在二元分类领域。当训练数据集的类分布不均时会发生这种情况,从而导致训练模型存在潜在偏差。不平衡分类问题的示例包括欺诈检测、索赔预测、违约预测、客户流失预测、垃圾邮件检测、异常检测和异常值检测。为了提高我们模型的性能并确保其准确性,解决类不平衡问题很重要。
这次给大家介绍Masashi Tsubaki教授的论文“Compound-protein Interaction Prediction with End-to-end Learning of Neural Networks for Graphs and Sequences”。关于化合物与蛋白质的相互作用 (Compound-Protein Interactions ,CPIs)预测的相关问题是当今药物研发的重要课题,能更高效准确的预测 CPI,对生物科研、化学实验和日常制药都会大有益处。Masashi Tsubaki教授现有模型处理不平衡数据集(即包含少量的正样本(即相互作用)和大量的负样本(即不相互作用)的数据集)的不良性能问题。基于此问题,Masashi Tsubaki教授将GNN(Graph Neural Network,图神经网络)和CNN(Convolutional Neural Network,卷积神经网络)引入 基础分类器模型并加入注意力机制调控,提出一种具有图和序列的端到端神经网络模型,通过端到端表示学习在平衡和不平衡数据集上实现更强大的性能,在某些方面了优化CPI的预测。
我们的数据集包含来自多个澳大利亚气象站的每日天气信息。本次目标是要回答一个简单的问题:明天会下雨吗?
本文首发于 【集智书童】,白名单账号转载请自觉植入本公众号名片并注明来源,非白名单账号请先申请权限,违者必究。
近年来,目标检测技术取得了显著的进展,使得可以实现对解剖结构、病变或异常的自动识别和定位。多年来,目标检测方法取得了重大的进步,这是由于大规模的带有标注的数据集的出现和深度学习技术的开发所驱动的。这些技术在改善医疗诊断和治疗结果方面展示出巨大的潜力。
这篇文章记录了我参加 Kaggle 植物幼苗分类比赛 所采用的方法。我曾连续几个月占据榜首,并最终名列第五。这些方法通用性很好,可以应用到其他的图片分类任务中。(戳链接:https://www.kaggle.com/c/plant-seedlings-classification))
图结构数据在多个领域展现了其普遍性和广泛的适用性,例如社交网络分析、生物化学、金融欺诈检测以及网络安全等。在利用图神经网络(Graph Neural Networks, GNNs)在这些领域取得显著成功方面,已经取得了重要进展。然而,在现实世界场景中,模型的训练环境往往远非理想,由于包括数据分布的不平衡、错误数据中噪声的存在、敏感信息的隐私保护以及对于分布外(Out-of-Distribution, OOD)场景的泛化能力等多种不利因素,导致GNN模型的性能大幅下降。为了解决这些问题,已经投入了大量努力来改进GNN模型在实际现实世界场景中的性能,以及提高它们的可靠性和鲁棒性。在本文中,我们提出了一份全面的综述,系统性地回顾了现有的GNN模型,着重于解决四个提及的现实世界挑战,包括在许多现有综述未考虑的实际场景中的不平衡、噪声、隐私和OOD问题。具体来说,我们首先强调现有GNN面临的四大关键挑战,为我们探索现实世界的GNN模型铺平道路。随后,我们提供了这四个方面的详细讨论,分析这些解决方案如何有助于提高GNN模型的可靠性和鲁棒性。最后但同样重要的是,我们概述了有前景的方向,并在该领域提供了未来的视角。
空中图像中的物体检测已成为一个动态且关键的研究领域,主要关注通过空中平台(如卫星、无人机或飞机)捕获的高分辨率图像中物体的识别和定位。这种技术在众多领域得到应用,包括但不限于城市规划,精确农业,灾害管理,以及军事监视。
随着大数据概念的兴起,以数据为基础的商业模式越来越流行,用所收集到的因素去预测用户的可能产生的行为,并根据预测做出相应反应成为商业竞争的核心要素之一。单纯从机器学习的角度来说,做到精准预测很容易,但是结合具体业务信息并做出相应反应并不容易。预测精确性是核心痛点。
编者按:路面峰值附着系数是实现车辆精确运动控制的关键参数。现有的路面识别方法多是基于车辆动力学构建状态观测器实现。此类方法通常适用于车辆加速和减速期间,在轮胎力饱和的情况下,例如在强制动条件下,确定摩擦系数是可行的。困难在于在更正常的驾驶环境下获得摩擦估计,也就是当轮胎滑移率较小时的估计(路面附着利用较低)。实际的道路环境往往复杂多变,而此类方法的收敛速度往往不足以实现实时估计的要求。因此,如何实现高精度实时的路面识别方法将会是此类方法研究的难点与重点。与此同时,基于机器视觉的路面识别方法的优势在于探测范围广、预测性强,但是易受环境中的光线等因素干扰,未来此类方法的研究重点会放在抗干扰能力和对图像识别准确率上。而基于车辆动力学的识别方法与基于图像的识别方法的有效结合,可以充分解决实时性与准确性冲突的问题,基于图像的识别方法为基于车辆动力学的识别方法提供预测的参考输入,可以提前获悉前方路面的特征,使得智能驾驶系统的性能得到提升。
【导读】前几天,深度学习工程师George Seif发表了一篇博文,总结了7个深度学习的技巧,主要从提高深度学习模型的准确性和速度两个角度来分析这些小技巧。在使用深度学习的时候,我们不能仅仅把它看成一
对于人类的语音识别,目前有很多不同的项目和服务,像Pocketsphinx,谷歌的语音API,以及其他等等。这样的应用程序和服务能够以一种很不错的质量识别语音然后转换成文本,但没有一个能够对麦克风所捕
这些问题是我在面试 AI 工程师岗位时常问到的问题。事实上,并非所有面试都需要用到所有这些问题,因为这取决于面试者的经验以及之前做过的项目。经过很多面试(尤其是与学生的面试)之后,我收集了 12 个深度学习领域的面试问题。我将在本文中将其分享给你。
选自Analytics Vidhya 作者:Upasana Mukherjee 机器之心编译 参与:马亚雄、微胖、黄小天、吴攀 如果你研究过一点机器学习和数据科学,你肯定遇到过不平衡的类分布(imbalanced class distribution)。这种情况是指:属于某一类别的观测样本的数量显著少于其它类别。 这个问题在异常检测是至关重要的的场景中很明显,例如电力盗窃、银行的欺诈交易、罕见疾病识别等。在这种情况下,利用传统机器学习算法开发出的预测模型可能会存在偏差和不准确。 发生这种情况的原因是机器学习
大家好,我是架构君,一个会写代码吟诗的架构师。今天说一说面向高维和不平衡数据分类的集成学习研究论文研读笔记「建议收藏」,希望能够帮助大家进步!!!
纯机器学习(ML)模型的训练与建立端到端的数据科学解决方案与实际企业需要之间存在巨大差异。 本文总结了我们团队与来自不同行业的数十家企业客户(包括制造业,金融服务业,零售业,娱乐业和医疗保健业等)合作两年后所总结的经验教训。 企业面临的最常见的ML问题是什么?除了训练ML模型之外还有什么? 如何解决数据收集问题? 如何扩展到大型数据集? 为什么特征工程如此重要? 如何从生产中的模型转变为功能完备的系统? 我们是否需要数据科学平台?
内容一览:如果你正在学习如何创建或选择一个合适的数据集,那么这篇文章会给你一些实用的建议,帮助你在选择和创建数据集时做出明智的决策。
Learning Unknown from Correlations: Graph Neural Network for Inter-novel-protein Interaction Prediction Secondary Structure Prediction Using External Knowledge
每天给你送来NLP技术干货! ---- 作者丨专知 编辑丨极市平台 导读 本文对深度长尾学习的最新进展进行了综述。具体地说,我们将已有的深度长尾学习研究分为三类(即类重平衡、信息增强和模块改进),并根据这三类对这些方法进行了详细的回顾。 论文链接:https://arxiv.org/abs/2110.04596 摘要 深度长尾学习是视觉识别中最具挑战性的问题之一,其目标是从大量遵循长尾类分布的图像中训练出性能良好的深度模型。在过去的十年中,深度学习已经成为一种学习高质量图像表示的强大的识别模型,并导致
声音分类可能是一项艰巨的任务,尤其是当声音样本的变化很小而人耳无法察觉时。机器的使用以及最近的机器学习模型已被证明是解决声音分类问题的有效方法。这些应用程序可以帮助改善诊断,并已成为心脏病学和肺病学等领域的研究主题。卷积神经网络识别COVID-19咳嗽的最新创新以及使用咳嗽记录来检测无症状COVID-19感染的MIT AI模型(https://news.mit.edu/2020/covid-19-cough-cellphone-detection-1029)显示出仅凭咳嗽声就可识别COVID-19患者的一些令人鼓舞的结果。综观这些参考资料,这项任务可能看起来颇具挑战性,就像只有顶尖研究人员才能完成的任务一样。在本文中,我们将讨论如何使用Wolfram语言中的机器学习和音频功能获得这非常有希望的结果。
摘要: 本文主要讲述了如何在python中用七步就能完成中数据准备。 上图为CRISP-DM模型中的数据准备 下面七个步骤涵盖了数据准备的概念,个别任务以及从Python生态系统中处理整个任务过程的不同方法。 维基百科将数据清洗定义为: 它是从记录集、表或者数据库检测和更正(或删除)损坏或不正确的记录的过程。指的是识别数据的不完整、不正确、不准确或不相关的部分,然后替换、修改或删除它们。数据清洗(data cleaning)可以与数据整理(data wrangling)的工具交互执行,也
Towards understanding retrosynthesis by energy-based models 论文摘要:
今天分享来自浙江大学ICLR 2024的关于自动模型评估AutoEval的最新工作:MDE。
今天看到一篇非常非常棒的调节NN的文章,作者是特斯拉高级总监Andrej Karpathy,就翻译过来和大家一起分享,难免翻译有问题,有兴趣的朋友可以去引文阅读原文。
作者:布奇·昆托(Butch Quinto) 来源:大数据DT(ID:hzdashuju) 有监督学习 有监督学习是利用训练数据集进行预测的机器学习任务。有监督学习可以分为分类和回归。回归用于预测“价格”“温度”或“距离”等连续值,而分类用于预测“是”或“否”、“垃圾邮件”或“非垃圾邮件”、“恶性”或“良性”等类别。 分类包含三种类型的分类任务:二元分类、多类别分类和多标签分类。回归中包含线性回归和生存回归。 无监督学习 无监督学习是一种机器学习任务,它在不需要标记响应的情况下发现数据集中隐藏
这位特斯拉的人工智能研究负责人、李飞飞的斯坦福高徒刚刚难得更新了博客,推出了一篇长文《神经网络的训练秘籍》,详细讲述了我们在训练神经网络时候可以遵循的套路。
作者: Dimitrios Michail, Lefki-Ioanna Panagiotou, Charalampos Davalas, Ioannis Prapas, Spyros Kondylatos, Nikolaos Ioannis Bountos, Ioannis Papoutsis
1962年,在Hansch及其同事所做的关于定量结构-活性关系(quantitative structure−activity relationship, QSAR)的开创性工作中,预测Hammett函数和分配系数将在建立构效关系中变得非常重要。在过去的60年中,QSAR已经从小数据集的类似化合物的粗糙回归/分类分析发展到基于精巧的机器学习技术,机器学习可以提取嵌入在复杂结构的分子组成的大数据集中的化学、物理和生物功能信息特征。通过结构-活性映射关系的转换,QSAR成为药物发现的重要组成部分。这使得研究者可以高效、低成本地预测分子活性和性质,以及基于结构的虚拟筛选数百万候选药物组成的化学库得到有潜力的hits。机器学习也应用于各种其他领域,包括化合物的逆向合成路线预测,蛋白质和化合物设计,构象生成,力场优化和蛋白质结构预测。经典的QSAR方法依赖于数学模型来建立各种描述符与生物活性之间的关系。这些描述符包括分子指纹、图或其他数学表示等。生物活性包括吸收、分布、代谢、排泄、毒性(ADMET),结合自由能,蛋白质-配体复合物的动力学速率等。建立这样的关系也常常需要基于具有相似拓扑结构和功能的分子组成的数据集。由于可以使用广泛的数学模型,QSAR很早就结合了机器学习算法,通过多任务模型建模非线性结构-功能关系来处理大且高维数据集。
今天介绍来自西交利物浦大学和福建医科大学的Zitao Song, Daiyun Huang等人六月份发表在Nature Communication的文章“Attention-based multi-label neural networks for integrated prediction and interpretation of twelve widely occurring RNA modifications”。文中提出了一种建立在基于注意力机制的多标签深度学习框架上的方法——MultiRM,它不仅可以同时预测12种广泛发生的RNA修饰的假定位点,而且还可以返回对阳性预测贡献最大的关键序列上下文。该模型从相关序列上下文的角度揭示了不同类型的RNA修饰之间的强关联,能够综合分析并理解基于序列的RNA修饰机制。
在阅读了一篇 MNIST 的教程(或 10 篇)并了解了一些 Tensorflow / Keras 最佳实践后,你可能会认为将神经网络应用于预测任务是一种“即插即用”操作。
这是机器学习发挥作用的地方。我们将建立一个机器学习分类器来判断一只股票是买入、卖出还是持有。为了确定一个股票或公司是否属于这三种类型之一,我们将看一下每个公司的季度报告。这些季度报告包含了必要的财务信息,我们需要用基本面分析的方法来训练我们的机器学习分类器。
研究者提出了一个单阶段检测框架,该框架解决了多尺度目标检测和类不平衡的问题。没有设计更深层的网络,而是引入了一种简单而有效的特征丰富化方案来生成多尺度的上下文特征。进一步引入了一种级联的优化(精炼)方案,该方案首先将多尺度的上下文特征注入到一阶段检测器的预测层中,以增强其进行多尺度检测的判别能力。其次,级联精炼方案通过细化anchors和丰富的特征以改善分类和回归来解决类不平衡问题。对于MS COCO测试上的320×320输入,新的检测器在单尺度推理的情况下以33.2的COCO AP达到了最先进的一阶段检测精度,操作是在一个Titan XP GPU上以21毫秒运行的 。对于MS COCO测试上的512×512输入,与最佳的单阶段结果相比,就COCO AP而言,新方法获得了一个明显的增加(增加了1.6%)。
图像分割是计算机视觉和机器学习领域发展最快的领域之一,包括分类、分类与定位、目标检测、语义分割、实例分割和Panoptic分割。
您可以整天训练有监督的机器学习模型,但是除非您评估其性能,否则您永远无法知道模型是否有用。这个详细的讨论回顾了您必须考虑的各种性能指标,并对它们的含义和工作方式提供了直观的解释。
自动驾驶汽车的目标检测通常基于摄像头图像和激光雷达输入,通常用于训练深度人工神经网络等预测模型,用于目标识别决策、速度调节等。 这种决策中的一个错误可能是破坏性的; 因此,通过不确定性测度来衡量预测模型决策的可靠性至关重要。 在深度学习模型中,不确定性通常用于衡量分类问题。 然而,自动驾驶中的深度学习模型往往是多输出回归模型。 因此,我们提出了一种新的方法,即预测表面不确定度(PURE)来测量这类回归模型的预测不确定度。 我们将目标识别问题表述为一个具有多个输出的回归模型,用于在二维摄像机视图中寻找目标位置。 为了进行评估,我们修改了三个广泛应用的目标识别模型(即YoLo、SSD300和SSD512),并使用了KITTI、Stanford Cars、Berkeley DeepDrive和NEXET数据集。 结果显示,预测面不确定性与预测精度之间存在显著的负相关关系,表明不确定性对自动驾驶决策有显著影响。
全景感知系统是自动驾驶汽车的关键部件,使其能够全面感知和理解环境。这些系统同时解决了多个视觉任务,包括物体检测、车道线分割、可驾驶区域分割,并对道路场景产生了丰富的理解。
深度神经网络 (DNN) 容易过度拟合,过拟合的网络会导致对于新的数据实例表现不佳。该论文提出了不使用单个 DNN 作为分类器,而是使用一个由七个独立 DNN 学习器组成的集合,这些DNN都会保持它们的架构和内在属性相同,但是使用不同的数据输入。为了在训练输入中引入多样性, 每一个DNN将会删除七分之一的输入数据,并从剩余的样本中通过bootstrap抽样进行补充。论文提出了一种新的技术来结合DNN学习者的预测。这种方法被称 pre-filtering by majority voting coupled with stacked meta-learner,它在分配最终类标签之前对预测执行两步置信度检查。论文将所有算法在人类活动识别(Human Activity Recognition, HAR)、气体传感器阵列漂移(Gas sensor array drift)、Isolet、垃圾邮件(Spam-base)和互联网广告五个基准数据集上进行了测试,发现所提出的集成方法比单个DNN和多DNN的平均集成,以及多元化投票和元学习的基线方法获得了更高的准确率
在美国,急性心肌梗死(AMI)或冠心病是死亡的首要原因之一,而到2035年,据估计,有将近一半的成年人可能会遭受此类病痛。令人不安的是,AMI的大多数发生前都没有明显的症状,如胸痛或呼吸急促。现在,佛罗里达州立大学和佛罗里达大学盖恩斯维尔分校的研究人员正在利用AI,预测经历过一次发作的重症监护病房患者的一年的死亡率。
Language models enable zero-shot prediction of the effects of mutations on protein function 论文摘要:
来源:DeepHub IMBA本文约2700字,建议阅读5分钟本文整理了10个常见的问题。 评估指标是用于评估机器学习模型性能的定量指标。它们提供了一种系统和客观的方法来比较不同的模型并衡量它们在解决特定问题方面的成功程度。通过比较不同模型的结果并评估其性能可以对使用哪些模型、如何改进现有模型以及如何优化给定任务的性能做出正确的决定,所以评估指标在机器学习模型的开发和部署中发挥着至关重要的作用。所以评估指标是面试时经常会被问到的基础问题,本文整理了10个常见的问题。 1、你能在机器学习的背景下解释精度和召
领取专属 10元无门槛券
手把手带您无忧上云