近年来,药物科学家一直高度关注依赖于现有药物知识的新型药物开发策略。事实上,药物发现任务的困难在于已知的药物与基因相互作用位点的了解不充分,而主要风险在于药物与靶点的即副作用。尽管这些副作用大多数有害的,但有时它们会引起有趣的治疗发现。例如,米诺地尔主要用于治疗溃疡,西地那非(伟哥)用于治疗心绞痛。但是,它们目前分别用于治疗脱发和勃起功能障碍。因此,新型药物开发策略目前是许多药理学家的主要研究重点。
🙋♂️声明:本人目前大学就读于大二,研究兴趣方向人工智能&硬件(虽然硬件还没开始玩,但一直很感兴趣!希望大佬带带)
今天给大家介绍迪肯大学Thin Nguyen教授等人发表在Bioinformatics上的一篇文章 “GraphDTA: predicting drug–target binding affinity with graph neural networks” 。药物再利用可以避免昂贵和漫长的药物开发过程,估计新药物-靶标对相互作用强度的计算模型可加快药物的再利用,然而,以往的模型均是将药物表示为字符串,但这不是分子表示的合理方式,所以作者提出了一种新的GraphDTA模型,将药物表示为图,并使用图神经网络预测药物与靶点的亲和力。结果表明,图神经网络不仅比非深度学习模型更能预测药物靶点的亲和性,而且比其他深度学习方法更有效。
Part IV: Predicting the growth of practical computationalpower
深度学习模式可能需要几个小时,几天甚至几周的时间来训练。 如果运行意外停止,你可能就白干了。 在这篇文章中,你将会发现在使用Keras库的Python训练过程中,如何检查你的深度学习模型。 让我们开始
利用计算机的运算能力,从大量的数据中发现一个 “函数”或“模型” ,并通过它来模拟现实世界事物间的关系,从而实现预测、判断等目的。建模的过程就是机器“学习”过程。
关键要点 我们看到越来越多的公司使用深度学习算法。因此,我们将深度学习从创新者转移到了早期采用者类别。与此相关的是,深度学习存在新的挑战,例如在边缘设备上部署算法和训练非常大的模型。 尽管采用率正在缓慢增长,但现在有更多的商业机器人平台可用。我们在学术界之外看到了一些用途,但相信未来会有更多未被发现的用例。 GPU 编程仍然是一项很有前途的技术,但目前尚未得到充分利用。除了深度学习,我们相信还有更多有趣的应用。 借助 Kubernetes 等技术,在典型的计算堆栈中部署机器学习变得越来越容易。我们看到越来越
选自Medium 机器之心编译 参与:侯韵楚、李泽南 神经网络在图像处理中应用广泛,但经常面临难以调整参数的问题。最近,来自 Merantix 的 Ryan Henderson(博士毕业于康奈尔大学)等人发布了一个免费开源的卷积神经网络可视化工具,让我们可以方便地观察神经网络在图像中的焦点,为模型优化提供了帮助。 Github(运行环境-Python3.5 或以上):https://github.com/merantix/picasso arXiv-Picasso:https://arxiv.org/abs
机器学习之父 Arthur Samuel 对机器学习的定义是:在没有明确设置的情况下,使计算机具有学习能力的研究领域。国际机器学习大会的创始人之一 Tom Mitchell 对机器学习的定义是:计算机程序从经验 E 中学习,解决某一任务 T,进行某一性能度量 P,通过 P 测定在 T 上的表现因经验 E 而提高。 而机器学习的厉害之处就在于,它能利用计算机的运算能力,从大量的数据中发现一个“函数”或“模型”,并通过它来模拟现实世界事物间的关系,从而实现预测、判断等目的。这个过程的关键是建立一个合适的模型,并能主动地根据这个模型进行“推理”,而这个建模的过程就是机器的“学习”过程。 那么机器学习和我们传统的程序有什么区别呢?实际上,传统程序是程序员把已知的规则定义好后输入给机器的,而机器学习则从已知数据中,通过不断试错、自我优化、自身总结,归纳出规则来。下面这张图,直观地阐述了机器学习和传统程序的区别,你可以看一下。
选自arXiv 作者:Leslie N. Smith 机器之心编译 参与:Jane W、黄小天 近日来自美国海军研究室人工智能应用研究中心的 Leslie N.Smith 总结了一份报告,本报告对希
AI 科技评论按:本文来自 Keras 作者 François Chollet,同时也是根据他撰写的《Deeping Learning with Python》一书第 9 章第 2 节改编的。关于当前深度学习的局限性及其未来的思考,François Chollet 共撰写了两篇文章,这篇是其中第一篇。
凭借数百万和数十亿的数值参数,深度学习模型可以做到很多的事情,例如,检测照片中的对象、识别语音、生成文本以及隐藏恶意软件。加州大学圣地亚哥分校和伊利诺伊大学的研究人员发现,神经网络可以在不触发反恶意软件的情况下嵌入恶意负载。
使用tf.keras,您可以设计,拟合,评估和使用深度学习模型,从而仅用几行代码即可做出预测。它使普通的深度学习任务(如分类和回归预测建模)可供希望完成任务的普通开发人员使用。
超级计算机深度学习研讨会已经发出了征文的呼吁。该活动将于6月25日在德国法兰克福举行,作为ISC 2020的一部分。
想要了解什么是自监督注意力机制,我们可能需要先去了解什么是光流估计(optical flow estimation),以及它为何被人类和计算机视觉系统作为一种目标跟踪方法。
就像在学校上课一样,神经网络在“训练”阶段得到的教育跟大多数人一样——学会去做一份工作。
生产环境中使用Apache Kafka的可扩展的机器学习 智能实时应用程序是任何行业的游戏规则改变者。机器学习及其子课题深度学习正在获得动力,因为机器学习使计算机能够在没有明确程序设计的情况下找到隐藏的见解。分析非结构化数据,图像识别,语音识别和智能决策需要此功能。这与使用Java,.NET或Python的传统编程有很大的不同。 虽然机器学习背后的概念并不新鲜,但大数据集和处理能力的可用性使得每个企业都可以构建强大的分析模型。任何行业都有大量的使用案例,通过在企业应用程序和微服务中应用分析模型来增加收入,
三百六十行,行行不仅出状元,还出“黑话” 今天,小编为大家倾情整理“深度学习行业黑话解析” 一起show起来! (温馨提示:建议阅读时间8分钟) “学习”概念区分 人工智能:人工智能的发展依赖于计算
信任是实现深度学习应用程序的关键因素。从培训到优化,深度学习模型的生命周期与各方之间的可信数据交换相关联。这种动态对于实验室环境当然是有效的,但是结果容易受到各种各样的安全攻击,这些攻击操纵模型中不同参与者之间的信任关系。让我们以信用评分模型为例,该模型使用金融事务对特定客户的信用风险进行分类。传统的培训或优化模型的机制假定,执行这些操作的实体将完全访问这些金融数据集,从而为各种隐私风险打开大门。随着深度学习的发展,在数据集和模型的生命周期中,对加强隐私约束的机制的需求变得越来越重要。在试图解决这一重大挑战的技术中,PySyft是最近在深度学习社区中逐渐获得吸引力的框架。
机器之心报道 编辑:陈萍 Facebook 近日开源了数据增强库 AugLy,包含四个子库,每个子库对应不同的模态,每个库遵循相同的接口。支持四种模态:文本、图像、音频和视频。 最近,Facebook 开源了一个新的 Python 库——AugLy,该库旨在帮助 AI 研究人员使用数据增强来评估和改进机器学习模型的可用性。AugLy 提供了复杂的数据增强工具,可以创建样本来训练和测试不同的系统。 项目地址:https://github.com/facebookresearch/AugLy 该库基于 Fa
作者 | Francois Chollet 编译 | 聂震坤 深度学习:几何视图 深度学习最令人惊讶的特点便是极易上手。十年以前,没有人可以猜得到经过梯度下降法训练过的简单参数模型可以在机器感知问题上实现如此惊人的结果。现在,事实证明,研究者所需要做的只是使用足够大的梯度下降素材来训练参数模型。正如 Feynman 曾经描述宇宙一样,“它并不复杂,只是里面包含的东西实在太多。” 在深度学习中,所有的东西都是一个向量(任何的东西都是几何空间中的一个点)。模型的输入(可能是文字,图片,等等)和目标首先被向量化
文本分类是自然语言处理中最基本的任务。由于深度学习的空前成功,过去十年中该领域的研究激增。已有的文献提出了许多方法,数据集和评估指标,从而需要对这些内容进行全面的总结。本文回顾1961年至2020年的文本分类方法,重点是从浅层学习到深度学习的模型。根据所涉及的文本以及用于特征提取和分类的模型创建用于文本分类的分类法。然后,详细讨论这些类别中的每一个类别,涉及支持预测测试的技术发展和基准数据集。并提供了不同技术之间的全面比较,确定了各种评估指标的优缺点。最后,通过总结关键含义,未来的研究方向以及研究领域面临的挑战进行总结。
摘要。文本分类是自然语言处理中最基本的任务。由于深度学习的空前成功,过去十年中该领域的研究激增。已有的文献提出了许多方法,数据集和评估指标,从而需要对这些内容进行全面的总结。本文回顾1961年至2020年的文本分类方法,重点是从浅层学习到深度学习的模型。根据所涉及的文本以及用于特征提取和分类的模型创建用于文本分类的分类法。然后,详细讨论这些类别中的每一个类别,涉及支持预测测试的技术发展和基准数据集。并提供了不同技术之间的全面比较,确定了各种评估指标的优缺点。最后,通过总结关键含义,未来的研究方向以及研究领域面临的挑战进行总结。
深度学习:几何视图 深度学习最令人惊讶的特点便是极易上手。十年以前,没有人可以猜得到经过梯度下降法训练过的简单参数模型可以在机器感知问题上实现如此惊人的结果。现在,事实证明,研究者所需要做的只是使用足够大的梯度下降素材来训练参数模型。正如 Feynman 曾经描述宇宙一样,“它并不复杂,只是里面包含的东西实在太多。” 在深度学习中,所有的东西都是一个向量(任何的东西都是几何空间中的一个点)。模型的输入(可能是文字,图片,等等)和目标首先被向量化(变成了一些初始输入向量空间和目标向量空间)。深度学习模型中的每
AiTechYun 编辑:nanan 随着AI应用程序和深度学习算法的成熟,许多组织正在制定计划,以弄清楚它们将如何从数据中提取差异化竞争优势。 事实上,在过去的5-10年里,许多公司都在收集数据,因
文章首发于本人CSDN账号:https://blog.csdn.net/tefuirnever
今天为大家介绍的是来自Nathan C. Frey团队的一篇论文。在数据可用性和计算量方面的大规模扩展,使得深度学习在自然语言处理和计算机视觉等关键应用领域实现了重要突破。越来越多的证据表明,在科学深度学习中,规模可能是一个关键因素,但科学领域中物理先验的重要性使得规模扩展的策略和益处尚不确定。在这里,作者通过改变模型和数据集的大小(跨越多个数量级),研究了大型化学模型中的神经缩放行为,研究对象包括拥有超过十亿参数的模型,这些模型在高达一千万数据点的数据集上进行了预训练。
Azure 机器学习是一种用于加速和管理机器学习项目生命周期的云服务。机器学习专业人员、数据科学家和工程师可以在日常工作流中使用它:训练和部署模型,以及管理 MLOps。可以在 Azure 机器学习中创建模型,也可以使用从开源平台构建的模型,例如 Pytorch、TensorFlow 或 scikit-learn。MLOps 工具有助于监视、重新训练和重新部署模型。
导语:腾讯广告算法团队关于库存预估的论文《 Large-scale User Visits Understanding and Forecasting with Deep Spatial-Temporal Tensor Factorization Framework》被CCF A类学术会议KDD2019录用。论文提出了一种适用于大规模广告库存预估的深度学习算法,对交叉特征以及时间特征进行建模,从而对广告库存进行精确的预估。
在过去的几年里,有不少讲深度学习的书籍。今天给小伙伴们推荐8本关于AI和机器学习的经典书籍,大部分都有完整版PDF下载。
构建包含图像、文本和表格数据集的机器学习应用程序并不容易。它需要特征工程,或者使用数据领域的知识来创建AI算法工作的特征,再加上大量的数据集预处理,以确保在训练过的模型中不会出现偏差。这大概就是亚马逊开发AutoGluon的原因,旨在让开发人员只需几行代码就可以编写充满智能的应用程序。
不论环境如何,建立、监控和完善机器学习系统从来都不是一件简单的事情。要想保证数据准确无误,工程师们必须把控好每一个细节,在复杂的应用程序中发现问题。为了在一定程度上减轻开发者的负担,苹果公司开发了Overton框架,该框架旨在通过抽象的文本内容来生成一个对应的模型。例如,给定查询“美国的总统有多高”,Overton生成一个能够提供答案的模型。(目前它只支持文本处理,但苹果正在开发图像和视频的处理。)
本文简要介绍深度学习以及它支持的一些现有信息安全应用,并提出一个基于深度学习的TOR流量检测方案。
Schneider, R., Bonavita, M., Geer, A. et al. ESA-ECMWF Report on recent progress and research directions in machine learning for Earth System observation and prediction. npj Clim Atmos Sci 5, 51 (2022). https://doi.org/10.1038/s41612-022-00269-z
Memrise是一家英国创业公司,其语言学习应用程序使用AI来适应其客户的语言学习需求,募集了1500万美元的资金用于扩展其产品。
术语 LLMOps 代表大型语言模型运维。它的简短定义是 LLMOps 是 LLM 的 MLOps。这意味着 LLMOps 是一组工具和最佳实践,用于管理 LLM 支持的应用程序的生命周期,包括开发、部署和维护。
卷积神经网络的深度学习使计算机更加有效、全面的处理图像,生物学领域正在逐渐运用这一技术,它能使细胞、基因等图像更加清晰,使机器看到更多人类从未见过的东西。 眼睛被认为是心灵的窗口——而谷歌的研究人员把它看作是一个人的健康指示器。这家科技巨头正在通过分析人视网膜照片,利用深度学习来预测人的血压、年龄和吸烟状况。谷歌(Google)的计算机从血管的排列中收集线索——一项初步研究表明,这些机器可以利用这些信息来预测一个人是否有心脏病发作的危险。 这项研究依赖于一种卷积神经网络,这是一种深层学习算法,它正在改变生物
呜啦啦啦啦啦啦啦大家好,拖更的AI Scholar Weekly栏目又和大家见面啦!
给一个庞大的GPU集群,在实际的应用中,现有的大数据调度器会导致长队列延迟和低的性能,该文章提出了Tiresias,即一个GPU集群的调度器,专门适应分布式深度学习任务,该调度器能够有效率的调度并且合适地放置深度学习任务以减少他们的任务完成时间(JCT(Job Completion Time)),一个深度学习任务执行的时间通常是不可预知的,该文章提出两种调度算法,基于局部信息的离散化二维Gittins索引(Discretized Two Dimensional Gittins index)以及离散化二维LAS,对信息不可知并且能够降低平均的JCT,在实验中JCT能够快5.5倍,相比于基于Apache YARN的资源管理
机器之心专栏 机器之心编辑部 本文提出了一个图像去模糊方向的综述,来自澳大利亚国立大学、中山大学、美国加州大学 Merced 分校、日本乐天研究所的研究者回顾了基于深度学习的图像去模糊技术研究进展,回顾了图像去模糊的研究历史,总结了当前的研究进展,并进行了展望。该综述近期被计算机视觉旗舰期刊 International Journal of Computer Vision 接收。 链接:https://link.springer.com/article/10.1007/s11263-022-01633-
在大家开始深度学习时,几乎所有的入门教程都会提到CUDA这个词。那么什么是CUDA?她和我们进行深度学习的环境部署等有什么关系?通过查阅资料,我整理了这份简洁版CUDA入门文档,希望能帮助大家用最快的时间尽可能清晰的了解这个深度学习赖以实现的基础概念。
【新智元导读】 中国香港浸会大学褚晓文教授团队在2016年推出深度学习工具评测的研究报告《基准评测 TensorFlow、Caffe、CNTK、MXNet、Torch 在三类流行深度神经网络上的表现》,并在2017年年初发布更新,引起广泛关注。在本次专访中,褚晓文教授介绍了各个工具的优势和劣势,并谈到了TPU崛起对GPU的影响。本文后半部分是褚晓文教授在AICC大会上的演讲实录和PPT。 📷 中国香港浸会大学褚晓文教授团队在2016年推出深度学习工具评测的研究报告,并在2017年年初发布更新,引
选自NextPlatform 机器之心编译 对于开发者而言,深度学习系统的交互性和复杂度正在增加。从建立不断迭代强化的可扩展性数据集,到更多动态模型,再到神经网络内部更加连续的学习,这使得通过轻量级工具全面管理深度学习开发的需求也越发强大。而 TensorLayer 正是这样一种可管理深度学习开发复杂度的工具。 「甚至在部署之后,新的训练样本、人类的见解以及操作经验会不断出现,因此升级模型并跟踪其变化的能力变得不可或缺。」伦敦帝国理工学院的一个团队说,他们开发了一个库,用来管理深度学习开发者在复杂的多项目上
对话式 AI (聊天机器人)涉及到三个维度的问题:(1)语言技能(2)知识获取(3)对话行为。 这三者虽然强相关,但人类大脑通过单独的实验,在不同的时间段内,可能使用不同的神经区域来获得这些优点。 因此,开发整个过程的计算机模型也需要一些单独的处理和分布式方法。 深度学习提供了一个看上去可行的模型。 但是,它会在一个单一的模式下将所有数据都集成到大量的数据需求中。 这也与我们如何通过阅读学习相矛盾。和深度学习不同,我们每次阅读新文章时,显然不会重新学习语言技能。语言和知识能否分开处理,使后者的成长不需要与前
作者 Peter Gao 是 Aquarium 公司的联合创始人和首席执行官(CEO),Aquarium 公司建立了寻找和修复深度学习数据集问题的工具。在 Aquarium 之前,Peter 曾从事自动驾驶汽车、教育和社交媒体的机器学习,就职于 Cruise 等公司。本文是他结合数年在工业领域生产实践的经验,总结出关于深度学习的心得领会。 作者 | Peter Gao 编译 | 刘冰一 编辑 | 陈彩娴 当我大学毕业后开始第一份工作时,我自认为对机器学习了解不少。我曾在 Pinterest 和可汗学院(Kh
TensorFlowOnSpark 项目是由Yahoo开源的一个软件包,实现TensorFlow集群服务部署在Spark平台之上。 大家好,这次我将分享TensorFlow On Spark的解决方案
美国“数据科学中心”(Data Science Central)网站的编辑总监William Vorhies撰文表示,量子计算、神经形态计算和超级计算可以带来更快、更简单、更廉价、更聪明的人工智能。 人工智能与深度学习存在一个问题—实际上是三个。 时间:训练像卷积神经网络(CNN)或循环神经网络(RNN)[A1] 这样的深度网络可能需要几周时间。这还不包括深度网络在达到所需的性能阈值之前定义问题以及深度网络编程过程中的不断成功与失败所耗费的数周甚至数月的时间。 成本:让数百个图形处理器(GPU)连续进行数周
领取专属 10元无门槛券
手把手带您无忧上云