深度学习应用程序丢失数据的已知周期_深度学习:如何处理丢失的标签值_用于深度学习的白化数据 - 腾讯云开发者社区

近年来，药物科学家一直高度关注依赖于现有药物知识的新型药物开发策略。事实上，药物发现任务的困难在于已知的药物与基因相互作用位点的了解不充分，而主要风险在于药物与靶点的即副作用。尽管这些副作用大多数有害的，但有时它们会引起有趣的治疗发现。例如，米诺地尔主要用于治疗溃疡，西地那非（伟哥）用于治疗心绞痛。但是，它们目前分别用于治疗脱发和勃起功能障碍。因此，新型药物开发策略目前是许多药理学家的主要研究重点。

【数据挖掘 | 数据预处理】缺失值处理 & 重复值处理 & 文本处理确定不来看看？

🙋‍♂️声明：本人目前大学就读于大二，研究兴趣方向人工智能&硬件（虽然硬件还没开始玩，但一直很感兴趣！希望大佬带带）

您找到你想要的搜索结果了吗？

是的

没有找到

Python安装TensorFlow 2、tf.keras和深度学习模型的定义

无需标注数据集，自监督注意力机制就能搞定目标跟踪

想要了解什么是自监督注意力机制，我们可能需要先去了解什么是光流估计（optical flow estimation），以及它为何被人类和计算机视觉系统作为一种目标跟踪方法。

征文:Deep Learning on Supercomputers workshop

超级计算机深度学习研讨会已经发出了征文的呼吁。该活动将于6月25日在德国法兰克福举行，作为ISC 2020的一部分。

独家｜深度学习训练和推理之间有什么差异？

就像在学校上课一样，神经网络在“训练”阶段得到的教育跟大多数人一样——学会去做一份工作。

使用Kafka在生产环境中构建和部署可扩展的机器学习

生产环境中使用Apache Kafka的可扩展的机器学习智能实时应用程序是任何行业的游戏规则改变者。机器学习及其子课题深度学习正在获得动力，因为机器学习使计算机能够在没有明确程序设计的情况下找到隐藏的见解。分析非结构化数据，图像识别，语音识别和智能决策需要此功能。这与使用Java，.NET或Python的传统编程有很大的不同。虽然机器学习背后的概念并不新鲜，但大数据集和处理能力的可用性使得每个企业都可以构建强大的分析模型。任何行业都有大量的使用案例，通过在企业应用程序和微服务中应用分析模型来增加收入，

技术｜深度学习技术黑话合辑

三百六十行，行行不仅出状元，还出“黑话” 今天，小编为大家倾情整理“深度学习行业黑话解析” 一起show起来！（温馨提示：建议阅读时间8分钟） “学习”概念区分人工智能：人工智能的发展依赖于计算

PySyft与隐私深度学习的兴起

信任是实现深度学习应用程序的关键因素。从培训到优化，深度学习模型的生命周期与各方之间的可信数据交换相关联。这种动态对于实验室环境当然是有效的，但是结果容易受到各种各样的安全攻击，这些攻击操纵模型中不同参与者之间的信任关系。让我们以信用评分模型为例，该模型使用金融事务对特定客户的信用风险进行分类。传统的培训或优化模型的机制假定，执行这些操作的实体将完全访问这些金融数据集，从而为各种隐私风险打开大门。随着深度学习的发展，在数据集和模型的生命周期中，对加强隐私约束的机制的需求变得越来越重要。在试图解决这一重大挑战的技术中，PySyft是最近在深度学习社区中逐渐获得吸引力的框架。

全方位支持图文和音视频、100+增强功能，Facebook开源数据增强库AugLy

机器之心报道编辑：陈萍 Facebook 近日开源了数据增强库 AugLy，包含四个子库，每个子库对应不同的模态，每个库遵循相同的接口。支持四种模态：文本、图像、音频和视频。最近，Facebook 开源了一个新的 Python 库——AugLy，该库旨在帮助 AI 研究人员使用数据增强来评估和改进机器学习模型的可用性。AugLy 提供了复杂的数据增强工具，可以创建样本来训练和测试不同的系统。项目地址：https://github.com/facebookresearch/AugLy 该库基于 Fa

一文带你理解深度学习的局限性

作者 | Francois Chollet 编译 | 聂震坤深度学习：几何视图深度学习最令人惊讶的特点便是极易上手。十年以前，没有人可以猜得到经过梯度下降法训练过的简单参数模型可以在机器感知问题上实现如此惊人的结果。现在，事实证明，研究者所需要做的只是使用足够大的梯度下降素材来训练参数模型。正如 Feynman 曾经描述宇宙一样，“它并不复杂，只是里面包含的东西实在太多。” 在深度学习中，所有的东西都是一个向量（任何的东西都是几何空间中的一个点）。模型的输入（可能是文字，图片，等等）和目标首先被向量化

2021最新文本综述：从浅层到深度学习（附PDF下载）

文本分类是自然语言处理中最基本的任务。由于深度学习的空前成功，过去十年中该领域的研究激增。已有的文献提出了许多方法，数据集和评估指标，从而需要对这些内容进行全面的总结。本文回顾1961年至2020年的文本分类方法，重点是从浅层学习到深度学习的模型。根据所涉及的文本以及用于特征提取和分类的模型创建用于文本分类的分类法。然后，详细讨论这些类别中的每一个类别，涉及支持预测测试的技术发展和基准数据集。并提供了不同技术之间的全面比较，确定了各种评估指标的优缺点。最后，通过总结关键含义，未来的研究方向以及研究领域面临的挑战进行总结。

A Survey on Text Classification: From Shallow to Deep Learning-文本分类大综述

摘要。文本分类是自然语言处理中最基本的任务。由于深度学习的空前成功，过去十年中该领域的研究激增。已有的文献提出了许多方法，数据集和评估指标，从而需要对这些内容进行全面的总结。本文回顾1961年至2020年的文本分类方法，重点是从浅层学习到深度学习的模型。根据所涉及的文本以及用于特征提取和分类的模型创建用于文本分类的分类法。然后，详细讨论这些类别中的每一个类别，涉及支持预测测试的技术发展和基准数据集。并提供了不同技术之间的全面比较，确定了各种评估指标的优缺点。最后，通过总结关键含义，未来的研究方向以及研究领域面临的挑战进行总结。

0114

2020最新文本综述：从浅层到深度学习（附PDF下载）

一文带你理解深度学习的局限性

深度学习：几何视图深度学习最令人惊讶的特点便是极易上手。十年以前，没有人可以猜得到经过梯度下降法训练过的简单参数模型可以在机器感知问题上实现如此惊人的结果。现在，事实证明，研究者所需要做的只是使用足够大的梯度下降素材来训练参数模型。正如 Feynman 曾经描述宇宙一样，“它并不复杂，只是里面包含的东西实在太多。” 在深度学习中，所有的东西都是一个向量（任何的东西都是几何空间中的一个点）。模型的输入（可能是文字，图片，等等）和目标首先被向量化（变成了一些初始输入向量空间和目标向量空间）。深度学习模型中的每

【业界】创建深度学习数据平台时，你需要考虑的五个因素

AiTechYun 编辑：nanan 随着AI应用程序和深度学习算法的成熟，许多组织正在制定计划，以弄清楚它们将如何从数据中提取差异化竞争优势。事实上，在过去的5-10年里，许多公司都在收集数据，因

从零开始深度学习（二）：深度学习简介

文章首发于本人CSDN账号:https://blog.csdn.net/tefuirnever

Nat. Mach. Intell. | 深度化学模型的神经缩放

今天为大家介绍的是来自Nathan C. Frey团队的一篇论文。在数据可用性和计算量方面的大规模扩展，使得深度学习在自然语言处理和计算机视觉等关键应用领域实现了重要突破。越来越多的证据表明，在科学深度学习中，规模可能是一个关键因素，但科学领域中物理先验的重要性使得规模扩展的策略和益处尚不确定。在这里，作者通过改变模型和数据集的大小（跨越多个数量级），研究了大型化学模型中的神经缩放行为，研究对象包括拥有超过十亿参数的模型，这些模型在高达一千万数据点的数据集上进行了预训练。

KDD 2019 | 腾讯广告算法团队关于库存预估的一作论文被 KDD 2019 录用

导语：腾讯广告算法团队关于库存预估的论文《 Large-scale User Visits Understanding and Forecasting with Deep Spatial-Temporal Tensor Factorization Framework》被CCF A类学术会议KDD2019录用。论文提出了一种适用于大规模广告库存预估的深度学习算法，对交叉特征以及时间特征进行建模，从而对广告库存进行精确的预估。

Azure - 机器学习企业级服务概述与介绍

Azure 机器学习是一种用于加速和管理机器学习项目生命周期的云服务。机器学习专业人员、数据科学家和工程师可以在日常工作流中使用它：训练和部署模型，以及管理 MLOps。可以在 Azure 机器学习中创建模型，也可以使用从开源平台构建的模型，例如 Pytorch、TensorFlow 或 scikit-learn。MLOps 工具有助于监视、重新训练和重新部署模型。

2022新年荐书！最值得一读的8部机器学习教程（PDF下载）

在过去的几年里，有不少讲深度学习的书籍。今天给小伙伴们推荐8本关于AI和机器学习的经典书籍，大部分都有完整版PDF下载。

亚马逊的AutoGluon只需3行代码即可生成AI模型

构建包含图像、文本和表格数据集的机器学习应用程序并不容易。它需要特征工程，或者使用数据领域的知识来创建AI算法工作的特征，再加上大量的数据集预处理，以确保在训练过的模型中不会出现偏差。这大概就是亚马逊开发AutoGluon的原因，旨在让开发人员只需几行代码就可以编写充满智能的应用程序。

【AI模型】AI模型部署概述

在AI深度学习模型的训练中，一般会用Python语言实现，原因是其灵活、可读性强。但在AI模型实际部署中，主要会用到C++，原因在于其语言自身的高效性。

苹果发布了Overton开发工具

不论环境如何，建立、监控和完善机器学习系统从来都不是一件简单的事情。要想保证数据准确无误，工程师们必须把控好每一个细节，在复杂的应用程序中发现问题。为了在一定程度上减轻开发者的负担，苹果公司开发了Overton框架，该框架旨在通过抽象的文本内容来生成一个对应的模型。例如，给定查询“美国的总统有多高”，Overton生成一个能够提供答案的模型。(目前它只支持文本处理，但苹果正在开发图像和视频的处理。)

npj | ESA-ECMWF: 机器学习在地球系统观测和预测方面应用的最新进展和研究方向

Schneider, R., Bonavita, M., Geer, A. et al. ESA-ECMWF Report on recent progress and research directions in machine learning for Earth System observation and prediction. npj Clim Atmos Sci 5, 51 (2022). https://doi.org/10.1038/s41612-022-00269-z

独家 | 一文读懂如何用深度学习实现网络安全

本文简要介绍深度学习以及它支持的一些现有信息安全应用，并提出一个基于深度学习的TOR流量检测方案。

Memrise利用AI调整教学内容，帮助用户学习多门外语

Memrise是一家英国创业公司，其语言学习应用程序使用AI来适应其客户的语言学习需求，募集了1500万美元的资金用于扩展其产品。

大模型时代的模型运维与部署：LLMops

术语 LLMOps 代表大型语言模型运维。它的简短定义是 LLMOps 是 LLM 的 MLOps。这意味着 LLMOps 是一组工具和最佳实践，用于管理 LLM 支持的应用程序的生命周期，包括开发、部署和维护。

深度学习能使细胞和基因图像更加清晰

卷积神经网络的深度学习使计算机更加有效、全面的处理图像，生物学领域正在逐渐运用这一技术，它能使细胞、基因等图像更加清晰，使机器看到更多人类从未见过的东西。眼睛被认为是心灵的窗口——而谷歌的研究人员把它看作是一个人的健康指示器。这家科技巨头正在通过分析人视网膜照片，利用深度学习来预测人的血压、年龄和吸烟状况。谷歌（Google）的计算机从血管的排列中收集线索——一项初步研究表明，这些机器可以利用这些信息来预测一个人是否有心脏病发作的危险。这项研究依赖于一种卷积神经网络，这是一种深层学习算法，它正在改变生物

还在嫌弃猪队友？新研究加速人机协作学习，靠谱队友你值得拥有 | 一周AI最火论文

呜啦啦啦啦啦啦啦大家好，拖更的AI Scholar Weekly栏目又和大家见面啦！

分布式深度学习GPU管理之Tiresias

给一个庞大的GPU集群，在实际的应用中，现有的大数据调度器会导致长队列延迟和低的性能，该文章提出了Tiresias，即一个GPU集群的调度器，专门适应分布式深度学习任务，该调度器能够有效率的调度并且合适地放置深度学习任务以减少他们的任务完成时间（JCT(Job Completion Time)），一个深度学习任务执行的时间通常是不可预知的，该文章提出两种调度算法，基于局部信息的离散化二维Gittins索引(Discretized Two Dimensional Gittins index)以及离散化二维LAS，对信息不可知并且能够降低平均的JCT，在实验中JCT能够快5.5倍，相比于基于Apache YARN的资源管理

CUDA是什么-CUDA简介「建议收藏」

在大家开始深度学习时，几乎所有的入门教程都会提到CUDA这个词。那么什么是CUDA？她和我们进行深度学习的环境部署等有什么关系？通过查阅资料，我整理了这份简洁版CUDA入门文档，希望能帮助大家用最快的时间尽可能清晰的了解这个深度学习赖以实现的基础概念。

IJCV收录！深度去模糊综述论文来了

机器之心专栏机器之心编辑部本文提出了一个图像去模糊方向的综述，来自澳大利亚国立大学、中山大学、美国加州大学 Merced 分校、日本乐天研究所的研究者回顾了基于深度学习的图像去模糊技术研究进展，回顾了图像去模糊的研究历史，总结了当前的研究进展，并进行了展望。该综述近期被计算机视觉旗舰期刊 International Journal of Computer Vision 接收。链接：https://link.springer.com/article/10.1007/s11263-022-01633-

【深度学习框架大PK】褚晓文教授：五大深度学习框架三类神经网络全面测评（23PPT）

【新智元导读】中国香港浸会大学褚晓文教授团队在2016年推出深度学习工具评测的研究报告《基准评测 TensorFlow、Caffe、CNTK、MXNet、Torch 在三类流行深度神经网络上的表现》，并在2017年年初发布更新，引起广泛关注。在本次专访中，褚晓文教授介绍了各个工具的优势和劣势，并谈到了TPU崛起对GPU的影响。本文后半部分是褚晓文教授在AICC大会上的演讲实录和PPT。 📷 中国香港浸会大学褚晓文教授团队在2016年推出深度学习工具评测的研究报告，并在2017年年初发布更新，引

资源 | 详解帝国理工集成工具TensorLayer：控制深度学习开发复杂度

选自NextPlatform 机器之心编译对于开发者而言，深度学习系统的交互性和复杂度正在增加。从建立不断迭代强化的可扩展性数据集，到更多动态模型，再到神经网络内部更加连续的学习，这使得通过轻量级工具全面管理深度学习开发的需求也越发强大。而 TensorLayer 正是这样一种可管理深度学习开发复杂度的工具。「甚至在部署之后，新的训练样本、人类的见解以及操作经验会不断出现，因此升级模型并跟踪其变化的能力变得不可或缺。」伦敦帝国理工学院的一个团队说，他们开发了一个库，用来管理深度学习开发者在复杂的多项目上

人工智能安全：是营销炒作还是全新机会

作者 | Mark Horvath 译者 | 人人云图（AoGraph）：杨鹏，曹靖出品 | 人工智能头条（公众号ID：AI_Thinker）本文来自Gartner分析报告，原标题：Artificial Intelligence and Application Security Vendors: Marketing Hype or Genuine Hope在今天，企业的安全和风险负责人需要判断在研发、运维以及应用程序安全测试中使用人工智能或机器学习是否具有实际价值。他们必须能够意识到应用人工智能和机

深度学习 VS 深度克隆，谁才是解决聊天机器人的最佳方法？

对话式 AI (聊天机器人)涉及到三个维度的问题：(1)语言技能(2)知识获取(3)对话行为。这三者虽然强相关，但人类大脑通过单独的实验，在不同的时间段内，可能使用不同的神经区域来获得这些优点。因此，开发整个过程的计算机模型也需要一些单独的处理和分布式方法。深度学习提供了一个看上去可行的模型。但是，它会在一个单一的模式下将所有数据都集成到大量的数据需求中。这也与我们如何通过阅读学习相矛盾。和深度学习不同，我们每次阅读新文章时，显然不会重新学习语言技能。语言和知识能否分开处理，使后者的成长不需要与前

Aquarium华人CEO分享：机器学习在自动驾驶中落地，核心不是模型，是管道

作者 Peter Gao 是 Aquarium 公司的联合创始人和首席执行官（CEO），Aquarium 公司建立了寻找和修复深度学习数据集问题的工具。在 Aquarium 之前，Peter 曾从事自动驾驶汽车、教育和社交媒体的机器学习，就职于 Cruise 等公司。本文是他结合数年在工业领域生产实践的经验，总结出关于深度学习的心得领会。作者 | Peter Gao 编译 | 刘冰一编辑 | 陈彩娴当我大学毕业后开始第一份工作时，我自认为对机器学习了解不少。我曾在 Pinterest 和可汗学院（Kh

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐