首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

【深度干货】专知主题链路知识推荐#7-机器学习中似懂非懂的马尔科夫链蒙特卡洛采样(MCMC)入门教程02

【导读】主题链路知识是我们专知的核心功能之一,为用户提供AI领域系统性的知识学习服务,一站式学习人工智能的知识,包含人工智能( 机器学习、自然语言处理、计算机视觉等)、大数据、编程语言、系统架构。使用请访问专知 进行主题搜索查看 - 桌面电脑访问www.zhuanzhi.ai, 手机端访问www.zhuanzhi.ai 或关注微信公众号后台回复" 专知"进入专知,搜索主题查看。今天给大家继续介绍我们独家整理的机器学习——马尔科夫链蒙特卡洛采样(MCMC)方法。 上一次我们详细介绍了机器学习中似懂非懂的马尔

06

实现一个h264编码器前期准备

H264是新一代的编码标准,以高压缩高质量和支持多种网络的流媒体传输著称,在编码方面,我理解的他的理论依据是:参照一段时间内图像的统计结果表明,在相邻几幅图像画面中,一般有差别的像素只有10%以内的点,亮度差值变化不超过2%,而色度差值的变化只有1%以内。所以对于一段变化不大图像画面,我们可以先编码出一个完整的图像帧A,随后的B帧就不编码全部图像,只写入与A帧的差别,这样B帧的大小就只有完整帧的1/10或更小!B帧之后的C帧如果变化不大,我们可以继续以参考B的方式编码C帧,这样循环下去。这段图像我们称为一个序列(序列就是有相同特点的一段数据),当某个图像与之前的图像变化很大,无法参考前面的帧来生成,那我们就结束上一个序列,开始下一段序列,也就是对这个图像生成一个完整帧A1,随后的图像就参考A1生成,只写入与A1的差别内容。

04

PMLR|基于片段的分子深度生成模型

今天给大家介绍的是意大利比萨大学的Marco Podda等人在PMLR上发表的文章“A Deep Generative Model for Fragment-Based Molecule Generation”。在文章中,作者受基于片段的药物设计的启发,设计了一种使用分子片段的语言模型。该模型使用分子片段作为基本单位,而不是原子,从而解决了传统基于分子文本表示方法中的两个问题:产生无效分子和重复分子。为了提高产生分子的独特性,作者提出了一种基于频率的掩蔽策略,它有助于产生具有低频片段的分子。实验表明,该模型在很大程度上优于其他基于分子文本表示的模型,达到了基于图表示分子方法最先进的性能。此外,此方法生成的分子即使在没有明确监督时,仍然表现出类似于训练样本中的分子性质。

01

ICLR2021 | 利用数据扩充提高蛋白质序列模型的通用性

今天给大家介绍投稿在ICLR2021上的一项工作。由于蛋白质序列上的微小改变可能导致其功能上难以预测的变化,所以蛋白质序列往往无法使用类似于计算机视觉或自然语言处理中所使用的随机数据扩充方法。针对以上问题,作者从经验上探索了一组简单的字符串操作,当微调半监督蛋白质模型时,可使用这些操作来增加蛋白质序列数据。在TAPE baseline上的结果表明,对比学习微调方法优于mask token预测微调方法,随着数据扩充量的增加,对比学习方法的性能随之提高。当使用域驱动的转化以及将Transformer的注意力限制在蛋白质序列的随机采样子区域时,跨TAPE任务的结果最一致。在极少数情况下,破坏信息的扩充方式可以改善下游任务表现。

04

流体运动估计光流算法研究

大家好!我是苏州程序大白,今天讲讲流体运动估计光流算法研究。请大家多多关注支持我。谢谢!!! 简介: 对流体图像序列进行运动分析一直是流体力学、医学和计算机视觉等领域的重要研究课题。 从图像对中提取的密集精确的速度矢量场能够为许多领域提供有价值的信息,基于光流法的流体运动估计技术因其独特的优势成为一个有前途的方向。 光流法可以获得具有较高分辨率的密集速度矢量场,在小尺度精细结构的测量上有所改进,弥补了基于相关分析法的粒子图像测速技术的不足。 此外,光流方法还可以方便的引入各种物理约束,获得较为符合流体运动特性的运动估计结果。 为了全面反映基于光流法的流体运动估计算法的研究进展,本文在广泛调研相关文献的基础上,对国内外具有代表性的论文进行了系统阐述。 首先介绍了光流法的基本原理,然后将现有算法按照要解决的突出问题进行分类:结合流体力学知识的能量最小化函数,提高对光照变化的鲁棒性,大位移估计和消除异常值。 对每类方法,从问题解决过程的角度予以介绍,分析了各类突出问题中现有算法的特点和局限性。 最后,总结分析了流体运动估计技术当前面临的问题和挑战,并对未来基于光流法的运动估计算法的研究方向和研究重点进行了展望。 定义: 流体运动估计技术在日常生活的众多领域发挥着重要作用,对从流体图像序列中提取的速度场进行分析,有助于更深入地了解复杂的流体运动并提取有用的信息。粒子图像测速( particle image velocimetry,PIV)(Adrian,1991)是一种广泛使用的流体运动估计技术。 其基于两个连续粒子图像之间局部空间性,通过搜索图像对的两个查询窗口之间互相关的最大值,获得查询窗口之间的位移矢量。 这种依赖于互相关函数的PIV 技术虽然能够简单有效地从图像序列间获取速度矢量场,但仍存在许多不足。 首先,其假设查询窗口内的位移矢量保持一致,这使得获取的速度场空间分辨率低,无法测量流场中的小尺度精细结构。 其次,PIV 技术主要用于粒子图像,无法可靠获取标量图像的速度矢量场。 最后,PIV技术缺乏物理解释,对图像序列进行运动估计时,平等地对待各种性质的运动物体。研究发现光流法非常适合流体运动估计( Li等,2015)。 与基于互相关的 PIV 技术相比,光流法可以获取更加密集的速度场,而且可以对标量图像进行运动估计而不仅限于粒子图像。 此外,与 PI技术相比,光流法更能适应各种物理约束。 基于光流法的流体运动技术是对 PIV 技术的良好补充。虽然现有的基于光流法的流体运动估计技术已经广泛用于各种流体测速场景,但仍存在计算耗时鲁棒性不足等问题。 本文从光流法的基本原理入手,根据光流法需要解决的几个关键问题对现有的算法进行分类,并对每一类方法从问题解决的角度予以介绍。

02

《机器学习实战:基于Scikit-Learn、Keras和TensorFlow》第16章 使用RNN和注意力机制进行自然语言处理

自然语言处理的常用方法是循环神经网络。所以接下来会从 character RNN 开始(预测句子中出现的下一个角色),继续介绍RNN,这可以让我们生成一些原生文本,在过程中,我们会学习如何在长序列上创建TensorFlow Dataset。先使用的是无状态RNN(每次迭代中学习文本中的随机部分),然后创建一个有状态RNN(保留训练迭代之间的隐藏态,可以从断点继续,用这种方法学习长规律)。然后,我们会搭建一个RNN,来做情感分析(例如,读取影评,提取评价者对电影的感情),这次是将句子当做词的序列来处理。然后会介绍用RNN如何搭建编码器-解码器架构,来做神经网络机器翻译(NMT)。我们会使用TensorFlow Addons项目中的 seq2seq API 。

02

教程 | 从字符级的语言建模开始,了解语言模型与序列建模的基本概念

选自imaddabbura 机器之心编译 你有没有想过 Gmail 自动回复是如何进行的?或者手机在你输入文本时如何对下一个词提出建议?生成文本序列的通常方式是训练模型在给定所有先前词/字符的条件下预测下一个词/字符出现的概率。此类模型叫作统计语言模型,这种模型会尝试捕捉训练文本的统计结构,本文从字符级语言模型和名字预测出发向读者介绍了语言建模的核心概念。 循环神经网络(RNN)模型常用于训练这种语言模型,因为它们使用高维隐藏状态单元处理信息的能力非常强大,建模长期依赖关系的能力也非常强。任意语言模型的主要

05

新兴的MPEG-5 EVC标准:应用、技术与结果

三十多年以来,传媒业的数字化带来了新的服务、扩大了传统服务的覆盖范围并且给世界各地的消费者带来不断改善的视听体验。数字媒体的分发与消费中最核心的技术问题之一就是压缩,尤其是视频压缩。近几年来,行业里出现了多种不同的视频编码标准和专用的编解码器,并且新研制的编解码器的压缩性能也在不断提高。但是有时候,压缩效率并不是决定编解码器是否适合某一场景的唯一因素。本文介绍的MPEG-5 EVC(Essential Video Coding)标准是由MPEG开发的,它采用了一种新的研制思路,旨在解决业务需求,包括专利许可和技术需求,以便在整个媒体行业中实现快又广泛的部署。

05
领券