在 AI for Science 的规模化推广过程中,低门槛使用且开源的高性能工具至关重要。一方面,科研人员能够通过上手使用,更加直观地了解 AI 的能力;另一方面,当团队中缺乏交叉学科人才时,已有工具能够减少科研人员探索 AI 应用的成本,加速研究进程。
项目背景 上海纽约大学是国家教育部正式批准的、具有独立法人资格和学位授予权的第一所中美合作举办的国际化学,也是纽约大学全球教育体系的组成部分。学校配置国际一流的软硬件环境,支持高校师生科研事业,提高学术素养。 📷 上海纽约大学的计算化学是一个重点发展的研究方向。随着现代计算方法和高性能计算的进步,研究人员精确模拟化学和生物系统及预测其性质的能力得到了极大的提升。华东师范大学-纽约大学计算化学联合研究中心(上海纽约大学)成立于这样的背景之下。该中心从事的研究领域涉及到广泛定义的计算化学研究,报告材料科学,生物
微软研究院的全球项目:强化学习开放源代码节(RL Open Source Fest),目前已经开始面向全球接受申请。
当谈论强化学习时,我们在讨论一种机器学习方法,其目标是教会智能体(agent)在与环境的交互中学习最优的行为策略,以最大化累积奖励。在本文中,我们将介绍强化学习的基本概念,并使用 Python 和 OpenAI 的 Gym 库来实现一个简单的强化学习算法:Q-learning。
随着大数据和人工智能技术的快速发展,深度学习已经成为了机器学习领域最具前景的一个分支。Python作为一种功能强大、易于学习和使用的编程语言,已经成为了深度学习领域最流行的语言之一。Python拥有众多的深度学习库和框架,如TensorFlow、PyTorch和Keras等,这些库和框架提供了快速构建和训练深度神经网络的工具和算法。
CDK是结构化学信息学和生物信息学的开源Java库。 该项目由Christoph Steinbeck,Egon Willighagen与Jmol和JChemPaint的开发人员Dan Gezelter于2000年发起。迄今为止,它是在科学界广泛支持下开展的最活跃的开源化学信息学项目之一。
【导读】昨天 Google DeepMind在Nature上发表最新论文,介绍了迄今最强最新的版本AlphaGo Zero,不使用人类先验知识,使用纯强化学习,将价值网络和策略网络整合为一个架构,3天训练后就以100比0击败了上一版本的AlphaGo。Alpha Zero的背后核心技术是深度强化学习,为此,专知有幸邀请到叶强博士根据DeepMind AlphaGo的主要研究人员David Silver《深度强化学习》视频公开课进行创作的中文学习笔记,在专知发布推荐给大家! 随着DeepMind公司开发的Al
2013 年有研究者提出使用深度强化学习玩游戏,之后不久深度强化学习又被应用于模拟机器人控制,自此以后大量新算法层出不穷。其中大部分属于无模型算法,共分为三类:深度 Q 学习(DQN)、策略梯度和 Q 值策略梯度(QPG)。由于它们依赖不同的学习机制、解决不同(但有重合)的控制问题、处理不同属性的动作集(离散或连续),因此这三类算法沿着不同的研究路线发展。目前,很少有代码库同时包含这三类算法,很多原始实现仍未公开。因此,从业者通常需要从不同的起点开始开发,潜在地为每一个感兴趣的算法或基线学习新的代码库。强化学习研究者必须花时间重新实现算法,这是一项珍贵的个人实践,但它也导致社区中的大量重复劳动,甚至成为了入门障碍。
Python 安装包下载地址:https://www.python.org/downloads/ 打开该链接,点击下图中的版本号或者Download按钮进入对应版本的下载页面,滚动到最后即可看到各个平台的 Python 安装包。
【导读】Christine Doig是Anaconda公司的高级数据科学家。没错Anaconda就是那个著名的Python科学计算与发行管理软件。Christine Doig从最基本的强化学习概念开始
选自GitHub 机器之心编译 参与:路雪、李泽南 DeepMind 最近开源的强化学习环境 Control Suite 相比 OpenAI Gym 拥有更多的环境,更易于阅读的代码文档,同时更加专注
想想DeepMind训练的通用棋类AI AlphaZero,碾压一票同类选手,但堆砌了实验室里5064个TPU的算力。谷歌财大气粗,但小实验室就无法复制了。
目前,化学反应数据通常以非结构化的形式存储,这给下游应用(包括机器学习模型的训练)带来了重大阻碍。
本文介绍了DeepMind发布的一款名为dm_control的强化学习控制套件,该套件可以在仿真环境中训练和评估强化学习算法,同时提供了可解释性和可视化工具。使用该套件可以在一定程度上解决OpenAI的Gym在连续控制问题上的限制,并且可以在多个平台上进行部署。
还记得这个会跑酷的机器人吗? 5个多月前,DeepMind连发三篇强化学习论文,让机器人在仿真环境中自己就能学会灵活多变的各种动作,包括步行、跑动、跳跃、翻墙,等等。 今天,DeepMind公布了这三篇论文中所用的强化学习控制套件dm_control,它是一套基于MuJoCo物理引擎的Python强化学习的开发环境,可以在一套标准化的架构上执行各种不同的强化学习任务,并使用可解释性奖励来评估强化学习算法的学习效果。 控制套件的GitHub代码库地址是:https://github.com/deepm
夏乙 编译整理 量子位 出品 | 公众号 QbitAI 火遍全球的AlphaGo让我们知道了强化学习打游戏究竟有多6,这么强大的算法什么时候才能打破次元壁,走进现实、控制物理世界中的物体呢? DeepMind已经开始往这方面努力。他们昨天发布的控制套件“DeepMind Control Suite”,就为设计和比较用来控制物理世界的强化学习算法开了个头。 就像ALE(Arcade Learning Environment)极大推动了用强化学习打电子游戏的研究一样,DeepMind希望他们的Control S
介绍RDKit相关知识点和运用以及RDKit作为处理化学、生物、药学和材料学科中分子数据作为可输入机器学习和深度学习模型的重要工具应用。内容涵盖了基于RDKit的Python3的分子的读写、化合物的分子指纹和分子描述符计算、化合物的2D/2D比对、化合物相似性搜索、化合物骨架分析和亚结构搜索、RMSD计算与构象生成优化、分子相似图与聚类分析、化学反应处理、可视化与化学空间探索及RDkit相关的机器学习、深度学习应用过程详解
本文介绍了强化学习的基本概念,以及使用Python进行强化学习实践的方法和相关库。作者从强化学习的经典任务——Cartpole问题开始,介绍了如何使用不同的强化学习库进行实践。文章还介绍了强化学习的一些资源,包括课程、库和论文等。
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
PCL(Point cloud library) Ubuntu Linux 16 系统之所以会用Linux,很大的原因是应为SLAM在嵌入式平台上面的安置,所以尽量编写在inux下编写,同步arm编程环境的读者有兴趣可以去参考下搭建交叉编译环境 。 #OpenCV的安装 参考本菜的博客中,C++安装opencv的部分 Eigen C++线性代数计算库的安装 在slam的运行当中,会大量的使用到线性代数,为了省去手动写遍历去遍历代码,需要借助eigen去对opencv进行计算 关于Eigen的安
[导 读] 机器学习是使数据具有意义的算法的应用和科学,也是计算机科学中最令人兴奋的领域!在数据丰沛的时代,计算机可以通过自我学习获得算法把数据转化为知识。近年来涌现出了许多强大的机器学习开源软件库,现在是进入该领域的最佳时机,掌握强大的算法可以从数据中发现模式并预测未来。
即使你不喜欢玩游戏,深度强化学习也很重要。只用看当前使用深度强化学习进行研究的各种功能就知道了:
在机器学习和强化学习领域,学习和评估算法的性能通常是非常重要的。为了满足这个需求,OpenAI开发了一个名为gym的Python库。gym提供了一系列标准化的环境,用于开发和比较强化学习算法。
有些同学在写论文的时候光注意文字的阐述,忽略掉了一个重要因素——图表。插入的图表不仅无意义,有时候甚至造成图表影响了文章内容表达。
以前不懂编程,想做量化投资做不了。现在有了ChatGPT,借助GP4强大的编程能力,即使没有任何编程基础,也完成可以做出简单的量化投资。
特征选择是构建机器学习模型过程中的决定性步骤。为模型和我们想要完成的任务选择好的特征,可以提高性能。
RMG Database for Chemical Property Prediction
ChemDataExtractor是一种从科学文档中自动提取化学信息的工具。给它一篇期刊文章,它将从文本中提取化学名称、属性和光谱,以便将它们导入数据库或电子表格。
【磐创AI导读】:Github是全球最大的开源代码社区,本文为大家总结了2108年11月最热门的机器学习项目top5。欢迎大家点击上方蓝字关注我们的公众号:磐创AI,获取更多的机器学习、深度学习资源。
本文探讨了DeepMind Control Suite和OpenAI Gym等控制算法套件在强化学习中的重要性,并介绍了DeepMind Control Suite的主要特性和功能。同时,文章还分享了如何使用DeepMind Control Suite进行基准测试和强化学习任务的应用案例。
Oracle功能强大、性能卓越,完全可以代表数据库技术的最高水平,大量核心金融交易系统都构建在 Oracle 数据库之上,甚至在很多场景中,Oracle是无法替代的存在。 数据库性能的好坏直接影响应用程序能否快速响应用户指令,在高并发、高性能和高一致性要求的环境中,Oracle 数据库性能问题是众多DBA最恼火的问题。 SQL优化十分繁杂,而SQL改写却又是SQL优化中最难的一种工作,也是最实用的一种技术。SQL写法灵活多变,实现相同的业务逻辑,可以用不同的写法。不同写法之间的效率可能相差几百甚至
强化学习是一种机器学习方法,用于训练智能体(agent)在与环境的交互中学习如何做出最优决策。Q-learning是强化学习中的一种基于价值函数的方法,用于学习最优策略。本文将详细介绍Q-learning的原理、实现方式以及如何在Python中应用。
本文介绍了一种用于深度强化学习的控制套件,该套件包括多个任务,旨在评估算法在各种任务中的性能。该控制套件使用Mujoco物理引擎来模拟环境,并提供了多种学习算法和模型,包括DQN、DDPG、DeepMimic和A3C。作者提供了基准测试的详细结果,并提供了对代码库的访问,以便其他人可以复制并扩展其功能。
在Alphabet大额资金支持下,DeepMind一直以实现AGI为为目标的公司在各个领域不断的尝试,做出了很多基础研究。其中最为出名的当属在强化学习方面的探索,从2013年的Atari游戏到AlphaGo的横空出世,再到终极AlphaZero的实现,完成了一次次巨大的挑战,但一个完善的环境对强化学习的发展来说是非常重要的,而DeepMind就拥有这样一个杀手锏。
作为一种新兴的深度学习技术,采用 DRL 面临着简单实现算法之外的诸多挑战,如训练数据集、环境、监测优化工具和精心设计的实验,以简化 DRL 技术的采用。考虑到机制与大多数传统的机器学习方法不同(DRL agent 尝试在给定环境中通过反复试验来完成任务),应用 DRL 更是困难。在这种情况下,环境和实验的稳健性在 DRL agent 开发的知识中起着最基本的作用。
前面我们已经能够通过MATLAB调用Python操作键鼠,也在MATLAB环境中建立简单的环境来训练强化学习模型,比如matlab倒立摆环境建模,现在我们需要稍稍复杂的环境,如果在MATLAB中从零开始搭建游戏环境耗时费力,一顿搜索之后也没发现可以利用的游戏m程序,试图通过调用python的gym库时遇到很大难题解决不了,底层pyglet库更是相当底层,想要扩展或者模仿也很有难度,所以我们选用pygame库来实现游戏环境,网上有很多开源的小游戏实现,还有个将pygame游戏包装成为强化学习环境的PLE库
【新智元导读】DeepMind此前开源了《星际争霸2》机器学习训练平台,这个平台对于state-of-the-art的深度强化学习算法来说是极好的测试平台。希望下面这份教程能帮你更快更好地上手。 DeepMind 之前开源了《星际争霸2》的深度强化学习平台,这是个很好的训练环境,学起来也很有趣。下面是一份有关设置环境和训练模型的教程,基于Mac环境。我们会跑一遍训练脚本,使用Deep Q-Network解决CollectMineralShards这个mini-game。享受学习吧~ 在开始之前,你需要准备好
DrugBank数据库是唯一将详细的药品数据(即化学、药理学和制药)与综合药物靶点信息(即序列、结构和作用通路)相结合的“生物信息学和化学信息学”资源。DrugBank由加拿大卫生研究院,亚伯达省创新-健康解决方案和代谢组学创新中心(TMIC)提供支持,该中心是国家资助的研究以及支持广泛的尖端技术代谢组学研究的核心 。DrugBank数据库查询包含以下信息:药品类型、药品简介、化学结构、药品成分、临床试验、药物靶点、酶、转运体、载体、药品图片、批准情况、批准的处方药、国外上市商品名、药物相互作用、制造商、包装商等。
近来,人工智能聊天机器人ChatGPT实火。上线仅仅2个月,ChatGPT的活跃用户就突破一亿,曾创下无数增长奇迹的TikTok都望尘莫及。连比尔·盖茨都没忍住承认:ChatGPT出现的意义,不亚于互联网和个人电脑的诞生。
astropy - A community Python library for Astronomy. 一个面向天文学的Python社区库 bcbio-nextgen - A toolkit pr
强化学习是一种机器学习方法,用于训练智能体(agent)在与环境的交互中学习如何做出最优决策。SARSA是强化学习中的一种基于状态-行动-奖励-下一个状态的方法,用于学习最优策略。本文将详细介绍SARSA的原理、实现方式以及如何在Python中应用。
来源:DeepMind 编译:Bot 编者按:今天,DeepMind发表了一篇名为DeepMind Control Suite的论文,并在GitHub上发布了控制套件dm_control——一套由Mu
因本狗最近在学使用python进行数据分析, 所以就找了找教程,感觉这个教程还不错,就分享给大家。不过只供参考。
去年,DeepMind开源将星际争霸II的强化学习环境公之于众,很多人都为之兴奋。 https://deepmind.com/blog/deepmind-and-blizzard-release-starcraft-ii-ai-research-environment/ 我是暴雪游戏的忠实粉丝,尤其是星际争霸2,所以我把强化学习环境看成是一个学习的好机会,而且也有很多乐趣。我这篇文章将利用星际争霸2写一份建立环境和训练一些模型的入门教程。 前提 IntelliJ (或者PyCharm) Python3 星际
GitHub和Reddit都是比较有趣的平台,在这里,我不仅学习了数据科学的一些最佳应用,而且还了解数据科学家们是如何编程的。
RDKit在2000-2006年期间在Rational Discovery开发和使用,用于构建吸收、分布、代谢、代谢、毒性和生物活性的预测模型。2006年6月Rational Discovery被关闭,但该工具包在BSD许可证下作为开源发布。目前,RDKit的开源开发由诺华积极贡献,其中包括诺华捐赠的源代码。
谷歌(Google)本周宣布了进入GSoC 2020的200个开源项目。谷歌的GSoC(Google Summer of Code,暑期代码计划)已经走到第16年,该计划旨在让学生在暑假的几个月中参与开源开发。录取的学生将在活动中获得3000至6600美元之间的津贴。
【新智元导读】谷歌大脑的 Denny Britz 在他的个人博客上发表了一篇强化学习经验总结,包括好用的教程和教材,最关键的,是他经试着用 Python、OpenAI Gym、Tensorflow 写了大部分标准强化学习算法,并且按章节列出,还提供了练习和答案,是为强化学习实践的好资料。 为什么要学习强化学习? 强化学习(Reinforcement Learning,RL)是我最感兴趣的领域之一。过去几年里强化学习取得的一些成果得到了很多关注,例如掌握围棋、从原始像素学会玩 Atari 游戏,但强化学习还可
当一个化合物合成出来之后,化学工作者常常关心的是分子中某一部分(如功能团)的有关信息,因而,亚结构(substructure)检索,从某种角度上讲,对于化学工作者来说是最为重要的手段。
领取专属 10元无门槛券
手把手带您无忧上云