学习
实践
活动
专区
工具
TVP
写文章

生物分子序列的人工智能设计

伴随着人工智能技术的快速发展,智能算法在复杂生物特征的挖掘生物分子的设计中表现出巨大潜力。 近年来,人工智能技术的迅猛发展为生物序列的智能设计提供了新的机遇。 基于人工智能的设计模型,已逐渐被应用于药物研发、对未知化学反应的探索等方向,成功实现了小分子药物、基因调控序列新型人工蛋白质以及基于CRISPR编辑技术的guide RNA设计等的合成设计。 1 人工智能算法设计生物序列 从模式识别角度分析生物序列设计中的共性的问题:前人的研究发现,特定功能的生物分子序列会形成高维序列空间中的低维流形。 在人工智能领域中,深度生成式模型由于具有强大的模拟数据分布的能力,可通过从低维数据表示中采样和寻优设计全新的人工样本,因此近年来在生物序列的智能设计中有着广泛的应用。

28010
  • 广告
    关闭

    新年·上云精选

    热卖云产品新年特惠,2核2G轻量应用服务器9元/月起,更多上云必备产品助力您轻松上云

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【远古生物复活】深度学习生物大数据处理

    深度学习加速生物大数据处理速度 随着生命科学的迅猛发展,生物医学领域的数据量呈指数形式增长,生物医学数据表现为数据量大(Volume)、多样化(Variety)、有价值(Value)、高速(Velocity 曙光公司联合中科院计算机所,在生物医学处理方面取得了长足进展,大大加速了生物大数据处理速度。 生物医学大数据独具特色 生物医学领域数据有其自身特点。 1.数据量大:生物医学领域数据量十分庞大。 如今,只需几千美元和几个小时,即可完成一个人基因组的解析,低廉高效的研究方式得到生物科学家们的青睐,大量的物种得以测序解析,使得生物研究进入的生物数据的海洋,而积累的原始数据也必将迅速增长。 3.价值高:随着生物信息学的发展,越来越多有价值的信息从生物数据中挖掘出来,这些价值不仅体现在生物科研领域,而且已应用于农业、健康和医学等领域。 深度学习在生物领域取得的进展让人振奋。现阶段XSharp的应用主要集中在高维多模式生物图像分布式数据系统、海量生物图像数据的深度挖掘流程和生物图像处理数据密集型算法加速等项目中。

    63550

    软件开发生物

    由此也想到了《禅摩托车维修艺术》中将“分析”比作“刀子”的表述。 有时候的确是觉得,搞软件就像是学生物医学,分析的手术刀用得多了,脑海里也像是有了这么一把小刀,面对一个网页,不知不觉就在脑海里拿起了这把小刀对它大卸八块和重新组装,甚至对于小刀本身也是如此。 这两者的区别大概是:生物来源于自然,计算机则来自于人类现有认知的创造。 机器由灵魂而创造,研究探索肉块,也是为了灵魂的延续。有了更锋利的小刀,更需要小心翼翼地去把握,让它更好地为守护每一个独特的灵魂而服务。法医如此、程序员也是如此。技术无罪,但使用技术是需要谨慎对待的。

    29610

    艾伯维和Cerebras合作加速人工智能生物医药研究

    2022年5月5日,AI计算领域的先驱Cerebras Systems和艾伯维 (AbbVie) 宣布,艾伯维的人工智能工作取得了里程碑式的成就。 在生物医学自然语言处理 (NLP) 模型上使用Cerebras CS-2,艾伯维实现了超过图形处理单元 (GPU) 128倍的性能,而能耗只有1/3。 艾伯维人工智能负责人Brian Martin称,艾伯维在编程和训练BERT LARGE模型时遇到的一个常见挑战是在足够长的时间内提供足够的GPU集群资源。 该服务使用大型、最先进的Transformer模型 (如BERT、BERT LARGE和BioBERT) 准确翻译并制作可搜索的180种语言的庞大生物医学文献库。 确保Abbelfish既准确又始终保持最新,需要使用特定领域的生物医学数据从头开始训练和重新训练NLP模型。然而,Abbelfish模型非常庞大,有60亿个参数。

    11830

    生物医学大数据:现状展望

    生物医学大数据广泛涉及人类健康相关的各个领域:临床医疗、公共卫生、医药研发、医疗市场费用、个体行为情绪、人类遗传学组学、社会人口学、环境、健康网络媒体数据(表 1)。 ? 4.生物医学大数据面临的主要问题发展趋势:作为一个新兴领域,大数据也伴随着一些争议:①既然数据总是不断增加,是否有必要区分大数据传统数据? ②大数据更多意义上可能是一种商业上的宣传? 生物医学大数据面临的主要问题:①如何实现生物医学数据的标准化和规范化。数据标准化是数据共享的前提,只有标准化的数据才能有效融合整合,从而发挥大数据的价值。 ②如何打破数据孤岛,实现生物医学数据共享。 我国已积累了海量的生物医学数据,如何利用才是关键,这在一定程度上也依赖于大数据技术的发展。 ⑤生物医学大数据的分析、整合挖掘。 ⑤生物医学大数据的可视化。可视化信息图像、信息可视化,科学可视化以及统计图形密切相关,能够更清晰有效地传达沟通大数据包含的信息。 ⑥基于生物医学大数据的个体化健康管理逐步流行。

    2K50

    生物大数据:中国能否世界同步?

    全球蒸蒸日上的生物大数据创新发展热潮相比,中国的研发及应用才拉开帷幕。 “我们与国际前沿技术水平至少相差30年,差距主要表现在数据分析、数据管理和临床的应用对接上”,上海生物信息技术研究中心主任李亦学研究员对此深表担忧。    李亦学分析认为,我国有四大方面非常欠缺:其一,国内现有的生物大数据分析能力虽然欧美相差不大,但是在数据分析构架、软件系统先进的IT技术接轨上有待提升。 王亚东进一步指出,美国政府于近两年两次启动生物大数据研究计划,目的是有针对性地研究生物大数据管理、分析、共享等生物领域迫切需要的核心技术,从根本上提升美国利用生物大数据的水平,并以此带动生物领域研究产业发展 在生物大数据领域,我国缺乏从国家层面对生物大数据进行有效管理利用的体制、机制和环境,李亦学称,“这已经使中国的生物数字主权受到严重威胁”。

    42790

    【干货】追本溯源:5种受生物启发的人工智能方法

    【导读】1月15日,机器学习研究人员Luke James(简介见文末)发布一篇博文,介绍了5种受到生物启发的人工智能方法,包括人工神经网络(人脑神经元)、遗传算法(DNA染色体)、集群算法(蚁群优化和粒子群优化 作者将大自然中的启发流行的AI方法对应起来,从一个独特的角度讨论这五种AI算法的内部原理,非常值得一读。 ? 这些明星生物就是那些受大自然启发的人工智能算法。 但首先,我需要向您介绍两个算法的概念。 前馈神经网络——最基本的神经网络 算法类型:预测模型 生物启发:认知脑功能(神经元) 用例:情感分析,图像识别/检测,语言纠错,机器人 我们从最常见的人工智能(AI)算法开始。 AIS是生物启发计算和自然计算的子领域,机器学习和人工智能相关。

    1.2K70

    谷歌将把生物多样性研究人工智能引入Tensorflow Hub

    机器学习算法在生物多样性研究中有很多,但大都没有正确的归因或监督。 为了提高学术水平,谷歌表示,它将发布全球生物多样性信息基金(GBIF)、自然主义者和Visipedia合作开发的机构人工智能工作流程。 这家科技巨头的研究人员表示,该工作流程将支持跨团队的数据聚合协作,同时确保公司遵守标准化的许可条款,使用兼容的文件格式,并为手头的任务提供公平、充分的数据覆盖。 工作流程将由两部分组成:GBIF打包的数据集,以及由谷歌Visipedia培训和发布的模型。 更广泛地说,人们越来越意识到道德、公平和透明度在ML社区中的重要性……我们期待着全球各地的机构合作,以实现机器学习在生物多样性方面的创新应用。”

    35620

    生物统计学R极简手册

    600字,约2分钟,思考问题的熊 专栏7 ---- 入门生物信息或者进行生命科学研究,所有人都绕不开统计知识和计算实现方式。 针对生物统计学,Nature 杂志的专题中曾经有过如下评论: There is no disputing the importance of statistical analysis in biological 在做中科院生物统计课程助教的过程中,通过交流我发现不少人学习生物统计的首要困惑是理不清相关概念,其次才是不知道如何用诸如R语言之类的工具进行实现。 另外,这份资料主要面向(适合)生物统计学和R语言基础薄弱的人群。因为写的确实很简略,勉强将其称为极简手册 。如果详细学习还需要阅读相关教材资料并勤加练习。 如果你需要,可以在公众号回复 “生物统计” 获取完整文档的下载方式。

    87950

    Nature社论|结构生物学中的人工智能将会继续

    在这个研究报告中,人工智能(AI)被用来预测超过2万种人类蛋白质的结构,以及由20种模式生物(如大肠杆菌、果蝇和酵母,以及大豆和亚洲水稻)产生的几乎所有已知蛋白质的结构。大约是36.5万个预测结构。 另一种试图通过密切相关的蛋白质进行比较,利用生物体的进化史来预测其形状。然后成像技术非常重要,从X射线晶体学开始,到现在的低温电子显微镜。 在结构生物学的基础科学中,关键问题仍有待解决。 但仍有工作要做,以解开蛋白质如何以及为何折叠的基本的生物学、化学和物理学的科学问题。 公共和私有 就重要性而言,一些人将最新的进展20年前人类基因组序列的第一份草案相比较。确实可以进行比较。 大家的共识是,现在预测人工智能在生命科学领域的应用到底会产生什么影响还为时过早,除非任何影响都将是变革性的。 准确预测人工智能将如何改变生物学需要良好的训练数据,而我们现在还没有这种数据。 但是人工智能,结构生物学研究界以及它在其他领域的合作者拥有大量的新鲜数据。除了研究和数据之外,人工智能还为研究组织和管理模式(大学应该研究的)提供了一个窗口。

    28640

    欧盟生物识别评估测试项目正式对外开源

    2016年3月,由欧洲委员会资助的生物识别评估和测试项目BEAT推出了一个可供下载的开源平台。 BEAT的目的是建立一个用于评估生物识别技术的标准框架,并力求确保学术界和私营部门都可以使用这些标准,而这一努力的一个重要组成部分,是发展一个数字化的开源平台。 BEAT项目最明确的目标是帮助制定一个欧洲认证体系,但在它面世的时候,生物识别技术正在扩散到整个欧洲和世界其他国家,并有可能为实现公民团体、企业网络和公共政策规划者之间的讨论提供有力帮助。 事实上,对负责对欧盟美国之间银行隐私规则的认证标准进行谈判的官员来说,BEAT可能是一项非常有用的工具,这些隐私规则是数据传输有关的。

    47880

    IBM受生物启发,创造了一个超越传统的人工智能

    为了克服这一限制,普林斯顿大学、圣地亚哥大学、IBM Research和MIT-IBM Watson AI实验室的研究人员开发了BioHash,它应用“局部”和“生物学上合理的”突触可塑性规则,来生成哈希码 这种被称为扩展表征的现象在神经生物学中几乎无处不在。“扩展”是指将高维输入数据映射到更高维的二次表示。 在相似度搜索中,给定一个查询、一个相似度度量和一个包含任意数量项的数据库,就可以从数据库中检索查询最相似的项的排序列表。FlyHash利用了LHS,BioHash也是如此。 团队断言:扩展表示之所以在生物中普遍存在,是因为它们把相似的刺激聚在一起,把不同的刺激分开。 事实已经证明,神经生物学和机器学习领域是密切相关的。

    28410

    人工智能生物学和神经科学中的应用

    (许多现代人工智能系统也依赖于“自我监督学习”,通过使用自动方法对数据进行标记,例如,对不同的对象应用相同的标签,从而实现无监督学习相同的目标)。 接下来,我们首先讨论人工智能工具在分析和解释生命科学数据方面的影响,特别关注神经科学。然后,我们关注人工智能的第二个应用,特定是神经科学,即神经网络被用作生物神经网络如何计算的模型。 这篇评论补充了最近几个关于人工智能生物学和医学上的应用的综述。用于分析和解释数据的人工智能工具人工智能的第一个重要应用涉及开发分析和解释数据的工具。 虽然这篇评论的主要焦点是人工智能在神经科学中的应用,但人工智能生物学的许多其他领域也有应用。例如,人工智能在蛋白质建模、基因序列分析、医学诊断和药物发现等各个领域都有重要的应用。 这激发了创建神经网络的尝试,其结构生物网络的结构一样,必须通过“基因组瓶颈”。人们越来越认识到,神经科学在指导未来的人工智能创新方面可以发挥作用。

    16920

    NeurIPS 2018提前看:生物学习算法

    机器之心原创 作者:Joni 编辑:Hao 本文介绍了三篇关于生物学习算法的 NeurIPS 2018 论文。 分析师简介 Joni 目前是日本国立产业综合研究所的研究员。 在方法上是实验上验证深度网络的算法,前两篇的统计学背景是有不一样。但众所周知,Hinton 教授忠实地支持建立生物学基础的机器学习模型。 文中指出 BP 算法的两点主要与神经科学违背的地方:1) 反向传播中的权值是正向传播的权值共享;2)错误传播后,上一层的神经元活动不能马上更新,因此生物学的神经通讯的实验结果相违背。 正如图(1c)所示,SDTP 完全移除权值的梯度算法和权值共享这些不符合生物规律的算法。SDTP 的详细算法如下: ? ? BP TP 算法的比较示意图。 实验结论有点失望,虽然本文主要力推生物类似的 TP(target-propagation),但在 MNIST 和 CIFAR10 仍比不上如今流行的 BP 算法和 FA 算法。

    40430

    Nature Medicine | 组学和人工智能推动肝病生物标志物的发现

    他们将这些数据组织学、影像学和临床数据结合起来,以确定血浆中存在的疾病相关的蛋白质特征,然后使用机器学习来生成能够检测ALD中脂肪变性、炎症和纤维化的新型生物标志物。 取得这些进展的同时,人工智能(AI)也被采用,成为合成和分析大型数据集的有效工具。近年来,研究人员已经应用机器学习来改善肝病的筛查、诊断和预后结果。 正如Niu等人所展示的那样,人工智能和 "组学 "技术的综合力量提供了一个重要的机会,可以汇总和整合微创的数据模式,为整个肝脏疾病提供综合护理。 在将血浆样本肝脏组织配对并与纵向临床结果数据整合后,作者产生了生物学见解,并验证了一组蛋白质生物标志物,以支持微创模型的开发,为ALD的早期识别和管理提供信息。 蛋白质组学和人工智能在满足早期ALD的诊断和预后的关键需求方面已经显示出影响。即便如此,对整个ALD的综合管理将需要整合多模态数据、创新的计算技术和开发新的数据基础设施,以适应规模化的吞吐量。

    10220

    推动 AI 生物医药双向赋能,WAIC2022· 上海生物计算论坛精彩内容回顾​

    机器之心报道 编辑:萝卜皮 「赋能新未来,释放新动能」,由世界人工智能大会组委会办公室指导,上海市生物医药产业促进中心、上海市人工智能行业协会、机器之心发起并联合主办,上海中青年知识分子联谊会、上海市经济和信息化系统中青年知识分子联谊会协办的 来自加拿大皇家科学院、上海市生物医药促进中心、北大、微软、昇思MindSpore、BioMap、分子之心、天壤 XLab、晶泰科技、华深智药、联拓生物等机构、高校、科技和医药企业的专家学者,就生物计算发展趋势挑战展开分享讨论 晶泰科技联合创始人、CEO 马健,以《从自动化到智能化——新药研发的升级之路》为题,探讨了新药研发模式的挑战变革。 马健指出从行业视角来看,人工智能生物及药物研发的深度结合,是未来发展的趋势。 同时他也指出人口红利特别是工程师红利在消退,生物医药产业接下来将面临劳动力短缺的问题,因此人工智能和自动化技术医药研发的深度融合势在必行。 以上为本次论坛内容的精彩回顾。 未来,生物计算论坛将继续打造「AI + 生物医药」创新生态圈,驱动生物医药产业创新发展,释放生物计算行业新动能,实现 AI 生物医药的双向赋能。

    11130

    机器正在生物化&生物正在工程化

    《失控》第一章即开宗明义:人造天生的联姻正是本书的主题。KK指出,人造物自然生命之间有两种趋势正在发生: ❶机器,正在生物化; ❷生物,正在工程化。 从第二章至第二十三章,均在阐述这一个主题。 第一章 人造天生 人造天生的联姻正是本书的主题。机器,正在生物化;而生物,正在工程化。这并不意味着未来是灰色冰冷的钢铁世界;相反,未来朝向的正是一种新生物的文明。 物种变换角色尝试每个物种合作,探索合作关系。随着时间的推移,角色和扮演融入到生物体的基因中。科学家惊讶地发现,即使在恒常不变没有特色的环境中,生命也会自发地走向多样性。 第十五章 人工进化 还没有一个计算机科学家可以合成出符合预期的,无比强大的、能带来翻天覆地变化的人工智能。也没有一个生物化学家能够创造出人工生命。 今天,汤姆.雷也难以让他的同事们信服,他在实验室里人工合成的进化自然界的进化本质上是相同的。 生物自身特殊的硬件绑定在一起的——以碳为基础的DNA分子。

    70200

    扫码关注腾讯云开发者

    领取腾讯云代金券