首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

可应用于多种癌症的预测分子特征模型

将TCGA乳腺癌样本数据集分为训练集(70%)和检验集(30%)。模型将训练集样本分为高、低特征分数,用AUC值评估模型性能。...基于拷贝数变异的内在分子亚型预测:将DNA特征弹性网络建模成功应用于预测其他复杂的肿瘤,包括预测乳腺癌亚型,所有亚型的预测模型的AUC都较高(SFig. 6a-d)。 4....肺癌基因特征的预测:使用TCGA肺癌数据评估弹性网络预测模型的通用性。 在肺癌训练集、肺癌检验集和乳腺癌检验集中,弹性网络方法能够一致地预测最相关的特征。 8....模型还可以用来预测体细胞突变、癌症亚型、亚型特异性,可应用于TCGA中其他肿瘤数据25个肿瘤类型,具有很高的通用性和可重复性。...这个方法仅利用DNA信息就可以预测关键的复杂肿瘤表型,可能会应用于临床中。

49721

TimeMixer++:用于通用预测分析的通用时序特征机器

,基础模型,多分辨率融合 新智元:超越Transformer,全面升级!...MIT等华人团队发布通用时序TimeMixer++架构,8项任务全面领先 导读 在数据驱动的时代,时间序列分析成为了许多领域中不可或缺的一部分,比如气象预测、医学症状分类、航天器的异常检测、以及传感器数据中缺失数据的填充等等...零样本 在零样本预测的设置下,TimeMixer++表现取得了第一,说明提取到通用的时序特征,而并非得益于过拟合。...在天气数据填补和ETTm1长期预测任务中,相较于其他模型,具备更低的内存占用和较快的训练时间,且能有效捕捉长程依赖关系。...TimeMixer++的成功不仅为时序分析领域带来了新的思路,也展示了一种全新的时序理解视角。

13410
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    UFIN:用于多域点击率预测的通用特征交互网络

    导读 本文是针对多场景CTR预估中的特征交互提出的相关改进方法,利用LLM构建通用特征交互网络。常规的方法在迁移到新的推荐域会存在一定的问题,因为它们依赖于ID特征(例如,item ID)的建模。...本文提出了用于CTR预测的通用特征交互网络(UFIN)方法,利用文本数据来学习可以在不同domain有效迁移的通用特征交互。总体框架分为两部分:通用特征学习和基于通用特征的通用特征交互学习。...NN来学习用于增强表征的语义空间。...最终的预测为 \hat{y}=sigmoid(\zeta) 对于多场景方法, 可以在每个场景的预测过程中加入场景信息, 因此预测值可以表示为 \hat{y}=sigmoid(\zeta+\zeta_f...) 2.3 知识蒸馏来促进训练 对于每个domain,预训练一个特征交互模型作为引导网络,以学习特定领域的协作模式。

    55010

    SIGIR2021 | 基于特征交互学习的门控增强多任务神经网络用于CTR预测

    深度神经网络(DNN)模型已被广泛应用于在线广告点击率(CTR)预测。CTR训练框架通常由嵌入层和多层感知机(MLP)组成。...在这篇论文中,作者介绍了百度最近更新的CTR训练框架,称为门控增强的多任务神经网络(GemNN)。...特别地,他们开发了一种基于神经网络的多任务学习模型用于CTR预估,它以粗粒度到细粒度的方式逐步减少候选广告,并允许上游任务与下游任务之间的参数进行共享,从而提高训练效率。...其次,有效的特征交互对CTR模型的成功至关重要,因为它们提供了单个特征之外的额外交互信息。 许多模型被提出来进行特征交互建模,但是很少有人在实际工业生产环境下研究它的计算和延迟限制。...具体地说,他们提出了一种基于神经网络的多任务学习模型,以粗粒度到细粒度的方式进行广告排序,它允许上层任务与下层任务之间的参数共享,提高训练效率。

    92910

    20用于深度学习训练和研究的数据集

    数据集在计算机科学和数据科学中发挥着至关重要的作用。它们用于训练和评估机器学习模型,研究和开发新算法,改进数据质量,解决实际问题,推动科学研究,支持数据可视化,以及决策制定。...数据集提供了丰富的信息,用于理解和应用数据,从而支持各种应用领域,包括医疗、金融、交通、社交媒体等。正确选择和处理数据集是确保数据驱动应用成功的关键因素,对于创新和解决复杂问题至关重要。...Fashion-MNIST数据集包含Zalando的服装图像,其中包括60,000个训练样本和10,000个测试样本。 CelebA:包含年龄、性别和面部表情等属性的名人面部数据集。...Chess:用于国际象棋比赛预测的数据集,包含来自数千场比赛的数据,其中包含玩家评级和棋子移动序列等信息。...数据集在数据科学和人工智能领域中是不可或缺的工具,它们为模型的训练和评估、问题的解决以及科学研究提供了基础数据。选择适当的数据集并进行有效的数据处理和分析是确保数据驱动应用程序成功的重要一步。

    60020

    PyTorch中用于神经网络的开源特征可视化工具包

    新任务所需的额外训练数量取决于原始任务和新任务的相似性,训练数据的可用性等。 传统学习与迁移学习 迁移学习通常用于计算机视觉和自然语言处理任务,因为它通过利用先前的训练帮助节省计算/时间资源。...例如,在ImageNet(1000个类)上训练的网络可以重新用作狗标识符,而无需额外的训练。...将以毛地黄的这个图像为例。 在这里可以欣赏的是,没有额外训练的网络正在关注花杯的形状。但是有许多形状相似的花(例如蓝铃花)。...网络已经学会减少对花的形状的关注,并强烈关注那些斑驳的图案:) 显示什么样的神经网络学会是非常有用的。将其提升到另一个层次并解释神经网络如何学习的过程是特征可视化技术的另一个强大应用。...从准确性向前迈进 通过特征可视化技术,不仅可以更好地了解神经网络对物体的感知,而且还可以更好地: 诊断网络出错的原因和原因 找出并纠正算法中的偏差 从仅仅看准确性向前迈进 了解网络行为的原因 阐明神经网络如何学习的机制

    1.9K21

    KPGT: 用于分子性质预测的知识指导的预训练图形变换模型

    KPGT: Knowledge-Guided Pre-training of Graph Transformer for Molecular Property Prediction 论文摘要 为分子性质预测设计准确的深度学习模型在药物和材料发现中发挥着越来越重要的作用...近年来,由于标记分子的稀缺性,用于学习分子图的泛化和可迁移表示的自监督学习方法引起了极大关注。在本文中,作者认为,由于标记的数量,现有的自我监督学习方法无法获得所需的性能。...为此,作者提出了一种知识指导的预训练图形变换模型(KPGT),这是一种新的基于图的特征转换学习框架。...然后,提出了一种 KPGT知识指导策略,该策略利用原子核的知识来指导模型,以利用原子的结构和语义信息。大量的计算测试证明了KPGT比最先进的基于图的方法具有更好的性能。

    67610

    yolov7-pytorch可用于训练自己的数据集

    开始网络训练 train.py的默认参数用于训练VOC数据集,直接运行train.py即可开始训练。 训练结果预测 训练结果预测需要用到两个文件,分别是yolo.py和predict.py。...classes_path用于指向检测类别所对应的txt,这个txt和voc_annotation.py里面的txt一样!训练自己的数据集必须要修改!...train_percent用于指定(训练集+验证集)中训练集与验证集的比例,默认情况下 训练集:验证集 = 9:1。...前海征信大数据算法:风险概率预测 【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类 VGG16迁移学习,实现医学图像识别分类工程项目 特征工程(一) 特征工程...(二) :文本数据的展开、过滤和分块 特征工程(三):特征缩放,从词袋到 TF-IDF 特征工程(四): 类别特征 特征工程(五): PCA 降维 特征工程(六): 非线性特征提取和模型堆叠

    2.2K30

    Bing研究人员开发新的方法,用于自动收集高质量AI训练数据

    微软Bing团队的研究人员已经开发出一种用于训练机器学习模型的高质量数据生成方法。...研究人员写道:“获取足够高质量的训练数据通常是构建基于人工智能服务的最具挑战性的部分。通常,由人类标记的数据质量很高(错误相对较少),但成本高昂,无论是金钱还是时间方面。...Bing团队的模型清除了来自语料库的噪音数据。 但并不是每个结果都与搜索类别相关,并且训练数据中的错误可能会导致机器学习模型中的偏差和不准确性。...随着训练的进行,系统的设计方式使得如果图像是类别中的一部分,则类别嵌入向量和查询图像向量变得越来越相似,如果不是类别的一部分,则进一步分离。 该系统最终识别它用于为每个类别找到高度代表性图像的模式。...该团队说,它甚至可以在没有手动确认标记的情况下进行工作。 该团队写道,“这种方法对于为图像相关任务清理训练数据非常有效,我们相信它同样适用于视频,文字或演讲。”

    45330

    用于图神经网络研究的几个实用的数据集

    图数据集上的ML/DL是一项新的研究课题,有许多方面需要研究。因此,拥有有趣和实用的数据集将有助于研究和开发过程。本文将为ML/DL图网络的研究提供一些实用的数据集。...Yelp数据集 yelp是美国版的大众点评,这将是一个有趣的链接预测数据集,可以应用于推荐任务。链路预测任务的目的是学习一个模型,可以预测两个节点之间的链路在未来是否会连接。...数据集包括关于用户、业务和点评信息的json文件。它还包含商家的照片。该数据集可用于许多任务,是ML/DL任务的理想实用数据集。...该数据集非常适合链接预测和节点分类任务:与 yelp 类似,链接预测将在电子商务中具有实用的推荐应用;节点分类任务将应用于对销售服务的产品进行评级。...数据集从许多来源收集,图像由 SIFT 表示 从它们中提取的特征。该数据集包括 105938 张图像和 2316948 个图像之间的链接。该数据集非常适合 CV 任务:图像分类、对象检测和分割。

    1.6K20

    用于图神经网络研究的几个实用的数据集

    图数据集上的ML/DL是一项新的研究课题,有许多方面需要研究。因此,拥有有趣和实用的数据集将有助于研究和开发过程。本文将为ML/DL图网络的研究提供一些实用的数据集。...Yelp数据集 yelp是美国版的大众点评,这将是一个有趣的链接预测数据集,可以应用于推荐任务。链路预测任务的目的是学习一个模型,可以预测两个节点之间的链路在未来是否会连接。...数据集包括关于用户、业务和点评信息的json文件。它还包含商家的照片。该数据集可用于许多任务,是ML/DL任务的理想实用数据集。...该数据集非常适合链接预测和节点分类任务:与 yelp 类似,链接预测将在电子商务中具有实用的推荐应用;节点分类任务将应用于对销售服务的产品进行评级。...数据集从许多来源收集,图像由 SIFT 表示 从它们中提取的特征。该数据集包括 105938 张图像和 2316948 个图像之间的链接。该数据集非常适合 CV 任务:图像分类、对象检测和分割。

    88940

    用于训练多模态AI模型的5个有用数据集

    然而,构建有用的多模态AI模型需要高质量的多模态数据集,这些数据集是训练这些多功能系统的必要燃料——使它们能够超越单一维度或模式,扩展对世界的理解。...例如,图像字幕任务需要一个结合图像和相关描述性文本的训练数据集,这可以用来训练AI模型。训练过程结束后,就可以部署AI模型,利用自然语言处理和计算机视觉技术识别新图像的内容并生成相关的文本。...InternVid InternVid专为视频相关任务(如视频字幕、视频检索和视频生成)而开发,是一个相对较新的视频文本数据集,包含700万个不同类型物体和活动的视频,时长近76万小时。...许可证:CC-BY-4.0 结论 新的数据集不断涌现,以下是一些其他值得一提的近期多模态数据集: BigDocs:这个开放且“许可宽松”的数据集旨在训练用于从文档中提取信息的模型,使用增强的OCR、布局和图表分析以及表格检测...这些只是大量可用多模态数据集中的少数几个——更不用说也日益受到关注的多语言数据集了。有如此多的选择,找到合适的训练AI模型的数据集相对容易。

    16510

    MDNN: 一种用于药物-药物反应预测的多模态深度神经网络

    本文指出许多基于人工智能的技术已经被提出并用于预测药物-药物反应(DDI),而现有的研究方法较少关注DDI与靶标、酶等多模态数据之间的潜在相关性。...为了解决这一问题,作者提出了一个用于DDI预测的多模态深度神经网络(MDNN)。本文设计了一个基于药物知识图谱(DKG)的通道和基于异质特征(HF)的通道的双通道框架来获取药物的多模态表征。...对于任务A,作者以训练集中的DDI训练模型,然后对训练集药物与测试集药物之间的DDI进行预测。对于任务B, MDNN对测试集药物之间的DDI进行预测。...4.总结 本文提出了一种新的用于药物-药物反应预测的MDNN模型。MDNN利用药物知识图上的图神经网络,有效地利用拓扑信息和语义关系。...此外,多模态神经网络还利用了结构信息和异构特征的联合表示学习,有效地探索了多模态数据的跨模态互补性。实验结果表明,该模型优于传统的DDI预测模型。 021/0487.pdf

    1.9K20

    KG4SL:用于人类癌症合成致死预测的知识图神经网络

    对于SL pair的湿实验筛选存在成本高、成批效应和脱靶等问题。目前用于SL预测的计算方法包括基因敲除模拟、基于知识的数据挖掘和机器学习等方法。...结果:本文提出了一种新的基于图神经网络(GNN)的KG4SL模型,将知识图(KG)消息传递纳入到图神经网络预测中。...用于SL预测的计算方法可以分为三类。第一种是使用代谢网络模型来进行计算机模拟,第二种是面向知识的方法,主要是利用特定领域的知识进行特征工程。...并且现有方法,支持向量机,随机森林(RFs), SL2MF和GRSMF等等注入了一些基因组和蛋白质组数据来促进SL预测,这些研究的结果强调了整合额外信息的重要性。...5.总结 本文提出了一种新的基于图神经网络(GNN)的KG4SL模型,将知识图(KG)消息传递纳入到图神经网络预测中。

    1.6K30

    用于COVID-19严重程度诊断和预测的结构注意图神经网络

    ,联合识别轻症重症病例并预测轻症转化时间,对优化工作流程、减少临床医生工作量至关重要。...本研究提出了一种新型的新冠肺炎诊断框架——结构注意图神经网络(Structural Attention Graph Neural Network, SAGNN),它可以结合胸部CT提取的特征、肺潜在结构分布和非影像学患者信息等多源信息...,对新冠肺炎的严重程度进行诊断,并预测从轻到重的转换时间。...具体而言,本文首先构建一个包含肺结构信息的图,并采用图注意网络迭代更新肺段的表示。为了区分不同的左右肺感染程度,作者进一步介绍了一种结构注意机制。...实验在真实数据集上进行,共1687例胸部CT扫描,其中轻症1328例,重症359例。

    32710

    用于金融时序预测的神经网络:可改善经典的移动平均线策略

    在之前的 5 篇教程中,我们讨论了用于金融预测的人工神经网络,比较金融时序预测的不同架构,意识到如何通过正确的数据处理和正则化实现充分的预测,执行基于多变量时序的预测,并取得了非常好的波动率(volatility...在第 6 篇教程中,我们借助不同来源的数据进行设置和实验,用一个神经网络完成两个任务,优化超参数从而实现更优预测。...今天,我想借助一个实际的预测用例,对金融时序预测做个总结:我们将使用神经网络改善经典的移动平均线策略,证明它可以真正提升最后的结果,并介绍了一些大家可能感兴趣的新的预测目标。...我们基于 2012 到 2016 年的 AAPL 价格训练神经网络,然后在 2016-2017 年的数据上进行测试(测试教程:https://medium.com/machine-learning-world...这篇文章介绍了如何使用神经网络实现金融时序预测,也暂时完结了该系列教程。坦白讲,我们无法使用神经网络来预测价格趋势。 我们考虑不同的数据源和目标,认真处理过拟合和优化超参数。

    1.1K80

    用于训练具有跨数据集弱监督的语义分段CNN的数据选择

    作者:Panagiotis Meletis,Rob Romijnders,Gijs Dubbelman 摘要:训练用于具有强(每像素)和弱(每边界框)监督的语义分割的卷积网络需要大量弱标记数据。...我们提出了两种在弱监督下选择最相关数据的方法。 第一种方法设计用于在不需要标签的情况下找到视觉上相似的图像,并且基于使用高斯混合模型(GMM)建模图像表示。...作为GMM建模的副产品,我们提供了有关表征数据生成分布的有用见解。 第二种方法旨在寻找具有高对象多样性的图像,并且仅需要边界框标签。...这两种方法都是在自动驾驶的背景下开发的,并且在Cityscapes和Open Images数据集上进行实验。...我们通过将开放图像使用的弱标签图像数量减少100倍,使城市景观最多减少20倍来证明性能提升。

    74820

    Github 项目推荐 | 用于运行和训练深度神经网络的开源 C++ 库 —— nGraph

    nGraph 是一个用于运行和训练深度神经网络的开源 C++ 编译器库。...nGraph 目前支持三种流行的深度学习框架(neon、MXNet、TensorFlow),对于其他的深度学习框架,开发者可以根据官方的引导指南来创建用于编译和运行训练模型的自定义桥接代码。 ?...近期,nGraph 增加了对 ONNX 的早期支持。拥有「已训练好的」模型的开发者可以用 nGraph 避开框架的复杂性,同时导入模型以便通过 ngraph_api 在集成的、高效的后端测试和运行。...通过 nGraph,数据科学家可以专注于数据科学,而不用在不同的设备上调整模型。...支持的平台 早期支持的后端如下: Intel® Architecture Processors (CPUs), Intel® Nervana™ Neural Network Processor™ (NNPs

    1.1K20

    用于实时数据分析的机器学习:生产中训练模型

    在实时数据分析中,低延迟的数据对于选择和更新模型的特征和权重以获得更精确的结果非常有用。...一些最复杂的实时数据分析涉及在生产环境中部署先进的机器学习模型的同时对其进行训练。通过这种方法,模型的权重和特征会随着可获得的最新数据不断更新。...通过离线训练,组织可以利用更广泛的数据选择和更多的历史数据(例如遥远的几年前的确定流失的财务记录)来训练模型。...其基本前提是这些模型“需要用足够的数据进行训练,以捕捉正常情况,这样在部署时才能捕捉异常情况”,Ege 说。 这一要求适用于某些异常检测应用。...然而,在生产环境中训练模型,并根据实时输入更新其特征和权重的能力,对确保模型对最新可用数据做出反应至关重要。

    15010

    Chem Sci|用于药物-药物相互作用预测的子结构感知图神经网络

    该网络结合了新的子结构注意机制和用于DDI预测的子结构-子结构交互模块(substructure-substructure interaction module,SSIM)的消息传递神经网络。...因此,SSIM通过突出重要的子结构,而不强调次要的子结构用于DDI预测,从而对子结构-子结构相互作用进行建模。...背景 药物-药物相互作用(drug-drug interaction,DDI)会对人体产生难以预期的药理作用,其因果机制通常未知。图神经网络(GNN)已被开发用于更好地理解DDI。...可视化 总结 本文提出了一种基于图的模型,称为SA-DDI,用于DDI预测。...基于DDI从根本上是由化学子结构相互作用引起,本文提出了两种新的策略,包括子结构注意力和相互感知,专门用于检测具有不规则大小和形状的药物分子的子结构,并对子结构与子结构之间的相互作用进行建模。

    98920
    领券