开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

在StellarGraph返回NaNs中使用Hinsage/Graphsage的链接预测

在StellarGraph中，Hinsage（Hierarchical Sampling GraphSAGE）和GraphSAGE（Graph Sample and Aggregated GraphSAGE）是用于链接预测的两种常用方法。当在链接预测任务中使用Hinsage/Graphsage时，有时会遇到返回NaNs（Not a Number）的情况。

NaNs是一种特殊的数值，表示无法表示或计算的结果。在链接预测中，返回NaNs通常意味着模型在计算过程中遇到了问题，导致无法得出有效的预测结果。

要解决返回NaNs的问题，可以考虑以下几个方面：

数据质量：首先，检查输入数据的质量。确保数据没有缺失值、异常值或其他错误。可以使用数据清洗和预处理技术来处理数据，例如填充缺失值、处理异常值等。
模型参数：检查模型的参数设置。确保参数设置合理，并且与数据的特征和规模相匹配。例如，检查图的大小、采样邻居节点的数量、聚合函数的选择等。
训练策略：调整训练策略可能有助于解决返回NaNs的问题。可以尝试使用不同的优化算法、学习率调度器、正则化技术等来改善模型的训练效果。
特征工程：进行合适的特征工程可能有助于提高模型的性能。根据具体任务的特点，可以考虑使用不同的特征表示方法、特征选择技术等来提取和选择有效的特征。
模型选择：如果问题仍然存在，可以尝试使用其他链接预测方法或模型。除了Hinsage/Graphsage，还有许多其他的链接预测算法可供选择，例如基于图卷积网络（GCN）、图注意力网络（GAT）等。

总之，在使用Hinsage/Graphsage进行链接预测时，如果遇到返回NaNs的情况，需要仔细检查数据质量、模型参数、训练策略、特征工程等方面，逐步排查问题并进行调整。通过不断优化和调整，可以提高模型的性能和预测效果。

腾讯云提供了一系列与图计算和机器学习相关的产品和服务，例如腾讯云图数据库TGraph、腾讯云机器学习平台Tencent Machine Learning Platform等。您可以通过访问腾讯云官方网站（https://cloud.tencent.com/）了解更多相关产品和详细信息。

相关搜索:tail()在样本外预测中的使用在Python中搜索特定超链接后返回超链接的URL值在Pandas中，Groupby和fill NaNs使用之前和之后的值的均值在Tensorflow 2.0中使用加载的Estimator进行预测用于在sql中返回链接表中的值的查询在jQuery中.off()函数之后返回到按钮的链接如何使用ACF返回WordPress REST API中的固定链接？对于在调试中返回404的JavaScript文件,"添加为链接"使用开关返回输入，在表单中返回不同的<Input>在CNN模型中对图像使用预测方法时的尺寸误差在toString方法中返回动态堆栈链接列表的所有值使用链接中的变量调用curl将返回一个空行如何使用UIWebView在Safari中打开除某些链接之外的所有链接？在python中使用selenium捕获web中的链接使用INSERT的返回值...在多个后续插入中返回在Access中使用VBA和SQL更新预测过程中的表使用Google Cloud AutoML模型在Firebase函数中预测存储在Google Cloud存储中的图像使用石墨烯在Graphql中返回字符串的返回字典在IE8中使用Raphael的文本链接在ms-access中的下列链接后使用openform

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

【教程】用GraphSAGE和UnsupervisedSampler进行节点表示学习

此外，这个笔记本展示了在下游节点分类任务中使用学习到的嵌入（按主题对论文进行分类）。请注意，节点嵌入也可用于其他图机器学习任务，如链接预测、社区检测等。...在我们的无监督GraphSAGE的实现中，节点对的训练集是由图中同等数量的正负（目标，背景）节点对组成。...整个模型通过最小化所选择的损失函数（例如，预测的节点对标签和真实链接标签之间的二进制交叉熵），使用随机梯度下降法（SGD）更新模型参数来进行端到端的训练，按要求生成迷你批次的 "训练 "链接并输入模型。...另外，在Keras 2.2.4及以上版本中可以使用多个工作者，由于多线程，它可以大大加快训练过程。...在这个例子中，我们将使用节点嵌入来训练一个简单的逻辑回归分类器来预测Cora数据集中的论文题目。

9423 0

. | 预测人工智能的未来：在指数级增长的知识网络中使用基于机器学习的链接预测

作者将未来研究主题的预测形式化为人工智能领域中一个指数级增长的语义网络中的链接预测任务。目标是预测未来哪些尚未连接的节点，代表尚未共同研究的科学概念，将会被连接起来。...链接预测在计算机科学中是一个常见问题，通过经典的度量和特征以及机器学习技术来解决。在语义网络中对研究方向进行预测的目标是向研究者提供新的想法。在某种程度上，作者希望建立一个在科学上有创造力的人工缪斯。...数据的来源图 2 图 3 图 4 图 5 作者使用1992年到2020年在arXiv上发布的论文，在类别cs.AI、cs.LG、cs.NE和stat.ML中，创建了一个动态的语义网络。...实验部分图 6 作者展示了预测语义网络中新链接（基于2020年前的数据训练，预测2021年的研究）的各种方法，范围从纯统计学方法到带有手工制作特征（NF）的神经网络，再到不含NF的机器学习（ML）模型...结果显示在图6中，使用NF作为ML模型输入的方法获得了最高的AUC分数。没有ML的纯网络特征也具有竞争力，而纯ML方法尚未胜过那些带有NF的方法。

2011 0

GNN 系列（三）：GraphSAGE

其次，GCN在训练时需要知道整个图的结构信息(包括待预测的节点), 这在现实某些任务中也不能实现(比如用今天训练的图模型预测明天的数据，那么明天的节点是拿不到的)。...GraphSAGE的出现就是为了解决这样的问题，这篇文中我们将会详细得讨论它。原文链接：GNN 系列（三）：GraphSAGE 作者：金良，杨开漠 Inductive learning v.s....与其他类型的数据不同，图数据中的每一个节点可以通过边的关系利用其他节点的信息，这样就产生了一个问题，如果训练集上的节点通过边关联到了预测集或者验证集的节点，那么在训练的时候能否用它们的信息呢?...概述 GraphSAGE是一个inductive框架，在具体实现中，训练时它仅仅保留训练样本到训练样本的边。...1.对邻居采样 2.采样后的邻居embedding传到节点上来，并使用一个聚合函数聚合这些邻居信息以更新节点的embedding 3.根据更新后的embedding预测节点的标签算法细节 1.

1K2 0

NIPS 2017 | 斯坦福GraphSAGE：改进的GCN

GraphSAGE模型机构：斯坦福大学代码： https://github.com/cenyk1230/GATNE 官方介绍链接： http://snap.stanford.edu/graphsage.../ 发表： NIPS 2017 一、动机动机一：大型图中节点的embedding在机器学习中有许多应用（例如，节点分类、聚类、链接预测）。...第3.2节，我们描述如何使用标准随机梯度下降和反向传播技术学习GraphSAGE模型的参数。...3.1、前向传播：embedding生成在模型已经过训练且参数固定的情况下进行预测其前向传播的方法为：如上图所示，2～6行我们可以看到该算法的遍历操作：该过程为：在每一层k，对于每个节点v，...该损失函数鼓励附近的节点具有相似的表示，同时强制要求不同节点的表示具有高度不同性：其中： v是在固定长度随机游走中，在u附近共现的节点，σ是sigmoid函数，Pn是负采样分布，Q定义了负样本的数量

6071 0

GraphSAGE: GCN落地必读论文

在图中学习目标是学习目标是直接生成当前节点的 embedding，例如 DeepWalk、LINE，把每个节点 embedding 作为参数，并通过 SGD 优化，又如 GCN，在训练过程中使用图的拉普拉斯矩阵进行计算...可视化例子：下图是 GraphSAGE 生成目标节点（红色）embededing 并供下游任务预测的过程： ?...将 embedding 作为全连接层的输入，预测目标节点的标签。 b. 伪代码: ?...3.5 运行时间和参数敏感性计算时间:下图A中 GraphSAGE 中 LSTM 训练速度最慢，但相比DeepWalk，GraphSAGE 在预测时间减少 100-500 倍（因为对于未知节点，DeepWalk...聚合K跳内信息：在 GraphSAGE， K=2 相比 K=1 有 10-15% 的提升；但将 K 设置超过 2 ，边际效果上只有 0-5% 的提升，但是计算时间却变大了 10-100 倍。 ?

5.2K3 2

图神经网络11-GCN落地的必读论文：GraphSAGE

1 GraphSAGE论文简介论文：Inductive Representation Learning on Large Graphs 在大图上的归纳表示学习链接：https://arxiv.org...，对于节点分类和链接预测问题的表现也比较突出 2 GraphSAGE动机第一点：大多数graph embedding框架是transductive(直推式的), 只能对一个固定的图生成embedding...,来预测图中想预测的信息; 5 GraphSAGE模型细节 GraphSAGE的目标是基于参数h的相邻节点的某种组合来学习每个节点的表示形式。...在k = 0层中，我们将初始化嵌入其初始特征向量的邻居节点。 ? 在上面的示例中，我们简单地设置k = 2并使用节点A的邻居和邻居邻居获得最终的目标节点表示形式。...但是，太多的邻域可能会稀释节点v的节点表示形式，但是太少的邻域（少于2个）可能类似于不使用GNN而是只使用MLP而已–值得深思步骤2 Update 在基于节点v的邻居获得聚合表示后，请使用其先前表示和聚合表示的组合来更新当前节点

2.6K3 0

图神经网络从入门到入门

图3 因此一个比较常见的图神经网络的应用模式如下图（图4），输入是一个图，经过多层图卷积等各种操作以及激活函数，最终得到各个节点的表示，以便于进行节点分类、链接预测、图与子图的生成等等任务。...图6 当然，其实GCN的缺点也是很显然易见的，第一，GCN需要将整个图放到内存和显存，这将非常耗内存和显存，处理不了大图；第二，GCN在训练时需要知道整个图的结构信息(包括待预测的节点), 这在现实某些任务中也不能实现...到此为止，整个模型的架构就讲完了，那么GraphSAGE是如何学习聚合器的参数以及权重矩阵呢？如果是有监督的情况下，可以使用每个节点的预测lable和真实lable的交叉熵作为损失函数。...其中，GraphSAGE是采用全局平均池化；DiffPool-DET是一种DiffPool变体，使用确定性图聚类算法生成分配矩阵；DiffPool-NOLP是DiffPool的变体，取消了链接预测目标部分...总的来说，DiffPool方法在GNN的所有池化方法中获得最高的平均性能。

6202 0

图神经网络从入门到入门

图3 因此一个比较常见的图神经网络的应用模式如下图（图4），输入是一个图，经过多层图卷积等各种操作以及激活函数，最终得到各个节点的表示，以便于进行节点分类、链接预测、图与子图的生成等等任务。...图6 当然，其实GCN的缺点也是很显然易见的，第一，GCN需要将整个图放到内存和显存，这将非常耗内存和显存，处理不了大图；第二，GCN在训练时需要知道整个图的结构信息(包括待预测的节点), 这在现实某些任务中也不能实现...到此为止，整个模型的架构就讲完了，那么GraphSAGE是如何学习聚合器的参数以及权重矩阵呢？如果是有监督的情况下，可以使用每个节点的预测lable和真实lable的交叉熵作为损失函数。...其中，GraphSAGE是采用全局平均池化；DiffPool-DET是一种DiffPool变体，使用确定性图聚类算法生成分配矩阵；DiffPool-NOLP是DiffPool的变体，取消了链接预测目标部分...总的来说，DiffPool方法在GNN的所有池化方法中获得最高的平均性能。

1K4 0

PGL图学习之图神经网络GraphSAGE、GIN图采样算法

图片 GraphSAGE也是图嵌入算法中的一种。在论文Inductive Representation Learning on Large Graphs 在大图上的归纳表示学习中提出。...github链接和官方介绍链接。与node2vec相比较而言，node2vec是在图的节点级别上进行嵌入，GraphSAGE则是在整个图的级别上进行嵌入。...，对于节点分类和链接预测问题的表现也比较突出。...0.2 回顾GCN及其问题在大型图中，节点的低维向量embedding被证明了作为各种各样的预测和图分析任务的特征输入是非常有用的。...顶点embedding最基本的基本思想是使用降维技术从高维信息中提炼一个顶点的邻居信息，存到低维向量中。这些顶点嵌入之后会作为后续的机器学习系统的输入，解决像顶点分类、聚类、链接预测这样的问题。

5275 0

终于有人总结了图神经网络！

图3 因此一个比较常见的图神经网络的应用模式如下图（图4），输入是一个图，经过多层图卷积等各种操作以及激活函数，最终得到各个节点的表示，以便于进行节点分类、链接预测、图与子图的生成等等任务。 ?...图6 当然，其实GCN的缺点也是很显然易见的，第一，GCN需要将整个图放到内存和显存，这将非常耗内存和显存，处理不了大图；第二，GCN在训练时需要知道整个图的结构信息(包括待预测的节点), 这在现实某些任务中也不能实现...如果是有监督的情况下，可以使用每个节点的预测lable和真实lable的交叉熵作为损失函数。...其中，GraphSAGE是采用全局平均池化；DiffPool-DET是一种DiffPool变体，使用确定性图聚类算法生成分配矩阵；DiffPool-NOLP是DiffPool的变体，取消了链接预测目标部分...，第一，GCN需要将整个图放到内存和显存，这将非常耗内存和显存，处理不了大图；第二，GCN在训练时需要知道整个图的结构信息(包括待预测的节点) 2.GraphSAGE的优点：（1）利用采样机制，很好的解决了

10.9K8 1

PGL图学习项目合集&数据集分享&技术归纳业务落地技巧

contributionType=1 现在已经覆盖了图的介绍，图的主要类型，不同的图算法，在Python中使用Networkx来实现它们，以及用于节点标记，链接预测和图嵌入的图学习技术，最后讲了GNN分类应用以及未来发展方向...在GraphSAGE中，还有聚合层数\迭代次数，比如说只考虑了一阶邻接节点，那就只有一层聚合（迭代了一次），以此类推。...从复杂度角度考虑：如果没有采样，单个batch的内存使用和预期运行时间是不可预测的；最坏的情况是，即所有的节点都是目标节点的邻接节点。...GraphSAGE在采样的时候和（带权）随机游走进行负采样的时候，考虑边的权重了。 14.如果只有图、没有节点特征，能否使用GraphSAGE？...在聚合邻居节点时，可以考虑节点的重要性；在PinSAGE实践中，使用的就是加权平均（weighted-mean），原文把它称作 importance pooling 。

3302 0

图神经网络必读的5个基础模型: GCN, GAT, GraphSAGE, GAE, DiffPool.

图3 因此一个比较常见的图神经网络的应用模式如下图（图4），输入是一个图，经过多层图卷积等各种操作以及激活函数，最终得到各个节点的表示，以便于进行节点分类、链接预测、图与子图的生成等等任务。...图6 当然，其实GCN的缺点也是很显然易见的，第一，GCN需要将整个图放到内存和显存，这将非常耗内存和显存，处理不了大图；第二，GCN在训练时需要知道整个图的结构信息(包括待预测的节点), 这在现实某些任务中也不能实现...到此为止，整个模型的架构就讲完了，那么GraphSAGE是如何学习聚合器的参数以及权重矩阵呢？如果是有监督的情况下，可以使用每个节点的预测lable和真实lable的交叉熵作为损失函数。...其中，GraphSAGE是采用全局平均池化；DiffPool-DET是一种DiffPool变体，使用确定性图聚类算法生成分配矩阵；DiffPool-NOLP是DiffPool的变体，取消了链接预测目标部分...总的来说，DiffPool方法在GNN的所有池化方法中获得最高的平均性能。

4.7K1 0

Datawhale组队学习动手学数据分析第一章

参考链接： Python中的Inplace运算符| 2(ixor()，iand()，ipow()等) 1.1载入数据任务1：导入numpy和pandas import numpy as np import... 891 rows × 8 columns 2.2筛选的逻辑任务一：我们以"Age"为筛选条件，显示年龄在10岁以下的乘客信息。 ...Harold Theodormale4.001134774211.1333NaNS 62 rows × 12 columns 任务二：以"Age"为条件，将年龄在10岁以上和50岁以下的乘客信息显示出来...William Henrymale35.0003734508.0500NaNS 连接两个逻辑条件需要用括号括起来任务三：将midage的数据中第100行的"Pclass"和"Sex"的数据显示出来...Tidomale 任务五：使用iloc方法将midage的数据中第100，105，108行的"Pclass"，"Name"和"Sex"的数据显示出来 midage.iloc[[100,105,108

7793 0

图神经网络从入门到入门

图3 因此一个比较常见的图神经网络的应用模式如下图（图4），输入是一个图，经过多层图卷积等各种操作以及激活函数，最终得到各个节点的表示，以便于进行节点分类、链接预测、图与子图的生成等等任务。...图6 当然，其实GCN的缺点也是很显然易见的，第一，GCN需要将整个图放到内存和显存，这将非常耗内存和显存，处理不了大图；第二，GCN在训练时需要知道整个图的结构信息(包括待预测的节点), 这在现实某些任务中也不能实现...到此为止，整个模型的架构就讲完了，那么GraphSAGE是如何学习聚合器的参数以及权重矩阵呢？如果是有监督的情况下，可以使用每个节点的预测lable和真实lable的交叉熵作为损失函数。...其中，GraphSAGE是采用全局平均池化；DiffPool-DET是一种DiffPool变体，使用确定性图聚类算法生成分配矩阵；DiffPool-NOLP是DiffPool的变体，取消了链接预测目标部分...，第一，GCN需要将整个图放到内存和显存，这将非常耗内存和显存，处理不了大图；第二，GCN在训练时需要知道整个图的结构信息(包括待预测的节点) 2.GraphSAGE的优点：（1）利用采样机制，很好的解决了

5333 0

神经网络图的简介（基本概念，DeepWalk以及GraphSage算法）

GNN的一个典型应用是节点分类。本质上，图中的每个节点都与一个标签相关联，我们希望预测未标记节点的标签。本节将介绍论文中描述的算法，GNN的第一个提法，因此通常被视为原始GNN。...在节点分类问题中，每个节点v都可以用其特征x_v表示并且与已标记的标签t_v相关联。给定部分标记的图G，目标是利用这些标记的节点来预测未标记的节点标签。...这是因为，在原始方法中，不同的迭代使用转移函数f的相同参数，而不同MLP层中的不同参数允许分层特征提取。...1中生成的节点序列学习每个节点的嵌入在随机游走过程中，下一个节点是从前一节点的邻居统一采样。...由于每个节点的孩子节点的概率和为1，因此在多层softmax中，所有顶点的概率之和等于1的特性仍然能够保持。

1.4K4 0

Python数据清洗实践

数据清洗是数据科学中很少提及的一点，因为它没有训练神经网络或图像识别那么重要，但是数据清洗却扮演着非常重要的角色。没有它，机器学习预测模型将不及我们预期那样有效和精准。...问卷结果中缺失的数据在使用前必须做相应的解释及处理。下面，我们将看到一份关于不同层次学生入学考试的数据集，包括得分、学校偏好和其他细节。通常，我们先导入Pandas并读入数据集。...使用中位数替换缺失值我们可以使用非数值型值所在列的中位数进行替换，下列中的中位是为3.5。...，它包含一些我们不希望包含在模型中的字符串，我们可以使用下面的函数来删除每个字符串的某些字符。...以上只是数据科学所需要的一小部分。清理完数据后，您可以在处理数据之前对其进行可视化（数据可视化），并根据结果进行预测。

2.3K2 0

图学习项目合集&数据集分享&技术归纳业务落地技巧

contributionType=1 现在已经覆盖了图的介绍，图的主要类型，不同的图算法，在Python中使用Networkx来实现它们，以及用于节点标记，链接预测和图嵌入的图学习技术，最后讲了GNN分类应用以及未来发展方向...在GraphSAGE中，还有聚合层数\迭代次数，比如说只考虑了一阶邻接节点，那就只有一层聚合（迭代了一次），以此类推。...从复杂度角度考虑：如果没有采样，单个batch的内存使用和预期运行时间是不可预测的；最坏的情况是，即所有的节点都是目标节点的邻接节点。...GraphSAGE在采样的时候和（带权）随机游走进行负采样的时候，考虑边的权重了。 14.如果只有图、没有节点特征，能否使用GraphSAGE？...在聚合邻居节点时，可以考虑节点的重要性；在PinSAGE实践中，使用的就是加权平均（weighted-mean），原文把它称作 importance pooling 。

9672 1

Python数据清洗实践

数据清洗是数据科学中很少提及的一点，因为它没有训练神经网络或图像识别那么重要，但是数据清洗却扮演着非常重要的角色。没有它，机器学习预测模型将不及我们预期那样有效和精准。...问卷结果中缺失的数据在使用前必须做相应的解释及处理。下面，我们将看到一份关于不同层次学生入学考试的数据集，包括得分、学校偏好和其他细节。通常，我们先导入Pandas并读入数据集。...使用中位数替换缺失值我们可以使用非数值型值所在列的中位数进行替换，下列中的中位是为3.5。...，它包含一些我们不希望包含在模型中的字符串，我们可以使用下面的函数来删除每个字符串的某些字符。...以上只是数据科学所需要的一小部分。清理完数据后，您可以在处理数据之前对其进行可视化（数据可视化），并根据结果进行预测。

1.8K3 0

PGL图学习之图神经网络GraphSAGE、GIN图采样算法

contributionType=1 在图神经网络中，使用的数据集可能是亿量级的数据，而由于GPU/CPU资源有限无法一次性全图送入计算资源，需要借鉴深度学习中的mini-batch思想。...GraphSAGE也是图嵌入算法中的一种。在论文Inductive Representation Learning on Large Graphs 在大图上的归纳表示学习中提出。...github链接和官方介绍链接。与node2vec相比较而言，node2vec是在图的节点级别上进行嵌入，GraphSAGE则是在整个图的级别上进行嵌入。...，对于节点分类和链接预测问题的表现也比较突出。...顶点embedding最基本的基本思想是使用降维技术从高维信息中提炼一个顶点的邻居信息，存到低维向量中。这些顶点嵌入之后会作为后续的机器学习系统的输入，解决像顶点分类、聚类、链接预测这样的问题。

1.1K2 0

训练的神经网络不工作？一文带你跨过这37个坑

机器之心对该文进行了编译，原文链接请见文末。神经网络已经持续训练了 12 个小时。它看起来很好：梯度在变化，损失也在下降。但是预测结果出来了：全部都是零值，全部都是背景，什么也检测不到。...检查训练、验证、测试集的预处理 CS231n 指出了一个常见的陷阱：「任何预处理数据（例如数据均值）必须只在训练数据上进行计算，然后再应用到验证、测试数据中。...监控其它指标有时损失并不是衡量你的网络是否被正确训练的最佳预测器。如果可以的话，使用其它指标来帮助你，比如精度。 22. 测试任意的自定义层你自己在网络中实现过任意层吗？...给它一些时间也许你的网络需要更多的时间来训练，在它能做出有意义的预测之前。如果你的损失在稳步下降，那就再多训练一会儿。 32....克服 NaNs 据我所知，在训练 RNNs 时得到 NaN（Non-a-Number）是一个很大的问题。一些解决它的方法：减小学习速率，尤其是如果你在前 100 次迭代中就得到了 NaNs。

1.1K10 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭