首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    算法测评 | 如何选择合适的 PPI 检测方法以识别关键癌症通路

    在这个方法中,如DOMINO所示,整个PPI网络首先通过社区检测算法被划分为不同的社区。 随后,识别出富含高分基因的子社区。...值得注意的是,在我们的评估中,DOMINO在所有三个指标上表现不佳。 这可能是因为该方法首先将PPI网络划分为社区,然后在每个检测到的社区内识别亚网络。...对于聚类系数,我们注意到,在第一类方法(即DOMINO和HotNet2)中,对高程度节点施加惩罚的方法,其检测概率随着程度的增加而增加(补充图6)。...具体而言,对于具有高特征向量中心性的基因,HotNet2的检测概率并未随中心性的增加而下降,而对于DOMINO和DIAMOnD,检测概率甚至有所增加。...为了确定目标亚网络的检测概率,我们利用F分数来考虑识别出的亚网络中的部分覆盖和假阳性。 具体来说,我们计算了目标亚网络与每个识别出的亚网络之间的F分数,并将最高分作为检测比例。

    7600

    斯坦福李飞飞团队新研究登 Nature 子刊:实现可信 AI,数据的设计、完善、评估是关键

    设计的关键标准是确保数据适用于任务,并覆盖足够的范围来代表模型可能遇到的不同用户和场景。 而目前用于开发 AI 的数据集通常覆盖范围有限或者具有偏差。...提高数据覆盖率的一种方法,是让更广泛的社区参与数据的创建。...而当代表性数据难以获得时,可以用合成数据来填补覆盖空白。比如真实人脸的收集通常涉及隐私问题和抽样偏差,而由深度生成模型创建的合成人脸现在已经被用于减轻数据不平衡和偏差。...有用的元数据包括数据集中参与者的性别、性别、种族和地理位置的统计数据,这有助于发现是否有代表性不足的亚群未被覆盖。数据来源也是一种元数据,它跟踪数据的来源和时间以及产生数据的过程和方法。...当元数据不可用时,Domino 等方法会自动识别评估模型容易出错的数据集群,并使用文本生成来创建这些模型错误的自然语言解释。

    77320

    斯坦福李飞飞团队新研究登 Nature 子刊:实现可信 AI,数据的设计、完善、评估是关键

    设计的关键标准是确保数据适用于任务,并覆盖足够的范围来代表模型可能遇到的不同用户和场景。 而目前用于开发 AI 的数据集通常覆盖范围有限或者具有偏差。...提高数据覆盖率的一种方法,是让更广泛的社区参与数据的创建。...而当代表性数据难以获得时,可以用合成数据来填补覆盖空白。比如真实人脸的收集通常涉及隐私问题和抽样偏差,而由深度生成模型创建的合成人脸现在已经被用于减轻数据不平衡和偏差。...有用的元数据包括数据集中参与者的性别、性别、种族和地理位置的统计数据,这有助于发现是否有代表性不足的亚群未被覆盖。数据来源也是一种元数据,它跟踪数据的来源和时间以及产生数据的过程和方法。...当元数据不可用时,Domino 等方法会自动识别评估模型容易出错的数据集群,并使用文本生成来创建这些模型错误的自然语言解释。

    34220

    斯坦福李飞飞团队新研究登Nature子刊:实现可信AI,数据的设计、完善、评估是关键

    设计的关键标准是确保数据适用于任务,并覆盖足够的范围来代表模型可能遇到的不同用户和场景。 而目前用于开发 AI 的数据集通常覆盖范围有限或者具有偏差。...提高数据覆盖率的一种方法,是让更广泛的社区参与数据的创建。...而当代表性数据难以获得时,可以用合成数据来填补覆盖空白。比如真实人脸的收集通常涉及隐私问题和抽样偏差,而由深度生成模型创建的合成人脸现在已经被用于减轻数据不平衡和偏差。...有用的元数据包括数据集中参与者的性别、性别、种族和地理位置的统计数据,这有助于发现是否有代表性不足的亚群未被覆盖。数据来源也是一种元数据,它跟踪数据的来源和时间以及产生数据的过程和方法。...当元数据不可用时,Domino 等方法会自动识别评估模型容易出错的数据集群,并使用文本生成来创建这些模型错误的自然语言解释。

    28010
    领券