首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏成员
2149
文章
2148038
阅读量
191
订阅数
【2023新书】程序证明,Program Proofs
来源:专知本文为书籍介绍,建议阅读5分钟这本全面和高度可读的教科书教学生如何使用增量方法和验证感知的编程语言Dafny来形式化地推理计算机程序。 《程序证明》一书向大家展示了程序编写规范的意义,以及如何编写连接规范和程序的证明。作者以清晰和幽默的文字,概述了程序推理的基本理论,逐步建立起复杂的概念和应用,直到你对使用对象、数据结构和非微观递归等概念有全面的认知。 程序证明向学生展示了为程序编写规范意味着什么,程序满足这些规范意味着什么,以及如何编写将规范和程序联系起来的证明。K. Rustan M. Le
数据派THU
2023-04-08
3310
独家|OpenCV1.8 使用XML和YAML文件实现文件的输入/输出
翻译:陈之炎 校对:李海明 本文约2400字,建议阅读5分钟本文为大家介绍了OpenCV使用XML和YAML文件实现的输入输出。 目标 本小节将回答以下问题: 如何使用YAML或XML文件打印和读取文本输入到文件和OpenCV? 如何对OpenCV数据结构做相同的操作? 如何为自定义的数据结构做相同的操作? OpenCV中cv::FileStorage , cv::FileNode 和 cv::FileNodeIterator 的数据结构和使用方法。 源代码 C ++ 可以在原文下载源代码,也可以在
数据派THU
2023-03-29
1K0
图学习如何用结构和文本?密歇根大学博士论文《用文本增强结构改进图学习》
来源:专知本文为论文介绍,建议阅读5分钟本文考虑了通过结合结构和文本来改进图学习的重要问题。 机器学习和数据挖掘中的许多重要问题,如知识库推理、个性化实体推荐、科学假设生成等,都可以归结为图数据结构上的学习和推理。这些问题代表了推进图学习的令人兴奋的机会,但也带来了重大挑战。由于图通常是稀疏的,并且由模式定义,因此它们通常不能完全捕获数据中潜在的复杂关系。将图与丰富的辅助文本模态相结合的模型具有更高的表达潜力,但联合处理这些不同的模态——即稀疏的结构化关系和密集的非结构化文本——并不是直接的。 本文考虑了
数据派THU
2023-03-29
2200
图神经网络从入门到入门
来源:AI有道 极市平台本文约5900字,建议阅读10分钟本篇文章将从一个更直观的角度对当前经典流行的GNN网络,包括GCN、GraphSAGE、GAT、GAE以及graph pooling策略DiffPool等等做一个简单的小结。 近年来,深度学习领域关于图神经网络(Graph Neural Networks,GNN)的研究热情日益高涨,图神经网络已经成为各大深度学习顶会的研究热点。GNN处理非结构化数据时的出色能力使其在网络数据分析、推荐系统、物理建模、自然语言处理和图上的组合优化问题方面都取得了新的突
数据派THU
2023-02-28
6170
图数据库和知识图谱在微财风控系统中的探索和应用
来源:AI前线 本文约3500字,建议阅读7分钟 本文为你介绍图数据库作为复杂关系网络分析的一个强有力的工具在微财风控系统中的探索和应用。 近年来随着监管力度的不断提升,金融机构业务的不断发展,交易方式越发便利的背景下。客户、账务、资金等关系也越发复杂,黑产也更加隐蔽,对内部风控要求也在不断加强。传统的关系型数据库在这种复杂的关系网络上发挥的效果越发有限,在多维度的查询上很难在合理的时间内返回结果。图数据库作为复杂关系网络分析的一个强有力的工具,如何高效的发挥其在高性能、高扩展、高稳定性方面的能力,显得至
数据派THU
2022-10-09
5570
【Manning新书】面向数据编程降低软件复杂度
来源:专知本文为书籍介绍,建议阅读5分钟这本书讲述了一个故事,说明了面向数据编程(DOP)的价值,以及如何在现实生产系统中应用它的原则。 面向数据编程是介绍面向数据范式的独一无二的指南。这种开创性的方法用通用的不可变数据结构表示数据。它简化了状态管理,简化了并发性,并消除了在面向对象代码中会发现的常见问题。这本书通过对话、代码片段和图表展示了强大的新思想,帮助您快速了解关于DOP的伟大之处。最重要的是,该范例与语言无关,您将学习编写可以用JavaScript、Ruby、Python、Clojure实现的DO
数据派THU
2022-09-07
9290
【2022新书】有趣的数据结构
来源:专知本文为书籍介绍,建议阅读5分钟理解数据结构如何起作用对于有效地使用它们至关重要。 这本通俗易懂且有趣的书通过数据结构的视角深入介绍了计算思维——数据结构是任何编程工作的关键组成部分。通过图表、伪代码和幽默的类比,你将了解数据结构如何驱动算法操作,不仅可以了解如何构建数据结构,还可以了解如何以及何时使用它们。 本书将为你提供15种以上关键数据结构的实现和使用的强大背景知识,从栈、队列、缓存到布隆过滤器、跳跃表和图。通过在咖啡馆排队来掌握链表,通过编目夏季奥运会的历史来掌握散列表,通过整齐地整理厨房
数据派THU
2022-09-02
3800
【KDD2022教程】图算法公平性:方法与趋势
来源:专知本文为教程介绍,建议阅读5分钟算法公平性是一个有吸引力但又具有挑战性的研究课题。 图是一种普遍存在的数据类型,出现在许多现实世界的应用中,包括社会网络分析、建议和财务安全。尽管这很重要,但几十年的研究已经发展出了丰富的计算模型来挖掘图表。尽管它很繁荣,但最近对潜在的算法歧视的担忧有所增长。图上的算法公平性是一个有吸引力但又具有挑战性的研究课题,它旨在减轻图挖掘过程中引入或放大的偏差。第一个挑战对应于理论挑战,图数据的非IID性质不仅可能使许多现有公平机器学习研究背后的基本假设失效,而且还可能基于
数据派THU
2022-08-29
2840
【KDD2022】图表示学习的网络级推荐系统:工业界视角
来源:专知本文为教程,建议阅读5分钟在本教程中,我们讨论了自监督图嵌入的不同方法家族。 推荐系统是现代消费者网络应用程序的基本组成部分,它试图预测用户的偏好,以更好地服务于相关商品。因此,作为推荐系统输入的高质量用户和项目表示对于个性化推荐至关重要。为了构造这些用户和项目表示,自监督图嵌入已经成为一种原则性的方法,用于嵌入关系数据,如用户社交图、用户成员关系图、用户-项目参与关系图和其他异构图。在本教程中,我们讨论了自监督图嵌入的不同方法家族。在每个家族,我们概述了各种技术,他们的优点和缺点,并阐述最新的
数据派THU
2022-08-29
2640
SIGIR 2022|邻域建模Graph-Masked Transformer提高微信视频点击率预测
来源:机器之心本文约3000字,建议阅读5分钟本文介绍了由腾讯 AI Lab 和微信公众平台共同研发的一种最新的在异质图上基于邻域交互的点击预测新模型。 本文介绍的是腾讯 AI Lab 和微信公众平台共同研发的一种最新的在异质图上基于邻域交互的点击预测新模型。论文题目为《Neighbour Interaction based Click-Through Rate Prediction via Graph-masked Transformer》,论文已被 SIGIR2022 录用。并且在实际线上场景部署 A/
数据派THU
2022-08-29
2150
图神经网络的可解释性方法介绍和GNNExplainer解释预测的代码示例(附代码)
来源:DeepHub IMBA本文约3800字,建议阅读7分钟本文使用pytorch-geometric实现的GNNExplainer作为示例。 深度学习模型的可解释性为其预测提供了人类可以理解的推理。如果不解释预测背后的原因,深度学习算法就像黑匣子,对于一些场景说是无法被信任的。不提供预测的原因也会阻止深度学习算法在涉及跨域公平、隐私和安全的关键应用程序中使用。 深度学习模型的可解释性有助于增加对模型预测的信任, 提高模型对与公平、隐私和其他安全挑战相关的关键决策应用程序的透明度,并且可以让我们了解网络特
数据派THU
2022-08-29
8480
原创 | 一文读懂图神经网络
作者:钟阳扬审校:陈之炎 本文约2500字,建议阅读5分钟本文对图神经网络基本概念以及典型的模型做简要的介绍。 图(Graph)是一种数据结构, 能够很自然地建模现实场景中一组实体之间的复杂关系。在真实世界中,很多数据往往以图的形式出现, 例如社交网络、电商购物、蛋白质相互作用关系等。因此,近些年来使用智能化方式来建模分析图结构的研究越来越受到关注, 其中基于深度学习的图建模方法的图神经网络(Graph Neural Network, GNN), 因其出色的性能已广泛应用于社会科学、自然科学等多个领域。 基
数据派THU
2022-06-13
1.4K0
基于图注意力机制和Transformer的异常检测
来源:专知本文为论文,建议阅读6分钟本文提出了一种基于图注意力和Transformer的异常检测模型。 异常检测对电力行业的发展有着重要的影响,如何根据大规模电力数据进行异常检测是重要的研究热点.目前,大多数研究通过聚类或神经网络进行异常检测. 但是这些方法忽略了时序数据之间潜在的关联关系及某些特点的重要信息,没有充分挖掘出数据的潜在价值. 因此,提出了一种基于图注意力和Transformer的异常检测模型. 该模型首先根据数据中台中获取的电力数据(主要包括用户ID、电能表ID、用户类型、电流、电压、功率
数据派THU
2022-05-20
8800
改善图形神经网络,提升GNN性能的三个技巧
来源:DeepHub IMBA本文约2800字,建议阅读8分钟本文总结了一些技巧来提高 GNN 模型的性能。 GNN 提供了一种在图结构化数据上使用深度学习技术的方法。图结构数据无处不在:从化学(例如分子图)到社交媒体(例如社交网络)以及金融投资(例如 VC 投资网络),GNN 在各种任务中显示出最先进的性能¹ ²。 在我的以前的一个实践:在投资者、初创公司和个人组成的投资网络上预测初创公司未来的融资轮次,其基线随机森林模型已经相当强大(AUC = 0.69)。但是GNN 模型(AUC = 0.66)一直落
数据派THU
2022-05-18
2550
GNN落地不再难,一文总结高效GNN和可扩展图表示学习最新进展
来源:机器之心本文约4200字,建议阅读8分钟剑桥大学在读博士生 Chaitanya K. Joshi 从数据准备、高效架构和学习范式三个方向综述了研究者们在克服这些问题时取得的进展。 图神经网络在应用到现实世界时会面临很多挑战,比如内存限制、硬件限制、可靠性限制等。在这篇文章中,剑桥大学在读博士生 Chaitanya K. Joshi 从数据准备、高效架构和学习范式三个方向综述了研究者们在克服这些问题时取得的进展。 用于高效和可扩展的图形表示学习的工具箱。 本文旨在概述关于高效图神经网络和可扩展图表示学
数据派THU
2022-05-07
4370
【哈佛大学Marinka Zitnik】图神经网络在计算生物医学中的应用:药物发现与疾病治疗
来源:专知本文约1000字,建议阅读6分钟在生物医学中如何用图神经网络?哈佛大学Marinka Zitnik团队系统性对图学习技在计算生物学应用做了研究,值得关注! 我们很高兴地邀请到来自哈佛大学的Marinka Zitnik教授来给我们做一个关于计算生物学中的图神经网络的讲座。在本讲座中,Marinka教授概述了为什么图学习技术可以极大地帮助计算生物学研究。具体来说,本演讲涵盖了3个范例用例: (1) 通过异构知识图谱的多关系链接预测发现安全的药物-药物组合;(2)通过学习子图嵌入对患者结局和疾病进行分
数据派THU
2022-04-26
5580
ICLR 2022 || 通过邻域/度/初始特征重建的等图自编码器
📷 来源:深度学习与图网络本文为论文,建议阅读5分钟该论文提出了一种新的图表示学习方法。 Graph Auto-Encoder via Neighborhood Wasserstein Reconst
数据派THU
2022-03-21
3730
「图神经网络东」最新2022综述
来源:专知本文约5000字,建议阅读5分钟本文为你介绍了《图神经网络综述》。 中国石油大学《图神经网络最新》综述论文 近几年来,将深度学习应用到处理和图结构数据相关的任务中越来越受到人们的关注。图神经网络的出现使其在上述任务中取得了重大突破,比如在社交网络、自然语言处理、计算机视觉甚至生命 科学等领域得到了非常广泛的应用。图神经网络可以把实际问题看作图中节点之间的连接和消息传播 问题,对节点之间的依赖关系进行建模,从而能够很好地处理图结构数据。鉴于此,系统综述了图神经网络模型以及应用。首先从谱域、空间域和
数据派THU
2022-03-04
3650
2021年Graph ML热门趋势和主要进展总结
📷 来源:DeepHub IMBA本文约4700字,建议阅读9分钟 本文为你介绍 Graph ML 这一年的进展进行结构化,并重点介绍 🔥 趋势和主要进步。 对于 Graph ML 来说2021年是重要的一年——成千上万的论文、无数的会议和研讨会......说明这个领域是在蓬勃的发展。我将Graph ML 这一年的进展进行结构化的展示,并重点介绍 🔥 趋势和主要进步。 无论您是在研究细分的主题还是刚开始使用 Graph ML - 我们都希望这篇文章是一个很好的参考点。这个领域太大了如果我错过了一些重要的东西
数据派THU
2022-03-04
2610
用AI分析食物成分,让你能更好地进行营养搭配!
人工智能已经进入游戏,自动驾驶和其他领域,并取得了不同的成功,现在它正在尝试烹饪。在谷歌的人工智能技术击败了英国烘培大赛的赢家之后,索尼开发了一种名为FlavorGraph的深度学习系统将大蒜、橄榄和牛奶等成分配对。
数据派THU
2021-05-11
1.1K0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档