一个组织是否可以读取另一个组织的隐式数据集合_是否可以创建一个模板，从另一个结构中生成一个完全常量的隐式可转换结构？_您是否可以使用另一个列表/集合中的值为数据框中的计算指定列？ - 腾讯云开发者社区

AI 科技评论按：近日张钹院士和朱军教授团队在 arXiv 上贴出一篇论文《Graphical Generative Adversarial Networks》，论文提出了一种 Graphical-GAN 模型框架，该模型综合了深度隐式模型（Deep Implicit Model）和概率图模型（Probabilistic Graphical Models）的优点，能够利用数据的基本结构来进一步提升生成网络的表现。

您找到你想要的搜索结果了吗？

是的

没有找到

Spark机器学习实战 (十二) - 推荐系统实战

数据处理的大一统——从 Shell 脚本到 SQL 引擎

“工业流水线”的鼻祖，福特 T 型汽车[1]的电机装配，将组装过程拆成 29 道工序，将装备时间由平均二十分钟降到五分钟，效率提升四倍，下图图源[2]。

条件随机场（CRF）的详细解释

条件随机场(CRF)由Lafferty等人于2001年提出，结合了最大熵模型和隐马尔可夫模型的特点，是一种无向图模型，常用于标注或分析序列资料，如自然语言文字或是生物序列。近年来在分词、词性标注和命名实体识别等序列标注任务中取得了很好的效果。

SIGIR2021 | 一种自动发掘CTR预估中强大特征交互的通用方法

本文分享一篇发表在SIGIR’21的点击率预估方面的文章，AutoPI：一种自动发掘点击率预估中强大特征交互的通用方法[1]

深入详解 Jetpack Compose | 优化 UI 构建

人们对于 UI 开发的预期已经不同往昔。现如今，为了满足用户的需求，我们构建的应用必须包含完善的用户界面，其中必然包括动画 (animation) 和动效 (motion)，这些诉求在 UI 工具包创建之初时并不存在。为了解决如何快速而高效地创建完善的 UI 这一技术难题，我们引入了 Jetpack Compose —— 这是一个现代的 UI 工具包，能够帮助开发者们在新的趋势下取得成功。

Pyspark学习笔记（四）---弹性分布式数据集 RDD [Resilient Distribute Data]（上）

RDD是Spark编程中最基本的数据对象，无论是最初加载的数据集，还是任何中间结果的数据集，或是最终的结果数据集，都是RDD。在Pyspark中，RDD是由分布在各节点上的python对象组成，如列表，元组，字典等。 RDD主要是存储在内存中（亦可持久化到硬盘上），这就是相对于Hadoop的MapReduce的优点，节省了重新读取硬盘数据的时间。

MYSQL基础知识和案例分享

· Mysql 5.1之前默认的存储引擎，支持包括全文索引、压缩、空间函数(GIS)等，不支持事务和行级锁。最大的缺陷是崩溃后无法安全恢复。

工大SCIR | 文本摘要简述

随着互联网产生的文本数据越来越多，文本信息过载问题日益严重，对各类文本进行一个“降维”处理显得非常必要，文本摘要便是其中一个重要的手段。文本摘要旨在将文本或文本集合转换为包含关键信息的简短摘要。文本摘要按照输入类型可分为单文档摘要和多文档摘要。单文档摘要从给定的一个文档中生成摘要，多文档摘要从给定的一组主题相关的文档中生成摘要。按照输出类型可分为抽取式摘要和生成式摘要。抽取式摘要从源文档中抽取关键句和关键词组成摘要，摘要全部来源于原文。生成式摘要根据原文，允许生成新的词语、短语来组成摘要。按照有无监督数据可以分为有监督摘要和无监督摘要。本文主要关注单文档、有监督、抽取式、生成式摘要。

【学习】LinkedIn大数据专家深度解读日志的意义（二）

第二部分：数据集成　　请让我首先解释一下“数据集成”是什么意思，还有为什么我觉得它很重要，之后我们再来看看它和日志有什么关系。数据集成就是将数据组织起来，使得在与其有关的服务和系统中可以访问它们。“数据集成”(data integration)这个短语应该不止这么简单，但是我找不到一个更好的解释。而更常见的术语 ETL 通常只是覆盖了数据集成的一个有限子集(译注：ETL，Extraction-Transformation-Loading的缩写，即数据提取、转换和加载)——相对于关系型数据仓库。但

卷积神经网络表征可视化研究综述（1）

近年来, 深度学习在图像分类、目标检测及场景识别等任务上取得了突破性进展, 这些任务多以卷积神经网络为基础搭建识别模型, 训练后的模型拥有优异的自动特征提取和预测性能, 能够为用户提供“输入–输出”形式的端到端解决方案. 然而, 由于分布式的特征编码和越来越复杂的模型结构, 人们始终无法准确理解卷积神经网络模型内部知识表示, 以及促使其做出特定决策的潜在原因. 另一方面, 卷积神经网络模型在一些高风险领域的应用, 也要求对其决策原因进行充分了解, 方能获取用户信任. 因此, 卷积神经网络的可解释性问题逐渐受到关注. 研究人员针对性地提出了一系列用于理解和解释卷积神经网络的方法, 包括事后解释方法和构建自解释的模型等, 这些方法各有侧重和优势, 从多方面对卷积神经网络进行特征分析和决策解释. 表征可视化是其中一种重要的卷积神经网络可解释性方法, 能够对卷积神经网络所学特征及输入–输出之间的相关关系以视觉的方式呈现, 从而快速获取对卷积神经网络内部特征和决策的理解, 具有过程简单和效果直观的特点. 对近年来卷积神经网络表征可视化领域的相关文献进行了综合性回顾, 按照以下几个方面组织内容: 表征可视化研究的提起、相关概念及内容、可视化方法、可视化的效果评估及可视化的应用, 重点关注了表征可视化方法的分类及算法的具体过程. 最后是总结和对该领域仍存在的难点及未来研究趋势进行了展望.

比9种SOTA GNN更强！谷歌大脑提出全新图神经网络GKATs

来源：Google、新智元本文约2550字，建议阅读5分钟本文为你介绍谷歌大脑与牛津大学、哥伦比亚大学的研究人员提出的一种全新GNN：GKATs。 [ 导读 ]GNN虽牛，但也避免不了计算复杂性等问题。为此，谷歌大脑与牛津大学、哥伦比亚大学的研究人员提出了一种全新的GNN：GKATs。不仅解决了计算复杂度问题，还被证明优于9种SOTA GNN。从社交网络到生物信息学，再到机器人学中的导航和规划问题，图在各种现实世界的数据集中普遍存在。于是乎，人们对专门用于处理图结构数据的图神经网络（GNN）产生了极

CIKM 2019 挑战杯冠军方案分享：「初筛-精排」两阶求解框架

近日，在中国北京举办 CIKM 2019 AnalytiCup 中，由来自浙江大学、中央财经大学、阿里巴巴等机构组成的团队 WWG 摘得「用户行为预测」赛道的桂冠。

降低Java垃圾回收开销的5条建议

随着一再拖延而即将发布的 Java9，G1(“Garbage First”)垃圾回收器将被成为 HotSpot 虚拟机默认的垃圾回收器。从 serial 垃圾回收器到CMS 收集器， JVM 见证了许多 GC 实现，而 G1 将成为其下一代垃圾回收器。

CIKM 2019 挑战杯「用户行为预测」冠军方案：层次GNN模型在推荐中的应用

近日，在中国北京举办 CIKM 2019 AnalytiCup 中，由来自浙江大学、中央财经大学、阿里巴巴等机构组成的团队 WWG 摘得「用户行为预测」赛道的桂冠。

CIKM 2019 挑战杯冠军方案分享：「初筛-精排」两阶求解框架

SQL Server数据库高级进阶之事务实战演练

一、SQL Server事务的本质 • 什么是SQL Server数据库事务？事务:是作为单个工作单元而执行的--系列操作，如查询和修改数据，甚至可能是修改数据定义。事务:保持逻辑数据一致性与可恢复性，必不可少的利器。 • SQL Server数据库事务举例在一个事务中，你写了2条sql语句，一条是修改订单表状态,一条是修改库存表库存-1 。如果在修改订单表状态的时候出错，事务能够回滚，数据将恢复到没修改之前的数据状态，下面的修改库存也就不执行，这样确保你关系逻辑的一致，安全。 • 阿笨对

CVPR 2020最佳学生论文分享回顾：通过二叉空间分割（BSP）生成紧凑3D网格

在这项研究中，西蒙弗雷泽大学和谷歌研究院的三位研究者提出了一种无监督方法，能够通过 convex decomposition 生成紧凑的结构化多边形网格。

第13章_事务基础知识

🧑个人简介：大家好，我是 shark-Gao，一个想要与大家共同进步的男人😉😉

空转应用篇 | 空间转录组学为肠道的理解增加了新维度

肠粘膜的深刻复杂性需要一种空间方法来研究肠道转录组学。《美国生理学杂志:胃肠和肝脏生理学》发表了一篇Mini-Review，描述了最近应用于肠道的空间转录组学技术以及其新发现。

PNAS：几何重正化揭示了多尺度人体连接组的自相似性

大脑的结构连通性通常是通过将其观察减少到单一的空间分辨率来研究的。然而，大脑拥有一个组织在多个尺度上彼此连接丰富的架构。我们利用五种不同分辨率重建的健康受试者数据集探索了人类连接组的多尺度组织。我们发现，当观察的分辨率随着解剖区域的分级粗粒化而逐渐降低时，人类大脑的结构仍然是自相似的。引人注目的是，一个距离不是欧几里德的几何网络模型预测了连接组的多尺度特性，包括自相似性。该模型依赖于几何重正化(GR)协议的应用，该协议通过粗粒度和在短的相似距离上平均来降低分辨率。

Spark RDD编程指南

在高层次上，每个 Spark 应用程序都包含一个驱动程序，该驱动程序运行用户的主要功能并在集群上执行各种并行操作。 Spark 提供的主要抽象是弹性分布式数据集 (RDD)，它是跨集群节点分区的元素集合，可以并行操作。 RDD 是通过从 Hadoop 文件系统（或任何其他 Hadoop 支持的文件系统）中的文件或驱动程序中现有的 Scala 集合开始并对其进行转换来创建的。用户还可以要求 Spark 将 RDD 持久化到内存中，以便在并行操作中有效地重用它。最后，RDD 会自动从节点故障中恢复。

【AI初识境】如何增加深度学习模型的泛化能力

机器学习方法训练出来一个模型，希望它不仅仅是对于已知的数据(训练集)性能表现良好，对于未知的数据(测试集)也应该表现良好，也就是具有良好的generalization能力，这就是泛化能力。测试集的误差，也被称为泛化误差。

清华提出：用于细粒度实体分类的Prompt-Learning，并提出可训练Prompt模板

提示学习（Prompt-learning）一个有效的tune预训练模型到特定任务上的方法，最近受到了各方学者的关注。

【Spark研究】用Apache Spark进行大数据处理第二部分：Spark SQL

在Apache Spark文章系列的前一篇文章中，我们学习了什么是Apache Spark框架，以及如何用该框架帮助组织处理大数据处理分析的需求。 Spark SQL，作为Apache Spark大数据框架的一部分，主要用于结构化数据处理和对Spark数据执行类SQL的查询。通过Spark SQL，可以针对不同格式的数据执行ETL操作（如JSON，Parquet，数据库）然后完成特定的查询操作。在这一文章系列的第二篇中，我们将讨论Spark SQL库，如何使用Spark SQL库对存储在批处理文件、JSO

010

Spark RDD详解 -加米谷大数据

1、RDD是什么 RDD：Spark的核心概念是RDD (resilientdistributed dataset)，指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。

用通俗的语言解释下：Spark 中的 RDD 是什么

RDD，学名可伸缩的分布式数据集（Resilient Distributed Dataset）。初次听闻，感觉很高深莫测。待理解其本质，却发现异常简洁优雅。本文试图对其进行一个快速侧写，试图将这种大数据处理中化繁为简的美感呈现给你。

DDIA：批中典范 MapReduce

MapReduce 在某种程度上有点像 Unix 工具，但不同之处在于可以分散到上千台机器上并行执行。和 Unix 工具一样，MapReduce 虽然看起来简单粗暴，但组合起来却非常强大。一个 MapReduce 任务就像一个 Unix 进程：接受一到多个输入，产生一到多个输出。

[置顶] SQL Server数据库高级进阶之事务实战演练

深入机器学习系列之：ALS

ALS是交替最小二乘（alternating least squares）的简称。在机器学习中，ALS特指使用交替最小二乘求解的一个协同推荐算法。它通过观察到的所有用户给商品的打分，来推断每个用户的喜好并向用户推荐适合的商品。举个例子，我们看下面一个8*8的用户打分矩阵

Implicit Language Model in LSTM for OCR 学习笔记

在本文中，我们试图改进对LSTMs的科学理解，特别是语言模型和LSTM中存在的字形模型之间的相互作用。我们称这种内部语言模型为隐式语言模型（隐式LM）。本文的贡献：1）在受控条件下建立隐式LM的存在; 2）通过找出它使用的上下文有多少个字符来描述隐式LM的本质。我们所描述的隐式LM与上面讨论的文献19、20中的语言模型有所不同，因为学习语言模型的背景和要求不同：OCR明确要求学习字形模型而不是语言模型。最近的关于使用LSTM进行OCR的基准文件22并没有涉及这一点，而且据我们所知，文献中也没有涉及。

知识分享：详解Hadoop核心架构

通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程，以及数据仓库工具Hive和分布式数据库Hbase的介绍，基本涵盖了Hadoop分布式平台的所有技术核心。　　通过这一阶段的调研总结，从内部机理的角度详细分析，HDFS、MapReduce、Hbase、Hive是如何运行，以及基于Hadoop数据仓库的构建和分布式数据库内部具体实现。如有不足，后续及时修改。 HDFS的体系架构　　整个Hadoop的体系结构主要是通过HDFS来实现对分布式存储的底层支持，并通过

【技术分享】Spark DataFrame入门手册

Spark SQL是spark主要组成模块之一，其主要作用与结构化数据，与hadoop生态中的hive是对标的。而DataFrame是spark SQL的一种编程抽象，提供更加便捷同时类同与SQL查询语句的API，让熟悉hive的数据分析工程师能够非常快速上手。

大会 | 智能感知与计算研究中心11篇论文被CVPR接收

AI 科技评论按：本文作者郭瑞娥，首发于中科院自动化所「智能感知与计算研究中心」微信公众号，AI 科技评论获授权转载。 CVPR 是计算机视觉、模式识别和人工智能领域国际顶级会议，2018 年 6 月 18-22 日将在美国盐湖城召开，届时 AI 科技评论也会在现场带来一线报道。不论你是论文录用作者，还是即将参会的企业机构，欢迎联系 AI 科技评论小编（微信号：aitechreview）报道/合作哟。智能感知与计算研究中心为中科院自动化所独立建制的科研部门，致力于研究泛在智能感知理论与技术以及与之相伴的

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐