在R中创建频率矩阵的聚合函数_在R中聚合表后创建矩阵_R中的聚合函数 - 腾讯云开发者社区

数据统计描述与列联表分析是数据分析人员需要掌握的基础核心技能，R语言与Python作为优秀的数据分析工具，在数值型数据的描述，类别型变量的交叉分析方面，提供了诸多备选方法。这里根据我们平时对于数据结构的分类习惯，按照数值型和类别型变量分别给大家盘点一下R与Python中那些简单使用的分析函数。 R语言：描述性统计：（针对数值型） library("ggplot2") myvars<-names(diamonds)[c(5,6,7)];myvars [1] "depth" "table" "price"

012

您找到你想要的搜索结果了吗？

是的

没有找到

这是我见过最好的NumPy图解教程！没有之一

NumPy使用图解教程「建议收藏」

NumPy是Python中用于数据分析、机器学习、科学计算的重要软件包。它极大地简化了向量和矩阵的操作及处理。python的不少数据处理软件包依赖于NumPy作为其基础架构的核心部分（例如scikit-learn、SciPy、pandas和tensorflow）。

安利！这是我见过最好的NumPy图解教程

一键获取新技能，玩转NumPy数据操作

一键获取新技能，玩转NumPy数据操作！

在本文中，将介绍NumPy的主要用法，以及它如何呈现不同类型的数据（表格，图像，文本等），这些经Numpy处理后的数据将成为机器学习模型的输入。

一键获取新技能，玩转NumPy数据操作

WikiNet — CS224W 课程项目的循环图神经网络实践

在这篇文章中，我们将使用现代的图机器学习技术在 Wikispeedia navigation paths路径数据集进行项目实践

安利！这是我见过最好的NumPy图解教程

PGL图学习之图神经网络GraphSAGE、GIN图采样算法[系列七]

0. PGL图学习之图神经网络GraphSAGE、GIN图采样算法系列七本项目链接：https://aistudio.baidu.com/aistudio/projectdetail/5061984

NIPS 2017 | 斯坦福GraphSAGE：改进的GCN

Inductive Representation Learning on Large Graphs

教你几招R语言中的聚合操作

在数据处理和分析过程中，可能会涉及到数据的聚合操作（可理解为统计汇总），如计算门店每天的营业总额、计算各地区的二手房的平均价格、统计每个消费者在近半年内最后一笔交易时间等。如果基于数据库SQL的语法来解决这些问题，将会显得非常简便，如果没有数据库环境该如何实现类似聚合问题的解决呢？

CS224w图机器学习（七）：Graph Neural Networks

本文主要介绍CS224W的第八课，图神经网络。上一篇章的主题是图表征学习，主要在讲Node Embedding，核心步骤包含编码网络和相似性度量。本文则是从图神经网络的角度出发，展开一些编码网络的深度方法。

有人把NumPy画成了画，生动又形象

我们可以创建一个NumPy数组(也就是强大的ndarray)，方法是传递一个python列表并使用' np.array() '。在本例中，python创建了我们可以在这里看到的数组:

GraphSAGE：我寻思GCN也没我厉害！

众所周知，2017年ICLR出产的GCN现在是多么地热门，仿佛自己就是图神经网络的名片。然而，在GCN的风头中，很多人忽略了GCN本身的巨大局限——Transductive Learning——没法快速表示新节点，这限制了它在生产环境中应用。同年NIPS来了一篇使用Inductive Learning的GraphSAGE，解决了这个问题。今天，让我们来一起琢磨琢磨这个GraphSAGE是个什么玩意儿。

巧用R语言中各类聚合窗口函数

这部分介绍一下R语言中的聚合窗口函数，R语言中的聚合窗口函数与sql中的窗口函数有点差异，R语言中的相同记录的累计求和累计平均不再相同。

硬核！一文梳理经典图网络模型

图神经网络已经在NLP、CV、搜索推荐广告等领域广泛应用，今天我们就来整体梳理一些经典常用的图网络模型：DeepWalk、GCN、Graphsage、GAT！

Apache Spark 1.5新特性介绍

Apache Spark社区刚刚发布了1.5版本，大家一定想知道这个版本的主要变化，这篇文章告诉你答案。 DataFrame执行后端优化（Tungsten第一阶段） DataFrame可以说是整个Spark项目最核心的部分，在1.5这个开发周期内最大的变化就是Tungsten项目的第一阶段已经完成。主要的变化是由Spark自己来管理内存而不是使用JVM，这样可以避免JVM GC带来的性能损失。内存中的Java对象被存储成Spark自己的二进制格式，计算直接发生在二进制格式上，省去了序列化和反序列化时间。同时

Apache Spark 1.5新特性介绍

作者：梁堰波现就职于明略数据,开源爱好者,Apache Hadoop & Spark contributor。曾任职于法国电信研究员,美团网技术专家,Yahoo!工程师,具备丰富的数据挖掘和机器学

GNN如何利用图上的边信息？

链接：https://zhuanlan.zhihu.com/p/432923190

Pandas进阶｜数据透视表与逆透视

数据透视表将每一列数据作为输入，输出将数据不断细分成多个维度累计信息的二维数据表。在实际数据处理过程中，数据透视表使用频率相对较高，今天云朵君就和大家一起学习pandas数据透视表与逆透视的使用方法。

什么特征进行交互才是有效的？

本文主要针对推荐系统中的特征交互而提出的相关方法，如果将所有可能的特征都进行交互，那消耗是很大的，本文提出HIRS用于直接生成有益特征交互。生成的特征交互的数量可以指定为远小于所有可能的交互的数量，因此模型运行时间更短。

【工具】Apache Spark 1.5发布了！！！

mysql聚合统计数据查询缓慢优化方案

随着业务发展，这些表会越来越大，如果处理不当，查询统计的速度也会越来越慢，直到业务无法再容忍。

MySQL数据库的查询

聚合函数又叫组函数，通常是对表中的数据进行统计和计算，一般结合分组（group by）来使用，用于统计和计算分组数据

图卷积和消息传递理论的可视化详解

来源：Deephub Imba本文共3500字，建议阅读5分钟本文中将研究如何基于消息传递机制构建图卷积神经网络，并创建一个模型来对具有嵌入可视化的分子进行分类。假设现在需要设计治疗某些疾病的药物。有一个其中包含成功治疗疾病的药物和不起作用的药物数据集，现在需要设计一种新药，并且想知道它是否可以治疗这种疾病。如果可以创建一个有意义的药物表示，就可以训练一个分类器来预测它是否对疾病治疗有用。我们的药物是分子式，可以用图表表示。该图的节点是原子。也可以用特征向量 x 来描述原子（它可以由原子属性组成，如质量

左手用R右手Python系列6——变量计算与数据聚合

R语言与Python的Pandas中具有非常丰富的数据聚合功能，今天就跟大家盘点一下这些函数的用法。 R语言： transform mutate aggregate grouy_by+summar

IJCAI2022: 利用随机游走进行聚合的图神经网络

在同质图中，具有相同标签或相似特征的结点更倾向于靠近彼此。而在异质图中，具有不同标签或不相似特征的结点也有邻接的可能性。在真实世界网络中，很多网络都是异质的，并不满足同质图的假定。比如在电商网络中，诈骗者经常骚扰正常用户；在邮件网络中，我们的邮箱经常会收到垃圾信息。

pandas时间序列常用方法简介

pandas是Python数据分析最好用的第三方库，没有之一。——笛卡儿没说过这句话！

PGL图学习项目合集&数据集分享&技术归纳业务落地技巧[系列十]

PGL图学习项目合集&数据集分享&技术归纳业务落地技巧[系列十] 1.PGL图学习项目合集 1.1 关于图计算&图学习的基础知识概览：前置知识点学习（PGL）[系列一] ：https://aistud

图学习项目合集&数据集分享&技术归纳业务落地技巧[系列十]

PGL图学习项目合集&数据集分享&技术归纳业务落地技巧系列十 1.PGL图学习项目合集 1.1 关于图计算&图学习的基础知识概览：前置知识点学习（PGL）系列一：https://aistudio.b

Numpy基础操作学习笔记

NumPy：Numerical Python，即数值Python包，是Python进行科学计算的一个基础包，因此要更好理解和掌握Python科学计算包，尤其是pandas，需要先行掌握NumPy库的用法

R&Python Data Science 系列：数据处理（3）

排序函数，按照某（几）个指定的列按照升（降）序排列重新排列数据集，参数ascending = False，降序排列，ascending = True，升序排列；

巧用R中的各种排名窗口函数

在sql中巧用窗口函数可以解决很多复杂的问题，窗口函数有4种函数类型：排名函数、偏移函数、聚合函数和分布函数，详细介绍可以浏览：

【GNN】GATNE：阿里大规模多元异构属性网络

今天学习的是清华大学和达摩院合作的一篇论文《Representation Learning for Attributed Multiplex Heterogeneous Network》，发表于 KDD 2019。

HAWQ + MADlib 玩转数据挖掘之（三）——向量

010

时序数据库：TDengine与其他时序数据库比对测试

TDengine Database开源项目里已经包含了性能对比测试的工具源代码。https://github.com/taosdata/TDengine/tests/comparisonTest，并基于这个开源的测试工具开展了TDengine和InfluxDB对比测试，TDengine和OpenTSDB对比测试，TDengine和Cassandra对比测试等一系列性能对比测试。为了更客观的对比TDengine和其他时序数据库（Time-Series Database）的性能差异，本项目采用由InfluxDB团队开源的性能对比测试工具来进行对比测试，相同的数据产生器，相同的测试用例，相同的测试方法，以保证测试的客观公平。

GraphSAGE: GCN落地必读论文

论文链接：Inductive Representation Learning on Large Graphs https://papers.nips.cc/paper/6703-inductive-representation-learning-on-large-graphs.pdf

比DGL快14倍：PyTorch图神经网络库PyG上线了

项目链接：https://github.com/rusty1s/pytorch_geometric

比DGL快14倍：PyTorch图神经网络库PyG上线了

项目链接：https://github.com/rusty1s/pytorch_geometric

【MySQL基础】：深入探索DQL数据库查询语言的精髓（上）

DQL英文全称是Data Query Language(数据查询语言)，数据查询语言，用来查询数据库中表的记录。查询关键字: SELECT

【ES三周年】腾讯云Elasticsearch Service基础知识，进阶使用以及优化方式

腾讯云 Elasticsearch Service 是一种托管式 Elasticsearch 服务，可用于构建和管理强大的搜索和分析引擎。以下是一份关于如何使用腾讯云 Elasticsearch Service 的技术文章。

不再迷惑，无值和 NULL 值

在关系型数据库的世界中，无值和NULL值的区别是什么？一直被这个问题困扰着，甚至在写TSQL脚本时，心有戚戚焉，害怕因为自己的一知半解，挖了坑，贻害后来人，于是，本着上下求索，不达通幽不罢休的决心（开个玩笑），遂有此文。

Quant进阶：用『最少』的数学，学『最全』的图神经网络

量化投资与机器学习微信公众号，是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者，荣获2021年度AMMA优秀品牌力、优秀洞察力大奖，连续2年被腾讯云+社区评选为“年度最佳作者”。作者 | Rishabh Anand 编译 | QIML编辑部前言多年来，图深度学习（GDL）的发展步伐加快了。现实生活中许多网状结构的问题使的GDL成为一个通用的工具。该领域在社交媒体、药物发

聊聊分布式 SQL 数据库Doris(八)

稀疏索引的创建过程包括将集合中的元素分段，并给每个分段中的最小元素创建索引。在搜索时，先定位到第一个大于搜索值的索引的前一个索引，然后从该索引所在的分段中从前向后顺序遍历，直到找到该搜索值的元素或第一个大于该搜索值的元素。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐