R:通过基于因子组合列来拉长透视_通过基于(部分)正则表达式组合一些行来修改R中的数据_有没有一个R函数可以通过创建更多的行而不丢失数据来组合同名的列？ - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

左手用R右手Python系列——数据塑型与长宽转换

今天这篇是R语言 with Python系列的第三篇，主要跟大家分享数据处理过程中的数据塑型与长宽转换。其实这个系列算是我对于之前学习的R语言系列的一个总结，再加上刚好最近入门Python，这样在总结R语言的同时，对比R语言与Pyhton在数据处理中常用解决方案的差异，每一个小节只讲一个小知识点，但是这些知识点都是日常数据处理与清洗过程中非常高频的需求。不会跟大家啰嗦太多每一个函数的详细参数，只列出那些参数中的必要设定，总体以简单实用为原则。如若需要详细了解每一个函数的内部参数，还是需要自己查阅官方文档

06

tidyverse：R语言中相当于python中pandas+matplotlib的存在

tidyverse就是Hadley Wickham将自己所写的包整理成了一整套数据处理的方法，包括ggplot2、dplyr、tidyr、readr、purrr、tibble、stringr、forcats。出版有《R for Data Science》（中文版《R数据科学》），这本书详细介绍了tidyverse的使用方法。

01

您找到你想要的搜索结果了吗？

是的

没有找到

R语言的数据结构（包含向量和向量化详细解释）

个人理解，向量是有方向的，由大于等于2个元素构成的数据类型。也就是说，向量的所有元素必须属于同种模式（mode），或数据类型（见1.2），比如数值型，字符型等。其类型可以用typeof()查看。标量只含有一个元素，在R中没有0维度或标量类型。单独的数字或字符串本质是一元向量。

02

OpenGL矩阵变换的数学推导

说起OpenGL的矩阵变换，我是之前在我们的项目天天P图、布丁相机中开发3D效果时才比较深入地研究了其中的原理，当时一开始时，也只是知道怎么去用这些矩阵，却不知道这些矩阵是怎么得来的，当出现一些莫名其妙的问题时，如果不了解其中的原理，就不知道如何解决，于是想彻底搞懂其中的原理，还好自己对数学挺有兴趣，于是从头到尾把推导过程研究了一遍，总算掌握了其中的奥秘，不得不佩服OpengGL的设计者，其中的数学变换过程令人陶醉，下面我们一起来看看。这些矩阵当中最重要的就是模型矩阵（Model Matrix）、视图矩阵（View Matrix）、投影矩阵（Projection Matrix），本文也只分析这3个矩阵的数学推导过程。这三个矩阵的计算OpenGL的API都为我们封装好了，我们在实际开发时，只需要给API传对应的参数就能得到这些矩阵，下面带大家来看看究竟是怎样计算得到的。

06

OpenGL矩阵变换的数学推导

说起OpenGL的矩阵变换，我是之前在我们的项目天天P图、布丁相机中开发3D效果时才比较深入地研究了其中的原理，一直想写这篇文章，由于很忙（lǎn），拖了很久，再不写我自己也要忘了。一开始时，也只是知道怎么去用这些矩阵，却不知道这些矩阵是怎么得来的，当出现一些莫名其妙的问题时，如果不了解其中的原理，就不知道如何解决，于是想彻底搞懂其中的原理，还好自己对数学挺有兴趣，于是从头到尾把推导过程研究了一遍，总算掌握了其中的奥秘，不得不佩服OpengGL的设计者，其中的数学变换过程令人陶醉，下面我们一起来看看。这

03

origin2018多因子组柱状图_对比柱状图怎么做

接下来，正文开始： 1，如图1，数据包含两个分组列（X轴），A列表示小分组，B列表示大分组，C/D/E三列表示三个因子列，作为Y轴。同样的方式，可以在E轴后侧依次添加数据增加四，五，六等多个因子。

02

Ground-VIO：在线标定相机-地面参数的单目视觉惯性里程计

文章：Ground-VIO: Monocular Visual-Inertial Odometry with Online Calibration of Camera-Ground Geometric Parameters

02

图形学入门（一）：坐标变换

将一个物体显示到屏幕上，这个事情似乎非常简单，以至于我们基本上认为它已经天经地义到直接告诉计算机我们要显示什么物体它就会自动显示出来，毕竟我们拍照的时候就是举起相机按下快门就会出现一张图片了。但事实上，相机是基于物理感光元件实现了从三维世界到二维图片的投影，在计算机的程序世界中一切都需要被计算出来，也就是说，我们只有一堆图形的描述信息，我们需要自己将这些图形在二维的平面上绘制的方式告诉操作系统，操作系统才能最终在屏幕上绘制出我们想要的图形。

02

R语言第一章数据处理基础②一行代码完成数据透视表目录

目录 R语言第一章数据处理基础①读取EXEL表格数据 R语言第一章数据处理基础②一行代码完成数据透视表 rpivotTable：R的数据透视表安装 # devtools::install_github(c("ramnathv/htmlwidgets", "smartinsightsfromdata/rpivotTable")) 数据透视表应出现在的RStudio的Viewer中。 data可以是data.frame表或data.table。如果仅选择数据，则数据透视表将打开，行和列上没有任何内容（但

01

Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险/收益可视化

本文我们超越了 CAPM 的简单线性回归，探索了 Fama French (FF) 股票风险/收益的多因素模型。

03

国外功能测试方法深度解析

作为黑盒测试的一个重要阶段，功能测试毋庸置疑是不可缺失的。功能测试的相关话题很多，无论是测试的形式，例如手动测试和自动化测试，还是测试方法，例如数据驱动和关键字驱动，都有大量的研究文章。我这篇文章里主要从国别不同的角度来讨论一下功能测试的差异，原创文章可能有一些谬误的地方，请读者指摘。 #No.1 日式循规蹈矩日本人给世界其他民族的印象是做事认真严谨，对待问题一丝不苟，犯了错误按严重程度该下跪的下跪，该剖腹的剖腹。他们的这种一贯行事方式也带到了软件行业，而软件行业的摩尔定律，技术的日新月异，代码、框架

08

国外功能测试有何不同？

作为黑盒测试的一个重要阶段，功能测试毋庸置疑是不可缺失的。功能测试的相关话题很多，无论是测试的形式，例如手动测试和自动化测试，还是测试方法，例如数据驱动和关键字驱动，都有大量的研究文章。

03

个人永久性免费-Excel催化剂功能第14波-一键生成零售购物篮/搭配率分析

原文在简书上发表，再同步到Excel催化剂微信公众号或其他平台上，文章后续有修改和更新将在简书上操作，其他平台不作同步修改更新，因此建议阅读其他出处的文章时，尽可能跳转回简书平台上查看。

01

组合优化（一）：换手率和alpha模型

新开一个系列写写组合优化的相关内容，主要以分享看到的各种研究和思考为主，偏理论。

02

Pandas 数据分析小技巧系列第五集

固定列zip_code，组合factory，warehouse，retail 三个列名为一个维度，按照这种方法凑齐两个维度后，数据一定变长。

02

文献分享(一)：你的风险模型能预测你的风险吗？

新开一个文献分享系列。今天分享一篇UBS的研报，获取原文后台回复“paper1”。

01

用Python实现因子分析

因子分析(factor analysis)因子分析的一般步骤factor_analyzer模块进行因子分析使用Python实现因子分析初始化构建数据将原始数据标准化处理 X计算相关矩阵C计算相关矩阵C的特征值和特征向量确定公共因子个数k构造初始因子载荷矩阵A建立因子模型将因子表示成变量的线性组合.计算因子得分.

01

R|apply，tapply

apply族功能强大，实用，可以代替很多循环语句，先简单介绍apply和tapply函数。

08

R包reshape2 |轻松实现长、宽数据表格转换

https://seananderson.ca/2013/10/19/reshape/

01

数据清洗与管理之dplyr、tidyr

先前已经讲过R语言生成测试数据、数据预处理和外部数据输入等内容，但这仅仅是第一步，我们还需要对数据集进行筛选、缺失值处理等操作，以便获得可以应用于建模或者可视化的数据集（变量）。接下来就以鸢尾花测试数据集进行进一步的数据管理和筛选操作。

04

R语言︱数据分组统计函数族——apply族用法与心得

笔者寄语：apply族功能强大，实用，可以代替很多循环语句，R语言中不要轻易使用循环语句。

03

数据分析5大软件「优势PK」：Python、Excel、R、SAS、SPSS你最爱哪个？

Microsoft Excel是微软公司的办公软件Microsoft office的组件之一，是由Microsoft为Windows和Apple Macintosh操作系统的电脑而编写和运行的一款试算表软件。Excel 是微软办公套装软件的一个重要的组成部分，它可以进行各种数据的处理、统计分析和辅助决策操作，广泛地应用于管理、统计财经、金融等众多领域。

02

茴”字有三种写法，低风险异象因子呢？

【30秒速览】【【002】高风险高收益，常识or谎言？】一文介绍了低风险异象的常规定义和主要实证表现，并给出了研究者提出的多种低风险因子的列表。本文则更进一步，详细介绍每一种因子的具体定义，帮助您更好地理解它们的异同。

01

翻译 | 简单而有效的EXCEL数据分析小技巧

介绍我一直很欣赏EXCEL蕴藏的巨大能量。这款软件不仅具备基本的数据运算，还能使用它对数据进行分析。EXCEL被广泛运用到很多领域，例如：金融建模和商业预测。对于刚进入数据分析行业新手来说，EXCEL可以被当做一款入门的软件。甚至在学习R或Python前，对于新入门的小白来说，事先掌握一定的EXCEL知识是百利而无一害。EXCEL凭借其功能强大的函数、可视化图表、以及整齐排列的电子表格功能，使你能够快速而深入的洞察到数据不轻易为人所知的一面。但与此同时，EXCEL也有它的一些不足之处，即它无法非常有

【技能get】简单而有效的 EXCEL 数据分析小技巧

作者 CDA 数据分析师我一直很欣赏 EXCEL 蕴藏的巨大能量。这款软件不仅具备基本的数据运算，还能使用它对数据进行分析。EXCEL 被广泛运用到很多领域，例如：金融建模和商业预测。对于刚进入数据分析行业新手来说，EXCEL 可以被当做一款入门的软件。甚至在学习R或Python前，对于新入门的小白来说，事先掌握一定的EXCEL知识是百利而无一害。EXCEL凭借其功能强大的函数、可视化图表、以及整齐排列的电子表格功能，使你能够快速而深入的洞察到数据不轻易为人所知的一面。但与此同时，EXCEL也有它

09

理论：因子分析原理剖析

F1,F2,F3...为前m个因子包含数据总量（累计贡献率）不低于80%。可取前m各因子来反映原评价

03

多文件数据横向汇总，怎么整？| Power Query实战

最近遇到一位朋友提问：怎么将多个文本文件（据说100多份）按列（横向）汇总？经过详细了解，需求如下图所示：

05

Excel统计各学校各分数段的人数

3.在“数据透视表字段”视图中，把“单位”拉到行区域，把“总分”拉到列区域，把“姓名”拉到值区域

02

Power BI透视表怎么快速做分组？| 实战技巧

导语：数据分组汇总比较在日常数据快速分析过程中非常有用，在Excel里可以直接在透视表上进行操作，但Power BI里的操作有一点点儿不同。

01

3秒种搞定HashMap

JDK1.8 总结定位元素 HashMap定位元素位置是通过键key经过扰动函数扰动后得到hash值，然后再通过hash(key) & (length - 1)代替取模的方式进行元素定位的。负载因子 HashMap的负载因子表示哈希表空间的使用程度（或者说是哈希表空间的利用率）。当负载因子越大，则HashMap的装载程度就越高。也就是能容纳更多的元素，元素多了，发生hash碰撞的几率就会加大，从而链表就会拉长，此时的查询效率就会降低。当负载因子越小，则链表中的数据量就越稀疏，此时会对空间造成浪费，但是此

00

R语言使用特征工程泰坦尼克号数据分析应用案例

特征工程对于模型的执行非常重要，即使是具有强大功能的简单模型也可以胜过复杂的算法。实际上，特征工程被认为是决定预测模型成功或失败的最重要因素。特征工程真正归结为机器学习中的人为因素。通过人类的直觉和创造力，您对数据的了解程度可以带来不同。

03

为什么业务分析师要学 PowerBI DAX - 历史演化篇

为什么业务分析师要学 Power BI 尤其是 DAX 呢？我们分三文来说清楚。

02

个人永久性免费-Excel催化剂功能第23波-非同一般地批量拆分工作表

一般来说，在各系统里导出的数据，在导出数据的时候，已经对导出行为进行了权限管控，如甲员工只能导广州区数据，乙员工只对导深圳数据，他们的主管可以导华南区的数据等等。理想的场景是各人使用各自的权限导出所需的数据作分析。

02

Pandas进阶｜数据透视表与逆透视

数据透视表将每一列数据作为输入，输出将数据不断细分成多个维度累计信息的二维数据表。在实际数据处理过程中，数据透视表使用频率相对较高，今天云朵君就和大家一起学习pandas数据透视表与逆透视的使用方法。

01

使用Spark轻松做数据透视(Pivot)

spark从1.6开始引入，到现在2.4版本，pivot算子有了进一步增强，这使得后续无论是交给pandas继续做处理，还是交给R继续分析，都简化了不少。大家无论在使用pandas、numpy或是R的时候，首先会做的就是处理数据，尤其是将列表，转成成合适的形状。

02

在pandas中使用数据透视表

经常做报表的小伙伴对数据透视表应该不陌生，在excel中利用透视表可以快速地进行分类汇总，自由组合字段聚合计算，而这些只需要拖拉拽就能实现。

04

在pandas中使用数据透视表

经常做报表的小伙伴对数据透视表应该不陌生，在excel中利用透视表可以快速地进行分类汇总，自由组合字段聚合计算，而这些只需要拖拉拽就能实现。

02

新型行情中心：基于实时/历史行情的指标计算和仿真系统

量化投资与机器学习微信公众号，是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者，荣获2021年度AMMA优秀品牌力、优秀洞察力大奖，连续2年被腾讯云+社区评选为“年度最佳作者”。随着国内量化金融的高速发展，行情数据所包含的微观交易结构信息越来越受到券商自营团队、资管团队以及各类基金的重视。这些交易团队迫切希望拥有一个与生产环境类似的投研仿真环境，提升研发的效率和质量。今天，公众号将为大家分享

02

懂Excel轻松入门Python数据分析包pandas(二十一)：透视表

> 经常听别人说 Python 在数据领域有多厉害，结果学了很长时间，连数据处理都麻烦得要死。后来才发现，原来不是 Python 数据处理厉害，而是他有数据分析神器—— pandas

05

左手用R右手Python系列10——统计描述与列联分析

数据统计描述与列联表分析是数据分析人员需要掌握的基础核心技能，R语言与Python作为优秀的数据分析工具，在数值型数据的描述，类别型变量的交叉分析方面，提供了诸多备选方法。这里根据我们平时对于数据结构的分类习惯，按照数值型和类别型变量分别给大家盘点一下R与Python中那些简单使用的分析函数。 R语言：描述性统计：（针对数值型） library("ggplot2") myvars<-names(diamonds)[c(5,6,7)];myvars [1] "depth" "table" "price"

小议斜透视投影矩阵(oblique projection matrix)

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/tkokof1/article/details/89074993

00

懂Excel轻松入门Python数据分析包pandas(二十一)：透视表

> 经常听别人说 Python 在数据领域有多厉害，结果学了很长时间，连数据处理都麻烦得要死。后来才发现，原来不是 Python 数据处理厉害，而是他有数据分析神器—— pandas

02

竟然是一个升级版的数据透视表,Tableau真的没有那么神秘~

前一篇跟大家详述了关于Excel在作图理念上的诸多细节，今天让我们把聚焦于多分类维度的数据呈现问题。当然今天这篇我会把视角从Excel切换到Tableau，没错就是Tableau。可能很多小伙伴儿已经了解过这款商务智能工具，这是一款目前市面上最成熟、最人性化的桌面端可视化工具（没有之一，至于PowerBI，我之后会写专门的体验贴来说明）。 ---- 相信很多小伙伴儿（特别是已经在职场已经混迹很多年的）对Excel中的数据透视表非常熟悉，没错Tableau就是一款升级版的数据透视表。它不仅仅可以将原始的一

07

实战｜用pandas+PyQt5制作一款数据分组透视处理工具

早起导读：pandas是Python数据处理的利器，如果每天都要使用pandas执行同样的操作，如何制作一个有界面的软件更高效的完成？本文提供了一种基于PyQt5的实现思路。

02

Nat. Commun. | 多视角预测病毒和哺乳动物宿主的关联

本次报道论文为发表于Nature Communications的Divide-and-conquer:machine-learning integrates mammalian and viral traits with network features to predict virus-mammal associations。该文章是英国利物浦大学的Maya Wardeh博士等人的研究成果：为预测病毒和哺乳动物宿主的关联，文中构建病毒、哺乳动物和网络三种视角，每个视角独立预测，以增强预测能力。

05

（三、四）Superset 1.3图表篇——透视表-Pivot Table

本系列文章基于Superset 1.3.0版本。1.3.0版本目前支持分布，趋势，地理等等类型共59张图表。本次1.3版本的更新图表有了一些新的变化，而之前也一直没有做过非常细致的图表教程。

02

（三、四）Superset 1.3图表篇——透视表-Pivot Table

本系列文章基于Superset 1.3.0版本。1.3.0版本目前支持分布，趋势，地理等等类型共59张图表。本次1.3版本的更新图表有了一些新的变化，而之前也一直没有做过非常细致的图表教程。

02

SQL、Pandas和Spark：如何实现数据透视表？

数据透视表是一个很重要的数据统计操作，最有代表性的当属在Excel中实现（甚至说提及Excel，个人认为其最有用的当属三类：好用的数学函数、便捷的图表制作以及强大的数据透视表功能）。所以，今天本文就围绕数据透视表，介绍一下其在SQL、Pandas和Spark中的基本操作与使用，这也是沿承这一系列的文章之一。

03

4道面试题，带你走上做图高手之路

解决思路：首先明白希望结果是以什么样的方式展示，根据本例要求可以用产品名称作列标题，还款期数做行标题，行列交叉的位置就是贷款金额，并对行列进行合计。此时用到数据透视图可以一举解决以上问题。

对比excel，用python实现逆透视操作（宽表变长表）

最近看到群友们在讨论一个宽表变长表的问题，其实这类需求也很常见于我们日常的数据处理中。综合群友们的智慧，今天我们就来看看excel与python如何实现这个需求吧！

05

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭