基于R中包含变量名的对象的子集数据帧_基于其他数据帧的筛选器/子集R数据帧_基于dates数据帧的子集 - 腾讯云开发者社区

R的源起 R是S语言的一种实现。S语言是由 AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件，它基于S语言，并由MathSoft公司的统计科学部进一步完善。后来Auckland大学的Robert Gentleman 和 Ross Ihaka 及其他志愿人员开发了一个R系统。R的使用与S-PLUS有很多类似之处，两个软件有一定的兼容性。 R is free R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的

012

R语言函数的含义与用法，实现过程解读

R是S语言的一种实现。S语言是由 AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件，它基于S语言，并由MathSoft公司的统计科学部进一步完善。后来Auckland大学的Robert Gentleman 和 Ross Ihaka 及其他志愿人员开发了一个R系统。R的使用与S-PLUS有很多类似之处，两个软件有一定的兼容性。

您找到你想要的搜索结果了吗？

是的

没有找到

RNA-seq 详细教程：结果汇总与提取（11）

Day4：R语言课程（向量和因子取子集）

https://hbctraining.github.io/Intro-to-R/lessons/04_introR-data-wrangling.html

Pandas 秘籍：1~5

本章的目的是通过彻底检查序列和数据帧数据结构来介绍 Pandas 的基础。对于 Pandas 用户来说，了解序列和数据帧的每个组件，并了解 Pandas 中的每一列数据正好具有一种数据类型，这一点至关重要。

Python3通过字符串访问与修改局部变量

在Python中定义一个函数时，就会把变量空间划分为全局变量(global)与局部变量(local)，如果是定义在一个类的成员函数中，那么就还有额外的成员变量(self)空间。那么，如果在实际操作中，想把这几种不同的变量空间做一个分离的话，有没有办法呢？

决策树：一种像人脑一样工作的算法

决策树是用于机器学习最流行的算法之一，尤其对于分类和回归问题。我们每次做决策时大脑都像决策树一样工作。

python数据分析——数据的选择和运算

在数据分析中，数据的选择和运算是非常重要的步骤。数据选择和运算是数据分析中的基础工作，正确和高效的选择和运算方法对于数据分析结果的准确性和速度至关重要。

Python探索性数据分析，这样才容易掌握

每个数据科学家都必须掌握的最重要的技能之一是正确研究数据的能力。彻底的探索性数据分析 (EDA， Exploratory Data Analysis) 是必要的，这是为了确保收集数据和执行分析的完整性。

Python入门之数据处理——12种有用的Pandas技巧

翻译：黄念校对：王方思小编和大伙一样正在学习Python，在实际数据操作中，列联表创建、缺失值填充、变量分箱、名义变量重新编码等技术都很实用，如果你对这些感兴趣，请看下文： ◆ ◆ ◆ 引言 Python正迅速成为数据科学家偏爱的语言——这合情合理。它作为一种编程语言提供了更广阔的生态系统和深度的优秀科学计算库。在科学计算库中，我发现Pandas对数据科学操作最为有用。Pandas，加上Scikit-learn提供了数据科学家所需的几乎全部的工具。本文旨在提供在Python中处理数据的12种方法

Pandas 秘籍：6~11

当以某种方式组合多个序列或数据帧时，在进行任何计算之前，数据的每个维度会首先自动在每个轴上对齐。轴的这种无声且自动的对齐会给初学者造成极大的困惑，但它为超级用户提供了极大的灵活性。本章将深入探讨索引对象，然后展示利用其自动对齐功能的各种秘籍。

使用SQLAlchemy将Pandas DataFrames导出到SQLite

在进行探索性数据分析时（例如，在使用pandas检查COVID-19数据时），通常会将CSV，XML或JSON等文件加载到 pandas DataFrame中。然后，您可能需要对DataFrame中的数据进行一些处理，并希望将其存储在关系数据库等更持久的位置。

精通 Pandas 探索性分析：1~4 全

在本章中，我们将学习如何在 Pandas 中使用不同种类的数据集格式。我们将学习如何使用 Pandas 导入的 CSV 文件提供的高级选项。我们还将研究如何在 Pandas 中使用 Excel 文件，以及如何使用read_excel方法的高级选项。我们将探讨其他一些使用流行数据格式的 Pandas 方法，例如 HTML，JSON，PKL 文件，SQL 等。

Pandas 学习手册中文第二版：1~5

欢迎来到《Pandas 学习手册》！在本书中，我们将进行一次探索我们学习 Pandas 的旅程，这是一种用于 Python 编程语言的开源数据分析库。 pandas 库提供了使用 Python 构建的高性能且易于使用的数据结构和分析工具。 pandas 从统计编程语言 R 中带给 Python 许多好处，特别是数据帧对象和 R 包（例如plyr和reshape2），并将它们放置在一个可在内部使用的 Python 库中。

NumPy 和 Pandas 数据分析实用指南：1~6 全

在本章中，我们将讨论如何安装和管理 Anaconda。 Anaconda 是一个包，我们将在本书的以下各章中使用。

如何从 Pandas 迁移到 Spark？这 8 个问答解决你所有疑问

作者 | Sanket Gupta 译者 | 王强策划 | 刘燕本文最初发布于 Medium 网站，经原作者授权由 InfoQ 中文站翻译并分享。当你的数据集变得越来越大，迁移到 Spark 可以提高速度并节约时间。多数数据科学工作流程都是从 Pandas 开始的。 Pandas 是一个很棒的库，你可以用它做各种变换，可以处理各种类型的数据，例如 CSV 或 JSON 等。我喜欢 Pandas — 我还为它做了一个名为“为什么 Pandas 是新时代的 Excel”的播客。我仍然认为 Pandas

Github项目推荐 | visdat - 数据初步探索性可视化工具

visdat - Preliminary Exploratory Visualisation of Data

SQL and R

R平台及编程语言支持浩大的数据科学技术，他拥有几十年的的历史和超过7000个包，这挂在CRAN的包纷杂的让你无法决定从哪里入手。R-Basics和Visualizing Data with R提供了基础的指导，但是没有详细介绍如何用R操作数据集。幸运的是，数据库专业人员可以通过他们的精湛的SQL技术，短时间内在这个领域变得更有效率。如你所愿，R支持使用SQL检索中心位置的关系数据库中的数据。然而，一些R包允许你超出这领域创建介于处理和分析数据之间的集席数据集的飞速查询，而不管数据的来源和最终目标。

010

R for data science （第一章） ②

添加其他变量的一种方法是aesthetics。另一种对分类变量特别有用的方法是将绘图分割为多个子图，每个子图显示一个数据子集。要通过单个变量来划分您的绘图，请使用facet_wrap（）。 facet_wrap（）的第一个参数应该是一个公式，你用〜后跟一个变量名创建（这里“formula”是R中数据结构的名称，而不是“equation”的同义词）。传递给facet_wrap（）的变量应该是离散的。

R语言中 "apply" 函数详解

数据操作是机器学习生命周期中最关键的步骤之一。它需要转换所提供的数据，以便用于建立预测模型。

3.4.2 单帧滑动窗口与停止等待协议

在停止等待协议中，源站发送单个帧后必须等待确认，在目的站的回答到达源站之前，源站不能发送其他的数据帧。从滑动窗口机制的角度看，停止等待协议相当于发送窗口和接受窗口的接受窗口大小均为1的滑动窗口协议。

用Prophet在Python中进行时间序列预测

预测通常被认为是报告的发展。报告可以帮助我们回答，发生了什么事？预测有助于回答下一个逻辑问题，将会发生什么？

入门 | 简易指南带你启动 R 语言学习之旅

选自TowardsDataScience 作者：Vihar Kurama 机器之心编译参与：刘晓坤、许迪 R 语言是结合了 S 编程语言的计算环境，可用于实现对数据的编程；它有很强大的数值分析工具，对于处理线性代数、微分方程和随机学的问题非常有用。通过一系列内建函数和库，你可以用 R 语言学习数据可视化，特别是它还有很多图形前端。本文将简单介绍 R 语言的编程基础，带你逐步实现第一个可视化案例。代码地址：https://github.com/aaqil/r-lang-fundamentals R 语言最

Capinfos实用指南：从零开始掌握PCAP/PCAPNG抓包文件元数据分析

capinfos是Wireshark默认配套安装的命令行工具之一，从其命名来看也能顾名思义，主要用于显示抓包文件的信息，如文件格式、数据包数量、时间范围（首尾包）、数据包类型等。

R语言之基本包

在实际的数据分析中，分析者往往需要花费大量的精力在数据的准备上，将数据转换为分析所需要的形式。遗憾的是，大多数统计学教材很少涉及这一重要问题。整理数据是统计学的任务之一。我们开始关注 R 中最常用的数据格式——数据框的基本操作。我们将首先使用基本包处理数据框。

ggplot2--R语言宏基因组学统计分析(第四章)笔记

ggplot2可以用来创建优雅的图形，由于它的灵活，简洁和一致的接口，可以提供美丽、可直接用来发表的图形，吸引了许多用户，特别是科研领域的用户。ggplot2使用grid包来提供一系列的高水平的函数，并将其延伸为图形语法，即独立指定绘图组件，并将它们组合起来，以构建我们想要的任何图形显示。图形语法包含6个主要成分：data, transformations, element, scales, guide和 coordinate system。图层图形语法源于多层数据构建图形的想法。它定义了下表中的图形组分：data, aesthetic mappings, statistical transformations, geometric objects, position adjustment, scales, coordinate system 和 faceting（数据、几何映射、统计变换、几何对象、位置调整、比例、坐标和面）。数据、几何映射、统计变换、几何对象、位置调整形成一个图层，一个图可以有多个图层。

R语言里面如何高效调试代码

新鲜出炉的第三版，更新也很大，全面拥抱了ggplot体系。对我来说，比较新的知识点可能是一些小技巧，这里借花献佛给大家。

使用Python分析姿态估计数据集COCO的教程

当我们训练姿势估计模型，比较常用的数据集包括像COCO、MPII和CrowdPose这样的公共数据集，但如果我们将其与不同计算机视觉任务（如对象检测或分类）的公共可用数据集的数量进行比较，就会发现可用的数据集并不多。

R数据科学|第八章内容介绍

本文将介绍如何使用readr包将平面文件加载到 R 中，readr 也是 tidyverse 的核心 R包之一。

精通 Pandas：1~5

在本节中，我们将讨论使数据分析成为当今快速发展的技术环境中日益重要的工作领域的趋势。

HTML5(十二)——一文读懂 WebSocket 原理

WebSocket 是一个持久化的协议，通过第一次 HTTP Request 建立连接之后，再把通信协议升级成 websocket，保持连接状态，后续的数据交换不需要再重复请求。websocket 可以看成一种类似 TCP/IP 的 socke t技术，在 web 应用中实现、并获得同 TCP/IP 通信一样的双向通信功能，因此客户端既和服务器可以发送消息也可以接收消息，同时还支持多路复用的功能，由于它借用了 HTTP 协议的一些概念，所以被称为 WebSocket。

HTML5(十二)——一文读懂 WebSocket 原理

R语言Data Frame数据框常用操作

Data Frame一般被翻译为数据框，感觉就像是R中的表，由行和列组成，与Matrix不同的是，每个列可以是不同的数据类型，而Matrix是必须相同的。

20个能够有效提高 Pandas数据分析效率的常用函数，附带解释和例子

Pandas是一个受众广泛的python数据分析库。它提供了许多函数和方法来加快数据分析过程。pandas之所以如此普遍，是因为它的功能强大、灵活简单。本文将介绍20个常用的 Pandas 函数以及具体的示例代码，助力你的数据分析变得更加高效。

（数据科学学习手札69）详解pandas中的map、apply、applymap、groupby、agg

*从本篇开始所有文章的数据和代码都已上传至我的github仓库：https://github.com/CNFeffery/DataScienceStudyNotes

速读原著-TCP/IP(RARP的分组格式)

具有本地磁盘的系统引导时，一般是从磁盘上的配置文件中读取 I P地址。但是无盘机，如X终端或无盘工作站，则需要采用其他方法来获得 I P地址。

数据科学和人工智能技术笔记十九、数据整理（下）

“全外连接产生表 A 和表 B 中所有记录的集合，带有来自两侧的匹配记录。如果没有匹配，则缺少的一侧将包含空值。” – [来源](http://blog .codinghorror.com/a-visual-explanation-of-sql-joins/)

Prophet在R语言中进行时间序列数据预测

您将学习如何使用Prophet（在R中）解决一个常见问题：预测公司明年的每日订单。

【SAS Says】基础篇：5. 开发数据（一）

本节目录：开发数据 5.1 创建并重新定义变量 5.2 使用SAS函数 5.3 使用IF-THEN语句 5.4 用IF-THEN语句将观测值分组 5.5 构造子集 5.6 处理SAS的日期数据 5.7 可选择的数据格式和函数 5.8 使用retain和sum语句 5.9 用数组简化程序 5.10 列出变量名的快捷方式 ---- 【SAS Says】基础篇：5. 开发数据（定义变量、构造子集、处理日期、SAS函数、简化数组） 5.1 创建并重新定义变量可以通过分配语句来创建并重新定义变量，基本形式为： V

Day5-学习笔记（2024年2月2日）

Diabates是名义变量，Status是顺序变量，二者都是分类变量，R中称为因子

CAN总线学习笔记（2）- CAN协议数据帧与遥控帧

依照瑞萨公司的《CAN入门书》的组织思路来学习CAN通信的相关知识，并结合网上相关资料以及学习过程中的领悟整理成笔记。好记性不如烂笔头，加油！

【SAS Says】基础篇：开发数据

特别说明：本节【SAS Says】基础篇：开发数据，用的是数说君学习《The little SAS book》时的中文笔记，我们认为这是打基础的最好选择。转载请在文章开头注明微信号：shushuojun，谢谢！复习：前面五节【SAS Says】基础篇：SAS软件入门（上）【SAS Says】基础篇：SAS软件入门（下）【SAS Says】基础篇：读取数据（上）【SAS Says】基础篇：读取数据（中）【SAS Says】基础篇：读取数据（下）在微信号“shushuojun”中回复“SAS”

NumPy、Pandas中若干高效函数！

我们都知道，Numpy 是 Python 环境下的扩展程序库，支持大量的维度数组和矩阵运算；Pandas 也是 Python 环境下的数据操作和分析软件包，以及强大的数据分析库。二者在日常的数据分析中都发挥着重要作用，如果没有 Numpy 和 Pandas 的支持，数据分析将变得异常困难。但有时我们需要加快数据分析的速度，有什么办法可以帮助到我们吗？

精通 Pandas：6~11

在本章中，我们将介绍一些必要的主题，这些主题对于培养使用 Pandas 的专业知识必不可少。这些主题的知识对于准备数据作为处理数据以进行分析，预测或可视化的程序或代码的输入非常有用。我们将讨论的主题如下：

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐