使用mutate_at将R中缺少的值替换为从列名称获取的值(如果不缺少

使用mutate_at函数可以将R中缺少的值替换为从列名称获取的值。mutate_at函数是dplyr包中的一个函数，用于对指定的列进行变换操作。

具体步骤如下：

导入dplyr包：首先需要导入dplyr包，可以使用以下代码进行导入：

library(dplyr)

读取数据：将需要处理的数据读入R中，可以使用read.csv()或read.table()等函数进行读取。
使用mutate_at函数进行替换：使用mutate_at函数对指定的列进行替换操作。该函数的第一个参数是数据集，后面的参数是需要进行操作的列名。可以使用vars()函数指定需要操作的列，也可以使用starts_with()、ends_with()、contains()等函数进行模糊匹配。

下面是一个示例代码，假设有一个数据集df，其中包含了三列A、B、C，其中部分值缺失：

df <- data.frame(A = c(1, NA, 3), B = c(NA, 2, NA), C = c(NA, NA, 3))
df <- df %>% mutate_at(vars(A:C), ~ifelse(is.na(.), get(colnames(df)), .))

在上述代码中，使用了mutate_at函数对列A、B、C进行操作。使用了ifelse函数判断每个值是否为缺失值，如果是缺失值，则使用get(colnames(df))获取对应列的名称作为替换值。

这样，就可以将R中缺少的值替换为从列名称获取的值。

推荐的腾讯云相关产品和产品介绍链接地址：

云服务器（CVM）：提供弹性计算能力，满足各种业务需求。产品介绍链接
云数据库 MySQL版（CDB）：提供高性能、高可用的MySQL数据库服务。产品介绍链接
云原生容器服务（TKE）：提供高度可扩展的容器化应用管理平台。产品介绍链接
云存储（COS）：提供安全、稳定、低成本的对象存储服务。产品介绍链接
人工智能机器学习平台（AI Lab）：提供丰富的人工智能开发工具和资源，支持机器学习、深度学习等任务。产品介绍链接

请注意，以上链接仅供参考，具体选择产品时需要根据实际需求进行评估和选择。

相关·内容

R语言第二章数据处理⑤数据框列的转化和计算目录正文

正文本篇描述了如何计算R中的数据框并将其添加到数据框中。一般使用dplyr R包中以下R函数： Mutate（）：计算新变量并将其添加到数据表中。它保留了现有的变量。...同时还有mutate（）和transmutate（）的三个变体来一次修改多个列： Mutate_all（）/ transmutate_all（）：将函数应用于数据框中的每个列。...Mutate_at（）/ transmutate_at（）：将函数应用于使用字符向量选择的特定列 Mutate_if（）/ transmutate_if（）：将函数应用于使用返回TRUE的谓词函数选择的列...转换特定列 mutate_at（）：转换按名称选择的特定列： my_data2 %>% mutate_at( c("Sepal.Length", "Petal.Width"),...mutate_if（）对于将变量从一种类型转换为另一种类型特别有用。

4.1K2 0

数据处理第2节：将列转换为正确的形状

它涵盖了操纵列以便按照您希望的方式获取它们的工具：这可以是计算新列，将列更改为离散值或拆分/合并列。...在示例代码中，我们将睡眠数据从以小时为单位的数据更改为分钟。...通过使用mutate_at（），我们在管道中需要两个参数：首先，它需要有关列的信息。...如果我想在几分钟内完成，我可以使用mutate_at（）并将包含列的所有'sleep'包装在vars（）中。其次，我在飞行中创建一个函数，将每个值乘以60。...NA 函数na_if（）将特定值转换为NA。

8K3 0

Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险收益可视化

这篇文章的很大一部分内容涉及从FF网站导入数据，并对其进行整理，以用于我们的投资组合收益。我们将看到，处理数据在概念上很容易理解，但在实际操作中却很耗时。...数据被打包为 zip 文件，所以需要做的不仅仅是调用 read_csv()。使用tempfile() 基础 R 中的函数来创建一个名为 temp. 这是我们将放置压缩文件的地方。...如果我们导入不同的 FF 因子集，我们将需要指定不同的列名。作为一种替代方法，下面的代码块在导入后将列转换为数字，但更通用。它可以应用于其他 FF 因子集合。...还将FF数据转换为十进制，并创建了一个名为R\_excess的新列，保存高于无风险利率的收益。...conf.high 和 conf.low 列来保存我们的置信区间最小值和最大值。

3.7K3 0

Numpy 修炼之道（12）—— genfromtxt函数

字段名称使用names关键字定义。当dtype=None时，每个列的类型从其数据中迭代确定。...在以下示例中，转换器convert将剥离的字符串转换为相应的浮点型或如果字符串为空，转换为-999。...使用 missing 和 filling values 在我们尝试导入的数据集中可能会丢失某些条目。在前面的示例中，我们使用转换器将空字符串转换为浮点数。...我们可以使用特殊键None为所有列定义默认值。在下面的例子中，我们假设缺少的值在第一列中用"N/A"标记，"???"在第三列。...我们希望将这些缺失值转换为0，如果它们出现在第一列和第二列中，则转换为-999，如果它们出现在最后一列中： >>> data = "N/A, 2, 3\n4, ,???"

9.6K4 0

独家 | 用于数据清理的顶级R包（附资源）

纠正错误 R有许多预先构建的方法来纠正数据错误，例如转换值，就像在Excel或SQL中那样，使用简单的逻辑，例如as.charater（）将列转换为字符串。...例如，此函数将完全消除所选数据列中缺少的值。 Na.omit(YOUR_DATA_COLUMN) 有类似的选项可以用0或N / A替换空白值，具体取决于字段类型，并提高数据集的一致性。...名称考试A 考试B 约翰 55 80 麦克 76 90 山姆 45 75 gather收集功能通过将其转换为可用的列来完成。...这个函数允许你在R studio中编写SQL代码来选择你的数据元素 Janitor包该软件包能够通过多个列查找重复项，并轻松地从您的数据框中创建友好列。...splitstackshape包这是一个较旧的包，可以使用数据框列中的逗号分隔值。用于调查或文本分析准备。 R拥有大量的软件包，本文只是触及了它可以做的事情的表面。

1.3K2 1

MR应知应会：MungeSumstats包

该软件包还使用户能够灵活地将重新格式化的文件导出为制表符分隔的 VCF 或 R 本机对象，例如 data.table、GRanges 或 VRanges 对象。...小 p 值超过 R 限制，可能会导致 LDSC/MAGMA 出现错误，应进行转换。默认值为 TRUE。 convert_large_p p 值 >1 是否转换为 1？...如果不需要过滤，则使用 NULL。默认为 X、Y 和线粒体。 rmv_chrPrefix 控制是否从染色体名称中删除“chr”/“CHR”（默认为 TRUE）。...任何不在参考基因组上的 SNP 将使用染色体和碱基对位置数据从参考基因组（如果可能）进行校正。...但是，如果 youf 文件中的列标题丢失，我们提供的映射不正确，您可以提供自己的映射文件。必须是 2 列数据框，列名称为“未更正”和“已更正”。

1.2K1 0

Python—关于Pandas的缺失值问题(国内唯一)

从旧版数据库手动传输时，数据丢失。发生编程错误。用户选择不填写字段。其中一些来源只是简单的随机错误。在其他时候，可能会有更深层的原因导致数据丢失。...稍后我们将使用它来重命名一些缺失的值。导入库后，我们将csv文件读取到Pandas数据框中。使用该方法，我们可以轻松看到前几行。...(使用.head()方法) 从列名称中推断出以下字符组非常容易： ST_NUM：街道号码 ST_NAME：街道名称 OWN_OCCUPIED：住所所有人是否被占用 NUM_BEDROOMS：卧室数我们还可以进行设置...遍历OWN_OCCUPIED列尝试将条目转换为整数如果条目可以更改为整数，请输入缺失值如果数字不能是整数，我们知道它是一个字符串，所以继续看一下代码，然后我将对其进行详细介绍 # 检测数据 cnt...要尝试将条目更改为整数，我们使用。int(row) 如果可以将值更改为整数，则可以使用Numpy's将条目更改为缺少的值。np.nan 另一方面，如果不能将其更改为整数，我们pass将继续。

3.1K4 0

sparksql源码系列 | 生成resolved logical plan的解析规则整理

AddMetadataColumns Resolution fixedPoint 当节点缺少已解析属性时，将元数据列添加到子关系的输出中。...除非此规则将元数据添加到关系的输出中，否则analyzer将检测到没有任何内容生成列。此规则仅在节点已解析但缺少来自其子节点的输入时添加元数据列。这可以确保元数据列不会添加到计划中，除非使用它们。...如果名称重复，则使用最内部作用域中定义的名称。...关于减法：1.如果两边都是间隔，保持不变；2.否则，如果左侧为日期，右侧为间隔，则将其转换为DateAddInterval(l, -r)；3.否则，如果右侧是区间，则将其转换为TimeAdd(l, -r...例如，如果实际数据类型为Decimal（30，0），编码器不应将输入值转换为Decimal（38，18）。然后，解析的编码器将用于将internal row反序列化为Scala值。

3.6K4 0

python数据分析之清洗数据：缺失值处理

在使用python进行数据分析时，如果数据集中出现缺失值、空值、异常值，那么数据清洗就是尤为重要的一步，本文将重点讲解如何利用python处理缺失值创建数据为了方便理解，我们先创建一组带有缺失值的简单数据用于讲解...或者使用data.info()来检查所有数据 ? 可以看到一共有7行，但是有两列的非空值都不到7行缺失值处理一种常见的办法是用单词或符号填充缺少的值。例如，将丢失的数据替换为'*'。...我们可以使用.fillna('*') 将所有缺失值替换为* ? 当然也可以针对某一列的缺失值进行填充，比如选择score列进行填充 ? 还有一种办法是将其替换为平均值。...如果是数字，则可以包括均值；如果是字符串，则可以选择众数。比如可以将score列的缺失值填充为该列的均值 ? 当然也可以使用插值函数来填写数字的缺失值。比如取数据框中缺失值上下的数字平均值。 ?...使用的数据为之前文章使用过的NBA数据(可以查看早起python历史文章获取数据与更多分析)，我们先导入数据并检查缺失值 ?

2K2 0

R数据科学|第八章内容介绍

使用readr进行数据导入本文将介绍如何使用readr包将平面文件加载到 R 中，readr 也是 tidyverse 的核心 R包之一。...如果为FALSE，将自动生成列名:X1, X2, X3等。如果col_names是一个字符向量，这些值将被用作列的名称，并且输入的第一行将被读入输出数据帧的第一行。...默认的区域设置是以美国为中心的(如R)，但您可以使用locale()创建自己的区域设置，控制默认时区、编码、十进制标记、大标记和日/月名称等内容。 na 字符串的字符向量，解释为缺少的值。...quoted_na 是否引号内缺少的值应该被视为缺少的值(默认)或字符串 comment 用于标识注释的字符串 trim_ws 在解析每个字段之前，是否应该修剪其前导和尾随空格?...guess_max 用于猜测列类型的最大记录数 progress 显示进度条 skip_empty_rows 是否忽略空白行如果能够熟练使用read_csv()函数，就能同样使用readr包中的其他函数来读取文件了

2.1K4 0

R语言缺失值的处理：线性回归模型插补

p=14528 在当我们缺少值时，系统会告诉我用-1代替，然后添加一个指示符，该变量等于-1。这样就可以不删除变量或观测值。...---- 视频缺失值的处理：线性回归模型插补 ---- 我们在这里模拟数据，然后根据模型生成数据。未定义将转换为NA。一般建议是将缺失值替换为-1，然后拟合未定义的模型。...如果未定义50％，则缺少数据，将删除一半的行 n=1000 x1=runif(n) x2=runif(n) e=rnorm(n,.2) y=1+2*x1-x2+e alpha=.05 indice=sample...，我们获得与第一种方法完全相同的值，该方法包括删除缺少值的行。...5.在r语言中使用GAM（广义相加模型）进行电力负荷时间序列分析 6.使用SAS，Stata，HLM，R，SPSS和Mplus的分层线性模型HLM 7.R语言中的岭回归、套索回归、主成分回归：线性模型选择和正则化

3.4K1 1

.NET 可移植性分析器

将项目转换为面向 .NET Core 等新平台后，可以使用基于 Roslyn 的 API 分析器工具来识别引发 PlatformNotSupportedException 异常以及其他兼容性问题的 API...可并行安装意味着无需破坏其他应用即可采用新的 .NET Core 版本。如果目标是将应用移植到 .NET Core 以支持多个平台，则建议使用此对象。...如果使用的是 ApiPort 控制台应用，.NET 可移植性报表将以指定的格式保存为文件。默认位于当前目录中的 Excel 文件 (.xlsx) 中。...目标类型：该类型具有目标平台缺少的 API 目标成员：目标平台缺少的方法程序集名称：缺少的 API 所在的 .NET Framework 程序集。...每个选定的目标平台都是一列，例如“.NET Core”：“不支持”值表示此目标平台不支持 API。建议的更改：要进行更改的推荐 API 或技术。对于许多 API，此字段当前为空或已过时。

1.1K4 0

30 个小例子帮你快速掌握Pandas

我们删除了4列，因此列数从14减少到10。 2.读取时选择特定的列我们只打算读取csv文件中的某些列。读取时，列列表将传递给usecols参数。如果您事先知道列名，则比以后删除更好。...8.删除缺失值处理缺失值的另一种方法是删除它们。“已退出”列中仍缺少值。以下代码将删除缺少任何值的行。...第一个参数是位置的索引，第二个参数是列的名称，第三个参数是值。 19.where函数它用于根据条件替换行或列中的值。默认替换值是NaN，但我们也可以指定要替换的值。...符合指定条件的值将保持不变，而其他值将替换为指定值。 20.排名函数它为这些值分配一个等级。让我们创建一个根据客户余额对客户进行排名的列。...29.根据字符串过滤我们可能需要根据文本数据（例如客户名称）过滤观察结果（行）。我已经将虚构名称添加到df_new DataFrame中。 ? 让我们选择客户名称以Mi开头的行。

10.6K1 0

python数据处理 tips

df.head()将显示数据帧的前5行，使用此函数可以快速浏览数据集。删除未使用的列根据我们的样本，有一个无效/空的Unnamed:13列我们不需要。我们可以使用下面的函数删除它。...注意：请确保映射中包含默认值male和female，否则在执行映射后它将变为nan。处理空数据 ? 此列中缺少3个值：-、na和NaN。pandas不承认-和na为空。...解决方案1：删除样本（行）/特征（列）如果我们确信丢失的数据是无用的，或者丢失的数据只是数据的一小部分，那么我们可以删除包含丢失值的行。在统计学中，这种方法称为删除，它是一种处理缺失数据的方法。...在该方法中，如果缺少任何单个值，则整个记录将从分析中排除。如果我们确信这个特征（列）不能提供有用的信息或者缺少值的百分比很高，我们可以删除整个列。...在这种情况下，让我们使用中位数来替换缺少的值。 ? df["Age"].median用于计算数据的中位数，而fillna用于中位数替换缺失值。

4.3K3 0

基于 mlr 包的逻辑回归算法介绍与实践（上）

新画作整个分类过程通过使用算法学习得到的线性模型，将新数据的铜含量（copper）和铅含量（lead）转换为它们的 log odds (或 logits)。...mutate_at(.vars = fctrs, .funs = factor) %>% #将变量转换为因子 mutate(FamSize = SibSp + Parch) %>% #定义新的变量...gather() 函数将数据转化为 untidy 形式：每个预测变量名保存在一列中，它们的值保存在另一列中。...此时报错，查看年龄数据可知存在缺失值，而逻辑回归无法处理这样的数据。 2.5 处理缺失值处理缺失数据有两种方法: 简单地从分析中排除缺少数据的情况。应用一种机制来填补空白。...在本例中，由于年龄缺失值较多，故使用第二种处理缺失值的方法。

2.2K2 0

Pandas 秘籍：1~5

序列的视觉输出风格比数据帧少。它代表一列数据。连同索引和值一起，输出显示序列的名称，长度和数据类型。或者，虽然不建议这样做，但可能会出错，但是可以使用带有列名作为属性的点表示法来访问数据列。...我们通过观察count方法的结果与size属性不匹配，确定该序列中缺少值。...当像上一步那样将数字列彼此相加时，pandas 将缺失值默认为零。但是，如果缺少特定行的所有值，则 Pandas 也会将总数也保留为丢失。...如果仔细观察，您会发现步骤 3 的输出缺少步骤 2 的所有对象列。其原因是对象列中缺少值，而 pandas 不知道如何处理字符串值与缺失值。它会静默删除无法为其计算最小值的所有列。...duration列缺少一些值。如果回头看步骤 1 的数据帧输出，您将看到最后一行缺少duration的值。为此，步骤 2 中的布尔条件返回False。

37.2K1 0

Oracle 错误总结及问题解决 ORA「建议收藏」

ORA-01151: 如果需要，请使用介质恢复以恢复块和恢复备份 ORA-01152: 文件没有从完备的旧备份中恢复 ORA-01153: 激活了不兼容的介质恢复 ORA-01154: 数据库正在运行...ORA-01410: 无效的 ROWID 说明：当将字符转变为ROWID时，如果使用了无效的字符串，会触发此异常。...类型 ORA-13266: 将数据插入表时出错 ORA-13267: 从层次表读取数据时出错 ORA-13268: 从 USER_SDO_GEOM_METADATA 获取维时出错 ORA-13269...：更新分区关键字列将导致分区的更改说明：在更新记录中的Partition Key时，如果不开启ROW MOVEMENT，则会报此错误。...-19717: 对于非 OMF 搜索, 必须指定模式 ORA-19718: 命令 ID 的长度大于 ORA-19719: 操作名称的长度大于 ORA-19720: 将 OCI 号转换为 SCN 时出错

18.9K2 0

「R」dplyr 列式计算

❝在近期使用「dplyr」进行多列选择性操作，如 mutate_at() 时，发现文档提示一系列的「dplyr」函数变体已经过期，看来后续要退休了，使用 across() 是它们的统一替代品，所以最近抽时间针对性的学习和翻译下...，但目前我们还没找到解决方案）当前列如果需要，你可以通过调用 cur_column() 来获取当前列的名字。...这是由 base R 提供的，但它并没有很好的文档，我们花了一段时间才发现它是有用的，而不仅仅是理论上的好奇。我们可以使用数据框让汇总函数返回多列。...我们可以使用没有外部名称作为将数据框列解包为单独列的约定。你如何转移已经存在的代码？...幸运的是，将已有的代码转换为使用 across() 实现通常是非常直观的：去掉函数 _if(), _at() and _all() 后缀调用 across()，第一个参数如下：后面如果还有参数，保持原样即可

2.4K1 0

tf.io

decode_csv():将CSV记录转换为张量。每一列映射到一个张量。decode_gif():将gif编码图像的帧解码为uint8张量。...serialize_张量():将张量转换为序列化的张量。tf_record_iterator():从TFRecords文件中读取记录的迭代器。...对于稀疏量，删除索引矩阵的第一个(batch)列(索引矩阵是列向量)，值向量不变，删除形状向量的第一个(batch_size)条目(现在是单个元素向量)。...features:dict将特性键映射到FixedLenFeature或VarLenFeature值。name:此操作的名称(可选)。example_names:(可选)标量字符串张量，关联的名称。...域：shape:输入数据的形状dtype:输入的数据类型default_value:如果示例缺少此特性，则使用的值。

2.6K2 0

4个解决特定的任务的Pandas高效代码

在本文中，我将分享4个在一行代码中完成的Pandas操作。这些操作可以有效地解决特定的任务，并以一种好的方式给出结果。从列表中创建字典我有一份商品清单，我想看看它们的分布情况。...，这是Pandas的一维数据结构，然后应用value_counts函数来获得在Series中出现频率的唯一值，最后将输出转换为字典。...如果有一行缺少值(即NaN)，用B列中同一行的值填充它。...如果我们想要使用3列，我们可以链接combine_first函数。下面的代码行首先检查列a。如果有一个缺失的值，它从列B中获取它。如果列B中对应的行也是NaN，那么它从列C中获取值。...上面的代码可能不会经常使用，但是当你需要处理这种任务时，它们是非常好的解决办法。作者：Soner Yıldırım

1891 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云