rowSums(X%*%C* X)的语义是什么_最小二乘与X'Xθ= X'y的关系是什么？_猜猜0x564c是什么？ - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

基本操作/包的移动/向量/矩阵/数组/数据框/列表/因子/NA/字符串

28. R 数据整理（三：缺失值NA 的处理方法汇总）

可以使用is.na() 函数对向量进行遍历，如果存在NA，则会返回TRUE，反之。

生信技能树数据框data.frame练习1

生信技能树练习题大全：http://www.biotrainee.com/thread-1754-1-1.html by Jimmy老师

🤩 scRNA-seq | 吐血整理的单细胞入门教程（数据格式和处理）（四）

1写在前面我们还是在正式进行代码操作前想几个小问题：👇 如何将单细胞数据导入R中？不同类型的数据/信息（如细胞信息、基因信息等）是如何存储和操作的？如何获得细胞和基因的基本信息并对数据进行相应的过滤？ 2用到的包目前常用的scRNA-seq分析包，包括Seurat、Scanpy(python)、Scater、Monocle2、Monocle3等。🤒 rm(list = ls()) library(tidyverse) library(SingleCellExperiment) library(Dro

学徒作业完成！多个单细胞亚群各自差异分析后如何汇总可视化

先找出各细胞类型上下调的gene,然后拿到gene-cell type的表达矩阵，将其分为上调的和下调的

几种加快R语言运算的方法

提升R代码运行速度并不需要很高级的优化技术, 例如代码并行化, 使用数据库, 使用c++等. 实际上, 通过简单的操作, 就能够是R的运算速度显著的加快, 下面介绍几种方法.

不让人省心的LULU！

前几天对LULU这种方法进行了介绍：但是！我在组会上讲了一下这个方法的原理，马上得到了老板的灵魂连击：

R优雅绘制小样本间相关性网络图

报错信息表明rcorr函数在尝试计算Spearman相关性时遇到了问题，原因是数据中的某些变量（列）的观测值数量不足以进行相关性分析。具体来说rcorr 函数要求每个变量至少有5个观测值来计算相关性。

R语言_apply系列函数

#apply #get answer grouped by col/row d = matrix(1:30,5,6) apply(d,1,mean) #row apply(d,2,mean) #col M <- array( seq(32), dim = c(4,4,2)) apply(M, 1, sum) #row apply(M, c(1,2), sum) #row % col colMeans,rowMeans,colSums,rowSums #lapply #list to list x <-

R语言中的apply函数族

apply函数族是R语言中数据处理的一组核心函数，通过使用apply函数，我们可以实现对数据的循环、分组、过滤、类型控制等操作。但是，由于在R语言中apply函数与其他语言循环体的处理思路是完全不一样的，所以apply函数族一直是初学者玩不转的一类核心函数。很多R语言新手，写了很多的for循环代码，也不愿意多花点时间把apply函数的使用方法了解清楚，最后把R代码写的跟C似得。

KNN算法在保险业精准营销中的应用

一、KNN算法概述 KNN是Machine Learning领域一个简单又实用的算法，与之前讨论过的算法主要存在两点不同：它是一种非参方法。即不必像线性回归、逻辑回归等算法一样有固定格式的模型，也不需要去拟合参数。它既可用于分类，又可应用于回归。 KNN的基本思想有点类似“物以类聚，人以群分”，打个通俗的比方就是“如果你要了解一个人，可以从他最亲近的几个朋友去推测他是什么样的人”。在分类领域，对于一个未知点，选取K个距离（可以是欧氏距离，也可以是其他相似度度量指标）最近的点，然后统计这K个点，在这K个

R语言ggplot2做柱形图并在指定的位置添加灰色背景

ggplot2作图X轴默认坐标轴的刻度是朝下的，Y轴默认的刻度是朝左的，如果要改为朝上和朝右，该如何设置。之前也有人问过这个问题

差异分析①

加载数据 setwd("D:\\diff") # Reading in count data files <- c("GSM1545535_10_6_5_11.txt", "GSM1545536_9_6_5_11.txt", "GSM1545538_purep53.txt","GSM1545539_JMS8-2.txt", "GSM1545540_JMS8-3.txt","GSM1545541_JMS8-4.txt", "GSM1545

R语言计算GC/AT含量

大家晚上好，今天给大家介绍一个可以处理FASTA文件的包-Biostrings。这个包主要是处理基因组的一些序列信息，包括：序列翻译、DNA/RNA互转、统计各个碱基的含量、三连字母的含量.....这些都是一行命令可以解决的。今天就先来教大家怎样计算GC/AT含量。

R语言学习 - 基础概念和矩阵操作

R基本语法获取帮助文档，查看命令或函数的使用方法、事例或适用范围 >>> ?command >>> ??command #深度搜索或模糊搜索此命令 >>> example(command) #得到

预测三分类变量模型的ROC介绍

我们对Logistics回归很熟悉，预测变量y为二分类变量，然后对预测结果进行评估，会用到2*2 Matrix，计算灵敏度、特异度等及ROC曲线，判断模型预测准确性。

数据可视化有意思的小例子：Taylor Swift 歌词数据分析和可视化

Data Visualization and Analysis of Taylor Swift’s Song Lyrics

4-2 R语言函数 apply

#apply函数，沿着数组的某一维度处理数据 #例如将函数用于矩阵的行或列 #与for/while循环的效率相似，但只用一句话可以完成 #apply(参数)：apply(数组,维度,函数/函数名) > x <- matrix(1:16,4,4) > x [,1] [,2] [,3] [,4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 >

数据转换

一般的 R 函数只能接受固定类型的数据，例如绘制热图，输入数据必须是数值型向量，数据框则不行，线性回归分析中，输入数据必须为一个数据框。因此，需要熟悉各种数据类型之间的转换。此外，在做数据转换的过程中，还要记住，有些数据只能单方向进行转换，而不能相互转换，例如部分数据框无法转换为数值型矩阵。

R语言实现：混合正态分布EM最大期望估计法

因为近期在分析数据时用到了EM最大期望估计法这个算法，在参数估计中也用到的比较多。然而，发现国内在R软件上实现高斯混合分布的EM的实例并不多，大多数是关于1到2个高斯混合分布的实现，不易于推广，因此这里分享一下自己编写的k个高斯混合分布的EM算法实现请大神们多多指教。并结合EMCluster包对结果进行验算。

数据分析|R-缺失值处理

本版块打算分享一些数据分析过程中用到的数据清洗，统计分析，建立简单模型等。

ChIP-seq 分析：Consensus Peaks（14）

我们将审查的 Myc peak 调用位于 peaks 目录中，因此我们在这里使用 dir() 函数列出与我们预期的文件模式匹配的所有文件。

R语言︱缺失值处理

1、输出数据格式不同。is.na按照数据框格式形成一个（FALSE,FALSE,TURE）列，而complete.cases形成是一个数列向量，不再是按照数据框格式；

单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析19

单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析1：https://cloud.tencent.com/developer/article/2055573

认识向量

在使用R语言过程中，每一步中都需要关注R语言的数据结构。数据结构是R语言中最重要的内容，也是最难的一部分，学会了这部分之后，R语言就不难了。很多时候，函数无法运行，都是因为数据结构的问题。在学习R语言数据结构之前需要首先了解下数据的类型。

「R」dplyr 列式计算

同时对数据框的多列执行相同的函数操作经常有用，但是通过拷贝和粘贴的方式进行的话既枯燥就容易产生错误。

2. R语言中各种数据类型常见运算的函数

本文介绍了R语言中各种数据类型常见运算的函数，包括向量运算、矩阵运算、以及一般函数的运算。此外，还介绍了apply函数的用法，用于对各行各列进行运算。

ATAC-seq分析：差异分析（10）

在下部分中，我们将研究如何使用 R/Bioconductor 识别开放区域中的变化。

MIC: 最大信息系数计算OTU与环境因子相关性

Logares, R., Deutschmann, I.M., Junger, P.C. et al. Disentangling the mechanisms shaping the surface ocean microbiota. Microbiome 8, 55 (2020). https://doi.org/10.1186/s40168-020-00827-8

R Programming week 3-Loop functions

Writing for, while loops is useful when programming but not particularly easy when working interactively on the command line. There are some functions which implement looping to make life easier

画韦恩图那么容易，为什么拿到指定元素却有问题

这个时候，如果你的合作者并不擅长代码，可以直接打开这个csv文件，根据sum列进行筛选即可。

手把手带你复现NC图表之Figure 3

多重IHC（mxIHC）和 CIBERSORT显示成纤维细胞亚群占据空间离散的小生境和不同的NSCLC组织亚型富集

ATAC-seq分析：差异分析（10）

在下部分中，我们将研究如何使用 R/Bioconductor 识别开放区域中的变化。

有了单细胞数据的类器官研究其实可以不做常规基因组和转录组啦

恰好单细胞时代到了，可以让之前的CNS类器官研究文章继续“复制粘贴一波”，比如2021发表Advanced Science期刊的类器官文章：《Single-Cell Transcriptome Analysis Uncovers Intratumoral Heterogeneity and Underlying Mechanisms for Drug Resistance in Hepatobiliary Tumor Organoids》，就已经舍弃了传统的常规的转录组和肿瘤外显子数据，仅仅是看单细胞转录组。详见：只有单细胞转录组数据的肿瘤类器官研究（肝癌）。但是它主要是关心的是肿瘤病人内部的异质性，每个病人内部降维聚类分群后看特征基因，做拟时序分析看变化趋势，并没有展示类器官培养的成功性。

R语言ggplot2两个离散变量画热图的简单小例子

数据集下载链接 http://userweb.eng.gla.ac.uk/umer.ijaz/bioinformatics/ecological/SPE_pitlatrine.csv

R语言︱异常值检验、离群点分析、异常值处理

如何实现马尔可夫链蒙特卡罗MCMC模型、Metropolis算法？

这只是众多算法之一。这个术语代表“马尔可夫链蒙特卡洛”，因为它是一种使用“马尔可夫链”（我们将在后面讨论）的“蒙特卡罗”（即随机）方法。MCMC只是蒙特卡洛方法的一种，尽管可以将许多其他常用方法看作是MCMC的简单特例。

《高效R语言编程》7--高效优化

需要使用C++编译器，安装方法取决于操作系统，Linux：一般安装了R就会安装了；Mac：Xocode；Windows：Rtools，与版本要对应。需要用到的包：microbenchmark, ggplot2movies, profvis, Rcpp

cellphonedb之可视化受体配体对

1 下载cellphonedb官网测试数据，并运行软件 cellphonedb官网下载测试数据 curl https://raw.githubusercontent.com/Teichlab/cellphonedb/master/in/example_data/test_counts.txt --output test_counts.txt curl https://raw.githubusercontent.com/Teichlab/cellphonedb/master/in/example_data/

R文本挖掘-中文分词Rwordseg

本文主要介绍了如何使用 R 语言对中文文本进行分词和词频统计。首先介绍了 R 语言中的 tm 包和 Rwordseg 包，然后通过一个示例展示了如何使用这两个包进行中文分词和词频统计。最后，介绍了一些常用的分词方法，并给出了一个使用 wordcloud 包进行词云展示的示例。

如何进行批量差异分析并绘制其火山图及拼图

上周，曾老师给了我一个8个样本8个组别的转录组数据，即每组只有一个样本的转录组数据。我的处理方式是从中抽取两组进行差异分析，与文中描述的显著差异基因数目以及文中指出的差异基因进行比较，看看分析结果是否大致相同。但是，其实我有些没有理解到老师的意思。老师的初衷是想同原文一样批量绘制「同个部位」两两组别间的差异分析结果，看看其差异基因数量的分布，然后进行比较。在看到我理解偏差后，老师还飞快地给我提供了单样本批量差异分析的脚本。「因此，本周我们主要重点展示如何批量进行单样本差异分析以及批量绘制火山图并拼图」。

R语言性能Tips和GC

最近团队在使用R语言作为算法的实践语言，通过人工策略和xgboost算法进行一些价格算法的控制和输出，发现一些代码中对于内存、CPU、程序设计思想以及现代统计算法并不是很熟悉，于是特写此篇普及一下知识，也算是我对R语言的入门文章吧。

这个肝癌单细胞数据集居然真的有这么多NK细胞亚群啊！！！

根据生信技能树发布的学徒作业：SingleR说是NK细胞你就相信了吗, 验证一下看真的是有这么多NK细胞

跟着Nature学数据分析：R语言iNEXT包估计物种数并使用ggplot2作图展示结果

https://www.nature.com/articles/s41586-022-04567-7

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐