首页
学习
活动
专区
工具
TVP
发布

科技记者

专栏作者
170
文章
164724
阅读量
35
订阅数
SAIGE用户手册笔记2
SAIGE-GENE(现在称为SAIGE-GENE+)采取两个步骤来执行基于集合的关联测试
用户1075469
2022-04-15
1K14
Hail-GWAS教程笔记
主要参考自:Hail | GWAS Tutorial[1]本笔记旨在提供Hail功能的概述,重点是操作和查询遗传数据集的功能。我们进行了全基因组SNP关联测试,并证明了需要控制由群体分层引起的混杂。
用户1075469
2022-03-04
9680
第11章 降维 笔记
去掉数据集中关联性不大和冗余的数据,确保不出现过度适应的前提下降低计算的成本,需要对特征进行无损规约,数学上叫降维。广泛用于模式识别、文本检索以及机器学习领域,主要分为两类,特征提取和特征筛选,前者是高维数据投影到低维空间,后者是特征子集代替原始特征集,包括特征分级和特征筛选,分级是找到优化后的特征子集。特征提取可以分成线性抽取和非线性抽取两种方法,前者是试图找到一个仿射空间能够最好的说明数据分布的变化,后者对高维非线性曲线平面分布的数据非常有效。线性特征的抽取方法:
用户1075469
2022-03-04
8920
第10章 关联分析和序列挖掘 笔记
关联分析是发现交易数据内有趣联系的一种方法,比如著名的“啤酒-尿布”。频繁序列模式挖掘,可以预测购买行为,生物序列等等。
用户1075469
2022-03-04
4390
第9章 聚类 笔记
不同于分类和回归,聚类不需要事先的任何参考分类信息,可以简单地通过判断数据特征的相似性来完成对数据的归类。
用户1075469
2022-03-04
4140
第7章 模型评估 笔记
trainControl中可以设置重采样的参数,指定boot\boot632\cv\repeatdcv\LOOCV\LGOCV\non\oob\adaptive_cv\adaptive_boot\adaptive_LGOCV等。
用户1075469
2022-03-04
7350
理解回归分析--机器学习与R语言实战笔记(第四章)
回归是一种有监督的学习方式,用于建模分析一个独立变量(响应变量)和一个或多个非独立变量(预测变量)之间的关联。
用户1075469
2021-12-18
8890
分类I-树、延迟和概率笔记
这个数据集和书中的略有区别,不过应该是包含的关系,这个数据的样本更多,应该不影响的。扩展:split函数完成训练和测试的划分
用户1075469
2021-12-18
5790
QIIME 2 2021.11发布啦
下一版计划于 2021 年2月(QIIME 2 2022.2)发布,请继续关注更新。
用户1075469
2021-12-18
4080
机器学习与R语言实战笔记(第三章)
这里记录下这本书里我之前不了解的内容,欢迎一起交流!向量的模式作者写了个函数来干这件事,我学习下,登上巨人的肩膀。我的理解,这个是相当于motif,计数最多的元素的意思。
用户1075469
2021-12-18
1.1K0
《写给系统管理员的Python脚本编程指南》笔记
从南图借的这本书,已经拖了好几个月没有读完了,加紧阅读和学习一下!前面3章的笔记记在了纸上,如果有可能拍照记录一下,后面还是电子记录下,纸质的不方便和保存和查阅,也不方便分享。书的配套代码,来自异步社区:https://box.lenovo.com/l/o5OgDR
用户1075469
2021-11-02
1.8K0
QIIME 2 2021.8到来啦
2.一个新工具:qiime tools cast-metadata,允许用户通过命令行将元数据列转换为新的 q2:types
用户1075469
2021-11-02
3620
R语言宏基因组学统计分析(第四章)笔记
citation("ggplo2")取包引用信息,RStudio.Version()可以获取RStudio引用信息。
用户1075469
2021-07-05
1.7K0
ggplot2--R语言宏基因组学统计分析(第四章)笔记
ggplot2可以用来创建优雅的图形,由于它的灵活,简洁和一致的接口,可以提供美丽、可直接用来发表的图形,吸引了许多用户,特别是科研领域的用户。ggplot2使用grid包来提供一系列的高水平的函数,并将其延伸为图形语法,即独立指定绘图组件,并将它们组合起来,以构建我们想要的任何图形显示。图形语法包含6个主要成分:data, transformations, element, scales, guide和 coordinate system。图层图形语法源于多层数据构建图形的想法。它定义了下表中的图形组分:data, aesthetic mappings, statistical transformations, geometric objects, position adjustment, scales, coordinate system 和 faceting(数据、几何映射、统计变换、几何对象、位置调整、比例、坐标和面)。数据、几何映射、统计变换、几何对象、位置调整形成一个图层,一个图可以有多个图层。
用户1075469
2021-07-05
4.9K0
高效R编程
这是《高效R语言编程》的学习笔记,前面的笔记在这里:https://blog.csdn.net/zd200572/article/details/115349366 https://www.jianshu.com/p/71392ef45d01 很多R语言用户并不认为自己是程序员,我也是:),精通专业知识,理解R语言的标准数据结构,但是缺乏正规编程训练,你是这样的吗?
用户1075469
2021-05-20
1.3K0
SMURF流程之q2-sidle(二)-- 序列重建
继续前面的文档学习,地址在这里啦!官方文档‎ SMURF 算法的核心是基于基于 kmer 的短区域重建到全长框架中。有两个步骤,首先是ASV在单个区域基于kmer进行比对,然后完整的序列集组装成重建的计数表。
用户1075469
2021-03-11
3570
R语言宏基因组学统计分析学习笔记(第三章-3)
早在1897年,皮尔逊就警告说,在器官测量中使用两个绝对测量值的比值,可能会形成“伪相关”。自1920s以来,地质学的研究人员已经知道,使用标准的统计方法来分析成分数据可能会使结果无法解释。Aitchison认识到关于组成成分的每一个陈述都可以用成分的比率来表述,并开发出一套基本原理、各种方法、操作和工具来进行成分数据分析。其中,对数比变换方法被地质学、生态学等领域的统计学家和研究人员广泛接受,因为通过对数比变换,可以消除组成数据的样本空间(单纯性)受约束问题,并将数据投影到多元空间中。因此,所有可用的标准多元技术都可以再次用于分析成分数据。
用户1075469
2021-01-26
2.7K0
宏转录组学习笔记--另一个教程
这项工作已获得Creative Commons Attribution-ShareAlike 4.0 International协议的许可。这意味着您可以复制,共享和修改作品,只要结果以相同的许可证分发即可。本教程由Mobolaji Adeolu(adeolum@mcmaster.ca),John Parkinson(john.parkinson@utoronto.ca)和Xuejian Xiong(xuejian@sickkids.ca)制作。
用户1075469
2020-03-31
2.6K0
简单的snptest要不要学
下载地址在这个网站 https://mathgen.stats.ox.ac.uk/genetics_software/snptest/snptest.html
用户1075469
2020-03-18
1.1K0
PRS多基因评分教程学习笔记(二)
之前学习了Base Data质控过程,下面继续,最近一直没有开启博客写作,十月将过,加紧补点。
用户1075469
2020-03-03
2.1K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档