首页
学习
活动
专区
工具
TVP
发布

数据科学(冷冻工厂)

专栏作者
362
文章
189955
阅读量
30
订阅数
基因组组装:NextDenovo2 使用大全
NextDenovo 是一种针对长序列读取(包括CLR和ONT技术)的新型基因组组装工具。它采取了一种“先校正错误再进行组装”的方法,这与canu工具类似,但对于PacBio HiFi读取数据则无需进行校正。相较于其他工具,NextDenovo在计算资源和存储空间的需求上要小得多。完成组装后,每个碱基的准确率可以达到98%至99.8%。如果您希望进一步提升单个碱基的精确度,可以尝试使用NextPolish工具进行优化。
冷冻工厂
2024-04-28
550
Linux|Awk 变量、数字表达式和赋值运算符
本部分[1]将深入学习 Awk 的高级应用,以应对更为复杂的文本或字符串过滤任务。将介绍包括变量、数值表达式和赋值运算符在内的 Awk 功能。
冷冻工厂
2024-04-28
1050
单细胞分析|整合 scRNA-seq 和 scATAC-seq 数据
单细胞转录组学极大地提升了对细胞状态进行分类的能力,但要深入理解生物学现象,不能仅仅停留在对细胞群的简单列举上。随着新方法的不断涌现,用于测量细胞的不同状态,一个关键的挑战是如何将这些数据集整合起来,以便更全面地理解细胞的特性和功能。
冷冻工厂
2024-04-28
1950
Python网络数据抓取(4):Beautiful Soup
这个库通常被称为Beautiful Soup 4(BS4)。它主要用来从HTML或XML文件中抓取数据。此外,它也用于查询和修改HTML或XML文档中的数据。
冷冻工厂
2024-04-28
680
Python网络数据抓取(3):Requests
在这一部分,我们将探讨Python的requests库,并且利用这个库来进行网页数据抓取。那么,我们为何需要这个库,以及怎样利用它呢?
冷冻工厂
2024-04-28
1050
数据处理:A New Coefficient of Correlation
假设告诉你有一种新的方法可以像相关性一样衡量两个变量之间的关系,甚至可能更好,你会怎么想呢?具体来说,2020年发表了一篇名为《一个新的相关系数》的论文,介绍了一种新的衡量方法,当且仅当两个变量独立时等于0,当且仅当一个变量是另一个变量的函数时等于1,而且具有一些良好的理论性质,可以进行假设检验,同时在实际应用中对数据不做任何假设。
冷冻工厂
2024-04-28
760
基因组组装:Hifiasm 使用教程
Hifiasm[1] 是一个快速的单倍型解析 de novo 组装软件,最初设计用于 PacBio HiFi 读取。其最新版本可以通过利用超长的 Oxford Nanopore 读取支持端粒到端粒的组装。Hifiasm 可以生成单样本端粒到端粒的组装,结合了 HiFi、超长和 Hi-C 读取,可以说是最好的组装软件之一。对于 trio-binning 组装来说,它是最好的单倍型解析组装软件之一,适用于父本短读取。对于人类基因组来说,hifiasm 可以在一天内完成端粒到端粒的组装。
冷冻工厂
2024-04-15
1090
scRAN-seq|加权最近邻分析(2)
本文[1]介绍了Seurat 5.0.0中的加权最近邻(WNN)分析方法,这是一种用于整合和分析多模态单细胞数据的无监督框架。
冷冻工厂
2024-04-15
740
Linux | 从 STDIN 读取 Awk 输入
在之前关于 Awk 工具的系列文章中,主要探讨了如何从文件中读取数据。但如果你希望从标准输入(STDIN)中读取数据,又该如何操作呢?
冷冻工厂
2024-04-15
790
Python网络数据抓取(2):HTTP Headers
接下来,本文会向大家阐述 HTTP 请求中的“请求头”(headers)的概念,并通过实例来帮助大家理解。让本文直接进入主题。
冷冻工厂
2024-04-15
1360
大型语言模型(LLMs)面试常见问题解析
这篇文章[1]是关于大型语言模型(LLMs)的面试问题和答案,旨在帮助读者准备相关职位的面试。
冷冻工厂
2024-04-15
1070
scRAN-seq|加权最近邻分析(1)
本文[1]介绍了Seurat 5.0.0中的加权最近邻(WNN)分析方法,这是一种用于整合和分析多模态单细胞数据的无监督框架。
冷冻工厂
2024-04-15
440
Linux| Awk 中“next”命令奇用
本文[1]介绍了在Linux中使用Awk的next命令来跳过剩余的模式和表达式,读取下一行输入的方法。
冷冻工厂
2024-04-15
810
Python网络数据抓取(1):Why Python?
欢迎来到在 Python 中进行网络抓取的全面指南!如果您曾经想学习如何使用 Python 进行网络抓取,那么您来对地方了。在这个广泛的 Python 网络抓取教程中,将涵盖您需要了解的一切,从基础知识到更高级的技术,将构建自己的网络爬虫。
冷冻工厂
2024-04-03
920
Mamba深度解析:AI模型的新突破
人工智能领域迎来了一位新星——Mamba,这是一种基于状态空间模型(SSMs)的新型AI模型,它作为Transformer模型的有力竞争者,解决了后者在处理长序列数据时的效率问题。
冷冻工厂
2024-04-02
1000
单细胞分析|映射和注释查询数据集
在本文中,我们首先构建一个reference,然后演示如何利用该reference来注释新的查询数据集。生成后,该reference可用于通过cell类型标签传输和将查询cell投影到reference UMAP 等任务来分析其他查询数据集。值得注意的是,这不需要纠正底层原始查询数据,因此如果有高质量的reference可用,这可能是一种有效的策略。
冷冻工厂
2024-04-02
660
Linux|如何管理多个Git身份
作为一名通用软件开发者,我经常发现自己在处理各种各样的项目,每个项目都有自己的要求和期望。这包括为个人、工作和客户项目管理不同的Git身份。以下是我组织Git仓库以简化这一过程的方法。
冷冻工厂
2024-04-02
960
自然语言处理(NLP)全面指南
自然语言处理(NLP)是人工智能领域中最热门的技术之一,它通过构建能够理解和生成人类语言的机器,正在不断推动技术的发展。本文将为您提供NLP的全面介绍,包括其定义、重要性、应用场景、工作原理以及面临的挑战和争议。
冷冻工厂
2024-04-02
3280
单细胞分析|Seurat中的跨模态整合
在单细胞基因组学领域,将新数据集映射到已建立的参考数据集上的能力,与读取映射工具变革基因组序列分析的方式如出一辙。
冷冻工厂
2024-04-02
1150
Python is Easy. Go is Simple. Simple != Easy
有一个常见的误解,认为“简单”和“容易”指的是同一件事。毕竟,如果某样东西易于使用,那么它的内部工作原理也一定很容易理解,对吧?或者相反也是一样?事实上,情况恰恰相反。虽然这两个概念指向相同的结果,但要让事情看起来简单,背后需要巨大的复杂性。
冷冻工厂
2024-04-02
1070
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档