前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CITE-seq分析数据报错:Duplicate rownames not allowed

CITE-seq分析数据报错:Duplicate rownames not allowed

原创
作者头像
JJJJack
发布2024-03-30 06:39:12
1620
发布2024-03-30 06:39:12
举报

今天分析CITE-seq数据的时候遇到了一个error:“Invalid class "LogMap" object: Duplicate rownames not allowed”。Google之后并没有发现很好的解决方案。

以上是我咨询ChatGPT的结果,可是我发现Expression这个object的rownames没有重复的,怎么都想不通为啥会报错提示duplicate rownames。

代码语言:R
复制
Invalid class "LogMap" object: Duplicate rownames not allowed

然后我就检查了一下colnames有没有重复的。结果发现我的colnames居然有duplicates。这个colnames就是一个个细胞的barcode。我建库的时候用了不同的sample_Tag,然后不同的Sample_Tag之间竟然有几个overlap,即: 使用了相同的barcode。很奇怪的是不同的Sample_Tag包含的Cell_Index居然有duplicates。 以下是我个人的猜测:

代码语言:R
复制
Q1-难道不同的Sample Tag会使用部分重复的barcode么?
Q2-还是测序仪不同批次之间有污染?

Solution: 暴力解决的方法:
既然已经知道了哪些细胞来自哪个sample,那么我就可以manually edit these Cell_index。即我可以认为的修改这些Cell_index,可以从小到大排序。从10000开始计数。避免产生duplicated colnames.

当我认为的修改完这些Cell Index之后,再run CreateSeuratObject() function之后就没有报错了。

总结:

代码语言:Python
复制
1. 明明是colnames存在duplicate, 报错却提示duplicate rownames。为何会出现这样的报错尚待解决。
2. Different Sample_Tag (BD company) may exist same cell_index. When combine different samples to one .csv file, need to make clear whether there are duplicate value.
3. 只要是run code, 就没有轻松的时刻。。。总是会报错,勤于Google或者chatgpt,可以解决大部分的问题。同时也要善于记录,不然相同的问题再次出现,又会去花时间搜索。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档