腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
适合于多类分类的深度学习结构
、
、
、
、
我有以下
数据
gene_1 100.33 10.2 ... 90.23 great....M
大
~30K行我的问题是,什么样的深度学习结构适合学习和测试上述
数据
。 在一天结束时,用户将给出一个
基因
表达载体。gene_1 989
浏览 6
提问于2016-04-27
得票数 15
回答已采纳
1
回答
如何在python中使用大数组?
、
、
我需要在python中从Sqlite
数据
库创建一个大数组。它的大小是1000_000_000*1000_000_000,每一项都是1或0。实际上,我的计算机不能在RAM中存储这么大量的信息。也许将这些向量存储在
数据
库中,或者有一些类似需求的框架?如果我能够做到这一点,那么我需要构建集群,使用这种信息大小,这个问题仍然让我感到害怕。提前感谢/
浏览 1
提问于2016-04-27
得票数 1
1
回答
使用R从RNAseq结果摘要文件中提取多个
基因
集的
数据
、
、
我正在尝试从RNAseq结果摘要文件中提取几个
基因
集的
数据
: ? 示例
基因
列表: ? 我正在使用Excel首先突出显示重复的
基因
,对摘要文件进行排序,然后复制所需的
数据
。这是耗时的,Excel在排序时总是“冻结”,特别是对于
大
的
基因
列表。 我想知道R能不能做得更好。如果R可以是一个更好的解决方案,有人能提供代码吗?
浏览 24
提问于2020-06-12
得票数 0
2
回答
在R中优化文件读取
、
、
我的R应用程序从
大
的txt文件中读取输入
数据
。它不会一次读取整个文件。用户指定
基因
的名称(一次3个或4个),根据用户输入,应用程序转到适当的行并读取
数据
。文件格式: 32,000行(每行一个
基因
,前两列包含
基因
名称等信息) 35,000列数字
数据
(十进制数)。我使用read.table (文件名,skip=10,000 )等转到正确的行,然后读取35,000列
数据
。然后,我对第二个
基因
,第三个
基因
(最多4个
基
浏览 1
提问于2013-06-28
得票数 2
1
回答
在R中使用for循环根据前列条件组合列值
、
我正在处理一个
大
的
数据
集,对某个
基因
进行多个观察,在不同的日期和不同的表达水平上。我想把所有的“表达式”列值之和到 我试着做了一个for循环,但是我对R相对来说还是比较新的,并且
浏览 1
提问于2022-05-12
得票数 0
1
回答
Python/熊猫-将
数据
行合并为相同的列id
、
我有一只熊猫
数据
,行代表一个标识符,列代表一个
基因
名。有些
基因
名称被复制,因此有多个同名的列,但是每一行只有一个
基因
的结果。 我想用相同的
基因
名称“合并”这些列,在任何相同的列中保留任何结果。我可以使用.loc()提取某一特定
基因
的所有列,并可能为所提取的
数据
找到解决方案,但
数据
集非常
大
,而且我有点头脑发热,试图同时完成所有列。
浏览 1
提问于2021-02-15
得票数 0
回答已采纳
1
回答
Spring-批处理:为数目未知的分区编写分区处理程序
、
、
、
、
我目前正在处理如下生物
数据
: public String getChromosome(); publicSet<String> getGenes();(变异体在
基因
组中的位置可能与某些
基因
重叠)。我已经写了一些 此外,返回的
浏览 0
提问于2017-10-11
得票数 0
1
回答
DEAP框架-使用每个
基因
统计的mutGaussian
、
、
我有一个有以下
基因
的个体:然后,我应用以下高斯突变:toolbox.mutate(genes)[9, 4, 301, 2, 24, 9, -65, -60] 我这个突变的问题是,这个个体的高斯统计量似乎是用所有的
基因
来决定的,而不是对大多数
基因
的每个gene.
浏览 1
提问于2018-11-09
得票数 1
回答已采纳
1
回答
下采样
数据
集
、
我有一个
数据
集,它是一个
大
的字符向量(1,024,459个元素),由
基因
ID组成。allres)>allres[1:10] 每个
基因
ID被重复的次数是在RNA
浏览 4
提问于2014-12-22
得票数 2
回答已采纳
1
回答
ISCN-从
基因
组坐标
、
我在我们的队列中找到了一张
大
桌子,上面有CNV的
基因
组坐标:chr1:146458850-148003653国际人类细胞遗传学命名系统,cnv大小,
基因
组区域
基因
的/amount名称,OMIM
基因
的数量和OMIM描述:chr1:146458850
浏览 23
提问于2018-08-19
得票数 0
1
回答
使用拆分函数按因子对
数据
进行分组,这是大型
数据
格式的备选方案。
、
关于使用split函数按factor对
数据
进行分组,我有一个问题。 我有一个由snps和
基因
两栏组成的
数据
框架。Snps是一个因子,gene是一个字符向量。我想根据snp因子对
基因
进行分组,这样我就可以看到一个映射到每个snp的
基因
列表。一些snps可能定位于多个
基因
,例如rs10000226映射到
基因
345274和
基因
5783,并且
基因
发生多次。为了做到这一点,我使用拆分函数来列出每个snp映射到的
基因
列表。df.
浏览 4
提问于2015-04-27
得票数 5
回答已采纳
1
回答
对于R中的小p值,Z-分数四舍五入为无穷
大
、
、
、
我正在使用一个全
基因
组关联研究
数据
集,p值从1E-30到1。我有一个R
数据
框架“
数据
”,其中包括p值的变量"p“。我需要执行p值的
基因
组校正,这是我使用以下代码所做的:在第二行的命令中,我使用qchisq函数将p值转换为z分数,p值&
浏览 2
提问于2014-06-16
得票数 0
回答已采纳
2
回答
包含数千个表的MySQL
数据
库
、
、
因此,我正在MySQL中建立一个
数据
库,其中包含大约20,000个表,其中每个
基因
的表都有一个列,列出文献中发现的该
基因
的可选名称(同义词),而且通常情况下,这些同义词没有逻辑,它们的存在纯粹是出于历史原因首先,是否有更好的方法来使用更少的表来设置这个
数据
库? 问题是每个
基因
都有一个可变的可选名称,所以我不能用每一行对应一个
基因
和一组列来做一个
大
表。即使每个
基因
都有相同数量的可供选择的名称,任何特定的列基本上都是毫无意义的,因为,例如,第1列中的同义词
浏览 2
提问于2017-02-22
得票数 2
回答已采纳
1
回答
^符号在R正则表达式中是什么意思?
、
以下是背景:这个命令只用于从一
大
串
基因
中提取线粒体
基因
。这来自Seurat教程,可以在这里找到:我正在努力提高我的理解,这样我就可以修改这个命令,通过它们的名字中的字符来提取其他的
基因
。 谢谢你的帮忙
浏览 2
提问于2017-02-17
得票数 1
回答已采纳
1
回答
从gds文件中计算次要等位
基因
频率?
、
我有一个gds文件,描述了与参考
基因
组相关的许多个体的SNP变体。我在R中使用了SeqVarTools包中的hwe()函数,这为我提供了每个变体的参考等位
基因
频率。我想要获得次要等位
基因
频率,但我不知道如何处理这个问题,因为许多软件包需要将
数据
转换为模糊的矩阵分类,这对进一步的分析没有用处。我的主要问题是:在给定参考等位
基因
频率的情况下,如何获得次要等位
基因
频率? 下面是一个小例子来帮助可视化我的问题。我的
数据
集非常
大
,有超过30,000个变量,所以f
浏览 24
提问于2019-09-26
得票数 1
回答已采纳
2
回答
用于大型
数据
集的LDA替代方案
、
、
我正在分析一个
大
的R
基因
表达
数据
集,有100个样本和50.000个
基因
。 我已经对样本间的模式做了一些非常有用的PCA预测。现在,我想对
数据
做一些预测,最大限度地扩大我对样本的标签之间的差异。
浏览 1
提问于2015-03-18
得票数 1
回答已采纳
1
回答
如何使用awk将
基因
型转换为T/F -1/0/1格式?
、
我有一个非常
大
的
数据
集,我想将其从
基因
型转换为编码格式。
基因
型应表示如下:A B -> 0我曾使用awk考虑过这一点,但我似乎找不到一种可行的解决方案,可以读取两列并输出单个代码来代替
基因
型。
浏览 0
提问于2014-04-07
得票数 1
2
回答
在标签之间提取信息
我有一个文本文件,下面显示了文件内容的示例: 1234一个新的同源结构域编码
基因
与一个
大
的CpG岛有关,该岛被肌营养不良不稳定(CTG)n重复序列所打断。肌营养不良(DM)与蛋白激酶编码
基因
DMPK的( CTG )n三核苷酸重复扩增有关,该
基因
位于19q13染色体上。3.这种
基因
在病人组织中表达的特征,迄今产生了关于DMPK mRNA稳态水平的变化和在存在扩张时的最终DMPK蛋白水平的相互矛盾的
数据
。19号染色体的DM区
基因
丰富,重复扩增可能导致附近多个转录单元功能障碍
浏览 0
提问于2013-11-07
得票数 0
2
回答
基于时间序列条件的DataFrame时间点识别
、
、
、
我有一个带有时间序列
数据
的DataFrame,如下所示:gene number TP1 TP2 TP3 TP4 TP5 TP6 gene1对于每一行(
基因
),我希望识别TP值达到其值比时间序列中的最小值
大
4倍的水平,并附加条件,即该标识的TP必须在最小TP之后。因此,对于
基因
2,我感兴趣的是TP3,而不是TP1 (它比TP2的最小值
大
4倍),因为在这个系列中,TP1比最小TP2更早。我的
数据
在一个数字数组中。
浏览 5
提问于2015-02-13
得票数 2
回答已采纳
2
回答
如何对Python中的大型
数据
集执行有效的成员资格搜索
、
、
、
、
我想比较一小组
基因
组kmers (核苷酸串)和一个非常
大
的kmers列表来测试成员资格。由于该算法是针对大型真核生物
基因
组而设计的,因此
大
列表可以达到GB范围内的范围。根据我所见过的类似问题,我不应该将
大
列表转换为一组,因为这会花费太多的内存。我一直使用较小的列表作为集合,但它并没有为我节省明显的时间。最后,一旦脚本完成,它将被设计为运行在通常用于大型
基因
组算法的大型内存机器上。 谢谢
浏览 7
提问于2014-02-14
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
大基因信息及其大数据保护的挑战
引力基因打造下一代基因数据平台
分析和展示RNAseq基因表达数据中基因的相关性
基因变异解读很麻烦?最全基因变异数据库Pubvar上线
深圳国家基因库发布生菜种质基因资源数据库
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券