我是在RedHat Enterprise Linux中运行的集群的新手用户。我使用bsub命令运行python脚本(版本2.6.5)。不知怎么的,这个python程序在多处理过程中就停止了。这个程序是这样的:
from multiprocessing import Pool
import multiprocessing
def pop_genomics(chrom):
os.system('run analysis on DNA')
os.system('run analysis on DNA')
os.system('run
在linux中,使用for循环,我希望从一组输入txt文件中生成每个新的txt文件,方法是选择两列(第1和第4列),然后使用定义的字符串变量添加新的列3、4和5。其中一个输入文件名是:
E2_NCAPG_r1_UCSC_DNA_exon_fraction_counts.txt
对于这个输入文件,我想要的输出文件是:
AluJb 165824 E2 DNA exon
AluSp 43328 E2 DNA exon
AluSc5 5753 E2 DNA exon
我试过:
for file in `ls E2*.txt`; do
treat=`echo ${f
我有一个Docker镜像,我想在本地运行,但我认为它是由于Qemu的问题而失败的,这似乎源于试图在M1芯片上运行Cypress:
REPOSITORY TAG IMAGE ID CREATED SIZE
dna local 097c5f291db5 2 hours ago 3.66GB
当我尝试使用docker run dna:local在本地运行镜像时,我得到了以下信息:
WARNING: The requested image's platform (linux/amd64) does not match t
def codon_usage(seq, aminoacid):
"""Provides the frequency of each codon encoding a given aminoacid in a DNA sequence"""
tmpList = []
for i in range(0, len(seq) - 2, 3):
if DNA_Codons[seq[i:i + 3]] == aminoacid:
tmpList.append(seq[i:i + 3]
每次运行python脚本时,我都会运行以下类:
class MySplashScreen(wx.SplashScreen):
def OnSplashScreenExit(self,e):
self.Hide();
frame = MyFrame(None)
def __init__(self,parent=None):
if "linux" in sys.platform or "darwin" in sys.platform:
bmp = wx.Bitm
我尝试在one_frame函数()中输入一个字符串:
one_frame("catatgdaftgaatg")
我想要做的是返回一个列表["atgdaf","atg"]。每当我在字符串中找到"atg"时,我都想抓取那个"atg"和它之后的任何东西,直到我到达任一"taa" "tga" "tag"。这就是我到目前为止得到的结果,但它只返回["atg"]。
def get_orf(dna_seq):
for x in dna_seq:
if(
我找到了两种解决泛型中缺乏“新(参数)”的方法,但我想知道是否有更好的解决方案。
我需要一个方法,在地球上,创造任何水果使用Dna作为参数在ctor。我有很多水果。
使用Activator (或任何类似的形式)的缺点是,如果派生类没有corret,或者是抽象的,就会中断。
public class Earth
{
public Earth()
{
var dna = new Dna();
var orange = GetFruit<Orange>(dna);
}
private static T GetFruit&l
我将Perl用于一个脚本,该脚本接受两个简短的DNA字符串形式的输入。作为输出,我将两个字符串连接在一起,然后打印在连接字符串末尾的副本上排成一行的第二个字符串。例如:如果输入字符串是AAAA和TTTTT,则打印:
AAAAATTTTT
TTTTT
我知道还有其他方法可以做到这一点,但我很好奇为什么我使用tr/不起作用。
该程序的代码为:
use strict;
use warnings;
print "enter a DNA sequence \n";
$DNA1=<>; #<> shorthand for STDIN
$DNA1=~ s/\
使用已建立的函数,我需要调用它来解释外部txt文件,并将氨基酸代码输出到控制台。
翻译功能解释输入DNA。
txtTranslate应该解释txt文件DNA。
外部文件包含:
dna_ = input("Enter the DNA sequence to translate: ")
def translate():
translate()
for i in range(0,len(dna_),3):
dna = dna_[i:i+3]
if dna == "ATA" or dna == "ATC" or dna ==
我想输入一个DNA序列,并制作某种生成器,产生具有特定突变频率的序列。例如,假设我有DNA链"ATGTCGTCACACACCGCAGATCCGTGTTTGAC",我想要制造T->A频率为5%的突变。我该如何创造这个呢?我知道创建随机突变可以用这样的代码来完成:
import random
def mutate(string, mutation, threshold):
dna = list(string)
for index, char in enumerate(dna):
if char in mutation:
我正在尝试使用不同的布尔值来获得相同的结果。我有两个函数,我不明白为什么一个可以工作,另一个不能。
这是可行的:
dna='ATGTGGTAG'
def orf_4(dna):
if dna[len(dna)-3:]=='TGA' or dna[len(dna)-3:]== 'TAG' or dna[len(dna)-3:]=='TAA':
return 'This could be an ORF'
else:
return 'This is not an
我试图创建两个随机序列的列表,dna1和dna2。下面的代码是按垂直顺序返回dna1和dna2的随机序列。我想知道如何为每个dna结果创建一个水平格式的列表。
import numpy as np
BASES = ('A','C','T','G')
def random_dna_sequence(length):
return ''.join(np.random.choice(BASES,length)) #list() can be used
with open('dna.txt'
我想将下面的列转换为下面的格式。重新格式化的工作方式是在样本类型N之间对样本进行分组。例如,下面的前两行分组在一起,7397-DNA_A01到7399-DNA_A01分组在一起。
Sample Sample Type
7393.DNA_A01 N
7394-DNA_A01 T
7395-DNA_A01 N
7396-DNA_A01 T
7397-DNA_A01 N
7398-DNA_A01 T
7399-DNA_A01 LN
7400-DNA_A01 N
7401-DNA_A01 T
7402-DNA_A01 B
我一直在致力于java编程的开发,以找到DNA链中的基因。我的问题是,为什么for循环在dna2结束,输出停留在第三个字符串,而不返回更多的结果。以下是守则:
import edu.duke.*;
import java.io.*;
public class Part1 {
public String findSimpleGene (String dna) {
String result = "";
int startIndex = dna.indexOf("atg");
我有这样的进口:
import qualified Bioinformatics.DNA as DNA
另一个文件如下所示:
data DNA = A | C | G | T
deriving (Eq, Ord, Show)
在这个函数中,RNA模块中:
module Bioinformatics.RNA
( RNA
, fromDna
) where
import qualified Bioinformatics.DNA as DNA
data RNA = A | C | G | U
deriving (Eq, Ord, Show)
fromDna :: D
我有这样的查询:
SELECT a.CONTAINER, GROUP_CONCAT(DISTINCT a.COIL_NO SEPARATOR '; ') AS COIL_NO FROM tb_barang a
WHERE DATE(a.TGL_TRANSFER_SYSTEM) = "2016-05-04"
GROUP BY a.CONTAINER
ORDER BY a.CONTAINER ASC
它给出的结果如下:
+-------------+-----------------------------------------------------
我从纯素data.frame中提取了一个metaMDS,如下所示:
MDS1 MDS2 time nucleic_acid habitat treatment
10dnawatercontrol 0.06297458 0.153364604 10 dna water control
10dnawatertreated -0.20010385 -0.241614081 10 dna water treated
11dnawatercontrol 0.15518683 0.067861388 1
我正在尝试一些相对基本的字符串连接,但似乎找不到我正在接收的错误的来源。
我的代码如下:
def crossover(dna1, dna2):
"""
Slices both dna1 and dna2 into two parts at a random index within their
length and merges them.
"""
pos = int(random.random()*DNA_SIZE)
return (dna1[:pos]+dna2[pos:], dna2[:pos
我正在使用Biopython库的AlignIO和Phylo函数来比对多个序列并创建系统树。文档在这方面非常清楚,我在获得我的结果时没有任何问题。然而,我不想只在程序运行时显示结果,还想将它们保存到一个文件中(最好是不同的文件)。然而,正如我所怀疑的那样,我得到了TypeError: expected a character buffer object。我找不到任何关于将这些结果写入文件的帮助。
我的代码:
from Bio import AlignIO, Phylo
align = AlignIO.read("allseqs.aln", "clustal")
def contains_sequence(dna1, dna2):
''' (str, str) -> bool
Return True if and only if DNA sequence dna2 occurs in the DNA sequence
dna1.
>>> contains_sequence('ATCGGC', 'GG')
True
>>> contains_sequence('ATCGGC', 'G
使用字典的函数在使用文本文件中的DNA字符串时返回KeyFile错误"\n“,但当我手动键入DNA字符串:时则不会返回
DNA = open(r"C:\Users\CP\Desktop\Python\rosalind_revc.txt","r")
DNA = DNA.read()
DNA.replace(' ','')
print(DNA)
# Output works when I manually type a DNA string, such as the one below in the comment
# DNA
我有一个像这样的.txt文件,其中包含六列。我希望根据列V8的值将第七列V7_Pheno添加到文件中,方法是将Yes编码为2,将No编码为1,将缺失的值编码为-9。
V1 V2 V3 V4 V6 V7_Pheno
2253792 20482 NA DNA 1 Yes
2253802 20491 NA DNA 4 Yes
2253816 20503 NA DNA 0 No
2253820 20508 NA DNA 4
我试图计算并返回两个长度相同的DNA序列不同的地方。例如,给定字符串"ATGT“和"GTGA",结果应该是数组{ true、false、false、true }。我得到了一个错误: False/true不能解析为变量,这是我到目前为止得到的。
/**
* Calculates and returns where two DNA sequences of equal lengths differ. For
* example, given strings "ATGT" and "GTGA", the result should
我有一个std::set,我需要删除相似的相邻元素:
DnaSet::const_iterator next = dna_list.begin();
DnaSet::const_iterator actual = next;
++next;
while(next != dna_list.end()) // cycle over pairs, dna_list is the set
{
if (similar(*actual, *next))
{
Dna dna_temp(*actual); // copy constructor
dna_li