我想使用python中的regex从文件中提取基因边界(如1..234,234..456)，但每次我使用此代码时，它都会返回空列表。 - 腾讯云开发者社区

python、regex

我想使用python中的regex从文件中提取基因边界(如1..234,234..456)，但每次我使用此代码时，它都会返回空列表。下面是示例文件 ? 以下是我到目前为止所掌握的： import re #with open('boundaries.txt','a') as wf: with open('sequence.gb','r') as rf: for line in rf: x= re.findall(r"^\s+\w+\s+\d+\W\d+",line)

浏览 29提问于2021-08-01得票数 0

1回答

R:站点抓取器的想法

javascript、html、r

在这里度过一段艰难的时光。请导航到它的底部写着：“从示例基因集合中选择”。如果你点击这些集合中的任何一个，基因列表就会出现在它的上方。我想提取列表中每一项的基因，但该列表不在源HTML中。有什么想法吗？谢谢!

浏览 2提问于2012-01-13得票数 1

回答已采纳

1回答

Zapier问题中的Python Regex

python、regex、zapier

我正在尝试从salesforce中提取一个有换行的字段，并在zapier中使用python步骤提取单词和标点符号。这是我的代码，但它返回空字符串。如果有更好/更简单的方法让我知道，我对任何代码都是超级新手，Frankensteined从谷歌中收集到了这一点。 import re string = input_data['ac'] regex = r"^[a-z,A-Z].*[?.!]$" cleaned = re.findall(regex, string) return [{'cleaned': cleaned}] 这里有2张图片，原

浏览 22提问于2020-07-28得票数 0

11回答

如何在Python 3.7中从pdf中提取文本

python、pdf、python-3.7、pypdf2、pdf-extraction

我正在尝试使用Python从PDF文件中提取文本。我的主要目标是试图创建一个程序，读取银行对账单，并提取其文本，以更新excel文件，以方便地记录每月的支出。现在我只专注于从pdf文件中提取文本，但我不知道如何做到这一点。当前将PDF文件中的文本提取为字符串的最佳和最简单的方法是什么？现在最好使用的库是什么，我该怎么做？我曾尝试使用PyPDF2，但每次尝试使用extractText()从任何页面提取文本时，它都返回空字符串。我尝试过安装textract，但是我得到了错误，因为我想我需要更多的库。 import PyPDF2 pdfFileObj = open("January2

浏览 203提问于2019-04-20得票数 19

回答已采纳

1回答

Regex不匹配模式，后面跟着字符串中的水平省略号

regex、r

我正在尝试使用R中的regex从文本中提取Twitter标签，从“stringr r”包中使用str_match_all来提取Twitter标签。问题是，有时哈希标签会被截断，在文本字符串的末尾附加一个水平省略字符，如本例所示： str_match_all("hello #goodbye #au…","#[[:alnum:]_+]*[^…]")[[1]] 我可以使用上面的代码成功地提取出一个哈希标签列表，但是我想排除被截断的哈希标签(即具有水平省略号的)。这是令人沮丧的，因为我到处寻找解决方案，上面的代码是我能想出的最好的代码，但显然不起作用。任何帮助都是

浏览 10提问于2015-06-11得票数 1

回答已采纳

3回答

从HTML中存在的JavaScript代码中抓取数据

javascript、python、web-scraping、scrapy

我使用scrapy(Python)从中抓取所有地址。“城市/城镇”下拉列表包含许多城市。每当我选择一个城市时，都会显示新的地址。但是，没有向服务器发出任何请求。我使用了firebug和Chrome中的开发工具。没有向服务器发出POST/GET请求。当我查看源代码时，我发现： <script src="jScript/myScript.js" type="text/javascript"></script> 当单击"jScript/myScript.js“时，我被重定向到。此源代码是一个javascript文件，并在下拉框中包含

浏览 6提问于2015-05-28得票数 3

回答已采纳

2回答

正则表达式匹配第n个匹配项并返回字符串的后续部分

regex

我正在使用Zapier提取一个模式，我需要使用Regex从以下数据中为Zap的每个步骤返回一个不同的名称： ‘使用示例名称A (. “来自示例名称A的消息” 使用示例名称B的对话(. “来自示例名称B的消息” 使用示例名称C的对话(. “来自示例名称C的消息” 示例名称为D的对话(. “来自示例名称D的消息”‘ 例如，对于第三个Zap，我想返回位于'Conversation with‘和’()‘的第三个实例之间的所有内容。在本例中是Sample Name C。每次运行正则表达式时，名称都会不同。到目前为止，我有^.*Conversation with (\S[^(]*)(?: |\

浏览 1提问于2019-05-25得票数 2

3回答

在python中从字典中获取随机键:值对

python、csv、random、dictionary

我正在尝试从由csv文件生成的字典中随机提取一组键值对。字典包含有关基因的信息，基因名称是字典的关键字，以及一个数字列表(与基因表达等相关)。就是价值。 # python 2.7.5 import csv import random genes_csv = csv.reader(open('genes.csv', 'rb')) genes_dict = {} for row in genes_csv: genes_dict[row[0]] = row[1:] length = raw_input('How many genes do you

浏览 1提问于2013-09-23得票数 6

回答已采纳

3回答

在R中连接两个数据帧

r、dataframe、merge

抱歉，如果这是一个非常基本的问题，但我在处理R项目时遇到了一个问题。基本上我有两个数据框对象，一个是基因及其在不同患者中表达水平的主列表，另一个只有一列大小。然后，一个只有一列的列表是属于特定基因子类别的基因列表，所有这些基因都在主列表中。我正在尝试创建一个数据框架，其中我有我的特定基因子集及其在主列表中包含的不同患者的表达。我尝试使用merge()函数，但只创建了一个空的dataframe。基本上代码是这样的:合并<- new_dataframe (master_list，specific_gene_list，by = "gene")。我认为这段代码应该在我的主列表

浏览 24提问于2020-07-13得票数 0

1回答

Grep提取-从图像源提取文本值

regex、burp

我试图从我的HTML源代码中提取一个值，并将其用作Grep解压缩。使用Burp的“Grep-提取”，如何提取以下文本值(在本例中，文本是hello，但每次都会更改，我希望能够提取text=的值)。 <div id="CaptchaImage"> <img src="Captcha.ashx?text=hello"> </div> 在开始和结束时定义？还是从regex集团提取出来的？我似乎不能让这件事起作用。

浏览 0提问于2015-01-12得票数 0

回答已采纳

1回答

用于从Python中的html代码中提取值的代码

python、html

我需要一个紧急帮助来解决下面描述的问题。我正在使用selenium python绑定自动化一个项目场景:使用头像创建新成员，并将该成员添加到group.Then检查创建头像时提供给该成员的头像是否与好友列表中显示的相同为此，我想比较一下创建配置文件时的图像in和好友列表中的图像in。我发现使用firebug.Image id的图像Id是在 <div><a class=........Imageid=234563453.....................> 但是如何从中提取此图像Id呢？ print self.driver.find_element_by_xp

浏览 0提问于2012-05-21得票数 0

1回答

Bash命令用于搜索模式(序列)，并打印模式旁边的所有内容(右侧和左侧)

bash、printing、match、sequence

我试图根据一个种群的PoolSeq文件(fasta格式)和一个保守区域重建一个基因序列。我想搜索与此序列匹配的文件，然后从该保守序列开始构建相邻区域。因此，我基本上需要一个Bash命令来搜索fasta文件中的序列段，并在每次读取时打印匹配的相邻区域。档案:一种种的二分卫个体的Fasta档案输入: 20-30 bp序列输出:所有读取与该序列和相邻区域在该读取

浏览 5提问于2022-04-29得票数 0

2回答

Git预提交挂钩:获取已更改文件的列表

python、git、pre-commit-hook、pre-commit

我正在开发验证和linting实用程序，以便与各种提交挂钩集成，包括Git one 目前，每次提交时都会针对整个项目代码库运行验证器和链接器。但是，仅针对更改后的文件运行它们会更理想。为此，我需要知道Git precommit钩子(Python中的)中已更改的文件列表我有什么选项来提取已更改的文件列表(如果重要的话，在Python中)？

浏览 0提问于2012-04-15得票数 10

回答已采纳

2回答

Python中的"ValueError: list.index(x)：x不在列表中“，但它确实存在

python、string-parsing

我想使用Python从电子邮件地址中提取用户名。我想到的解决方案是将电子邮件地址附加到一个列表中，找到@符号的索引，然后对列表进行切片，直到找到索引。我的代码是： #!/usr/bin/env python<br/> email = raw_input("Please enter your e-mail address: ") email_list = [] email_list.append(email) at_symbol_index = email_list.index("@") email_username = email_list[0:a

浏览 0提问于2013-01-06得票数 1

回答已采纳

1回答

awk中的精确模式匹配

awk

我有一个listA，它看起来像这样： gene1 gene2 gene11 gene22 gene23 我也没有几个标签分隔的文本文件(*hist.txt)，其第4列与列表中的基因匹配。我想从标签分隔的文本文件中提取listA中每个基因的值。这就是我写的 for i in `cat listA.txt` do for a in *hist.txt do fn=${a%%_*} cat $a | awk -v OFS="\t" -v fn="$fn" -v pattern="$i" '$4

浏览 0提问于2019-09-18得票数 0

回答已采纳

4回答

从python 2.7.5中的文本文件中提取字符串

python、regex、python-2.7

你好，我是蟒蛇的新手，希望你能帮我。我有一个文本文件(叫data.txt)，上面有基因号的数据，有相应的rs号和一些距离度量。数据如下所示： rs1982171 55349 40802 rs6088650 55902 38550 rs1655902 3105 12220 rs1013677 55902 0 其中第一列为rs数，第二列为基因号，第三列为某种距离测度。数据要大得多，但希望上面的内容能让您对数据集有一个了解。我想要做的是找到所有的rs数字，它们对应于某个特定的基因。例如，对于上面的数据集

浏览 5提问于2016-04-04得票数 0

回答已采纳

3回答

正则表达式不匹配

python、regex

我正在编写一个小的python脚本来从数据库中收集一些数据，唯一的问题是当我从mysql中将数据导出为XML时，它在XML文件中包含一个\b字符。我写了删除它的代码，但后来意识到我不需要每次都做这个处理，所以我把它放在一个方法中并调用它，我在XML文件中找到了a \b，只是现在正则表达式不匹配，即使我知道\b在那里。下面是我正在做的事情：主程序： '''Program should start here''' #test the file to see if processing is needed before parsing for li

浏览 1提问于2011-06-14得票数 3

回答已采纳

3回答

Scala基于条件的列表抽取

list、scala、map、slice

我有一个单词列表，我想提取长度可能在5到10之间的单词，我正在使用以下代码，但似乎不起作用。另外，我只能使用val，而不能使用var。 val sentence = args(0) val words = sentence.split(" ") val fullsort = words.sortBy(w => w.length -> w) val med = fullsort.map(x => if(x.length>3 && x.length<11) x)

浏览 0提问于2013-01-24得票数 1

回答已采纳

2回答

R:如何访问循环中的列表元素

r、list

浏览 1提问于2015-07-13得票数 0

回答已采纳

1回答

从与CSV数据文件的匹配中提取单词

python

def fetch_data(document): with open('data_file.pickle', 'rb') as fp: datafile = pickle.load(fp) matched_word = [] for data in datafile.splitlines(): job_regex = r'[^a-zA-Z]'+data+r'[^a-zA-Z]' regular_expression = re.compile(job_reg

浏览 0提问于2018-01-08得票数 0

1回答

RNA-seq数据与特定基因的关联

python、bioinformatics

我有一个基因列表(作为一个bed文件)和一个全基因组RNA-seq数据集(也存储为一个bed文件)。我目前正在尝试开发一个python脚本，它允许我提取转录起始点上游500bp到下游2000bp的读取计数，即基因的开始，并将这些值存储在一个数组中以备将来使用。目前，我的脚本如下所示： feature_genes=np.zeros((6576, 2501)) for lines in feature: for i in range(0,6575): if line[5]==lines[5] and line[5]=='+' and line[0]==li

浏览 4提问于2014-02-10得票数 1

5回答

查找位于List Python中特定字符串之间的字符串

python、string、list、substring

我正在编写从网站中提取数据的代码，它会打印出特定标签之间的所有文本。每次代码从标记中提取数据时，我都会将结果存储到一个列表中，因此我有一个如下所示的列表 Warning Not News Legends Name1 Name2 Name3 Pickle Stop Hello 我想要查看这个字符串列表，并让代码找到关键字legends和pickle，并打印它们之间的任何字符串。为了在进一步的活动中详细说明，我可能会创建所有可能的legend names的完整列表，然后，如果它们在我生成列表时出现，则打印出重复出现的那些。对这些问题有什么见解吗？

浏览 68提问于2021-02-11得票数 0

回答已采纳

1回答

使用R从RNAseq结果摘要文件中提取多个基因集的数据

r、subset、rna-seq

我正在尝试从RNAseq结果摘要文件中提取几个基因集的数据： ? 示例基因列表： ? 我正在使用Excel首先突出显示重复的基因，对摘要文件进行排序，然后复制所需的数据。这是耗时的，Excel在排序时总是“冻结”，特别是对于大的基因列表。我想知道R能不能做得更好。如果R可以是一个更好的解决方案，有人能提供代码吗？

浏览 24提问于2020-06-12得票数 0

3回答

正则表达式(Python)从<和>的内部提取文本字符串，例如<string and ><string-2>等

python、regex、string、tags、extraction

我目前正在处理堆栈溢出数据转储，并试图构造一个简单的正则表达式，从<和>字符中提取标记名。因此，对于每个问题，我都有一个或多个标签的列表，比如<tagone><tag-two>...<tag-n>，并试图只提取一个标签名的列表。下面是从数据转储中获取的几个示例标记字符串： <javascript><internet-explorer> <c#><windows><best-practices><winforms><windows-services> <c

浏览 3提问于2010-09-14得票数 1

回答已采纳

1回答

阅读Python 3中的遗传算法代码

python、python-3.x、range

我正在读克林顿·谢泼德写的"Genetic Algorithms with Python“这篇文章，同时努力学习Python3。我希望有人能帮助我正确解释一些Python3代码。我的意思是，代码可以工作--它做了它应该做的事情--但我需要帮助理解为什么。下面是第一段代码：随机导入 geneSet = " abcdef....zA...Z!." target = "Hello World!" def generate_parent(length): genes = [] while len(genes) < length: #

浏览 0提问于2017-06-22得票数 0

1回答

操作一组变量的有效方法是什么？

java

我正在制作一个“基因模拟器”，在某一时刻，我想比较基因中的数据，以确定个体的结果。我想出了一个解决办法，但似乎不太实际，我相信有一个正确的方法现在，我在处理操作的支持类中使用了一个静态方法，但我担心维护会很烦人，因为我计划经常修改属性列表。 public class GeneOps { public static AttributeList AddAttributeLists (AttributeList a, AttributeList b) { AttributeList x=new AttributeList(); x.agressiven

浏览 0提问于2019-08-03得票数 1

回答已采纳

1回答

将信息从可变数量的文件添加到python类和子类

python、class、subclass

这可能是一个非常初级的问题，但我以前从未使用过python中的类，我希望得到一些帮助。我正在浏览一份包含相关信息的基因文件列表。我想为基因创建一个类，类似于： class Gene: def __init__(self, name): self.name = name 要为每个基因添加信息，我需要指定它来自哪个文件，比如FileA或FileB (可以有可变数量的文件)。我假设我需要添加一个子类来做这件事，但我不确定。沿着这样的思路思考： class GeneFileInfo (Gene): def __init__(self, Gene, File, expression, v

浏览 1提问于2014-08-16得票数 0

1回答

Python提取文本文件中(多个)表达式之间的文本

python、regex、text-mining、text-extraction

我是个Python初学者，如果你能帮我解决我的文本提取问题，我会非常感激的。我想提取所有文本，它位于文本文件中的两个表达式之间(字母的开头和结尾)。对于字母的开头和结尾，都有多个可能的表达式(定义在列表"letter_begin“和"letter_end”中，例如。“亲爱的”，“敬我们的”，等等。我想对一堆文件进行分析，下面是一个例子，说明这样的文本文件是如何像->的--我想从“亲爱的”开始提取所有的文本，直到“道格拉斯”。在" letter_end“没有匹配的情况下，即没有找到letter_end表达式时，输出应该从letter_beginning开始，并在要

浏览 0提问于2018-11-06得票数 1

回答已采纳

1回答

从正则表达式中提取值

php、regex

我有这个代码 $regex = '/{tip(?:\s+class\s*=\s*"([a-zA-Z\s]+)")?}([^{]*){\/tip}/'; $matches = null; preg_match_all($regex, $article, $matches); if(is_array($matches)) { foreach ($matches as $match) { $article = preg_replace($regex, '<span class="tooltip $1"><i

浏览 0提问于2016-10-20得票数 0

1回答

在脚本sh中创建文本文件

shell

我正在编写一个lil‘shell脚本，为我的实习工作创建一个Venn diagramm。第一步是从表格文本文件中提取基因列表，然后使用python脚本构建图。但是，在终端中执行此脚本时，我的输出文件list_geneX.txt出现了严重问题。似乎在txt扩展名旁边添加了一些其他字符和未知字符，例如"list_gene1.txt“"list_gene2.txt"，我的python脚本找不到预期的文件。我不知道如何解决这个问题，这很奇怪，因为当用文本编辑器打开这些文件时，这些文件包含预期的内容。 Thx PS:很抱歉我的英语/编程很差，我是一个年轻的生物信息学学生，

浏览 15提问于2019-03-26得票数 0

3回答

如何使用Python精确匹配提取子字符串

python、regex

我正在学习Python正则表达式(re)来分析twitter文本。假设我有像下面这样的twitter文本，我只想从txt中准确地提取'3/10‘。在本例中，Python返回空列表[]。 txt = "my mood is low 3/10. 05/01/2021 Tuesday" re.findall('^\d+\/\d{2}$', txt) 我的密码怎么了？

浏览 1提问于2021-01-05得票数 1

回答已采纳

2回答

在MATLAB中使用regexp提取文本数据

regex、matlab

我正在处理提取METAR(机场天气观测数据)中的能见度数据。可见性是一个4位数(0~9)的数据，当可见性良好时，也可以表示为‘’CAVOK‘。但是使用regexp是相当棘手的。(METAR数据有许多变化。) 数据示例(MET_VIS)如下： 201903072300 METAR RKPC 072300Z 17003KT 110V210 CAVOK 05/02 Q1026 NOSIG= 201903062000 METAR RKPC 062000Z 33018G29KT 4000 BR FEW012 SCT025 08/04 Q1018 WS R13 R31 NOSIG= 20190306

浏览 42提问于2020-03-28得票数 0

回答已采纳

3回答

Python中匹配括号的正则表达式

python、regex

我有一个fasta序列列表，每个序列如下所示： >>> sequence_list[0] 'gi|13195623|ref|NM_024197.1| Mus musculus NADH dehydrogenase (ubiquinone) 1 alp ha subcomplex 10 (Ndufa10), mRNAGCCGGCGCAGACGGCGAAGTCATGGCCTTGAGGTTGCTGAGACTCGTC CCGGCGTCGGCTCCCGCGCGCGGCCTCGCGGCCGGAGCCCAGCGCGTGGG (etc) 我希望能够从列表中的每个fasta条目中提取基

浏览 0提问于2014-07-11得票数 1

回答已采纳

2回答

正则表达式

python、regex

我希望在我已经为我的类完成的一串代码中找到一些单词。我想知道我找到的文献摘要中是否包含“基因”或“基因”这两个词。到目前为止，我已经 match = re.search(r"(gene|tic)" 这给出了44个结果；然而，这个表达式拉出了任何包含单词gene或gene的内容(如general或biotic)。我如何才能改变这一点，只提取基因或基因，而不提取其他信息？这必须是正则表达式。

浏览 4提问于2020-05-06得票数 0

2回答

如何在python中编码/解码\xbe？

python、encoding

我有一个使用xlrd模块在python中读取的excel文件。我从每一行提取值，添加一些额外的数据，并将其全部写到一个新的文本文件中。然而，我遇到了一个问题，单元格包含分数为3/4的文本。Python将值读取为\xbe，每次我遇到它时，我都会收到以下错误： UnicodeEncodeError: 'ascii' codec can't encode character u'\xbe' in position 317: ordinal not in range(128) 我正在将每一行的值列表转换为字符串，我尝试了以下操作，但没有成功： row_vals_

浏览 0提问于2016-11-15得票数 0

2回答

使用API删除Socrata中的数据集附件

python、socrata、soda

我正在编写一个python脚本，它将: 1)从企业数据库中提取GIS元数据2)将元数据从XML解析为纯文本3)将文本文件附加到Socrata中相应的已发布数据集(每月发布) 4)该脚本也将每月运行，以便企业数据集中的任何模式更改都会反映在附加的纯文本元数据文件中。我已经能够使用一些代码发现的成功地将文本元数据文件附加到已发布的苏格拉塔数据集。问题是，每次运行脚本时，都会添加一个附加附件。我想删除现有附件并添加新附件，或者用新附件的内容覆盖现有附件。我对此做了大量的研究，但似乎找不到任何使用Socrata管理附件的文档。有什么建议吗？

浏览 0提问于2015-08-11得票数 0

1回答

grep命令grep在gff文件中的第一个文件中的基因列表。

grep、bioinformatics

我正在使用这个命令grep，在gff文件中的第一个文件中的基因列表。 grep -w -f upregulated_genes_in_BEg GCA_900659725.1_ASM90065972v1_genomic.gff 这对我没用..。请有任何建议。第一个文件中的基因列表。 LOCUS10095 LOCUS10108 LOCUS10129 LOCUS10130 LOCUS10152 LOCUS10161 LOCUS10225 LOCUS10252 LOCUS10266 LOCUS10268 LOCUS10294 LOCUS10313 LOCUS10351 LOCUS10355 LOC

浏览 0提问于2021-10-04得票数 -2

1回答

使用Docker的空目录“已存在且不是空目录”

git、docker

我一直在做一个Docker映像，从github回购中提取必要的文件，然后构建自己。它只打算每次从github更新自己，但为了测试它，我每次运行github回购文件夹时都会删除整个github回购文件夹。删除文件夹后，我开始致命:目标路径‘Projec-4’已经存在，并且不是一个空目录。 Dockerfile (生成图像的文件)的内容如下： FROM python:3.7 WORKDIR /usr/src/app CMD ["sh", "-c", "git clone https://github.com/nathanhtaylor/Proje

浏览 0提问于2019-03-22得票数 1

回答已采纳

1回答

Python脚本不能在bash脚本中运行，但在cmd提示符下运行良好

python、bash、cmd

我有一个要自动化的python脚本，所以我创建了一个简单的bash脚本(名为mybash.sh)。 #!/bin/sh vars="C:\Users\Jane\Desktop\Work\variables.csv" while IFS="," read gname gid do echo "Gene Name: $gname" echo "Gene ID: $gid" python alignment.py work_file $gid > C:\\Users\\Jane\\Desktop\\Wo

浏览 0提问于2017-10-27得票数 0

2回答

用块分割DNA序列

python、python-3.x

我想制作一个Python程序，其中DNA序列是在文本文件中给出的。它有9000多个字符。我必须将序列剪成3个字符，这样我们的帧就可以从1 to 3中读取，然后从4 to 6,读取，然后从7 to 9中读取，它被称为密码子。例如，序列是 ACCTGCCTCTTACGAGGCGACACTCCACCATGGATCACTCCCCTGTGAGGAACTACTGTCTTCACGCAGA 然后我要把它切成三个字符。我已经做过了。我的问题是如何从给定的DNA中提取基因序列？基因序列从ATG开始，在TAG、TAA或TGA上终止。如果我使用Regular Expression，这很容易做到。但问题是，如果你看

浏览 1提问于2018-10-18得票数 1

回答已采纳

1回答

从2个文件中进行“大数据”csv搜索

python、csv、bigdata

我有一个计算问题。我正在使用python迭代2个csv文件。 csv file1=包含(6-7)列..重要的一列是来自dbSNP的"rs ID“列。 csv file2=有3列，其中2列很重要，还有rs ID和基因符号列。我的问题是：现在我想搜索:是csv文件1中的rs ID在csv 2中吗？如果是，则从csv文件2中提取基因符号，并将其放入发生匹配的csv文件1中(位置"x"，例如行4512451)。 csv文件1= 1,3 gb，csv文件2= 8.8 mb 我正在用python从csv文件2生成一个字典，并使用它在csv文件1中进行搜索。问题:对于csv文

浏览 1提问于2015-02-26得票数 0

1回答

如何提取文件中同一特殊字符的多个实例之间的行/文本

python、shell、bioinformatics

输入文件: seq.gb // 位点NC_12345 299 bp ss-RNA线性VRL 1-11-1 定义xyz 加入特征位置/限定符来源1.29903 /organism="ABC2“ /mol_type=“基因组RNA” /isolate="xyz“ /host="jgdg“ /db_xref=“分类群:123456” /country="wf“ /collection_date=“2011年12月” 5'UTR 1.265 基因266.21555 /gene="jgn“ CDS加入(266.13468,13468.21555) //

浏览 0提问于2020-04-14得票数 0

2回答

unix:获取文件中的字符10至80

text-processing、awk、wc

我有一个包含行分隔文本的文件： GCAACACGGTGGGAGCACGTCAACAAGGAGTAATTCTTCAAGACCGTTCCAAAAACAGCATGCAAGAGCG GTCGAGCCTAGTCCATCAGCAAATGCCGTTTCCAGCAATGCAAAGAGAACGGGAAGGTATCAGTTCACCG GTGACTGCCATTACTGTGGACAAAAAGGGCACATGAAGAGAGACTGTGACAAGCTAAAGGCAGATGTAGC 从这里，我想提取字符10到80，所以： TGGGAGCACGTCAACAAGGAGTAATTCTTCAAGACCGTTCCAAAAACAGCA

浏览 0提问于2017-04-06得票数 4

回答已采纳

3回答

使用regex Java获取重叠模式

java、regex、algorithm、overlap

此代码是从数据集中提取顺序字母。 import java.util.regex.*; public class IFS { public static void main(String[] args) { String a; a = "ABC1abc"; regexchecker ("\\D+", a); } public static void regexchecker(String theRegex, String stuffToCheck) { // comp

浏览 5提问于2016-04-09得票数 1

2回答

解析制表符分隔的文件

python、parsing

我很抱歉这个问题有点含糊，我是Python的新手…… 我需要解析制表符分隔的文本文件。这是一个非常大的文件，我试图从中识别和提取特定的内容。例如，如果一行是：苹果香蕉樱桃日期我想搜索并识别术语" apple“，然后提取术语" date”。然后，我需要访问提取的术语列表并使用它们(用于与其他列表的比较，等等)。我读过有关正则表达式的文章，但虽然这似乎对搜索很好，但我不知道如何使用它来提取除搜索关键字word..Also之外的术语，我不确定如何在解析后访问/操作结果数组。任何帮助/方向/指针/建议/示例都将是令人惊讶的。非常感谢!

浏览 2提问于2013-07-03得票数 1

1回答

在Hibernate HQL中，当多个子类具有相同名称的属性时，如何让join获取子类的链接实体？

java、hibernate

摘要在Hibernate中，我试图从main类的子类中保留JOIN FETCH属性，其中多个子类具有相同名称的属性。然而，Hibernate只获取第一个子类的链接实体，而不是其他的。背景我正在模拟一个基于冬眠的系统中的基因组特征(基因、转录本和外显子)和遗传变异。基因、转录本和外显子都是GenomicFeature的亚类，每个变体都可以有零到多个GenomicFeatures.反过来，基因有零对多的转录本--就像外显子一样--转录本也有零到多的基因和外显子。这些关系中的每一种都是懒洋洋的。有时，我想获取一个变异体及其所有的基因组特征，以及从直接的基因组特征中连接的所有基因组特征。我想取一

浏览 2提问于2016-09-01得票数 6

1回答

Excel VBA中的正则表达式执行精确匹配

excel、regex、vba、search、vba6

因此，我从excel中的Cell中提取文本，然后在该文本中搜索特定的短语。现在，只有当它是精确匹配的单词时，我才需要返回true。例如，如果文本是"The Quick brown fox dog over the lazy dog“，我搜索的是"Qui”，它应该返回false，但如果我搜索"Quick"，它应该返回true。类似地，"brown Quick“应返回false，"Quick brown”应返回true。因此，我在VBA中使用正则表达式进行了尝试，并提出了 With regex .Pattern = " *

浏览 36提问于2020-12-08得票数 0

2回答

从数据框架中提取或子集数百列

r、csv

我需要从数据集中提取许多列。我有一个包含数千列和行的非常大的csv文件，我使用以下方法将其读取到R中： mydata <- read.csv(file = "file.csv",header = TRUE,sep = ",",row.names = 1) 每一列都是一个基因名称。我知道如何使用以下基本代码从我的R data.frame中提取特定列： dataset[ , "GeneName1", "GeneName2"] 但我的问题是，我如何提取数百个基因的名字？太多而不能输入？它们列在txt文件中。我是新来的，所以请不要用

浏览 0提问于2019-04-03得票数 1

1回答

查找以“ing”结尾的单词的两个正则表达式的差异

python、regex、string、python-3.6

我试着在下面的句子中找到以'ing‘结尾的单词=“当外面下雨总是很有趣的时候玩户外游戏！” 这不是我自己的问题，因为我找到了必要的regex模式来完成它- (r'\b([A-z]+ing)\b')**.** 问题是，我无法理解为什么上面的内容有效，但我无法理解我在下面尝试了什么： re.findall('([A-z]+ing)$',"Playing outdoor games when it's raining outside is always fun!") 返回空列表，即使下面的 re.findall('([A-z]+

浏览 5提问于2019-09-22得票数 0

回答已采纳

2回答

从Sparklyr中的字符串中提取十进制数

r、regex、apache-spark、sparklyr

我一直在尝试从sparklyr中的字符串中提取十进制数，但它不适用于通常在Spark之外使用的常规语法。我尝试过使用regexp_extract，但它返回空字符串。 regexp_extract($170.5M, "[[:digit:]]+\\.*[[:digit:]]*") 因此，我想得到170.5英镑。

浏览 0提问于2019-06-19得票数 1

回答已采纳