我正在编写一个php类来从csv文件中提取数据。所以我需要正则表达式的帮助。
数据样本
Data
Data
Datatest1
Data test
Data 867$33@!.//()7
Field somthing
Field
正则表达式
/(?:Data|Field)(.+)/
这不应该与第1行、第2行和第7行相匹配,因为它在Data和Field之后只有空格和制表符(空格)。
这是我的regex测试器链接
我正在尝试从pdf中提取一些特定的数据,我已经设法从pdf中提取文本,并将其放入txt文件中。放置在文本文件中的数据是一行。我需要提取这条线的一个特殊的部分。
如果它以'UK‘开头,以'- -’结尾
我一直在尝试使用。
Using read = New StreamReader(fName)
Dim line As String = read.ReadToEnd
If line.StartsWith(" UK") And line.Contains("- -") Then
Else
我想从文本数据中提取关键字和句子之间的行。这是我的数据
CUSTOMER SUPPLIED DATA:
- topic: Sign in & Password Support
- First Name: Brenda
- Last Name: Delacruz
- Account number: xxxxxxxxx
- U-verse 4-digit PIN: My PIN is
- 4 digit PIN: xxxx
- Email: deedelacruz28806@yahoo.com
- I need help with: Forgot password or ID
**
假设我有下面的文本,我想提取“数字的开始”和“数字的结束”之间的文本有动态的行数和唯一变化的数字,例如:第一,第二,等等。我将提取数据的每个文件在“数字的开始”和“数字的结束”之间有不同数量的行。在不知道文件中“数字开始”和“数字结束”之间有多少行的情况下,如何编写正则表达式来匹配“数字的开始”和“数字的结束”之间的内容?
致以问候!
This is the first line This is the second line
Start of numbers
This is the first line
This is the second line
This is the third
我想提取:
50%
从或多或少具有这种格式的字符串中:
The 50% is in here somewhere.
我还想提取:
50%50%25%
从这样的字符串中:
50% of 50% is 25%
Regex.Match()似乎是一个明显的竞争者。但是,这需要检查是否找到了任何匹配项(例如match.Success),从数组中的特定索引中提取结果,以及/或寻址超出范围的索引的风险。
Regex替换通常更容易应用。一行执行此任务,包括返回结果字符串。许多语言都是如此。
result = Regex.Replace(input, stuffWeDontLike, "")
基
我试图从R中的SQL语句中提取表名--例如,我将SQL查询导入到R中,一行将包含:
SELECT A , B
FROM Table.1 p
JOIN Table.2 pv
ON p.ProdID.1 = ProdID.1
JOIN Table.3 v
ON pv.BusID.1 = v.BusID
WHERE SubID = 15
ORDER BY v.Name;
在R中,我一直试图对SQL语句使用str拆分,该语句将每个单词拆分成一个列,创建一个数据框架,然后找到与单词"from“的匹配,并提取下一个单词,即表1。
我在如何从多个连接中提取其他表方面遇到了困难,或者如果有一种更有效的
我试图使用str_extract_all包中的stringr从R中的某些文本中提取值,并希望使用perl的regexps (?:...)中的非匹配组来提取和清除一行中的相关值。
运行此代码时:
library(stringr)
## Example string.
## Not the real string, but I get the same results with this one.
x <- 'WIDTH 4\nsome text that should not be matched.\n\nWIDTH 46 some text.'
## extrac
提取到数据框中的API数据在几个注释单元格中包含空值。我最终希望将数据帧加载到csv文件中。当我将数据帧加载到csv时,注释中的空行被视为新行,因此在csv中给出了错误的行数。
数据帧:
Employee_id | Employeee_comments
---------------------------------------
1 | 1. This is test comment 1
| 2. This is test comment 2
|
| Comments above employee a
我正在尝试从字符串中提取$()中的数据。我的绳子看起来是这样的
$(123=tr@e:123)124rt12$(=ttre@tre)frg12<>$(rez45)
基本上,$()内部和每个$()之间都有任何内容。但是,在$()中不能有任何$()。
这就是我到目前为止没有用的东西。
var reg = new RegExp('\\$\\(.*(?![\\(])\\'), 'g');
var match = reg.exec(mystring);
有一些.txt文件的数据,我需要提取到其他文件,同时保持原始文件完整。这些文件包含以A或开头的行。我需要能够打开原始的txt文件,如果lines =A提取文件中的所有这些条目,然后保存到另一个文件中作为.txt.A,而lines =B保存为.txt.B。
selectPattern = r"^[A]$"
for files in text_file:
with open(files) as infiles:
with open(files) as outfiles: