我有一个包含超过3M条记录的表。其中一个属性有时包括英文字母和数字(包括它们之间的空格和符号,如-),有时还包括其他值,如不同的语言,如中文、俄文字母、空格、特殊字符等。我希望保留每个属性的值,就像英文字母和数字之间包含减号或合法字符一样。对于特殊字符和非英语字符(以及空格)-我想将它们转换为相同的值,例如所有相同的中文名称将被转换为SC1 (特殊字符1),下一个特殊字符将被转换为SC2等。
下面是表(TB1)的一个示例:
+-----+-----------+-------------+---------
| ID | Att1 | New Att1 | Some mor
我使用'id‘字段- char(22)作为MySQL表的主键。此字段仅用于在向表中添加新用户时筛选唯一is。
对我来说,使用utf8_bin还是utf8_general_ci排序规则并不重要,因为字母的大小写并不重要,而且我只使用英文字母作为id。
唯一的问题是:哪个排序规则会提供更快的性能?
对我的表最常见的查询是:
LOAD DATA INFILE ... IGNORE INTO TABLE mytable(id)
or
INSERT IGNORE INTO mytable(id)...
and
SELECT COUNT(id) FROM mytable
现在,我看不到性能上的任
我正在尝试编写一个查询,它将告诉我某些记录是否只包含特殊字符。例如- "%^&%&^%&“将会出错,但是”%HH678*(*)“是正确的(因为它也有字母数字值。我写了下面的查询,但是,它只对英文字母和数字工作良好,如果列有一些其他字符,如普通话,那么它也没有给出预期的value.Any帮助是非常感谢的。
SELECT * FROM test WHERE REGEXP_LIKE(sampletext, '[^]^A-Z^a-z^0-9^[^.^{^}^ ]' );
假设我有以下数据集,我希望用类似于“ABC”的东西替换那些不在英文字母表中的数据集
Data
コハニー
Cat
Blue
زبان
所以我的理想输出是:
Data
ABC
Cat
Blue
ABC
一种选择是使用所有的英文字母表,如以下所示,以识别没有英文字母表的数据。
df$Data <- ifelse(!grepl("A",df$Data ) .... |!grepl("Z",df$Data ) ,"ABC",grepl("A",df$Data ))
但有没有其他选择?
我有以下代码,可以从混合的英文和阿拉伯字母中提取英文字母 Sub Test()
Dim a As Variant
Dim i As Long
With Cells(1).CurrentRegion.Resize(, 3)
a = .Value
With CreateObject("VBScript.RegExp")
.Global = True
For i = 1 To UBound(a, 1)
.Pattern = "[^\w_ ]+"
因此,我试图为一个绞刑游戏编写一个函数,它将返回一个字符串,该字符串由小写的英文字母组成--所有小写的英文字母都不是lettersGuessed中的。我看不出能不能让名单上的理解起作用
def getAvailableLetters(lettersGuessed):
'''
lettersGuessed: list, what letters have been guessed so far
returns: string, comprised of letters that represents what letters have not
对不起我的英语
我的数据库中的文本列包含英文字母和非英文字母。
因此,我无法检索(使用LIKE) Title列符合(案例-无关)某种模式的行:
SELECT * FROM TableName WHERE TitleColumn LIKE '%pattern%';
甚至:
SELECT * FROM TableName WHERE UPPER(TitleColumn) LIKE UPPER('%pattern%');
例如。如果字段Title包含"ГазПром",而pattern是"газ" (在不同的情况下,Г和г是相同的字母)