Delphi :在unicode utf-8中搜索跳过变音符号

在这个问题中，您提到了 Delphi 和 Unicode UTF-8。Delphi 是一个跨平台的应用程序开发环境，支持多种编程语言，如 Object Pascal、C++、C# 和 Python。Unicode UTF-8 是一种字符编码标准，用于表示 Unicode 字符集中的字符。

在 Unicode UTF-8 中搜索跳过变音符号是指在搜索时忽略变音符号，例如在搜索时将 "é" 和 "e" 视为相同的字符。要实现这一点，可以使用正则表达式或其他文本处理工具来删除或忽略变音符号。

在 Delphi 中，可以使用正则表达式库（例如 TRegEx）来执行此类操作。以下是一个示例代码，演示如何使用 TRegEx 删除变音符号：

uses
  System.RegularExpressions;

function RemoveAccents(const AText: string): string;
var
  RegEx: TRegEx;
begin
  RegEx := TRegEx.Create('[^\u0000-\u007F]');
  Result := RegEx.Replace(AText, '');
end;

在这个函数中，我们使用了一个正则表达式 [^\u0000-\u007F]，它匹配所有不在 ASCII 字符集中的字符。然后，我们使用 TRegEx.Replace 方法将这些字符替换为空字符串，从而删除它们。

请注意，这个方法只适用于基于 Unicode 的字符串，例如 string 类型。如果您使用的是非 Unicode 字符串，例如 AnsiString，则需要使用不同的方法来处理变音符号。

总之，要在 Delphi 中实现 Unicode UTF-8 搜索时跳过变音符号，可以使用正则表达式或其他文本处理工具来删除或忽略变音符号。

在mysql中使用变音符号搜索阿拉伯语

、、、、

所以我有一个巨大的数据库，里面有阿拉伯文字和变音符号(变音符号是阿拉伯语中附加在其他字符后面的小字符) 例如:带有变音符号:不带变音符号的وَهَكَذَافيكُلّعَقْدٍ：وهكذافيكلعقد我使用mysql和laravel在文本中搜索没有变音符号的特定单词。如何忽略搜索中的变音

浏览 3提问于2019-09-09得票数 3

1回答

使用Verdana/Arial字体显示变音符号Windows XP

、、、

当创建一个需要能够显示一系列外文字符的应用程序时，我们在尝试显示瑞典语变音符号时遇到了显示问题。以下示例应用程序在使用Windows Vista时工作正常，但在使用Windows XP时不显示更正：使用charmap表明，在Windows XP上，Arial和Ve

浏览 0提问于2011-02-08得票数 1

回答已采纳

1回答

除了旁遮普语的变音符号之外，一切都运行得很好。与e和é一样，旁遮普语也有ਸ和ਸ਼的变音符号。但问题是，当我在数据库中搜索时，它认为带有ਸ਼和ਸ的单词是相同的。数据库以utf-8格式存储单词。我正在对数据库和表使用排序规则utf8_unicode_ci。mysql_query("SET charset utf8"); $exists = mysql_query("SELECT COUNT(word) FROM uni

浏览 3提问于2013-07-25得票数 1

2回答

在Go中将UTF-8转换为ISO8859-1的最佳方法

、、

我正在尝试将UTF-8字符映射到它们的“相似”ISO8859-1表示。删除变音符号，但也用L替换Ł或用i替换ı等字符。// (From https://blog.golang.org/normalization#TOC_10.) "unicode" "golang.org&#

浏览 17提问于2017-12-06得票数 5

1回答

在python中仅从文本中删除特定的变音符号

、、、、

我需要从希伯来语文本中删除某些变音符号。如果我需要从所有的变音符号中剥离文本，就不会有这样的问题。在unicode中，我要删除的范围在\u0591和\u05AF之间(或十进制的1425 - 1455 )。其他所有字符(字母、变音符号或标点符号)最好保留。输入是文本文件，输出也应该是文本文件。仅删除一定范围的unicode字符的最佳方法是什么？或者也许un

浏览 37提问于2019-12-12得票数 1

回答已采纳

2回答

在UIWebView中查找并突出显示带有变音符号的阿拉伯语文本

、、、、

我正在UIWebView中查看带有变音符号(塔什克尔)文本的阿拉伯语。我还有一个搜索视图。我想给UIWebView一个关键字，然后UIWebView会找到并突出显示它，但是搜索应该忽略变音符号。正文应保留变音符号。例如:如果文本是“الَلَهُمصَلِعَلىمُحَمّدوآلمُحمد”，并且我告诉UIWebView搜索“محمد”，那么它应该突出显示"مُحَمّد“和”مُحمد“，而不考虑所

浏览 4提问于2012-08-25得票数 5

回答已采纳

1回答

如何将变音标记向左移动一个字母

我正在使用这个正则表达式从字幕文件中删除一个阿拉伯变音符号，是否可以将其修改为将变音符号仅向左移动一个字母而不是将其删除？我使用的是python 2.7。file_content = re.sub(u'\u0651', '', file_content) 这是字幕文件中的原始行，变音符号位于其正确的位置 أنالاأترصّدعبرالإنترنت这就是我想要的 أنالاأترصدّعبرالإنترنت

浏览 23提问于2020-01-01得票数 3

回答已采纳

3回答

MySQL变音不敏感搜索(阿拉伯语)

、、

我在使用阿拉伯文本进行变音不敏感搜索时遇到问题。我测试了该表的多个设置: utf8和utf16中的编码以及utf8_general_ci、utf16_general_ci和utf16_unicode_ci中的排序规则。有什么办法通过这个吗？真正的用法稍后将是PHP (一个搜索

浏览 1提问于2015-03-05得票数 6

2回答

具有特定变音符号的正则表达式匹配字符

、、、

在正则表达式中，有没有办法指定一个带有特定变音符号的字符的匹配项？例如，让我们说一个严肃的口音。我希望有像\p{hasGraveAccent}这样的Unicode属性，但是我找不到这样的东西。在搜索解决方案时，人们只会遇到试图匹配字符而忽略变音符号的问题，这涉及到执行某种标准化，这不是我想要的。

浏览 4提问于2016-02-13得票数 7

3回答

如何在搜索时忽略unicode字符？

、、、、

我正在尝试实现对我的应用程序的搜索。如果你在搜索栏中写一个确切的单词，这是可以的，但例如，如果我想要查找"book“，并且我输入了”bök“，那么发音符号不应该有什么关系。我使用了下面的代码，但它没有用，而且在搜索"New York - Björk“时也失败了。我也尝试了不同的searchEditedText组合，但是代码变得很恶心。我该怎么做呢？

浏览 0提问于2012-07-14得票数 1

回答已采纳

3回答

变音符号的按键代码

、、

我在哪里可以找到变音符号的关键代码？字母ā，č，ē，ģ，ī，ķ，ļ，ņ，š，ū，ž？我想做一个与所有的拉托维亚字母的拉维亚语自定义键盘。

浏览 3提问于2013-08-08得票数 0

2回答

Delphi 2009: unicode utf-8中的搜索跳过diacritics

、、、、

我有包含阿拉伯文本的utf-8编码文件，我必须搜索它。比如，如果您在Internet中加载文本(当然是HTML转换文本)，IE就跳过了这些对话框吗？Edit1：搜索是通过以下代码执行的： m2 : TMemo; // contains results m2.Li

浏览 9提问于2009-04-08得票数 4

回答已采纳

1回答

是否将unicode字符和变音符号视为单个字符？

、、、

在我的VB.NET应用程序中，我比较了使用IPA记录的单词，其中许多单词有许多变音符号。在其中一个比较中，我逐个字符地比较单词。但是当我遍历字符时，变音符号显示为单独的字符(正如我所预期的那样，因为这是unicode)：但是，就本程序而言，u字符与u加重音字符不同，需要加以区分。有没有一种好的方法来迭代unicode字符串，使字符和它们的重音被认为是一个字符？我正在努力避免硬编码所有组合，这些组合组合被认为是一个字

浏览 5提问于2010-08-23得票数 2

回答已采纳

5回答

PAnsiChar与PChar的区别

、

(在2007年以前的Delphi中) 谢谢你，提前！

浏览 0提问于2009-11-26得票数 7

回答已采纳

1回答

如何分别改变元音和辅音的颜色？

、、、、

在阿拉伯语中，元音和辅音组成一个单词。但是，在Windows中，元音不能在没有辅音的情况下单独着色。在阿拉伯语中，特别是出于教育目的，用不同颜色显示元音是很常见的，但Windows没有考虑到这一点。要更好地理解阿拉伯语的结构，请参阅维基百科中的。// In Delphi<

浏览 0提问于2014-05-12得票数 1

2回答

Python如何正确打印cp1258越南语字符？

、

如何在Python3中正确打印越南语cp1258编码字符？我的终端似乎不是问题所在，因为它将正确地打印我代码中的第一个print语句。

浏览 0提问于2019-11-01得票数 2

1回答

从文件读取未正确编码的文本，缺少空格，字符错误

、、、、

然而，在阅读文件后，我发现文本缺少空格，只有一些单词之间有错误的字符。我使用的是Python 3，文本是越南语。

浏览 13提问于2019-05-24得票数 0

1回答

拼音字母表的变音符号显示问题

、

我需要在网页中写入unicode字符和变音符号。它们是为浪漫主义研究而设计的拼音字母表( Bourciez Alphabet)的一部分。我的问题是显示问题，我相信:字符代码在unicode中都可以，但一些变音符号无法按预期显示。最值得注意的是，“组合下面的双字母”(U+035C)没有按预期显示:它不显示在应该应用的两个字母下面，而是显示在这些字母的最后一个字母和下一个字符(另一个字母或空格)下面。例如，在这里，组合变音</em

浏览 0提问于2016-08-30得票数 1

1回答

如何使iText 7变音符号堆叠正常工作？

、、、

我在iText 7中遇到了一个问题，当在一个字符上使用多个标记时，变音标记会一个接一个地绘制在另一个的顶部，而不是正确地堆叠。有没有让它们正确显示的设置，或者这是iText 7中的一个错误？如果您在PDF中创建如下所示的文本对象，则可以观察到这一点。显然，将相关部分替换为实际的字体对象，而不是我在其中的内容。new Text("ḗ and ṓ are characters that display incorrectly").setFont(<U

浏览 0提问于2016-12-09得票数 1

3回答

iTextSharp变音符号

、、、、

我正在试着用iTextSharp库排版一个pdf文件，但是我找不到任何地方去处理变音符号。因为我找到了两本关于iTextSharp的书的目录，其中有一节是变音的，所以我想这是可行的。

浏览 0提问于2009-11-25得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Delphi :在unicode utf-8中搜索跳过变音符号

相关·内容

在mysql中使用变音符号搜索阿拉伯语

使用Verdana/Arial字体显示变音符号Windows XP

区分变音的搜索PHP

在Go中将UTF-8转换为ISO8859-1的最佳方法

在python中仅从文本中删除特定的变音符号

在UIWebView中查找并突出显示带有变音符号的阿拉伯语文本

如何将变音标记向左移动一个字母

MySQL变音不敏感搜索(阿拉伯语)

具有特定变音符号的正则表达式匹配字符

如何在搜索时忽略unicode字符？

变音符号的按键代码

Delphi 2009: unicode utf-8中的搜索跳过diacritics

是否将unicode字符和变音符号视为单个字符？

PAnsiChar与PChar的区别

如何分别改变元音和辅音的颜色？

Python如何正确打印cp1258越南语字符？

从文件读取未正确编码的文本，缺少空格，字符错误

拼音字母表的变音符号显示问题

如何使iText 7变音符号堆叠正常工作？

iTextSharp变音符号

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐