反转python对元音的编码，以规范化文本或以当前形式规范化

、、、

Python自动将德语元音和标点符号读取为 Gefrier- undçhlmçbel 如何规范化此输出以删除标点符号？

浏览 12提问于2020-10-16得票数 1

1回答

nginx url解码在url中的斜线

有什么可以阻止的吗？

浏览 2提问于2014-10-31得票数 1

回答已采纳

1回答

了解有关编码U+30C9与U+30C8U+3099的更多信息

、

U+30C9(ド)与ド(U+30C8U+3099) 用户将一个名为ド(U+30C8U+3099)的文件从web应用程序上传到AWS s3。然后，该网站向AWS函数发送一个POST请求，其中包含没有url编码的文件名，以便使用Python进行进一步处理。当到达兰博达时，这个名字变成了ド(U+30C9)。由于unicode中的差异，Python无法访问存储在s3中的文件。我认为解决方案是在发送请求之前在前端进行url编码，并使用ur

浏览 2提问于2022-01-29得票数 0

回答已采纳

4回答

“剪切和粘贴”是如何影响字符编码的，会出什么问题？

、

我在工具A中显示了一个编码为A的文档A，在工具B中显示了一个编码为B的文档B。如果我将B剪切并粘贴(部分)到A中，得到的字符编码可能是什么？我意识到这取决于工具A和工具B以及粘贴缓冲区中保存的信息(可能包含编码？)和操作系统。高质量的工具应该做些什么？以及在实践中有多少常用工具(如Word、TextPad、各种IDE等)好好干?

浏览 15提问于2009-12-19得票数 23

回答已采纳

2回答

字符串到字符数组在Visual和Android中返回不同的结果

、、、、

我想要转换成字符数组的字符串是ষ্টোর，它在Unicode和一个孟加拉语单词中。 B:我的和项目编码是UTF

浏览 8提问于2017-04-04得票数 15

回答已采纳

1回答

从哪里可以得到不同规格化的unicode示例？

、

我增加了另一个unicode规范化问题，因为我花了相当长的时间寻找并且找不到我需要的东西。在这种情况下，我需要对unicode进行规范化，以检查字符串是否等效，但我不理解选择不同范式的后果。我想要做的是得到一些有效的unicode输入，这些输入以不同的方式标准化，这样我就可以使用不同的选项，但是我不知道如何制作它，也不知道在哪里可以找到它。有一些示例数据，但示例集中在格式错误或无效的</em

浏览 6提问于2022-03-30得票数 1

回答已采纳

1回答

哪种形式的unicode规范化适合文本挖掘？

、、、、

我读了很多关于Unicode的文章，但是我仍然对规范化及其不同的形式感到困惑。简而言之，我正在从事一个项目，该项目涉及从PDF文件中提取文本并执行一些语义文本分析。我已经成功地使用一个简单的python脚本成功地提取了文本，但是现在我需要确保所有等效的正交字符串都有一个(而且只有一个)表示。例如，“fi”排版结扎应该分解为“f”和“i”。我看到python的uni

浏览 20提问于2012-06-27得票数 6

回答已采纳

2回答

Python os.walk() umlauts u'\u0308‘

、、

我在OSX机器上运行Python2.7。我正在尝试在smb共享上执行一个os.walk。预期：filename_ö.jpg如果我硬编码文件名如下： re.match( r".*ö.*",'fi

浏览 2提问于2015-11-11得票数 3

回答已采纳

1回答

是否可以使用nginx规范“双点”URL？

、、、

根据像这样的RFC3986网址由一些UserAgent (curl是个很好的例子)转换为http://example.com/catalog/category/brand/product.html如果我的愚蠢的UserAgent不能正确地解析原始的<

浏览 0提问于2018-05-04得票数 2

回答已采纳

1回答

在python中迭代utf-8字符

、、、

我正在使用python3.6读取以utf-8编码的西班牙语文件(因此，也包括信函)。我用utf-8编解码器打开文件，它正确地加载:调试时，我可以在加载的文本中看到。or hexc in U_LETTERS[lang][2:] \ filtered_text+=c 文本包含一个当以这种方式迭代时，我想有一个内部转换为8位字符。做这件事的正确方

浏览 0提问于2017-12-08得票数 3

回答已采纳

1回答

什么时候一个角色最终会在特定的“组合”中被考虑？

、、、、

在Unicode中，一个字符可以被认为是不同的“组合”。什么时候一个角色最终会在特定的作品中被考虑？我的意思是:键盘？编码？复制-粘贴文本？我知道使用\X元字符的方法，但我希望有人能解释我的疑惑。

浏览 1提问于2011-07-30得票数 3

回答已采纳

2回答

规范化与输出编码

、、、、

我正在阅读OWASP的安全编码实践检查列表，在他们的“输入验证”部分中，他们有一项内容如下：什么是“输出编码”，谁能提供一个验证例程如何利用它的具体例子？什么是“双重编码”，为什么是“混

浏览 0提问于2012-08-09得票数 8

回答已采纳

2回答

在散列时，哪些Unicode规范化(和其他处理)适合于密码？

、、、、

如果我接受密码的完整Unicode，那么在将字符串传递给哈希函数之前，应该如何规范字符串？这是由用户代理或其操作系统控制的. Unicode规范化表单：如果服务器接收到无效

浏览 3提问于2013-04-23得票数 20

1回答

Python反转UTF-8字符串

、、、、

我目前正在学习Python，作为一个斯洛文尼亚人，我经常使用UTF-8字符来测试我的程序。正常情况下一切都很好，但有一件事我无法超车。即使在文件顶部声明了编码，但当我试图反转包含特殊字符的字符串时，它将失败print a #prints čšž b = a[:

浏览 0提问于2015-12-01得票数 8

回答已采纳

1回答

go lang可版本化字符串规范化

、

我正在从事一个项目，其中一些字符串是散列的。为了确保我总是得到正确的结果，我想在散列它们之前对它们进行标准化。..。为此，我们提供了Unicode规范包。到目前一切尚好。我不想存储规范化的表单，已经将数据存储在它的原始格式中--我假设客户喜欢它。我希望几年后，如果我被要求计算相同字符串的哈希，我会得到相同的结果。现在，如果标准改进了，或者修复了一个bug，那么使用最新版本的库将会得到不同的结果。我不在乎之前的

浏览 5提问于2017-01-25得票数 1

2回答

文件系统在Mac OS X中的Unicode编码在Python中不正确？

、、、、

在OS和Python中使用Unicode文件名有点困难。我试图在后面的代码中使用文件名作为正则表达式的输入，但是文件名中使用的编码似乎与sys.getfilesystemencoding()告诉我的不同。使用以下代码： #!utf-8，但是当我使用该编码对我的文件名进行编码时，它将与我用相同的字符串创建一个目录名称不同。我希望当我使用我的字符串创建一个目录，并读回它的名称时，它应该

浏览 3提问于2012-03-18得票数 18

回答已采纳

1回答

字符串列表中的unicode字符

、、、、

但是我的字符串可以有一些特殊的字符，比如"lã“，我想打破它，给出一个包含三个项目"l"，"a"，"~”的列表。我怎么才能得到一个只有"l"，"ã“的列表呢？这是我的代码。它是这样的，因为我已经尝试了几次。它给了我正确的输入，但是如果我有一个字符串x= "lã“并使用getListOfWords(x)，它会给我"l"，"a"，&qu

浏览 0提问于2019-02-02得票数 0

2回答

Python的glob模块和unix的find命令无法识别非ascii

、、

我使用的是Mac OS X 10.8.2> find */Bärlauch*> find */B*rlauch*所以这个文件肯定是存在的。类似地，Python模块glob无法找到该文件： >>> glob.glob(

浏览 0提问于2013-01-07得票数 5

回答已采纳

1回答

如何处理XML字符串属性中的特殊字符？

、、

因此，我有一些来自web表单的输入，该表单以XML格式发送，并在文本到达服务器之前通过XSS过滤器对所有文本进行规范化/解编码。我是否必须遍历每个属性并重新编码它们，或者在groovy/grails中有一种简单的方法可以做到这一点吗？

浏览 3提问于2018-11-08得票数 0

2回答

将包含umlauts的数据导出到.csv中，该可由Excel读取。

、、、、

我在MacOSX10.8.2上使用Python2.7.2。但是，如果我在Microsoft 2004中读到这些单词，它的显示方式如下：我知道Excel在处理UTF-8方面有问题。我将UTF-8 BOM设置为以下一行：因此，作为下一步，我尝试的不是将其导出为UTF-8文件，而是将字符编码设置为mac。使用下面的行，我对utf-8中的值进行了解码，并用mac对其重新编码。

浏览 3提问于2012-12-21得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

nginx url解码在url中的斜线

了解有关编码U+30C9与U+30C8U+3099的更多信息

“剪切和粘贴”是如何影响字符编码的，会出什么问题？

字符串到字符数组在Visual和Android中返回不同的结果

从哪里可以得到不同规格化的unicode示例？

哪种形式的unicode规范化适合文本挖掘？

Python os.walk() umlauts u'\u0308‘

是否可以使用nginx规范“双点”URL？

在python中迭代utf-8字符

什么时候一个角色最终会在特定的“组合”中被考虑？

规范化与输出编码

在散列时，哪些Unicode规范化(和其他处理)适合于密码？

Python反转UTF-8字符串

go lang可版本化字符串规范化

文件系统在Mac OS X中的Unicode编码在Python中不正确？

字符串列表中的unicode字符

Python的glob模块和unix的find命令无法识别非ascii

如何处理XML字符串属性中的特殊字符？

将包含umlauts的数据导出到.csv中，该可由Excel读取。

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐