腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2507)
视频
沙龙
1
回答
反转
python
对
元音
的
编码
,
以
规范化
文本
或以
当前
形式
规范化
、
、
、
Python
自动将德语
元音
和标点符号读取为 Gefrier- undçhlmçbel 如何
规范化
此输出
以
删除标点符号?
浏览 12
提问于2020-10-16
得票数 1
1
回答
nginx url解码在url中
的
斜线
有什么可以阻止
的
吗?
浏览 2
提问于2014-10-31
得票数 1
回答已采纳
1
回答
了解有关
编码
U+30C9与U+30C8U+3099
的
更多信息
、
U+30C9(ド)与ド(U+30C8U+3099) 用户将一个名为ド(U+30C8U+3099)
的
文件从web应用程序上传到AWS s3。然后,该网站向AWS函数发送一个POST请求,其中包含没有url
编码
的
文件名,以便使用
Python
进行进一步处理。当到达兰博达时,这个名字变成了ド(U+30C9)。由于unicode中
的
差异,
Python
无法访问存储在s3中
的
文件。我认为解决方案是在发送请求之前在前端进行url
编码
,并使用ur
浏览 2
提问于2022-01-29
得票数 0
回答已采纳
4
回答
“剪切和粘贴”是如何影响字符
编码
的
,会出什么问题?
、
我在工具A中显示了一个
编码
为A
的
文档A,在工具B中显示了一个
编码
为B
的
文档B。如果我将B剪切并粘贴(部分)到A中,得到
的
字符
编码
可能是什么?我意识到这取决于工具A和工具B以及粘贴缓冲区中保存
的
信息(可能包含
编码
?)和操作系统。 高质量
的
工具应该做些什么?以及在实践中有多少常用工具(如Word、TextPad、各种IDE等)好好干?
浏览 15
提问于2009-12-19
得票数 23
回答已采纳
2
回答
字符串到字符数组在Visual和Android中返回不同
的
结果
、
、
、
、
我想要转换成字符数组
的
字符串是ষ্টোর,它在Unicode和一个孟加拉语单词中。 B:我
的
和项目
编码
是UTF
浏览 8
提问于2017-04-04
得票数 15
回答已采纳
1
回答
从哪里可以得到不同规格化
的
unicode示例?
、
我增加了另一个unicode
规范化
问题,因为我花了相当长
的
时间寻找并且找不到我需要
的
东西。在这种情况下,我需要对unicode进行
规范化
,
以
检查字符串是否等效,但我不理解选择不同范式
的
后果。我想要做
的
是得到一些有效
的
unicode输入,这些输入
以
不同
的
方式标准化,这样我就可以使用不同
的
选项,但是我不知道如何制作它,也不知道在哪里可以找到它。有一些示例数据,但示例集中在格式错误或无效
的</em
浏览 6
提问于2022-03-30
得票数 1
回答已采纳
1
回答
哪种
形式
的
unicode
规范化
适合
文本
挖掘?
、
、
、
、
我读了很多关于Unicode
的
文章,但是我仍然
对
规范化
及其不同
的
形式
感到困惑。简而言之,我正在从事一个项目,该项目涉及从PDF文件中提取
文本
并执行一些语义
文本
分析。我已经成功地使用一个简单
的
python
脚本成功地提取了
文本
,但是现在我需要确保所有等效
的
正交字符串都有一个(而且只有一个)表示。例如,“fi”排版结扎应该分解为“f”和“i”。我看到
python
的
uni
浏览 20
提问于2012-06-27
得票数 6
回答已采纳
2
回答
Python
os.walk() umlauts u'\u0308‘
、
、
我在OSX机器上运行
Python
2.7。我正在尝试在smb共享上执行一个os.walk。预期:filename_ö.jpg如果我硬
编码
文件名如下: re.match( r".*ö.*",'fi
浏览 2
提问于2015-11-11
得票数 3
回答已采纳
1
回答
是否可以使用nginx规范“双点”URL?
、
、
、
根据像这样
的
RFC3986网址由一些UserAgent (curl是个很好
的
例子)转换为http://example.com/catalog/category/brand/product.html如果我
的
愚蠢
的
UserAgent不能正确地解析原始
的<
浏览 0
提问于2018-05-04
得票数 2
回答已采纳
1
回答
在
python
中迭代utf-8字符
、
、
、
我正在使用
python
3.6读取
以
utf-8
编码
的
西班牙语文件(因此,也包括信函)。我用utf-8编解码器打开文件,它正确地加载:调试时,我可以在加载
的
文本
中看到。or hexc in U_LETTERS[lang][2:] \ filtered_text+=c
文本
包含一个当
以
这种方式迭代时,我想有一个内部转换为8位字符。做这件事
的
正确方
浏览 0
提问于2017-12-08
得票数 3
回答已采纳
1
回答
什么时候一个角色最终会在特定
的
“组合”中被考虑?
、
、
、
、
在Unicode中,一个字符可以被认为是不同
的
“组合”。什么时候一个角色最终会在特定
的
作品中被考虑?我
的
意思是:键盘?
编码
?复制-粘贴
文本
? 我知道使用\X元字符
的
方法,但我希望有人能解释我
的
疑惑。
浏览 1
提问于2011-07-30
得票数 3
回答已采纳
2
回答
规范化
与输出
编码
、
、
、
、
我正在阅读OWASP
的
安全
编码
实践检查列表,在他们
的
“输入验证”部分中,他们有一项内容如下:什么是“输出
编码
”,谁能提供一个验证例程如何利用它
的
具体例子? 什么是“双重
编码
”,为什么是“混
浏览 0
提问于2012-08-09
得票数 8
回答已采纳
2
回答
在散列时,哪些Unicode
规范化
(和其他处理)适合于密码?
、
、
、
、
如果我接受密码
的
完整Unicode,那么在将字符串传递给哈希函数之前,应该如何规范字符串?这是由用户代理或其操作系统控制
的
. Unicode
规范化
表单: 如果服务器接收到无效
浏览 3
提问于2013-04-23
得票数 20
1
回答
Python
反转
UTF-8字符串
、
、
、
、
我目前正在学习
Python
,作为一个斯洛文尼亚人,我经常使用UTF-8字符来测试我
的
程序。正常情况下一切都很好,但有一件事我无法超车。即使在文件顶部声明了
编码
,但当我试图
反转
包含特殊字符
的
字符串时,它将失败print a #prints čšž b = a[:
浏览 0
提问于2015-12-01
得票数 8
回答已采纳
1
回答
go lang可版本化字符串
规范化
、
我正在从事一个项目,其中一些字符串是散列
的
。为了确保我总是得到正确
的
结果,我想在散列它们之前
对
它们进行标准化。..。为此,我们提供了Unicode规范包。到目前一切尚好。我不想存储
规范化
的
表单,已经将数据存储在它
的
原始格式中--我假设客户喜欢它。我希望几年后,如果我被要求计算相同字符串
的
哈希,我会得到相同
的
结果。现在,如果标准改进了,或者修复了一个bug,那么使用最新版本
的
库将会得到不同
的
结果。我不在乎之前
的
浏览 5
提问于2017-01-25
得票数 1
2
回答
文件系统在Mac OS X中
的
Unicode
编码
在
Python
中不正确?
、
、
、
、
在OS和
Python
中使用Unicode文件名有点困难。我试图在后面的代码中使用文件名作为正则表达式
的
输入,但是文件名中使用
的
编码
似乎与sys.getfilesystemencoding()告诉我
的
不同。使用以下代码: #!utf-8,但是当我使用该
编码
对
我
的
文件名进行
编码
时,它将与我用相同
的
字符串创建一个目录名称不同。我希望当我使用我
的
字符串创建一个目录,并读回它
的
名称时,它应该
浏览 3
提问于2012-03-18
得票数 18
回答已采纳
1
回答
字符串列表中
的
unicode字符
、
、
、
、
但是我
的
字符串可以有一些特殊
的
字符,比如"lã“,我想打破它,给出一个包含三个项目"l","a","~”
的
列表。我怎么才能得到一个只有"l","ã“
的
列表呢?这是我
的
代码。它是这样
的
,因为我已经尝试了几次。它给了我正确
的
输入,但是如果我有一个字符串x= "lã“并使用getListOfWords(x),它会给我"l","a",&qu
浏览 0
提问于2019-02-02
得票数 0
2
回答
Python
的
glob模块和unix
的
find命令无法识别非ascii
、
、
我使用
的
是Mac OS X 10.8.2> find */Bärlauch*> find */B*rlauch*所以这个文件肯定是存在
的
。类似地,
Python
模块glob无法找到该文件: >>> glob.glob(
浏览 0
提问于2013-01-07
得票数 5
回答已采纳
1
回答
如何处理XML字符串属性中
的
特殊字符?
、
、
因此,我有一些来自web表单
的
输入,该表单
以
XML格式发送,并在
文本
到达服务器之前通过XSS过滤器
对
所有
文本
进行
规范化
/解
编码
。我是否必须遍历每个属性并重新
编码
它们,或者在groovy/grails中有一种简单
的
方法可以做到这一点吗?
浏览 3
提问于2018-11-08
得票数 0
2
回答
将包含umlauts
的
数据导出到.csv中,该可由Excel读取。
、
、
、
、
我在MacOSX10.8.2上使用
Python
2.7.2。但是,如果我在Microsoft 2004中读到这些单词,它
的
显示方式如下:我知道Excel在处理UTF-8方面有问题。我将UTF-8 BOM设置为以下一行:因此,作为下一步,我尝试
的
不是将其导出为UTF-8文件,而是将字符
编码
设置为mac。使用下面的行,我
对
utf-8中
的
值进行了解码,并用mac
对
其重新
编码
。
浏览 3
提问于2012-12-21
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python分析文本学习笔记
70个NumPy练习:在Python下一举搞定机器学习矩阵运算
70个NumPy分级练习:用Python一举搞定机器学习矩阵运算
数据库技术简介
基于人工智能的病历质控系统研究
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券