python将unicode字符串拆分为3个字节的utf8字符_如何将python Unicode字符串转换为字节_在火猴如何将unicode字符串转换为utf8字节？ - 腾讯云开发者社区

、、、

我对Python的syslog包装器如何处理unicode文本感到困惑。特别是，当Python在Ubuntu/Debian中运行时，我很感兴趣。例如，如果在命令行中打开python并键入以下命令，为什么第一个命令会出现ascii错误，而第二个命令如何工作？ syslog不知道如何处理unicode文本吗？有什么东西我可以配置，使编码(‘utf8’)部分为所有系统日志自动化？谢谢你能给我的任何帮助。 from syslog import syslog extended_chars = u"∞§¶¡™£¢" syslog( "test: %s" % extende

浏览 2提问于2014-12-18得票数 1

回答已采纳

1回答

函数返回字节字符串。

据我所知，Python的str()函数在默认情况下应该返回一个UTF8编码的字符串。但是，除非我明确指定编码为UTF8，否则我将得到一个字节字符串。我应该在某个地方设置一个全局，使默认的活动，或者我做错了什么？Python 3.10.6在Fedora 36/XFCE上 #!/usr/bin/python3 # Get the mount point of /dev/sd* mounts. import subprocess str2=subprocess.check_output(['cat', '/proc/mounts']) mounts=str2.sp

浏览 9提问于2022-08-15得票数 0

2回答

使用UTF-8的Python unicode编码

、、、

我正在研究unicode上的python的，我有一个简单的问题要问:当我打开python并键入： >>> unicode('\x80abc') Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can't decode byte 0x80 in position 0: ordinal not in range(128) 我得到了上述错误，因

浏览 5提问于2014-02-26得票数 2

回答已采纳

1回答

使用StringIO实现ConfigObj和Unicode

、、

我正在尝试使用StringIO来给ConfigObj喂食。我想在我的单元测试中这样做，这样我就可以动态地模拟配置“file”，这取决于我想在配置对象中测试什么。我在配置模块中处理了很多事情(我正在读取几个conf文件，为其余的应用程序聚合和“格式化”信息)。但是，在测试中，我面临来自地狱的unicode错误。我想我已经把我的问题固定在了最小的功能代码上，为了这个问题，我已经提取并过度简化了这些代码。我所做的工作如下： #!/usr/bin/env python # -*- coding: utf-8 -*- import configobj import io def main():

浏览 2提问于2012-08-06得票数 5

回答已采纳

2回答

Python无法将错误的unicode编码为ascii

、

我有一些Python代码，它接收包含错误unicode的字符串。当我尝试忽略错误字符时，Python仍然阻塞(2.6.1版)。下面是重现它的方法： s = 'ad\xc2-ven\xc2-ture' s.encode('utf8', 'ignore') 它抛出 UnicodeDecodeError: 'ascii' codec can't decode byte 0xc2 in position 2: ordinal not in range(128) 我做错了什么？

浏览 3提问于2011-05-25得票数 6

回答已采纳

2回答

使用unicode字符迭代字符串时对字符串的错误解释

、、、

我在MacOSx10.6上运行python2.7，文件在utf8中，终端在utf8中。我想在一个给定字符串中存在的元音或元音之后添加一个句点。下面是我想要做的事情的简略版本： # coding: utf8 a = 'change these letters äöå' b = map( (lambda x: a.replace(x, "{0}.".format(x))), 'åäö') for c in b: print c 它的输出如下： change these letters ?.??.??.? change these l

浏览 0提问于2013-06-01得票数 0

回答已采纳

1回答

打印UTF8编码的笑脸符号

、、、

我正在用Python语言(discord.py)编写一个ReactionRoles-Discord Bot。此机器人将ReactionRoles-Smileys保存为UFT8编码。编码的类型是字节，但它被转换为str以保存它。字符串看起来类似于"b'\\xf0\\x9f\\x98\\x82'"。我正在使用EMOJI_ENCODED = str(EMOJI.encode('utf8'))对其进行编码，但bytes(EMOJI_ENCODED).decode('utf8')不起作用。你知道如何解码它或如何以更好的方式保存它吗？

浏览 47提问于2020-04-03得票数 0

2回答

Python中字符串的第一个字符

、、、

在Python中，我得到了这个字符串 string = "Ľubomír Mezovský" 我只需要得到第一个角色。但当我尝试string[0]时，它返回了�。当我尝试string[:2]时，效果很好。我的问题是为什么？我需要对几个字符串运行这个命令，当字符串不以对话框字符开头时，它返回两个字符的子字符串。我还使用了# encoding=utf8和Python2.7

浏览 0提问于2018-03-20得票数 4

回答已采纳

3回答

转储json时出现恼人的unicode错误

、

所以我收到了错误消息： Traceback (most recent call last): File "make.py", line 48, in <module> json.dump(amazon_review, outfile) File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/__init__.py", line 189, in dump for chunk in iterable: File "

浏览 0提问于2014-06-03得票数 0

1回答

如何修复json.dumps错误“utf8”编解码器无法解码位置2中的字节0xe0“？

、、

我有过 import json a = {'code': 'exam', 'list': [{'note': '2', 'right': '2', 'question': 'Tr\xe0n V?n H\xf9ng', 'answers': ['etreetetetetret', 'reteretet', 'tedtetetet', 'etetetet']}], '

浏览 0提问于2014-08-08得票数 2

回答已采纳

2回答

python中希伯来字符串的比较

、、、

我正在写一个小剪贴画，这将给我一些更新，从以色列有线电视公司的网站写希伯来语(html)。该网页使用的缩写，我想要更改为完整的单词。我在python文件的开头放了一行 #coding=utf8 和代码中的一行 if w = "ה.": print (w) 但我收到一个警告： wm.py:26: UnicodeWarning: Unicode相等比较未能将这两个参数转换为Unicode --如果w ==“ה”：print (w)，则将它们解释为不相等。因此，我试图把缩写放在一个文件中并从那里加载，但是键以\xd7\x94.'的形式加载，而不是以希伯来字母的形

浏览 0提问于2011-12-03得票数 2

回答已采纳

1回答

Python: POSTing二进制数据导致UnicodeDecodeError或Ascii解码错误

当使用urllib2、urllib3或httplib2对二进制数据执行POSTing时，我收到错误UnicodeDecodeError: 'utf8' codec can't decode或UnicodeDecodeError: 'ascii' codec can't decode...，这取决于Python脚本是处于UniCode模式还是ASCII模式。我首先认为是库的问题，所以我尝试了不同的库，但都没有解决问题。堆栈跟踪的结尾： File "/Library/Frameworks/Python.framework/Versions

浏览 4提问于2016-01-24得票数 0

2回答

Python通用unicode

、、

我在python2.7.2中理解unicode时遇到了问题，所以我尝试了一些空闲测试。有两件事标记为“不确定”。请告诉我他们为什么失败了。至于其他项目，请告诉我我的意见是否正确。 >>> s 'Don\x92t ' # s is a string >>> u u'Don\u2019t ' # u is a unicode object >>> type(u) # confirm u is unicode <type 'unicode'> >>> typ

浏览 4提问于2013-08-14得票数 0

回答已采纳

1回答

从xml生成文本

、

使用python3.4，我试图从xml文件中提取所有文本。我用： tree = etree.parse(xmlFile) notags = etree.tostring(tree, encoding='utf8', method='text') 这删除了所有的xml标记，只给了我文本。但我有三个问题的结果： “almost square”转向\xe2\x80\x9calmost square\xe2\x80\x9d <title><tag close=" ">1</tag>Introduction<

浏览 3提问于2015-03-05得票数 0

6回答

Python："...".encode("utf8")修复什么？

、、、、

我想要url编码一个python字符串，但得到了希伯来语字符串的异常。我无法修复它，于是开始做一些面向猜测的编程。最后，在将其发送到url编码器之前执行mystr = mystr.encode("utf8")可以节省时间。有人能解释一下发生了什么吗？.encode("utf8")做什么？我的原始字符串无论如何都是unicode字符串(即以u为前缀)。

浏览 3提问于2010-07-20得票数 9

回答已采纳

3回答

如何创建非UTF8 8字符串？

我需要测试我的代码是否也适用于非UTF8 8字符串。如何用Python创建非UTF8 8字符串？ str = ?

浏览 3提问于2014-01-12得票数 0

回答已采纳

1回答

关于UTF8子字符串长度的混淆

、、

有人能帮我处理XHTML第一行中的字节顺序标记(BOM)字节与UTF8字符吗？使用Python3.5，我以UTF8文本的形式打开了XHTML： inputTopicFile = open(inputFileName, "rt", encoding="utf8") 如这个十六进制编辑器所示，该UTF8 8编码的XHTML文件的第一行以三个字节的UTF8 BOM EF BB BF开始。我想将UTF8 BOM从我认为相当于字符串中的三个初始字符位置[0:2]的位置中删除。所以我试了一下： firstLine = firstLine[3:] 没有工作--在

浏览 2提问于2017-07-24得票数 2

1回答

TypeError:无法在python中隐式地将“字节”对象转换为str

、

下面是我生成错误的python脚本的一部分： tree = ET.ElementTree(element_table) xml = ET.tostring(element_table) xml = "<?xml version=\"1.0\" encoding=\"UTF-8\" standalone=\"no\"?><?xml- stylesheet type=\"text/xsl\" href=\".\/xsl\/brsdk.xsl\"?>" + xml obis_fi

浏览 0提问于2015-08-10得票数 1

2回答

使用Python读取csv时将字节解析为字符串

、、、

而我编写python代码来写入和读取csv文件utf8字符串 import csv test1='ab"cc"dd'.encode('utf8') test2='bbb'.encode('utf8') csv_file = open('test.csv','w') writer= csv.writer(csv_file) writer.writerow([test1,test2]) csv_file.close() with open('test.csv', ne

浏览 18提问于2021-02-15得票数 1

回答已采纳

1回答

UnicodeEncodeError：'ascii‘编解码器无法对位置47中的字符u'\u2019’进行编码:序数不在范围内(128)

、、、

我使用的是Python2.7和MySQLdb 1.2.3。我尝试了我在stackoverflow和其他论坛上找到的所有东西来处理我的脚本抛出的编码错误。我的脚本从源Postgres中的所有表中读取数据，将它们写入到一个MySQL StringIO.StringIO对象中，然后将数据从StringIO对象加载到Postgres(显然是UTF8编码格式)。我是通过使用psycopg2库的copy_from命令查看属性--pgadmin中的数据库定义)时发现的。我发现我的源MySQL数据库中有一些是latin1_swedish_ci编码的表，而另一些是utf_8编码格式的表(这是在informat

浏览 0提问于2014-10-30得票数 6

回答已采纳

2回答

协议缓冲区python - unicode解码错误

、、、

我需要在我的python - tornado服务器上接收一条protocol buffer消息，并从二进制消息中获取信息。 postContent = self.request.body message = prototemp.ReqMessage() message.ParseFromString(postContent) 它使用一个测试工具就能完美地工作。当我在沙箱环境中运行它并模拟来自客户端的1000个请求时，它在某些情况下可以工作，但在大多数请求中，它会抛出一个异常- File "server1.py", line 21, in post message.P

浏览 1提问于2012-06-09得票数 6

1回答

TreeView.insert抛出UnicodeDecodeError

、、、

我正在尝试用来自os.listdir(path)的数据填充TreeView。一切正常，直到我读取了一个带有非utf字符的目录名。在我的例子中是0xf6，它不是utf8。当我在Windows上运行时，来自os.listdir()的字符集是Windows-1252或ANSI。如何解决这个问题才能在TreeView中实现正确显示？下面是我的一些代码： def fill_tree(treeview, node): if treeview.set(node, "type") != 'directory': return path

浏览 2提问于2018-11-19得票数 0

1回答

python 2.7中特殊字符的编码/解码

、、、、

试图做一些反向工程使用覆盆子Pi。我正在将Can Analyzer的输出传输到python脚本。我的主要问题是，“扩展”ascii字符在最后没有正确显示。我正在按以下方式运行该脚本： ./candump blablabla | python test.py ./candump的结果是“十六进制”字符串，例如"3631B043“，在这种情况下应该翻译成"61°C”。因为我正在做逆向工程，我不知道所使用的编码，我只知道只有一个字节用于度符号("B0")。"ü“符号("FC")也是如此。当我在python上尝试了一些东西(在谷歌了很多次之后

浏览 1提问于2015-02-17得票数 0

回答已采纳

2回答

如何将UTF8编号转换为书面文本？

、

我正在编写一个winform，以便将写入的文本转换为Unicode数字和UTF8数字。这个位置工作得很好 //------------------------------------------------------------------------ // Convert to UTF8 // The return will be either 1 byte, 2 bytes or 3 bytes. //-----------------------------------------------------------------------

浏览 0提问于2018-06-22得票数 0

回答已采纳

3回答

为什么json.dumps用"\uxxxx“转义非ascii字符

、、、

在Python2中，函数json.dumps()将确保将所有非ascii字符转义为\uxxxx。但是，这不是很混乱吗?因为\uxxxx是一个unicode字符，应该在unicode字符串中使用。 json.dumps()的输出是一个str，它是Python2中的一个字节字符串，因此它不应该将字符转义为\xhh吗？ >>> unicode_string = u"\u00f8" >>> print unicode_string ø >>> print json.dumps(unicode_string) "\u00f

浏览 5提问于2015-09-05得票数 3

回答已采纳

1回答

Latin1字符值不显示与utf8中相同的值

、、、、

对于Python2.7(我在3中使用了一段代码，now...would对如何在PYTHON 3中复制这个测试有一些建议)。对于欧元字符(欧元)，我查找了它的utf8十六进制代码点使用的内容。上面说是0x20AC。对于Latin1 (再次使用Python2 2.7)，我使用了解码来获取其十六进制代码点： >>import unicodedata >>p='€' ## notably x80 seems to correspond to [Windows CP1252 according to the link][2] >>p.decode(

浏览 0提问于2013-12-11得票数 0

回答已采纳

2回答

Python:使用字符串连接字节

、、

我正在开发一个2.6版本的python项目，该项目将来也会支持Python3。具体地说，我正在研究digest-md5算法。在python 2.6中，不运行此导入： from __future__ import unicode_literals 我可以写一段这样的代码： a1 = hashlib.md5("%s:%s:%s" % (self.username, self.domain, self.password)).digest() a1 = "%s:%s:%s" %(a1, challenge["nonce"], cnonce ) 没有任

浏览 1提问于2010-07-01得票数 10

回答已采纳

2回答

Python3.0中C++的char * by swig问题

、

我们的python使用Swig在Python2.4上工作得很好，它将一个C++ char*返回给一个C++字符串。但是这个解决方案遇到了Python3.0中的问题，错误是： Exception=(，UnicodeDecodeError('utf8'，b"\xb6\x9d\xa.....",0，1，‘意外代码字节’) 我们的定义类似于(在Python2.4中运行良好)： void cGetPubModulus( void* pSslRsa, char* cMod, int* nLen ); %include "cstring.

浏览 2提问于2010-05-11得票数 1

回答已采纳

1回答

搜索字符串时发生python编码错误

、、、

在试图搜索下面的字符串时，我得到了以下错误错误： SyntaxError: Non-ASCII character '\xd8' in file Hadith_scraper.py on line 44, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details 弦乐： دَّثَنَا عَبْدَانُ، قَالَ أَخْبَرَنَا عَبْ 代码： arabic_hadith = "دَّثَنَا عَبْدَانُ، قَالَ أَخْبَر

浏览 2提问于2013-12-15得票数 1

回答已采纳

1回答

python 2.7中字符串格式的奇怪行为

、、、

使用xml格式的svn日志时，我在脚本中意外地发现了一个错误。错误信息是： UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-9: ordinal not in range(128) 通过调试输入数据，我发现了问题所在。下面是一个示例： a=u'\u0440\u0435\u044c\u0434\u0437\u0444\u043a\u044b\u0443\u043a \u043c\u0443\u043a\u044b\u0448\u0449\u0442 \u0430\u04

浏览 2提问于2013-09-18得票数 0

回答已采纳

2回答

将包含unicode数据的字节数组转换为str

、、、

我需要将包含非编码原始unicode数据的字节数组转换为unicode字符串，例如unicode \u 2167表示罗马数字8： print(u'\u2167') Ⅷ 将这些信息存储在字节数组中，我需要找到一种将其转换回unicode的方法。从例如“utf8”中解码显然不起作用： b = bytearray([0x21,0x67]) print(b.decode('utf8')) !g 有什么想法吗？编辑 @卢克的评论让我走上了正确的道路。显然，原始数据(不是我在这里显示的简化数据)被编码为UTF-16 as。数据来自wxpython TextDataObje

浏览 7提问于2020-06-20得票数 0

回答已采纳

2回答

UnicodeEncodeError：“charmap”，加上“Ç”、“圣书”等

、、

我连接到MySQL并检索包含‘MySQL’、‘ğ’，‘Ş’等的用户名。它在MySQL或PHP中运行良好，但是在Python2.6.8中会出现错误。这是我的代码： #C:\Python27\Lib\encodings #-*- coding: utf-8 -*- conn = MySQLdb.Connect(host="localhost", user="root", passwd="mypass", db="mydb", charset="utf8", init_command="SET NAMES UT

浏览 2提问于2015-11-13得票数 4

回答已采纳

1回答

理解decode()和encode() unicode

、、、

我只是不知道decode()和encode()函数是如何在python2.7上工作的我试过以下陈述 >>> s = u'abcd' >>> s.encode('utf8') 'abcd' >>> s.encode('utf16') '\xff\xfea\x00b\x00c\x00d\x00' >>> s.encode('utf32') '\xff\xfe\x00\x00a\x00\x00\x00b\x00\x00\x0

浏览 9提问于2015-01-28得票数 4

回答已采纳

2回答

UnicodeDecodeError：“utf8”编解码器无法解码字节"0xc3“

在python 2.7中，我有这样的功能： # -*- coding: utf-8 -*- from nltk.corpus import abc with open("abc.txt","w") as f: f.write(" ".join(i.words())) 然后我试着用Python 3读入这个文档： with open("abc.txt", 'r', encoding='utf-8') as f: f.read() 只是为了得到： File "C:\Pyth

浏览 2提问于2013-08-23得票数 11

1回答

在perl中将十六进制转换为UTF8不像预期的那样工作

、

我正在尝试理解perl中的UTF8。我有下面的字符串Alizéh，如果我查找这个字符串的十六进制，我将从获得416c697ac3a968 (这与这个字符串的原始源代码相匹配)。因此，我认为打包十六进制并将其编码为utf8应该会生成unicode字符串。但它产生了非常不同的东西。有人能解释我做错了什么吗？这里有一个简单的测试程序来展示我的工作。 #!/usr/bin/perl use strict; use warnings; use Text::Unaccent; use Encode; use utf8; binmode STDOUT, ':encoding(UTF-8

浏览 0提问于2019-12-10得票数 2

回答已采纳

2回答

在python中读取pdf文件时，编解码器出现unicode错误

、、

我正在尝试读取包含以下内容的pdf文件： %PDF-1.4\n%âãÏÓ 如果我用open读取它，它可以工作，但是如果我尝试用codecs.open(文件名，encoding="utf8"，mode="rb")来获取unicode字符串，我得到了以下异常： UnicodeDecodeError: 'utf8' codec can't decode byte 0xe2 in position 10: invalid continuation byte 您知道从这个文件的内容中获取unicode字符串的方法吗？ PS:我使用的是python

浏览 0提问于2013-06-18得票数 2

回答已采纳

1回答

Python-当我没有解码到utf-8时的意外行为

、、、

我有以下功能 import urllib.request def seek(): web = urllib.request.urlopen("http://wecloudforyou.com/") text = web.read().decode("utf8") return text texto = seek() print(texto) 当我解码到utf-8时，我得到了带有缩进和回车等的html代码，就像在实际网站上看到的那样。 <!DOCTYPE html> <html> <head>

浏览 1提问于2013-06-30得票数 1

回答已采纳

2回答

UnicodeDecodeError: ascii编解码器无法解码位置0中的字节0xe7 :序数不在范围内(128)

、、、、

我在用utf-8编码字符时遇到了麻烦。我正在使用Django，当我试图用非纯文本发送Android通知时，我得到了这个错误。我试图找出错误的来源，并设法找出错误的来源不在我的项目中。在python shell中，我输入： 'ç'.encode('utf8') 我得到了这个错误： Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can

浏览 0提问于2013-09-16得票数 16

回答已采纳

1回答

python2如何在内部处理字符串和unicode？

、、、

我对python的unicode/str进程感到困惑。我在python2中遇到了一些情况。下面这句话是在一个py文件中使用utf8编码编写的。 print "hello! %s" % u"中国" print "hello! %s" % "中国" print u"hello! %s" % "中国" 只有情况3引发解码错误： UnicodeDecodeError：'ascii‘编解码器无法解码0位置的字节0xe4 :序数不在范围内(128个)。谁能告诉我蟒蛇是怎么

浏览 3提问于2016-03-04得票数 2

1回答

UTF8 8-在文字和unicode点之间有什么区别？

、、、

我来了一个十字架--这个，它显示了Unicode表。当我打印字母‘ספר’时： >>> x = 'ספר' >>> x '\xd7\xa1\xd7\xa4\xd7\xa8' 我知道这个角色是'\xd7\xa1\xd7\xa4\xd7\xa8'。我认为python用utf-8 Unicode编码单词“ספר”，因为它是默认的，对吗？但当我运行这段代码时： >>> x = u'ספר' >>> x u'\u05e1\u05e4\u05e8'

浏览 0提问于2014-11-27得票数 7

回答已采纳

3回答

为什么打印到utf-8文件失败？

、、、、

所以今天下午我遇到了一个问题，我能够解决它，但我不太明白为什么它会起作用。这与我前几周遇到的一个问题有关：基本上，以下内容将行不通： #!/usr/bin/python import codecs from lxml import etree outFile = codecs.open('test.xml', 'w', 'utf-8') #cannot use codecs.open() root = etree.Element('root') sect = etree.SubElement(root,'sect

浏览 3提问于2011-06-29得票数 2

回答已采纳

1回答

使用ROT13的codecs.decode中可能存在的错误

、、

Ubuntu上的Python 3.5.1 >>> from codecs import decode >>> s = 'string' >>> b = b'bytes' >>> decode(b, 'utf8') 'bytes' >>> decode(s, 'utf8') Traceback (most recent call last): File "/usr/lib/python3.5/encodings/ut

浏览 1提问于2016-03-29得票数 0

3回答

UTF8编码错误

、

我需要导入一些外部数据。如何将输入字符串编码为unicode/utf8 8？下面是一个证明线的例子 ‘’Compa\xf1 1\xeda Dominicana de Tel\xe9fonos，C.por A. -CODETEL‘..encode(“utf8”) 回溯(最近一次调用)：文件""，第1行，在 UnicodeDecodeError：'ascii‘编解码器无法解码位置5的字节0xf1 :序数不在范围内(128个)

浏览 4提问于2012-11-26得票数 0

回答已采纳

3回答

在PostgreSQL中的unicode字符串中是否允许通过Python实现空字节？

、、

unicode字符串中是否允许空字节？我不问utf8，我指的是unicode字符串的高级对象表示。背景我们在PostgreSQL中通过Python存储包含空字节的unicode字符串。如果我们再读一次，字符串会在空字节处剪切。

浏览 10提问于2015-03-02得票数 6

回答已采纳

3回答

在Python中使用编码进行防弹工作

、、

关于Python2中unicode的问题。因为我知道这一点，我应该总是decode所有我从外部读取的东西(文件，网络)。decode使用参数中指定的字符集将外部字节转换为内部Python字符串。因此decode("utf8")意味着外部字节是unicode字符串，它们将被解码为python字符串。此外，我应该总是encode所有我写到外面的东西。我在encode函数的参数中指定了编码，它会转换为正确的编码并写入代码。这些陈述是正确的，不是吗？但有时当我解析html文档时，我会遇到解码错误。据我所知，文档采用其他编码(例如cp1252)，当我尝试使用utf8编码对其进行解

浏览 0提问于2013-12-03得票数 5

1回答

如何使用Windows上不属于UTF-8的字符创建文件名？

、、、

编辑/免责声明:注释指出，我必须澄清用户使用的编码。将相应更新我有一位来自中国的客户，他最近在Windows上报告了他们文件名的问题。该软件适用于大多数汉字，但他似乎找到了一个失败的文件。不幸的是，它们无法通过文件名发送我，因为压缩或通过其他媒体传输文件似乎都无法保存文件名。在Windows上生成由NTFS文件系统编码而不是UTF8覆盖的文件名最简单的方法是什么(例如通过Python)

浏览 0提问于2021-10-30得票数 0

1回答

当从windows-1252解码时，获取"UnicodeEncodeError：'ascii‘编解码器不能编码“？

我有一个认为可能是windows1252的文件 $ chardetect pub5.xml pub5.xml: windows-1252 with confidence 0.73 当我尝试用Python读取它，然后将它写入CSV文件时，我会得到错误： str = row[r].decode('windows-1252').encode('utf8') 我得到的错误是： Traceback (most recent call last): File "main.py", line 10, in <module> csv_fi

浏览 0提问于2015-04-13得票数 1

回答已采纳

1回答

从utf-8编码字符串打印特殊字符

、、、、

我在处理Python编码时遇到了困难：我从使用pandas.read_csv()打开的csv中获得了一些字符串，它们是用unicode编码的，因此我将其编码为utf-8，执行以下操作 # data is from my csv string = data.encode('utf-8') print string 然而，当我打印出来的时候，我得到了 "Parc d'Activit\xc3\xa9s des Gravanches" 我想回去 "Parc d'Activités des Gravanches" 这似乎是一个简单的问题，

浏览 0提问于2017-05-15得票数 0

1回答

.format()和UTF-8

、、

我的背景是Perl，但我正在尝试Python + BeautifulSoup的一个新项目。在本例中，我尝试提取并显示包含在单个页面中的链接目标和链接文本。以下是源代码： table_row = u'<tr><td>{}</td><td>{}</td></tr>'.encode('utf-8') link_text = unicode(link.get_text()).encode('utf-8') link_target = link['href'].enc

浏览 0提问于2012-06-13得票数 7

回答已采纳

3回答

python中的utf-16编码数据出错

、

下面是一段代码片段，其中的字符串将被UTF-16编码并发送到线路上： # -*- coding: utf8-*- import unit_test_utils import os import sys ... ... def run(): test_dir = unit_test_utils.get_test_dir("test") try: file_name = u'débárquér.txt' open_req = createrequest.CreateRequest(factory)

浏览 11提问于2016-05-31得票数 0

回答已采纳