腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

社区首页 >问答首页 >在Python 3中将Unicode转换为ASCII

问在Python 3中将Unicode转换为ASCII
EN

Stack Overflow用户

提问于 2021-03-19 17:44:39

回答 2查看 544关注 0票数 1

我已经尝试了许多解决方案，我已经阅读了许多网站，但我似乎无法解决这个问题。我有一个包含消息对象的文件。每条消息都有一个4字节值，即消息类型，一个4字节值，即长度，然后是消息数据，即Unicode中的ASCII。当我打印到屏幕上时，它看起来像ASCII。当我将输出定向到一个文件时，我得到了Unicode，所以我试图解码所有这些内容的方式有些不对劲。以下是python脚本：

import sys
import codecs
import encodings.idna
import unicodedata

def getHeader(fileObj):
    mstype_array = bytearray(4)
    mslen_array = bytearray(4)
    mstype = 0
    mslen = 0
    fileObj.seek(-1, 1)
    mstype_array = fileObj.read(4)
    mslen_array = fileObj.read(4)
    mstype = int.from_bytes(mstype_array, byteorder=sys.byteorder)
    mslen = int.from_bytes(mslen_array, byteorder=sys.byteorder)
    return mstype,mslen

def getMessage(fileObj, count):
    str = fileObj.read(count)#.decode("utf-8", "strict")
    return str

def getFields(msg):
    msg = codecs.decode(msg, 'utf-8')
    fields = msg.split(';')
    return fields

mstype = 0
mslen = 0
with open('../putty.log', 'rb') as f:
    while True:
        byte = f.read(1)
        if not byte:
            break
        if byte == b'\x1D':
            mstype, mslen = getHeader(f)
            print (f"Msg Type: {mstype} Msg Len: {mslen}")
            msg = getMessage(f, mslen)
            print(f"Message: {codecs.decode(msg, 'utf-8')}")
            #print(type(msg))
            fields = getFields(msg)
            print("Fields:")
            for field in fields:
                print(field)
        else:
            print (f"Char read: {byte}  {hex(ord(byte))}")

用户可以使用此link获取要解码的文件。

python

python-3.x

python-unicode

有奖征集｜云上CPU玩转AIGC挑战赛

参加活动赢取洛斐键盘、小米电纸书、智能音响等鹅厂周边！

回答 2

Stack Overflow用户

发布于 2021-03-19 19:06:11

在写入控制台和写入文件时，sys.stdout的行为似乎有所不同。手册(https://docs.python.org/3/library/sys.html#sys.stdout)说这是意料之中的，但只给出了Windows的细节。

在任何情况下，您都要将unicode写入标准输出(通过print())，这就是在文件中获取unicode的原因。可以通过不对getFields中的消息进行解码来避免这种情况(因此可以用fields = msg.split(b';')替换fields = getFields(msg)，并使用sys.stdout.buffer.write(field+b'\n')写入标准输出。

显然，混合使用print()和sys.stdout.buffer.write()存在一些问题，因此Python 3: write binary to stdout respecting buffering可能值得一读。

tl;dr -尝试在完全不解码为unicode的情况下写入字节。

票数 1

Stack Overflow用户

发布于 2021-03-19 19:22:59

简而言之，定义一个自定义函数，并在调用print的任何地方使用它。

import sys

def ascii_print(txt):
    sys.stdout.buffer.write(txt.encode('ascii', errors='backslashreplace'))

ASCII是utf-8的一个子集。ACSII字符与相同的utf-8编码字符无法区分。在内部，所有Python字符串都是原始Unicode。但是，原始Unicode不能读入或写出。必须先将它们编码为某种编码。默认情况下，在大多数系统上，默认编码是utf-8，这是最常见的Unicode编码标准。

如果要使用不同的编码写出，则必须指定该编码。我假设您出于某种原因需要ascii编码。

请注意，print的文档说明：

由于打印的参数被转换为文本字符串，因此print()不能与二进制模式文件对象一起使用。对于这些，请改用file.write(...)。

现在，如果您要重定向stdout，可以直接在sys.stdout中调用write()。然而，正如文档所解释的那样：

要在标准流中写入或读取二进制数据，请使用底层的二进制buffer对象。例如，要将字节写入stdout，请使用sys.stdout.buffer.write(b'abc')。

因此，您可以这样做，而不是print(f"Message: {codecs.decode(msg, 'utf-8')}")行：

ascii_msg = f"Message: {codecs.decode(msg, 'utf-8')}".encode('ascii')
sys.stdout.buffer.write(ascii_msg)

请注意，我专门对字符串调用了str.encode，并显式设置了ascii编码。还要注意，我编码了整个字符串(包括Message: )，而不仅仅是传入的变量(它仍然需要解码)。然后，您需要将该ASCII编码的字节字符串直接写入sys.stdout.buffer，如第二行所示。

这样做的一个问题是，输入可能包含一些非ASCII字符。如果是这样，就会发生Unicodeerror，程序就会崩溃。为了避免这种情况，str.encode支持一些不同的错误处理选项：

其他可能的值包括'ignore'、'replace'、'xmlcharrefreplace'、'backslashreplace'和通过codecs.register_error()注册的任何其他名称。

由于目标输出是纯文本，因此'backslashreplace'可能是保持无损输出的最佳方法。但是，如果您不关心保留非ASCII码字符，'ignore'也可以工作。

ascii_msg = f"Message: {codecs.decode(msg, 'utf-8')}".encode('ascii', errors='backslashreplace')
sys.stdout.buffer.write(ascii_msg)

是的，对于发送到print的每个字符串，您都需要这样做。定义一个自定义的打印函数来保持代码的可读性可能是有意义的：

def ascii_print(txt):
    sys.stdout.buffer.write(txt.encode('ascii', errors='backslashreplace'))

然后在你的代码中，你可以直接调用它，而不是print

ascii_print(f"Message: {codecs.decode(msg, 'utf-8')}")

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/66713175

复制

重启电脑继续运行MATLAB程序

编程算法 matlab

因为实验室断电问题，或者其他原因，程序运行会被打断。这里提供一个matlab可以在中断后，重启，利用之前已有的结果继续优化过程

万木逢春

2019/10/09

3.2K0

pycharm暂停了,如何继续运行_pycharm运行完后不退出运行

ide python https java

在pycharm中想要对一个程序同时多开几个运行窗口，并行的同时运行。但是会弹出下面提示：

全栈程序员站长

2022/09/27

5.8K0

Java中throw之后还会继续运行吗？

打包 jvm java

今天遇到一个问题，在下面的代码中，当抛出运行时异常后，后面的代码还会执行吗，是否需要在异常后面加上return语句呢？

用户7886150

2020/12/18

4.6K0

screen实现关闭ssh之后继续运行代码

ssh

使用SSH连接远程服务器，启动服务，退出SSH后，服务也就终止了，使用Screen可以解决这个问题。

怪兽

2022/12/14

5010

让Linux关闭SSH终端后程序继续运行

网站

解决方法：使用nohup命令让程序在关闭窗口（切换SSH连接）的时候程序还能继续在后台运行。

用户8965210

2021/08/31

6.8K0

JS定时器清除之后，已经开始但是没有运行完的函数还会继续运行吗？

break 测试定时器实践同步

最近使用定时器的时候遇到这样一种情况，定时器清除了，功能仍然在跑（遍历数组，同步定时网络请求）。

房东的狗丶

2023/02/17

2.4K0

取消xcode每次运行都提示输入用户名密码

xcode

每次修改了代码都让输入，就很不方便，只需要以下简单操作即可。 1、打开你的钥匙串 2、找到你项目的证书下的小钥匙 3、双击找到访问控制，然后修改为允许访问，最后点击保存 4、然后再次运行，就不会让输入密码了

用户1219438

2022/10/28

1K0

如何取消网站备案取消网站备案的流程

ICP备案网站

当网站经营了一段时间以后，网站的经营者不想使用网站，想要将网站关停，而网站关停后需要取消网站备案，以此避免后续的相关问题。然而大多数的站主在关闭网站后，并不知道如何取消网站备案？那么接下来就给大家介绍一下网站关停后如何取消备案的方法。

用户8715145

2021/10/08

29.3K0

继续昨天的源码

udp

云深无际

2020/09/07

8330

协程中的取消和异常 | 取消操作详解

javascript node.js python

在日常的开发中，我们都知道应该避免不必要的任务处理来节省设备的内存空间和电量的使用——这一原则在协程中同样适用。您需要控制好协程的生命周期，在不需要使用的时候将它取消，这也是结构化并发所倡导的，继续阅读本文来了解有关协程取消的来龙去脉。

Android 开发者

2022/09/23

2.1K0

老电脑如何继续继续工作

操作系统磁盘工作内存软件

作者从2017年开始使用Linux作为主操作系统，作者当作主操作系统的Linux如下：

zeekling

2023/05/15

8170

selenium 如何在已打开的浏览器上继续运行自动化脚本？

selenium 验证码自动化

使用selenium 做web自动化的时候，经常会遇到这样一种需求，是否可以在已经打开的浏览器基础上继续运行自动化脚本？这样前面的验证码登录可以手工点过去，后面页面使用脚本继续执行，这样可以解决很大的一个痛点。

上海-悠悠

2021/08/20

7.8K0

红包继续！

微信机器学习神经网络深度学习人工智能

量化投资与机器学习微信公众号，是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者，荣获2021年度AMMA优秀品牌力、优秀洞察力大奖，连续2年被腾讯云+社区评选为“年度最佳作者”。今年春节，微信为了感谢「量化投资与机器学习」对微信原创生态的贡献，免费了送了20万个微信红包封面。 QIML 今年的红包封面，受到了圈内的无数人的喜爱与赞美，发红包的人数近16万，拆红包的人数近100万！不过，领取的

量化投资与机器学习微信公众号

2022/07/12

9350

继续MapReduce

mapreduce hadoop

首先有一个client（客户端），然后由客户端发送一个请求，这里的请求就是我要计算某个数据，把请求发送给ResourceManager。这里ResourceManager下面有两个东西，一个叫做Applications Manager（应用），一个叫Resource Scheduler（资源）。接着由Applications Manager寻找一个节点，并开启这个节点上面的Application Master，开启后，这个App Mstr要计算这个任务需要多少资源，并且把这些需求汇报给ResourceManager中的Applications Manager，接着ResourceManager中的Resource Scheduler就开始在机架中寻找有资源的机器。

可爱见见

2019/09/09

6250

继续Django

django

环境准备 1、创建一个Django后，Django的目录： │ manage.py │ ├─Django_s1 │ settings.py │ urls.py │

coders

2018/01/04

2.1K0

vim/vi 怎么取消高亮或取消选中状态

其他

在Vi里面如果要搜索某个关键字，只要在命令状态下键入/xxx就可以了，比如，我要搜索port的位置，我就键入： /port 然后回车，一个文件中，所有出现这个字样的地方都会被高亮显示。按n键，就可以自动把光标跳到下一个。如下图所示：

黑泽君

2018/12/06

8.7K1

axios取消请求

axios

在使用Axios发送请求时，有时可能需要取消请求，特别是在用户需要中断请求或离开当前页面时。Axios提供了取消请求的功能，以便有效地管理和处理请求的取消操作。

堕落飞鸟

2023/05/19

2.5K0

【DB笔试面试496】如何让程序等待60秒钟后继续运行？

oracle

可以执行$ORACLE_HOME/rdbms/admin/dbmslock.sql来创建DBMS_LOCK包，该包可以实现让程序暂时等待的功能。若想普通用户使用该包，则需要在SYS用户下执行“GRANT EXECUTE ON DBMS_LOCK TO USER_XXX;”命令，下面给出一个示例：

AiDBA宝典

2019/09/29

1.2K0

继续xxx定律

uml

题目描述当n为3时，我们在验证xxx定律的过程中会得到一个序列，3，5，8，4，2，1，将3称为关键数，5，8，4，2称为覆盖数。现在输入n个数字a[i]，根据关键数与覆盖数的理论，我们只需要验证其中部分数就可以确定所有数满足xxx定律，输出输入的n个数中的关键数。如果其中有多个关键数的话按照其输入顺序的逆序输出。输入描述: 输入数据包含多个用例,每个用例首先包含一个整数n，然后接下来一行有n个整数a[i]，其中: 1<=n<=500, 1

AI那点小事

2020/04/20

3730

点击加载更多

相似问题

CountDownTimer未取消-在取消后继续运行()

取消订阅后，我的订阅继续运行

取消父任务时，NotOnRanToCompletion继续不会运行

使用BukkitTask更改ItemMeta

如果取消了之前的操作，则不会运行继续

活动推荐

即时通信IM，低门槛快速接入

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问在Python 3中将Unicode转换为ASCII
EN

有奖征集｜云上CPU玩转AIGC挑战赛

回答 2

Stack Overflow用户

Stack Overflow用户

CountDownTimer未取消-在取消后继续运行()

取消订阅后，我的订阅继续运行

取消父任务时，NotOnRanToCompletion继续不会运行

使用BukkitTask更改ItemMeta

如果取消了之前的操作，则不会运行继续

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在Python 3中将Unicode转换为ASCIIEN

有奖征集｜云上CPU玩转AIGC挑战赛

回答 2

Stack Overflow用户

Stack Overflow用户

CountDownTimer未取消-在取消后继续运行()

取消订阅后，我的订阅继续运行

取消父任务时，NotOnRanToCompletion继续不会运行

使用BukkitTask更改ItemMeta

如果取消了之前的操作，则不会运行继续

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在Python 3中将Unicode转换为ASCII
EN