UnicodeDecodeError：'charmap‘编解码器无法解码位置261060处的字节0x81 :字符映射到<undefined>_UnicodeDecodeError：'charmap‘编解码器无法解码位置2483处的字节0x81 :字符映射到<undefined>_UnicodeDecodeError：'charmap‘编解码器无法解码位置2310处的字节0x81 :字符映射到<undefined> - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

用python的算法工程师们，编码问题搞透彻了吗？

关于作者：Milter，一名机器学习爱好者、NLP从业者、终生学习者，欢迎志同道合的朋友多多交流

02

Python编解码问题与文本文件处理

在字符与字节之间的转换过程称为编解码，Python自带了超过100种编解码器，比如：

03

您找到你想要的搜索结果了吗？

是的

没有找到

如何在 Python 中使用 unidecode

在 Python 中使用 unidecode 库可以将 Unicode 文本转换为 ASCII。这对于需要处理非英文字符的文本并且希望保持可读性时非常有用。以下是如何在 Python 中使用 unidecode 库的示例和步骤：

01

Python中的文本和字节序列

原因在于这个latin1不会对中午编码，所以我们需要处理这个EncodeError,处理如下：

03

Python 'xxx' codec can't decode byte xxx常见编码错

利用python文件io方法 open打开文件，读取文件时报错，提示类似如下错误：

04

pandas文件读取错误及解决办法

错误一：‘gbk’ codec can’t decode byte 0x98 in position 2: illegal multibyte sequence

02

Python 字符编解码器

“字符串”是个相当简单的概念：一个字符串是一个字符序列。本文记录 Python 中字符串相关内容。基本的编解码器 Python 自带了超过 100 种编解码器（codec, encoder/decoder），用于在文本和字节之间相互转换。每个编解码器都有一个名称，如 ‘utf_8’，而且经常有几个别名，如 ‘utf8’、‘utf-8’ 和 ‘U8’。这些名称可以传给 open()、str.encode()、bytes.decode() 等函数的 encoding 参数。例如：使用 3 个编解码

02

《流畅的Python》第四章学习笔记

在Windows上使用open打开utf-8编码的txt文件时开头会有一个多余的字符\ufeff，它叫BOM,是用来声明编码等信息的,但python会把它当作文本解析。

01

走进音视频的世界——Matroska封装格式的介绍(二)「建议收藏」

Matroska封装格式非常灵活、兼容性好，既适用于本地文件存储又可以进行实时流传输。本篇文章主要探讨Matroska的编解码器映射，如何封装视频流、音频流、字幕流。如果要Matroska的介绍、功能和基本结构，请查看上一篇文章：走进音视频的世界——Matroska封装格式的介绍(一)。

01

Python ‘gbk’ codec can’t decode byte 0x80[通俗易懂]

从错误提示来看，应该是文件编码的问题，文件中含有 gbk 无法解码的内容，某个字符的起始字节为 0x80，不在 gbk 的编解码范围内。其对应的源码如下：

01

流畅的 Python 第二版（GPT 重译）（二）

我们在所有的 Python 程序中都使用字典。即使不是直接在我们的代码中，也是间接的，因为dict类型是 Python 实现的基本部分。类和实例属性、模块命名空间和函数关键字参数是内存中由字典表示的核心 Python 构造。__builtins__.__dict__存储所有内置类型、对象和函数。

00

变脸前奏：掌握可变编解码器

现代人工智能技术能神乎其神的将一个人的脸严丝合缝的移植到另一个人的照片或视频里，类似于ZAO这类风靡一时的应用就能让用户将指定头像切换到一段视频中的对应角色里，而且表情变化看不出任何违和感，我们本节提到的可变编解码器就能实现类似功能。

01

一文搞懂数字视频技术 [图文]

一个图像可以视作一个二维矩阵。如果将色彩考虑进来，我们可以做出推广：将这个图像视作一个三维矩阵——多出来的维度用于储存色彩信息。

02

[译]Flutter Platform Channels(一)

Flutter邀请你用Dart语言开发你的移动应用，一套代码可以同时构建Android和iOS。但是Dart不会编译成Android’s Dalvik字节码，在iOS上也不会有Dart/Objective-C的绑定。这意味你的Dart代码并不会直接访问平台特定的API，即 iOS Cocoa Touch 以及 Android SDK的API。

00

TICO : UHD生产系统中的Mezzanine Codec

本帖参考M. Miyazaki等人发表在SMPTE Motion Imaging Journal的文章UHDTV-2 Mezzanine Compression Codec For Miniaturized and Simplified UHD Production System，重点介绍了我们在生产应用中硬件压缩的发展。底层压缩方案经过多个编码/解码周期展现出最小的质量下降，使其适用于生产系统。Tiny Codec（TICO）编解码器采用48 Gbits / s（59.94 Hz，10 bit，4：2：2）的未压缩UHDTV-2比特流，并将其压缩以适合单个12G数字分量串行接口（SDI）电缆。该设备还可以配备IP接口。这些改变可以显着降低电缆和切换器的复杂性。

02

深入了解Android系统中的音视频编解码器：MediaCodec

Media内核是Android系统中负责音视频处理的核心模块，包括音视频采集、编解码、传输、播放等功能。Media内核源码位于Android源码树的/frameworks/av目录下，主要包括以下模块：

01

航拍 HDR 视频的 VVC 和 AV1 编码

视频产业现在处于一个十字路口，巨大的视频服务行业每年价值约 2000 亿美元。视频占互联网所有流量的 80%，这个比例还在增长。而在这 80% 的流量中，80% 是由 H.264 比特流组成的 -- 这是当今主流的视频编解码器。但 H.264 是在 2003 年实现标准化的，整整 18 年了，现在时机已经成熟，需要一个更新、更强大的编解码器来取代它。

01

AV1编码时间下降，接近使用水平

https://www.streamingmedia.com/Articles/Editorial/Featured-Articles/Good-News-AV1-Encoding-Times-Drop-to-Near-Reasonable-Levels-130284.aspx

02

给Android工程师的音视频教程之一文弄懂MediaCodec

音视频学习项目：LearnVideo AndroidMediaCodecDemo

01

Python3 处理 gb18030 乱

【环境】 Windows 10 x64 Python 3.6.3 【关于 gb18030 编码】 GB 18030 wiki：https://zh.wikipedia.org/wiki/GB_18030 单字节，其值从0到0x7F。双字节，第一个字节的值从0x81到0xFE，第二个字节的值从0x40到0xFE（不包括0x7F）。四字节，第一个字节的值从0x81到0xFE，第二个字节的值从0x30到0x39，第三个字节从0x81到0xFE，第四个字节从0x30到0x39。【解码错误的处理方式】错误

01

深入理解Python中的字符编码与解码：字符集、Unicode与实用操作详解

在Python编程中，处理字符编码和解码是一个常见但也容易出错的任务。随着计算机软硬件的发展，字符集和Unicode编码成为了解决字符处理问题的主要方法。本文将介绍Python中字符编码与解码的基本概念，并提供一些实用的代码示例。

01

如何编写Yate的编解码模块

From：http://yate.null.ro/pmwiki/index.php?n=Main.CppTutorial3 Yate的编解码模块不处理任何消息，而是通过API方式调用。其他模块通常两者

02

MediaCodec基本原理及使用「建议收藏」

MediaCodec类Android提供的用于访问低层多媒体编/解码器接口，它是Android低层多媒体架构的一部分，通常与MediaExtractor、MediaMuxer、AudioTrack结合使用，能够编解码诸如H.264、H.265、AAC、3gp等常见的音视频格式。广义而言，MediaCodec的工作原理就是处理输入数据以产生输出数据。具体来说，MediaCodec在编解码的过程中使用了一组输入/输出缓存区来同步或异步处理数据：首先，客户端向获取到的编解码器输入缓存区写入要编解码的数据并将其提交给编解码器，待编解码器处理完毕后将其转存到编码器的输出缓存区，同时收回客户端对输入缓存区的所有权；然后，客户端从获取到编解码输出缓存区读取编码好的数据进行处理，待处理完毕后编解码器收回客户端对输出缓存区的所有权。不断重复整个过程，直至编码器停止工作或者异常退出。

02

MPEG V-PCC项目启航

本帖参考Adrian Pennington近期发表在IBC的文章MPEG heads to the holograph，重点介绍了MPEG正在推广的基于视频的点云压缩技术 (V-PCC)。V-PCC解决了3D点云（空间中的一组数据点）的编码，以及相关的例如颜色的属性。其目的是启用包括人物角色表示在内的新应用。换句话说，人形化身或全息图作为沉浸式扩展现实的一部分在不久的将来就会实现。

05

提高Android 安全性的 google 一直在努力 Media/Bulethooth 贡献 90% 漏洞

Android的大多数漏洞都发生在多媒体和蓝牙组件中。释放后使用（UAF），整数溢出和越界（OOB）读/写构成漏洞的90％，其中OOB是最常见的漏洞。

03

Netty如何实现高效且万能的解码器?

本文主题：编码和解码，或者说是数据从一种特定协议的格式到另一种的转换。这些任务通常由编解码器组件处理 Netty 提供了多种组件，简化了为支持广泛协议而创建自定义编解码器的过程。若你正在构建一个基于 Netty 的邮件服务器，那就会发现 Netty 对于编解码器的支持对于实现 POP3、IMAP 和 SMTP 协议来说是多么宝贵！

01

.NET Core3.1 Dotnetty实战第三章

本章主要内容就是讲解如何在dotnetty的框架中进行网络通讯以及编解码对象、数据包分包拆包的相关知识点。

01

Python Moviepy 视频编辑踩坑实录01：谁动了我的音频比特率

00

Netty源码解析实战(6)-pipeline

ChannelPipeline是Netty中非常核心的概念。每个Netty SocketChannel包含一个ChannelPipeline。

02

容器格式的乐趣第三章：MPEG-TS和Matroska

之前的帖子翻译了Bitmovin博客上的《Fun with container formats》系列博文第一章（术语的介绍）和第二章（MP4与CMAF）。这个系列总共有三篇，分析四种最常见的容器格式及其重要性。本帖翻译第三章，将介绍MPEG-TS与Matroska这两种容器格式。

02

容器格式的乐趣第一章：术语的介绍

编解码器（codec）能够以二进制形式存储媒体信号，大多数编解码器以有损方式压缩原始媒体信号。最常见的媒体信号有视频，音频和字幕。电影由不同的媒体信号组成，除了动态影像之外，大多数电影都有音频和字幕。视频编解码器有H.264，HEVC，VP9和AV1等，而音频的编解码器则有：AAC，MP3或Opus等。每个媒体信号有许多不同的编解码器。单个媒体信号通常也称为基本流(ElementaryStream)或仅流（just Stream）。

03

高性能NIO框架Netty-对象传输

上篇文章高性能NIO框架Netty入门篇我们对Netty做了一个简单的介绍，并且写了一个入门的Demo,客户端往服务端发送一个字符串的消息，服务端回复一个字符串的消息，今天我们来学习下在Netty中怎么使用对象来传输数据。上篇文章中传输字符串我们用的是框架自带的StringEncoder，StringDecoder编解码器，现在想要通过对象来传输数据，该怎么弄呢？既然StringEncoder和StringDecoder可以传输字符串，我们来看看这2个类的源码不就知道它们到底做了一些什么工作。 Stri

08

Netty in Action ——— The codec framework

本文是Netty文集中“Netty in action”系列的文章。主要是对Norman Maurer and Marvin Allen Wolfthal 的《Netty in action》一书简要翻译，同时对重要点加上一些自己补充和扩展。本章含盖解码器、编码器、编解码器综述 Netty 的编解码类 Netty提供可以简化各种协议的自定义编解码器创建的组件。什么是编解码器？每个网络应用都会定义端之间传输的二进制字节该如何被解析和转换，从发送端到目标程序的数据类型。这个转换逻辑通过编解码器来

02

从wav到Ogg Opus 以及使用java解码OPUS

自然界中的声音非常复杂，波形极其复杂，通常我们采用的是脉冲代码调制编码，即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。

03

ICML 2023 Workshop | 使用量化整流器的神经图像压缩

量化通过将连续值映射到用于熵编码的有限离散值集来离散图像特征以压缩图像。虽然目前基于神经网络的图像压缩采用的量化方法解决了训练测试不匹配的问题，但量化对潜在特征的随机影响仍未解决。量化将连续值统一映射到单个离散值，根据特征可变性引入不同程度的噪声。例如，从

02

Netty源码面试解析(八) - 解码上

就像很多标准的架构模式都被各种专用框架所支持一样，常见的数据处理模式往往也是目标实现的很好的候选对象，它可以节省开发人员大量的时间和精力。当然这也适应于本文的主题:编码和解码，或者数据从一种特定协议的格式到另一种格式的转换。这些任务将由通常称为编解码器的组件来处理 Netty 提供了多种组件，简化了为了支持广泛的协议而创建自定义的编解码器的过程例如，如果你正在构建一个基于 Netty 的邮件服务器，那么你将会发现 Netty 对于编解码器的支持对于实现 POP3、IMAP 和 SMTP 协议来说是多么的宝贵

07

Netty源码阅读入门实战(八)-解码(更新 ing)

就像很多标准的架构模式都被各种专用框架所支持一样，常见的数据处理模式往往也是目标实现的很好的候选对象，它可以节省开发人员大量的时间和精力。当然这也适应于本文的主题:编码和解码，或者数据从一种特定协议的格式到另一种格式的转换。这些任务将由通常称为编解码器的组件来处理 Netty 提供了多种组件，简化了为了支持广泛的协议而创建自定义的编解码器的过程例如，如果你正在构建一个基于 Netty 的邮件服务器，那么你将会发现 Netty 对于编解码器的支持对于实现 POP3、IMAP 和 SMTP 协议来说是多么的宝贵

04

关于视频编码的一点点研究。

今天的文章更多的是一种研究，因为最近研究视频发现了很多有趣的东西如果不记录下来可真的太可惜了

01

Reparo: 用于视频会议的无损生成编解码器

视频会议中常常受到网络丢包的影响,导致视频质量下降甚至视频冻结。传统解决方案如重传丢失的数据包在实时应用中往往不切实际。采用前向纠错(FEC)技术恢复丢失的包具有挑战性,因为很难设定合适的冗余度。

01

微服务架构之Spring Boot（三十六）

Spring Boot为Spring WebFlux提供自动配置，适用于大多数应用程序。

02

纵观OTT服务中的视频工程

原标题：Video Engineering for OTT – A 10K Foot View

03

FFmpeg 使用教程

默认的编译会生成4个可执行文件和8个静态库。可执行文件包括用于转码、推流、Dump媒体文件的ffmpeg、用于播放媒体文件的ffplay、

01

项目开发中如何选择编解码器？如何解决TCP粘包问题？(Netty二)

在使用Netty进行通信开发，如何选择编码器？在TCP粘包/拆包的问题如何解决？服务端在启动流程是什么样的？连接服务流程是什么？

00

AV1：下一代视频标准—约束定向增强滤波器

https://hacks.mozilla.org/2018/06/av1-next-generation-video-the-constrained-directional-enhancement-filter/

02

云原生系列一：Aeraki --- 管理 Istio 服务网格中任何 7 层协议

今天由叶秋学长来介绍如何通过 Aeraki 来在服务网格中为 Dubbo、Thrift 等协议的服务提供七层流量路由、本地限流、全局限流，以及如何基于 Aeraki Protocol快速开发一个自定义协议，并在 Istio 服务网格中对采用自定义协议的服务进行管理。

02

python异常报错详解

这篇文章虽然篇幅有点长，但这不并是一篇关于Python异常的全面介绍的文章，只是在学习Python异常后的一篇笔记式的记录和平时写代码过程中遇到异常记录性的文章。

02

Netty 系列六（编解码器）.

网络传输的单位是字节，如何将应用程序的数据转换为字节，以及将字节转换为应用程序的数据，就要说到到我们该篇介绍的编码器和解码器。

01

Envoy 代理中的请求的生命周期

下面描述一个经过Envoy代理的请求的生命周期。首先会描述Envoy如何在请求路径中处理请求，然后描述请求从下游到达Envoy代理之后发生的内部事件。我们将跟踪该请求，直到其被分发到上游和响应路径中。

03

论视频与三维图形的融合

原标题：On the convergence of Video and 3D Graphics

04

实战详细讲解ffmpeg命令的使用（来自一线的经验，视频合并&avi转MP4&补空白音频【收藏下来一定用的到】）

ffmpeg是一个非常快速的视频和音频转换器，也可以从实时音频/视频源中抓取。它还可以在任意采样率之间进行转换，并使用高质量的多相滤波器动态调整视频大小。他能够兼容Windows,Linux以及mac三种操作系统（说白了就是这三种操作系统都能用）。ffmpeg的下载地址是:ffmpeg的下载地址安装过程没啥好说的，按照提示一直点下一步就行了。这里需要说明的一点是ffmpeg安装好之后最好在PATH中配置ffmpeg的环境变量。配置好之后在命令行中输入ffmpeg会出现如下结果：

04

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

火山引擎在机器写作和机器翻译方面的最新进展

热门标签

活动推荐

运营活动

活动名称

广告关闭