当我从Java程序将unicode字符打印到Windows 7控制台时，为什么会显示其他字符？ - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Python中的编码问题

注意这句编码声明一定要放在第一行或者第二行才生效，我之前就将它放在了其他位置，结果将源代码文件从windows移动到Linux后，出现了编码问题，文件中的中文注释全成了乱码。...第二节提到，字符串在Python内部使用unicode编码，因此，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码（decode）成unicode，再从unicode编码...输出打印我们在windows控制台下打印中文时，经常出现屏幕上打印出的字和我们想要的结果不一致的情况。这是由于python编码与控制台编码不一致造成的。...Windows下控制台中的编码默认使用的是gbk，而在代码中使用的是utf-8，python按照utf-8编码打印到gbk编码的控制台下自然就不能打印出正确的汉字。...Python在向控制台输出unicode对象的时候会自动根据输出环境的编码进行转换，但如果输出的不是unicode对象而是普通字符串，则会直接按照字符串的编码输出字符串，从而出现上面的现象。 4.

2K2 0

python编码问题一点通

当我们点击保存，内容才被刷到硬盘。　　　　上面做了两件事：写内容到内存,从内存将内存刷到硬盘。这是两个过程。...原始的ASCII标准定义了从0到127 的字符，这样正好能用七个比特表示。　　为什么选择了7个比特而不是8个来表示一个字符呢？我并不关心。...　　　str类型　　　当python解释器执行到产生字符串的代码时（例如s='林'），会申请新的内存地址，然后将'林'编码成文件开头指定的编码格式，这已经是encode之后的结果了，所以s只能decode...类型　　当python解释器执行到产生字符串的代码时（例如s=u'林'），会申请新的内存地址，然后将'林'以unicode的格式存放到新的内存空间中，所以s只能encode，不能decode. s=u...当程序执行时，比如:x='林';print(x) #这一步是将x指向的那块新的内存空间（非代码所在的内存空间）中的内存，打印到终端，而终端仍然是运行于内存中的，所以这打印可以理解为从内存打印到内存，即内存

1K8 0

您找到你想要的搜索结果了吗？

是的

没有找到

Python2.x的编码问题

在Python中,Unicode充当着解决各种字符编码问题的桥梁数据(字符串)与Python程序无非两种关系: 数据流到Python程序中(输入),Python程序流出各种数据(输出)....') #此处必须要知道源的编码格式数据从Python-->外部时 Unicode字符是不能随便写的,要先把我们的Unicode编码成具体编码格式,然后再写出 content = unicodeContent.encode...的记事本少用,一不小心就忘记了记事本会插入BOM这一事实) 7 如果能用Python3就绝不使用Python2,3修补了字符串的许多坑(不只是unicode这一项) 举例 1 Windows_cmd控制台打印...#ok,目的地能接受gbk print s.encode('utf-8') #fail,看来万能的utf-8不好用啦,因为目的地不接受 2 有时候从网页获取来的数据可能是utf-8的,但是打印到Windows_cmd...控制台出错了 content = unicode(contentFromHtml, 'utf-8') #当然也有可能是其他编码 print content.encode('gbk') #转换层控制台能接受的编码

5081 0

windows编程为什么要用宽字节

为什么用宽字节 Windows中所有的底层函数都是Unicode编码 C++语言中“_T”是什么意思？一. 多字节字符二....但是，GetWindowText不能接收其他应用程序中控件的文本。...函数不能返回在其他应用程序中的编辑控件的文本。...Visual C++里边定义字符串的时候，用_T来保证兼容性，VC支持ascii和unicode两种字符类型，用_T可以保证从ascii编码类型转换到unicode编码类型的时候，程序不需要修改。...宽字符类型 printf wprintf //打印到控制台函数 strlen wcslen //获取长度 strcpy

8893 0

【JavaSE专栏72】字符输入流Reader，用于读取字符数据的抽象类

主打方向：Vue、SpringBoot、微信小程序本文讲解了 Java 中字符流 Reader 类的语法，介绍了 Reader 类的应用场景，并给出了样例代码，字符输入流是 Java IO 库中用于读取字符数据的抽象类...Java 中的字符输入流主要用于从输入源（如文件、网络连接等）读取字符数据，字符输入流以字符为单位进行读取操作，并能够处理 Unicode 字符，对于处理文本文件非常有用。...然后，我们使用 BufferedReader 的 readLine() 方法逐行读取文件中的字符数据。最后，我们将读取到的每行字符数据打印到控制台上。...读取网络数据：当从网络连接或 URL 中读取数据时,字符输入流可以用于读取返回的字符数据。例如,读取网页内容、API 响应或其他文本数据。...读取用户输入：当从控制台或用户界面接收用户输入时,字符输入流可以用来读取用户输入的字符数据。读取日志文件：使用字符输入流可以方便地读取日志文件,对日志内容进行分析、过滤或其他操作。

4022 0

Java的基本数据类型char

一、定义char是Java语言中的一种基本数据类型，它用于表示一个16位的Unicode字符。Unicode字符是一种标准字符编码方案，可以表示世界上大部分语言的字符。...类型的数据可以用于表示任何Unicode字符，因此在处理多语言和多字符集应用程序时非常有用。...，并将每个字符打印到控制台中。...然后，它将这个字符的ASCII码打印到控制台中。注意事项在Java中，char类型的变量不能用于算术运算，但可以将其转换为整数类型进行算术运算。...使用char类型的变量时，要注意字符的编码方式，因为不同的编码方式可能会影响字符的表示方式。

6862 0

Python的解码和编码

如果发现声明，如# -*-coding: utf-8 -*-，会将文件中的字符串从utf-8先解释成unicode的形式；如果文件头没有编码声明，则会以默认的ASCII来解释成unicode的形式。...﹒decode()的作用是将其他编码的字符串转换成unicode 格式，例如：name.decode(“utf-8”)，表示将utf-8编码的字符串name转换成unicode ﹒encode()的作用是将...unicode编码转换成其他编码的字符串，例如： name.encode(“GB2312”)，表示将GB2312编码的字符串name转换成GB2312 当代码中同时有编码声明（例如# -*- coding...这里的“u”表示将后面跟的字符串以unicode格式存储，然后Python会根据程序第一行的utf-8编码识别代码中的中文“你好”，然后转换成unicode对象（重申一下：中文前加“u”，直接免去“将字符串解码成...Windows下控制台中的编码使用的是gbk，而在代码中使用的utf-8，Python按照utf-8编码打印到gbk编码的控制台下自然就会不一致而不能打印出正确的汉字。

2.5K10 0

python decode encode

字符串在Python内部的表示是unicode编码，因此，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码（decode）成unicode，再从unicode编码（encode...decode的作用是将其他编码的字符串转换成unicode编码，如str1.decode('gb2312')，表示将gb2312编码的字符串str1转换成unicode编码。...encode的作用是将unicode编码转换成其他编码的字符串，如str2.encode('gb2312')，表示将unicode编码的字符串str2转换成gb2312编码。...在某些IDE中，字符串的输出总是出现乱码，甚至错误，其实是由于IDE的结果输出控制台自身不能显示字符串的编码，而不是程序本身的问题。...首先，Windows的控制台确实是unicode（utf16_le编码）的，或者更准确的说使用字符为单位输出文本的。但是，程序的执行是可以被重定向到文件的，而文件的单位是“字节”。

2.5K1 0

C输入输出缓存

表现 linux系统上，休眠5000毫秒，打印出所有HelloWorld 输入输出缓存区输出缓存区在向控制台打印字符时，程序会先将需要打印的字符串放在输出缓存区中，到特定时刻，再一起显示到控制台...并且这些输入函数属于阻塞函数，当输入缓存区没有内容时。程序将阻塞在输入函数中，等待用户从键盘键入字符，并按回车确认。...当我们按下了回车键（即换行，存储为\n），输入的字符串将进入输入缓存区接下来，输入函数将从输入缓存区获取字符，删除缓存区中已获取的字符，并解除阻塞状态继续执行代码。...我们输入了字符串"123\n"，第一个getchar将获取字符’1’，现在缓存区中的数据为"23\n"。第一个getchar解除阻塞状态。随后’1’被putchar打印到控制台。...程序运行至getch，虽然输入缓存区中仍有数据，但是getch函数将阻塞等待键盘直接输入一个字符。输入’A’后，getch解除阻塞状态。‘A’被putchar打印到控制台。

1.6K3 0

转载：从程序员的角度看ASCII, GB2312, UNICODE, UTF-8

总结： UTF8 只是 UNICODE内码在存储/传输时的状态. 而从GB2312编码转换到UNICODE编码需要查表....二、字符编码的编程相关问题 1. Windows从NT开始,内核使用UNICODE内码. 为了向前兼容,前端使用的还是GB2312内码(中文环境). ...微软非常鼓励Windows程序员用Unicode编写程序,很明显,由于Windows内核就是原生的Unicode环境,调用API时,省却了编码转换的操作,效率更高....任何被写到终端的字符流都被认为是是一个UTF8字符流.所以,编程的时候,从外部(文件或者控制台)读入UTF8字符流,转换为wchar_t,然后程序在内部使用宽字符处理,最后再把要输出的宽字符流转换为UTF8...为什么很多Windows下的C源文件的注释在Linux编辑器下会显示为乱码就很好理解了. 3.

9633 0

字符编码的前世今生——一文读懂字符编码

编码从故事说起关于计算机的字符编码，很多人都是一知半解的，笔者遇到过做了几年开发的程序员，还是说不清字符编码是什么，乱码又是怎么回事，实际上笔者早期也说不清个所以然，后来有一次做一个自己的app，期初用...这也让我明白了一个道理，不懂C语言的程序员根本不懂计算机，因此我一直推崇程序员要会C语言，否则成不了高手，你会缺乏遇到问题透过现象直指本质的能力。...其实这个也很好理解，这就像我们一开始讲的小明小红的故事一样，我们只需要给每个字符一个编号，计算机不是只能存数字吗，那就把这个编号存起来，当我们需要显示的时候，再去解码，让显示器把这个编号转换成对应的字符显示到屏幕上就行了...该表编号从0~127，总共表示了128个字符。这个表不仅将26个字母的大小写字符都包含进去了，还包含了很多其他的老美们认为常用的字符，这才凑够了128个，为什么要凑够128呢？...在Windows系统上，许多Windows程序（包括Windows记事本在内）在保存为UTF-8时，会在文档的开头添加字节0xEF，0xBB，0xBF，这是Unicode字节顺序标记，通常称为UTF-8

1.8K4 0

python字符串编码

中文乱码问题　　无论以什么编码在内存里显示字符，存到硬盘上都是二进制，所以编码不对，程序就会出错。　　...无论以什么编码存储的数据，只要我们的软件把数据从硬盘上读到内存，转成unicode来显示即可，由于所有的系统、编程语言都默认支持unicode，所有我们的gbk编码软件放在美国电脑上，加载到内存里面，变成了...不过，如果你在Windows控制台下运行此代码的话，虽然程序是执行了，但屏幕上打印出的却不是哈哈字。这是由于python2编码与控制台编码的不一致造成的。...Windows下控制台中的编码使用的是gbk，而在代码中使用的utf-8，python2按照utf-8编码打印到gbk编码的控制台下自然就会不一致而不能打印出正确的汉字。　　...Python2在向控制台输出unicode对象的时候会自动根据输出环境的编码进行转换，但如果输出的不是unicode对象而是普通字符串，则会直接按照字符串的编码输出字符串，从而出现上面的现象。

2K1 0

Java知识--IO流操作（二）

当需求需要频繁操作读写文件或者传输数据时，使用缓冲流先将数据缓存起来，然后一起写入或读取出来，这样效率会大大提高。...它根据指定的编码方式，将这些字节转换为Unicode字符。...OutputStreamWriter从运行的程序中接收Unicode字符，然后使用指定的编码方式将这些字符转换为字节，再将这些字节写入底层输出流中。...例子：从控制台输入一行文字（BufferedReader来读, BuffereWriter来写，编码集用utf-8），保存到文件中。...fos, "utf-8"); //加入缓冲功能 BufferedWriter bfw = new BufferedWriter(ops); bfw.write(msg); bfw.close(); } 从电脑中的一个文本文件中的内容打印到屏幕上显示

2802 0

Python-基础05-字符编码

此时你可能会觉得，那如果我们以后开发软时统一都用unicode编码，那么不就都统一了吗，关于统一这一点你的思路是没错的，但我们不可会使用unicode编码来编写程序的文件，因为在通篇都是英文的情况下，耗费的空间几乎会多出一倍...乱码一：存文件时就已经乱码存文件时，由于文件内有各个国家的文字，我们单以shiftjis去存，本质上其他国家的文字由于在shiftjis中没有找到对应关系而导致存储失败但当我们硬要存的时候，编辑并不会报错...，但毫无疑问，不能存而硬存，肯定是乱存了，即存文件阶段就已经发生乱码而当我们用shiftjis打开文件时，日文可以正常显示，而中文则乱码了 #用open模拟编辑器的过程可以用open函数的write...'>, ) 打印到终端对于print需要特别说明的是：当程序执行时，比如 x='上' #gbk下，字符串存放为\xc9\xcf print(x) #这一步是将x指向的那块新的内存空间...，将内存中的\xc9\xcf转成字符显示，此时就需要终端编码必须为gbk，否则无法正常显示原内容：上对于unicode格式的数据来说，无论怎么打印，都不会乱码 unicode这么好

5985 0

python编码的意义

当我们谈论编码时我们在谈论什么 python中有关编码问题的对象有basestring, str, unicode，标准库有codecs等，在这篇文章里我们基本上不会提到标准库，而仅仅简单的对对象们进行分析...事实上，我们常犯的编码问题，从抛出异常的角度来说分为两种，很明显，本文一开头也列出这两种异常的打印情形，它们分别是 py文件编译时未指定文件字符集导致的解码异常字符串对象互相转换时使用默认编码导致的异常...也就是： # coding：文件编码至于为什么与你平常所见到的模式： # -*- coding: utf-8 -*- 不一样，本文作者会轻易告诉你-*-是装饰用的吗第二类异常 Unicode会梦见小绵羊吗...异常蛋疼的windows控制台 简单粗暴就在不久前，本文作者在服务器上部署爬虫代码，就不得不在控制台输出(当然不是因为作者懒得用其他方式跑代码)，结果是一连串的乱码，自认不是新手的作者完全不能忍了，于是心平气和的坐下来研究了下...windows控制台的编码事实上，windows的控制台的字符集编码不叫字符集编码，而叫代码页，多么古怪的名字！

8122 0

Java转换流_java中的字符使用什么编码

OutputStreamWriter(OutputStream out ,String charsetName)把Unicode转成其他编码输出 InputStreamReader : InputStreamReader...(InputStream in) 把传入的字节流转成字符流 InputStreamReader(InputStream in,String charsetName)读取其他编码转成Unicode 3...常见字符编码表 4 练习:编码转换测试创建包: cn.tedu. encoding 创建类: TestEncode.java package cn.tedu.encoding; import java.io...，以中文的格式展示在控制台 char[] ch = new char[8192]; //Reader中的方法：read(char[] cbuf)将字符读入数组，返回读取到的字符的个数 int len =...in.read(ch);//len保存的是读取到的字符的个数 //此处是String的构造函数，利用ch数组中的数据，构建一个字符串，并打印到控制台 System.out.println(new String

8132 0

C#和.NET中的字符串

然而，其他的类型（比如说许多Windows窗体）可能会认为字符串以第一个null字符作为结束标志——如果你的字符串表现为似乎会被奇数截断，可能就是出现了这种情况。...常规字符串字面值与许多其他语言（例如Java和C）类似，它们以"作为开始和结尾，并且各种字符（特别是"本身，\，以及回车（CR）和换行符（LF））需要转义成为在字符串中的表示。...讽刺的是，这些问题通常是由调试器自身试图帮助解析字符串的行为引起的：将字符串显示为带有反斜杠转义字符的常规字符串字面值，或将其显示为带有@的完整字符串字面值。...我建议使用下面的DisplayString方法，它以安全的方式将字符串内容打印到控制台。根据你正在开发的应用程序，你可能需要将此信息写入至日志文件，调试窗口或跟踪侦听器中，或者在消息框中弹出。...对于正常的IndexOf，其他的一些Unicode字符似乎是完全不可见的。有人在C＃新闻组询问为什么搜索/替换方法会进入无限循环。

2.4K10 0

python基础之字符编码

，是为了显示或者编辑，根本不去理会python的语法，而python解释器将文件内容读入内存后，可不是为了给你瞅一眼python代码写的啥，而是为了执行python代码、会识别python语法。...此时你可能会觉得，那如果我们以后开发软时统一都用unicode编码，那么不就都统一了吗，关于统一这一点你的思路是没错的，但我们不可会使用unicode编码来编写程序的文件，因为在通篇都是英文的情况下，耗费的空间几乎会多出一倍...，但毫无疑问，不能存而硬存，肯定是乱存了，即存文件阶段就已经发生乱码而当我们用shiftjis打开文件时，日文可以正常显示，而中文则乱码了 #用open模拟编辑器的过程可以用open函数的write...'>, ) 打印到终端对于print需要特别说明的是：当程序执行时，比如 x='上' #gbk下，字符串存放为\xc9\xcf print(x) #这一步是将x指向的那块新的内存空间...，将内存中的\xc9\xcf转成字符显示，此时就需要终端编码必须为gbk，否则无法正常显示原内容：上 ?

6472 0

java字符串操作（一）

下面我们将讲解一些Java字符串操作的常见方法。字符串长度我们可以使用length()方法获取一个字符串的长度，该方法返回一个整型值，表示字符串中字符的个数。...最后，我们将len的值打印到控制台上。字符串连接Java中的字符串可以使用加号（+）进行连接。当我们对两个字符串使用加号运算符时，会返回一个新的字符串，该字符串是将两个字符串连接起来的结果。...在上面的代码中，我们先定义了两个字符串str1和str2，然后使用加号运算符将它们连接起来，并将结果赋给了一个新的字符串str3。最后，我们将str3的值打印到控制台上。...最后，我们将pos的值打印到控制台上。字符串替换我们可以使用replace()方法将一个字符串中的某个子字符串替换为另一个字符串。该方法接受两个字符串参数，分别指定被替换的子字符串和替换后的字符串。...在上面的代码中，我们使用replace()方法将字符串str中的子字符串"world"替换为"Java"，并将结果赋给一个新的字符串newStr。最后，我们将newStr的值打印到控制台上。

4353 0

流畅的 Python 第二版（GPT 重译）（二）

Unicode 标准明确将字符的身份与特定字节表示分开：字符的身份——其代码点——是从 0 到 1,114,111（十进制）的数字，在 Unicode 标准中显示为带有“U+”前缀的 4 到 6 位十六进制数字...⁶ 当stdout写入控制台时，chcp和sys.stdout.encoding说不同的事情是很奇怪的，但现在我们可以在 Windows 上打印 Unicode 字符串而不会出现编码错误——除非用户将输出重定向到文件...你可能想要写一个解释字符代码的注释，所以\N{}的冗长是容易接受的。这意味着像示例 4-12 这样的脚本在打印到控制台时可以正常工作，但在输出被重定向到文件时可能会出现问题。...可能它被识别为有效字符，但控制台字体没有显示它的字形。然而，当我将stdout_check.py的输出重定向到文件时，我得到了图 4-4。图 4-4....因此，如果你想创建支持泰米尔数字或罗马数字的电子表格应用程序，就去做吧！图 4-7 显示正则表达式r'\d'匹配数字“1”和梵文数字 3，但不匹配一些其他被isdigit函数视为数字的字符。

2410 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭