首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Python3字符串替换replace(),translate(),re.sub()

    Python3的字符串替换,这里总结了三个函数,replace()和translate()和re.sub() replace() python 中的 replace() 方法把字符串中的 old(旧字符串...str.maketrans('','',del) 第一个参数为被替换的字符,第二个参数为替换的字符,第三个参数为要删除的字符 import string a = 'Hello,world....str.maketrans('abcdefgh','01234567',remove) print(a.translate(table)) H4lloworl3 By4By4 string.punctuation返回所有的标点符号...,更多字符串常量如下图: str.maketrans()的前两个参数相当于一个映射表,如上述结果,所有的'e'被替换成了'4' 第三个参数为要删除的字符,上述例子删除了所有的标点符号,如果要删除的字符还要加上空格的话...Reference: Python3 replace()方法 NLP-python3 translate()报错问题-TypeError: translate() takes exactly one argument

    1.4K10

    技术文档规范

    半角的百分号,视同阿拉伯数字。 英文单位若不翻译,单位前的阿拉伯数字与单位间不留空格。...反例:一部容量为 16 GB 的智能手机 正例:一部容量为 16GB 的智能手机 半角英文字符和半角阿拉伯数字,与全角标点符号之间不留空格。 反例:他的电脑是 MacBook Air 。...反例:没有删除权限的用户,不能删除此文件。 正例:用户必须拥有删除权限,才能删除此文件。 # 2.4. 英文处理 英文原文如果使用了复数形式,翻译成中文时,应该将其还原为单数形式。...参见《标点符号》一节的 “连接号” 部分。 带有单位或百分号时,两个数字都要加上单位或百分号,不能只加后面一个。...符号原则 中文语句的标点符号,均应该采取全角符号,这样可以保证视觉的一致。 如果整句为英文,则该句使用英文 / 半角标点。 句号、问号、叹号、逗号、顿号、分号和冒号不得出现在一行之首。 # 5.2.

    94640

    Python字符编码全解析

    字符编码是计算机编程中不可回避的问题,不管你用 Python2 还是 Python3,亦或是 C++, Java 等,我都觉得非常有必要厘清计算机中的字符编码概念。...UnicodeEncodeError & UnicodeDecodeError 根源 基本概念 字符(Character) 在电脑和电信领域中,字符是一个信息单位,它是各种文字和符号的总称,包括各国家文字、标点符号...比如,一个汉字,一个英文字母,一个标点符号等都是一个字符。 字符集(Character set) 字符集是字符的集合。字符集的种类较多,每个字符集包含的字符个数也不同。...比如,常见的字符集有 ASCII 字符集、GB2312 字符集、Unicode 字符集等,其中,ASCII 字符集共有 128 个字符,包含可显示字符(比如英文大小写字符、阿拉伯数字)和控制字符(比如空格键...(8-bit Unicode Transformation Format) 是一种针对 Unicode 的可变长度字符编码,它使用一到四个字节来表示字符,例如,ASCII 字符继续使用一个字节编码,阿拉伯文

    1.3K60

    你可能不知道的字符串分割技巧

    你可能会第一时间想到,用 split 按所有可能断句的标点符号分割就好了,比如下面的代码: var txt = '你好,我是 ConardLi。我来了!你是谁?你在哪?'.../); // ['你好,我是 ConardLi', '我来了', '你是谁', '你在哪', ''] 看起来结果还不错,但是可以断句的中文标点符号只有这三个吗?...显然不是,如果我们想要处理更复杂的文本,需要持续完善这个正则,另外这样分割还有一个最大的问题是标点符号会在分割后的结果中丢失。 如果我们想要按词语进行分割,而不是语句呢?...如果我们想要分割的文本是英语、阿拉伯语呢... // 中文 const cn = '你好,我是 ConardLi。我来了!你是谁?你在哪?'...; // 阿拉伯语 const ar = 'مرحبا، أنا كوناردلي. أنا قادم! من أنت؟ أين أنت؟'; 这时候 split 可能就会表示无能为力了!

    72910

    字符编码学习笔记

    二、Python3编码 Python中的编码问题困扰了我挺久的,尤其是Python2和Python3中还有区别,不过这里我只讨论Python3中的编码问题。...Python3最重要的新特性大概要算是对文本和二进制数据作了更为清晰的区分,文本总是Unicode,由str类型表示,二进制数据则由bytes类型表示,而两者之间的转换由编码(encode)和解码(decode...在Python3中可以使用chardet模块里的detect方法查看: import chardet print(chardet.detect(b'\xe5\x8d\x9a\xe5\xae\xa2\xe5...四、URL编码 URL即全球统一资源定位符(Uniform Resource Locator),一般来说,URL只能使用英文字母、阿拉伯数字和某些标点符号,不能使用其他文字和符号,这是因为网络标准RFC1738

    46820
    领券