自然语言处理涉及字符串构造、截取与格式化输出等基础操作,本文将介绍使用%、format()、f-string方法格式化字符串。
【自然语言处理】NLP入门(一):1、正则表达式与Python中的实现(1):字符串构造、字符串截取
字符串格式化输出是将变量或常量的值按照特定的格式插入到字符串中,形成新的字符串。字符串格式化涉及到两个概念:格式和格式化。
- 字符串格式化输出可以使用不同的格式规则,如占位符、格式化指令、模板字符串等方式来指定变量或常量嵌入到目标字符串中的方式。3 种模式 (1)%(2)format()(3)f-string
%符号格式化字符串是一种传统的格式化方法,通过在字符串中使用占位符 %
和格式化字符串中的参数来实现格式化输出。
字符串格式化的一般形式为:”wwww %rrrrr www”%x,其中:
常用的格式字符及其含义如下:
格式字符 | 说明 |
---|---|
%c | 格式化字符或编码 |
%s | 格式化字符串 |
%d, %i | 格式化整数 |
%u | 格式化无符号整数 |
%% | 输出字符 % |
%o | 格式化八进制数 |
%x | 格式化十六进制数 |
%f, %F | 格式化浮点数,可指定小数位数 |
%e, %E | 用科学计数法格式化浮点数 |
%g, %G | 根据值的大小采用科学计数法或者浮点数形式格式化浮点数 |
'%f' % 3.1416
'%.2f' % 3.1416
'%6.2f' % 3.1416
'%07.2f' % 3.1416
'%+07.2f' % 3.1416
'%-7.2f' % -3.1416
可以将一个数转换成不同的进位制,也可按科学计数法进行转换。
a = 123456
'%o' % a # 输出 '361100',转换为八进制串
'%x' % a # 输出 '1e240',转换为十六进制串
'%e' % 12345.678 # 输出 '1.234568e+04',转换为科学计数法串
可以一次转换多个对象,这些对象表示成一个元组形式,位置与格式化字符一一对应。
'%s, %4d, %s' % (3.456727, 89, 'Lily')
x = 10
name = 'Lily'
age = 18
pi = 3.1415926
# 常规示例
print("Value of x is %d" % x) # 输出 'Value of x is 10'
print("My name is %s, I am %d years old" % (name, age)) # 输出 'My name is Lily, I am 18 years old'
# 格式化整数示例
print("Decimal: %d, Octal: %o, Hexadecimal: %x" % (x, x, x)) # 输出 'Decimal: 10, Octal: 12, Hexadecimal: a'
# 格式化浮点数示例
print("Pi value with default precision: %f" % pi) # 输出 'Pi value with default precision: 3.141593'
print("Pi value with 2 decimal places: %.2f" % pi) # 输出 'Pi value with 2 decimal places: 3.14'
# 格式化科学计数法示例
print("Pi value in scientific notation: %e" % pi) # 输出 'Pi value in scientific notation: 3.141593e+00'
# 最小宽度和精度示例
print("Width 8: %8d" % x) # 输出 'Width 8: 10'
print("Width 8 with leading zeros: %08d" % x) # 输出 'Width 8 with leading zeros: 00000010'
print("Pi with width 10 and precision 3: %10.3f" % pi) # 输出 'Pi with width 10 and precision 3: 3.142'
# 对正数加正号示例
print("Positive number with sign: %+d" % x) # 输出 'Positive number with sign: +10'
# 左对齐输出示例
print("Left-aligned string: %-10s" % name) # 输出 'Left-aligned string: Lily '
# 其他进制示例
print("Binary: %b" % x) # 输出 'Binary: 1010'
print("Octal: %#o" % x) # 输出 'Octal: 0o12'
print("Hexadecimal: %#x" % x) # 输出 'Hexadecimal: 0xa'
# 字符串格式化拓展示例
print("Value of x is {}, My name is {}, I am {} years old".format(x, name, age)) # 使用format()方法进行字符串格式化
print(f"Value of x is {x}, My name is {name}, I am {age} years old") # 使用f-string进行字符串格式化
%符号格式化字符串方法在早期版本的Python中广泛使用,但在Python 3中,推荐使用format()
方法或f-string进行字符串的格式化输出。
format()
方法是一种更加灵活和易读的字符串格式化方法,它使用 {}
占位符和format()
方法中的参数来进行格式化。
'www{<参数序号>: <格式控制标记>}www'.format(x)
其中,{}
用来标记格式化的位置,<参数序号>
指定传递的参数序号,<格式控制标记>
用于控制格式化的方式。
name = 'Bob'
age = 25
formatted_string = "Name: {}, Age: {}".format(name, age)
print(formatted_string) # 输出: Name: Bob, Age: 25
在format()
方法中,使用 {}
占位符指定插入变量的位置,可以在占位符中指定参数的顺序,也可以使用索引指定参数的顺序。
formatted_string = "Name: {1}, Age: {0}".format(age, name)
print(formatted_string) # 输出: Name: Bob, Age: 25
下述代码均输出:‘我叫张清,今年18岁’
'我叫{},今年{}岁'.format('张清',18)
'我叫{0},今年{1}岁'.format('张清',18)
'我叫{1},今年{0}岁'.format(18, '张清')
my = ['张清', 18]
'我叫{0[0]},今年{0[1]}岁'.format(my)
'我叫{},今年{}岁'.format(*my)
'我叫{name},今年{age}岁'.format(name='张清', age=18)
**字典名
的形式将字典中的元素作为参数my = {'name': '张清', 'age': 18}
'我叫{name},今年{age}岁'.format(**my)
format()
方法还支持一些格式控制标记,比如进位制、千分位格式化、对齐方式等。
'{0:.2f}'.format(2/3) # 保留两位小数
'{0:b}'.format(8) # 二进制
'{0:o}'.format(8) # 八进制
'{0:x}'.format(18) # 十六进制
'{:,}'.format(1234567890) # 千分位格式化
'{0:*>10}'.format(18) # 右对齐
'{0:*<10}'.format(18) # 左对齐
'{0:*^10}'.format(18) # 居中对齐
'{0:*=10}'.format(-18) # *放在-和18中间
'{0:_},{0:#x}'.format(9999) # _作为分隔符
Python 3.6及以上版本引入了 f-string,它是一种在字符串前加上 f
或 F
,在字符串中直接使用变量名或表达式进行格式化的方法。
name = 'Charlie'
age = 20
formatted_string = f"Name: {name}, Age: {age}"
print(formatted_string)
字符串格式化输出在实际编程中非常常用,能够使代码更加清晰、易读,并且可以灵活地处理不同类型的数据。