语言是一种使用具有共同处理规则的沟通指令的广义概念,这些指令可以通过视觉、声音或触觉等方式传递。语言可以分为自然语言、动物语言和计算机语言。
自然语言是人类发展过程中形成的一种信息交流方式,它包括口语和书面语,并且反映了人类的思想。自然语言是通过语言习得和文化影响逐渐形成的,并且会随着时间的推移而自然地演化。人类使用自然语言进行沟通和表达时,利用语言中的词汇、语法和语义等元素来传递指令。通过自然语言,人们可以交流思想、传递信息、表达感情和进行社交互动。自然语言具有多样性和灵活性,不同的语言有着不同的特点和表达方式,这也反映了不同文化背景和社会环境对语言的影响。
自然语言处理(Natural Language Processing,NLP) 是一门研究通过建立形式化计算模型来分析、理解和生成自然语言的学科。它的终极目标是让计算机能够具备与人类进行自然语言交流的能力。NLP包含两大问题:
在自然语言处理领域,研究者们通过设计和开发各种算法、模型和技术,来实现自动处理自然语言的能力。这些技术可以应用于各种领域,比如机器翻译、情感分析、问题回答系统、语音识别和自动摘要等。
自然语言处理涉及字符串构造、截取与格式化输出等基础操作,本文将介绍使用引号构造字符串、字符串索引、切片操作等。
前文:【深度学习】 Python 和 NumPy 系列教程(二):Python基本数据类型:3、字符串(索引、切片、运算、格式化)
在Python中字符串的构造,主要通过两种方法来实现,一是使用str函数,二是用单引号、双引号或三引号。在Python中,使用引号是一种非常便捷的构造字符串方式。
str()
函数是Python内置的函数,用于将其他类型的数据转换为字符串类型。例如:
num = 123
str1 = str(num)
print(str1) # 输出:'123'
str2 = 'Python World!'
str3 = "ABC"
str_error = 'string"
"Let's go!"
print("Let's go!")
'Let's go!'
'" Hello world! ",he said. '
print('" Hello world!",he said. ')
PS:打三次单引号就会自动识别出三引号
print('''"What's your name?""My name is Jone"''')
print('''"What's your name?"
"My name is Jone"''')
编写程序,分别用双引号、单引号和三引号作为字符串边界符,实现语句 Let's say:"Hello World!"
的正确输出:
print("Let's say:\"Hello World!\"")
print('Let\'s say:"Hello World!"')
print('''Let's say:"Hello World!"''')
字符串的截取就是取出字符串中的子串。截取有两种方法:一种是索引str[index]
取出单个 字符;另一种是切片str[[start]:[end]:[step]]
取出一片字符。
通过索引可以获取字符串中指定位置的单个字符。
s = 'student'
print(s[0]) # 输出: 's',获取第一个字符
print(s[-1]) # 输出: 't',获取倒数第一个字符
切片用于获取字符串中一段连续的子串:
print(s[1:3])
tu
,获取位置为1到位置为2的子串,不包括位置3的字符print(s[:3])
stu
,从头开始取到位置为2的子串print(s[-2:])
nt
,从倒数第二个位置开始取到结尾print(s[:])
student
,取出全部字符print(s[::2])
suet
,步长为2,每隔一个字符取一个s[0] = 'e'
s[1:3] = 'ut'
TypeError: 'str' object does not support item assignment