在pandas中,通过DataFrame来存储文件中的内容,其中最常见的数据类型就是字符串了。针对字符串,pandas提供了一系列的函数,来提高操作效率。...这些函数可以方便的操作字符串类型的Series对象,对数据框中的某一列进行操作,这种向量化的操作提高了处理效率。pandas中的字符串处理函数以str开头,常用的有以下几种
1....拆分
通过str.split实现,可以指定拆分的次数,用法如下
>>> df = pd.DataFrame(['A_1_1', ' B_2_1', 'C_3_1', 'D_4_1'])
# 默认按照指定的分隔符进行拆分...=',')
'A,B,C,D'
# 当两个数组拼接时,返回一个新的Series对象
>>> df[0].str.cat(['1','2', '3', '4'])
0 A1
1 B2
2 C3
3 D4...Name: 0, dtype: object
# 当拼接的对象为一个数据框时,将数据框的所有列都进行拼接
>>> df[1] = df[0].str.cat(['1','2', '3', '4'])