Python 的一个优点是它在处理和操作字符串数据方面相对容易。Pandas 构建于此之上,并提供了一套全面的向量化字符串操作,它们成为处理(阅读“清理”部分)实际数据时所需的重要部分。...例如:
import numpy as np
x = np.array([2, 3, 5, 7, 11, 13])
x * 2
# array([ 4, 6, 10, 14, 22, 26])
这种向量化操作简化了操作数据数组的语法...使用传递的分隔符连接每个元素中的字符串
get_dummies() 将虚拟变量提取为数据帧
向量化的项目访问和切片
特别是get()和slice()操作,可以在每个数组中执行向量化元素访问。...在互联网上搜索此错误的文本,似乎是由于使用了一个文件,其中每行本身是一个有效的 JSON,但完整文件不是。...从每个食谱中提取完整的成分列表,是该任务的重要部分;遗憾的是,各种所使用格式使得这是一个相对耗时的过程。