我现在正在做的是使用pandas dataframe来存储每一行(这使得使用pandas startswith()或endswith()删除行变得很容易)。另一方面,通过让文本文件的每一行对应于DataFrame中的一行,我不知道如何在REGEX匹配之间提取数据。另一种选择是从文本文件中使用read(),并进行常规的字符串操作instad of DataFrame
我正在使用from_pandas()函数从熊猫数据帧创建一个dask数据帧。当我尝试使用方括号[ ]从dask dataframe中选择两列时,我得到了一个KeyError。根据dask文档,dask dataframe支持像pandas dataframe一样的方括号列选择。# data is a pandas dataframe
dask_df = ddf.from_pandas</em