我正在尝试读取一个csv文件(2 2GB)样本,大小很大,我使用dask,但它显示了一个样本:.Since不够大,不足以包含至少一行数据。请在对read_csv
/read_table
的调用中增加sample
中的字节数。谁能建议我如何解决它?谢谢
代码:
import dask.dataframe as dd
df= dd.read_csv('file1.csv')
错误:
ValueError: Sample is not large enough to include at least one row of data. Please increase the number of bytes in `sample` in the call to `read_csv`/`read_table`
发布于 2020-05-07 21:39:09
该错误意味着“请在对read_csv
的调用中包含可选的关键字参数sample
,给出一个足以包含一行数据的值(以字节为单位)”。查看函数docstring,您将看到默认值为256000字节。
所以也许可以试一试
df = dd.read_csv('file1.csv', sample=1000000)
https://stackoverflow.com/questions/61647974
复制相似问题