我想按列名'duration‘过滤,然后显示大于200的值。这只是数据集的一小部分。我有一个非常庞大的数据集。我可以使用dfdf.duration > 200。但是,这在整个数据帧上运行。有没有什么方法可以专门针对列持续时间,然后过滤数据,只显示列持续时间,而不引入新的数据帧。另外,一些关于在大型数据集(工作环境)中优化相同内容的解释也会有所帮助。
import pandas as pd
data = {
"calories": [420, 380, 390,100],
"duration": [50, 40, 45,300]
}
df = pd.DataFrame(data)
发布于 2021-04-16 18:45:23
使用熊猫,我认为df[df.duration > 200]
将是最好的选择之一,但渴望与任何替代品进行比较。
https://stackoverflow.com/questions/67128738
复制相似问题