我有多个数据集,我想对它们做同样的事情。如何使我的代码可重用?
我已经将我的一些代码分组到函数中,但是我应该如何集成一个类或其他类中的所有函数,以便每次读入DataFrame时,我只需要调用function
发布于 2019-06-09 23:57:19
我不确定你到底是什么意思,但是,假设我有一段数据要导入。每次导入时,我都想运行相同的预处理步骤,包括冗长的清理、数据转换等。
你可以这样做:
def clean_data():
pass
def transform_data():
pass
def import_data():
data = clean_data(data)
data = transform_data(data)
data = import_data(data)
如果更有意义,也可以将其转换为类。
您还询问了如何在不同的文件中使用它们。假设这个脚本叫做"data_import.py“。
然后我们可以在其他脚本中使用它(在相同的文件夹中),只需执行以下操作
import data_import
data_import.import_data(data)
或
from data_import import *
import_data(data)
如果它在另一个文件夹中,则必须在data_import.py所在的同一文件夹中添加名为__init__.py的空白文件。
https://stackoverflow.com/questions/56516033
复制相似问题