编写一个返回字典的函数,该字典中的关键字是数据框的列名,值是"numeric“、"categorical”、“or”、"date/time“或"text”之一,对应于每列的特征类型。
我能够将数据作为数据框导入。然后,我将df转换为字典。然后,我获得了作为列的键,但是在为每一列赋值( "numeric“、"categorical”、“or”、"date/time“或"text")时遇到了问题。
# Importing the pandas package
import pandas as pd
def helper(df):
# Creating data frame from csv.gz File. Enter the appropriate file path
cobra = pd.read_csv(df, compression='gzip')
cobra_dict = cobra.to_dict()
dict_keys = cobra.keys()
print(dict_keys)
helper(df)Expected Results:
In [1]: helper(df[['offense_id','beat','x','y']])
Out[1]: {'beat': 'categorical',
'offense_id': 'ordinal',
'x': 'numeric',
'y': 'numeric'}发布于 2019-10-20 08:16:28
IIUC
如果你想要和上面的输出完全一样,你可能需要创建一个映射字典,但这应该是可行的,我们可以将列和你的dtypes放入两个列表中,并创建一个dict,其中列作为键,值作为dtype。
def helper(df):
# Creating data frame from csv.gz File. Enter the appropriate file path
cobra = pd.read_csv(df, compression='gzip')
cobra_dict = dict(zip(cobra.columns.tolist(),cobra .dtypes.tolist()))
print(cobra_dict)在我自己的示例df上。
print(my_dict)
{'A': dtype('O'), 'B': dtype('int64'), 'C': dtype('float64')}https://stackoverflow.com/questions/58468533
复制相似问题