我需要获取每个列的类型,以便对其进行适当的预处理。目前,我通过以下方法做到这一点:# but has one type (int, float, str, bool) per column
column_types = dict(df.dtypes)matrix = df.values
由于我只使用<e
我想使用Spacy的Doc扩展功能。我需要将dataframe列转换成只包含文本的元组和一个包含列名值对的字典。使用pandasdataframe.to_dict(orient='records')很接近,但不允许我只使用1列或选择特定的列。将to_dict()方法应用于单个数据框列也不能使我更接近所需的布局。我应该采取不同的方法吗?import pa