我试图使用随机森林进行多类分类,使用spark 2.1.1我有一个包含多个字符串类型列的dataframe。我已经用distinct().count()检查了我的所有列,以确保我没有太多的类别,等等。经过一些调试后,我了解到每当我开始对某些列建立索引时,我就会得到以下错误.打电话时: if (labelToIndex.containslabel: $label.&q
我正在尝试使用sqlalchemy和函数df.to_sql将一些数据插入到sql-server中的表中。问题是dataframe的列数与表的列数不同(它的列数少于sql server表的列数),并且对于dataframe没有的列,它插入空值。有没有办法用空格代替空格。+Server")
final_df.to_sql("table", con = e