我正在试着分析nba球员的数据集来做家庭作业。我有一个数据集,其中包括姓名,积分,助攻,年份等。我正在尝试分析2017年的球员,所以首先我想打印他们的名字,积分,助攻等。 当我尝试下面的代码时: for i in df1.columns: print(df1.loc[:, ["Year","Player","Pos","Team","Games","AST","PTS","PPG
我有一个场景,通过where条件从同一个DataFrame中使用另一个列从DataFrame读取一列,这个值作为IN条件通过,从另一个DataFrame中选择相同的值,我如何在spark DataFrameA.date) from table A where A.key in (select B.key from table B where cond='D');val Bkey: DataFrame</