首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >Spark Datasets groupByKey不工作(Java)

Spark Datasets groupByKey不工作(Java)
EN

Stack Overflow用户
提问于 2017-12-11 23:30:11
回答 2查看 2.7K关注 0票数 4

我尝试使用Dataset的groupByKey方法。我找不到问题所在,也找不到使用groupByKey的任何工作示例。

因此,让我指出我在解决方案中寻找的要点:

  1. 我想使用groupByKey -有很多使用groupBy(“key”).agg(函数)的示例,我知道但不想使用它们(教育目的)
  2. 我想使用Java -很多示例使用Scala,同样不想要它。
  3. 该函数最好写成λ表达式。

下面是我所做的:

代码语言:javascript
复制
//Inner class
public static class Bean implements Serializable {
    private static final long serialVersionUID = 1L;
    private String k;
    private int something;

    public Bean(String name, int value) {
        k = name;
        something = value;
    }

    public String getK() {return k;}
    public int getSomething() {return something;}

    public void setK(String k) {this.k = k;}
    public void setSomething(int something) {this.something = something;}
}

//usage
List<Bean> debugData = new ArrayList<Bean>();
debugData.add(new Bean("Arnold", 18));
debugData.add(new Bean("Bob", 7));
debugData.add(new Bean("Bob", 13));
debugData.add(new Bean("Bob", 15));
debugData.add(new Bean("Alice", 27));
Dataset<Row> df = sqlContext.createDataFrame(debugData, Bean.class);
df.groupByKey(row -> {new Bean(row.getString(0), row.getInt(1));}, Encoders.bean(Bean.class)); //doesn't compile

我得到的错误是:

无法解析不明确的方法调用-集成开发环境显示有关无法显示和无法解析matching.

  • The getString和

MapFunction的警告:我无法显示/打印的结果

EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47756167

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档