让我们假设Flink每秒接收1000条tweet流,在这个过程中的某个地方,它需要将它们分类为垃圾邮件或非垃圾邮件。我有一个由20台机器组成的集群,它们通过REST API提供“分类”微服务,它们可以提供每秒10k tweet的最大吞吐量,并且它们的延迟是3秒。我猜要从Flink使用这个服务,实现应该是这样的:
public class Classifier implements MapFunction<Tweet, Tweet
正确设置项目后,我需要将几个.bsq文件读取/导入到我的环境中。我试图像这样使用方法:但我无法得到一个合适的FileInputFormat因为它是抽象的,所以我不能有我自己的实例。我应该扩展abstract class FileInputFormat并使用自己的扩展来实例化FileInputFormat吗?或者还有其他我不认